Salute Dentale > problemi orali > Salute dentale > L'identificazione dei casi di cancro orale e della faringe incidenti utilizzando Medicare claims

L'identificazione dei casi di cancro orale e della faringe incidenti utilizzando Medicare claims

 

Abstract
sfondo
basale e dati di tendenza per l'incidenza del cancro orale e della faringe è limitata. Un nuovo algoritmo è stato ottenuto utilizzando il Surveillance, Epidemiology, and End Results (SEER) -Medicare legata database per creare un algoritmo per identificare i casi incidenti di tumore del cavo orale e della faringe uso di indicazioni Medicare.
Metodi
Utilizzando uno split-sample approccio, Medicare sostiene 'procedura e diagnosi codici sono stati utilizzati per generare un nuovo algoritmo per identificare i casi di cancro orale e della faringe e convalidare le sue caratteristiche di funzionamento.
Risultati
L'algoritmo ha avuto alta sensibilità (95%) e specificità (97% ), che variava poco suddiviso per età, sesso e razza ed etnia.
Conclusione
esempi dell'utilità di questo algoritmo e le sue caratteristiche di funzionamento includono l'utilizzo per ricavare di base e di tendenza stime di incidenza del cancro orale e della faringe. Tali misure potrebbero essere utilizzati per fornire stime di incidenza ove essa risulti insufficiente o per servire come stime di confronto per registri tumori.
Parole
Medicare cancro orale analisi dei dati secondari SEER elettronico materiale supplementare
La versione online di questo articolo ( doi:. 10 1186 /1472-6831-13-1) contiene materiale supplementare, che è disponibile per gli utenti autorizzati
Sfondo
rapporto del Surgeon General sulla salute orale in America ha dichiarato che i database di sorveglianza orale e cranio-facciali. per le malattie, servizi sanitari, e utilizzo dei servizi sanitari sono limitate o mancano [1]. Questo rapporto chiamato per un ulteriore sviluppo e validazione di misure di outcome [1]. Il National Institute of Dental Research e craniofacciale (NIDCR) ha sollevato preoccupazioni simili [2], e ha descritto la necessità di dati di base, al fine di riconoscere le tendenze nel corso del tempo, in particolare per le popolazioni meno abbienti e le condizioni meno comuni tra la popolazione generale [2].
orale e della faringe (OP) tumori sono diagnosticati in circa 30.000 persone negli Stati Uniti ogni anno, e la mortalità annua per il cancro OP è di circa 7.500 [1-3]. Una gran parte dei casi diagnosticati OP sono tra gli individui età superiore ai 65 anni [4]. Nonostante il gran numero di nuovi casi ogni anno, OP cancro relativamente parlando, è una malattia rara; così grandi impostazioni basate sulla popolazione sono spesso necessari per rispondere a importanti domande di ricerca. Così, abbiamo generato e validato un algoritmo per identificare i casi OP incidenti sulla base delle domande di Medicare.
Gli investigatori hanno utilizzato Medicare rivendica per studi sul cancro e altri risultati di salute. Ospedale, ambulatoriali e medici affermazioni possono essere riconfigurati in banche dati longitudinali. Questi possono includere la diagnosi e procedura codici, costo dei servizi forniti, nonché le date corrispondenti di queste diagnosi e delle procedure.
Cooper et al. [5] ha studiato la sensibilità dei dati Medicare per identificare prostata incidente, del polmone, del colon-retto, della mammella, del pancreas, e casi di cancro endometriale. Un algoritmo da Freeman et al. [6] per identificare i casi di cancro al seno incidenti sulla base delle domande di Medicare avuto alta sensibilità (90%), e anche misurato la specificità e valore predittivo positivo del loro algoritmo. McClish e Penberthy [7] utilizzate Medicare sostiene di quantificare il numero di casi perse nel Registro di cancro Virginia. reclami Medicare creato un'opportunità unica per il loro lavoro, come ha richiesto i dati da tre fonti, il registro tumori separati Virginia, il Medicare parte A sostiene, e le affermazioni Medicare parte B. Mandelblatt et al. [8] e Mandelblatt et al. [9] utilizzato l'algoritmo di Freeman et al. [6] per identificare i casi di cancro al seno per indagare i trattamenti e le percezioni di trattamento del cancro. Di particolare interesse per Mandelblatt et al. [8] erano disparità di salute razziali. Oltre alla algoritmo sviluppato da Freeman et al. [6], Nattinger et al. [10] ha creato un algoritmo in quattro fasi per identificare i casi di cancro al seno tra la popolazione Medicare e migliorato il valore predittivo positivo (≥89%) per individuare i casi, pur mantenendo alti livelli di sensibilità e specificità.
In questo studio la SEER-Medicare legata database è stato utilizzato per ricavare un algoritmo che identifica i casi di cancro incidente OP tra gli anziani utilizzando solo reclami Medicare. Questo algoritmo può consentire studi futuri per rispondere alle domande di ricerca sul cancro OP attraverso i dati secondaria analisi sulle richieste Medicare. Gli individui identificati dall'algoritmo possono essere collegati contemporaneamente alla propria cartella clinica (sinistri Medicare) per valutare traiettorie di salute. Le stime dei tassi di incidenza del cancro OP possono anche essere derivati ​​usando questo algoritmo per i beneficiari Medicare, una grande popolazione-base comprensivo di molte popolazioni rurali e altri difficili da raggiungere negli Stati Uniti.
Metodi
fonti di dati
Il database collegato SEER-Medicare è stato utilizzato per questo studio. Il Centro per Medicare e Medicaid Services legata Surveillance, Epidemiology, e risultati dei dati del Registro di sistema (SEER) del tumore End con Medicare reclami e censimento dati per creare il SEER-Medicare legata database. Questi dati contenevano informazioni su persone con cancro, identificati come casi nel registro dei tumori SEER, che aveva anche l'assicurazione Medicare, come indicato dal record di iscrizione Medicare. Quasi tutti (97%) delle età della popolazione di 65 anni negli Stati Uniti hanno Medicare copertura assicurativa sanitaria [11], che prevede il ricovero ospedaliero, struttura d'assistenza specializzata, la salute a casa, e hospice (parte A) di copertura. La maggior parte dei beneficiari hanno anche la copertura per il medico e per la cura ambulatoriale (parte B) [11]. Le informazioni demografiche era disponibile dai file di Medicare iscrizione, tra cui l'appartenenza a Health Maintenance Organizations, o HMO [11] anche. Per questo studio, solo pazienti ricoverati (parte A) e medico e ambulatoriale sinistri (parte B) Medicare sono stati utilizzati. Precedenti ricerche del database SEER-Medicare hanno indicato che circa il 93,6% dei casi in registro dei tumori SEER sono stati inclusi anche nel database SEER-Medicare per persone dai 65 anni e più [12].
Il SEER-Medicare legata banca dati consisteva di due tipi di file denominatore, il diritto del paziente e diagnosi Riepilogo file (PEDSF) e file di riepilogo denominatore (SumDenom). Il file PEDSF conteneva dati anagrafici del paziente raccolti da entrambi SEER e la Social Security Administration. Queste misure comprese come la data di nascita, razza, etnia, regione di residenza, Medicare ammissibilità, l'appartenenza HMO e data della morte. Solo individui diagnosticati in un registro SEER con il cancro sono stati inclusi nel file PEDSF; così le misure tumorali (per esempio, il cancro del sito, data della diagnosi, stadio del tumore, ecc) dal SEER sono stati inclusi anche in questi file. Il nostro file PEDSF incluso pazienti nel database collegato SEER-Medicare cui diagnosi di cancro si è svolto dal 1973 al 2002. Abbiamo ottenuto i file di 100% per i soggetti con tumori diagnosticati OP nel corso di questi anni. I soggetti con tumori diversi dal cancro OP non sono stati inclusi in queste analisi. Il file SumDenom conteneva informazioni demografiche simili al PEDSF, con il suo informazioni raccolte esclusivamente dal Social Security Administration. Le informazioni nel file SumDenom era un campione del 5% degli individui che vivono in aree SEER che non erano legati a un registro SEER tumore. Le informazioni contenute nel nostro file SumDenom copriva gli anni 1986 al 2004.
Il Medicare sostiene porzioni del SEER-Medicare legati database (pazienti ricoverati, medico e file ambulatoriali) sono stati legati l'uno all'altro attraverso una variabile identificativo comune, temi specifici. I file di Medicare Provider Analysis Review (MedPAR) contenevano affermazioni ospedale pazienti ricoverati. Questi codici inclusi ICD-9-CM diagnosi, ICD-9-CM codici di procedura, così come le date corrispondenti delle diagnosi e delle procedure. I file di 100% per medici /fornitore (medico) sono stati un sottoinsieme dei file Nazionale Claims di storia, e sono stati denominati i file NCH. Questi dati inclusi codici di diagnosi ICD-9-CM e di un codice di procedura CPT, insieme con le date corrispondenti di queste diagnosi e delle procedure. I file ambulatoriale standard Analytic (ambulatoriale) erano anche un sottoinsieme dei file Nazionale Claims di storia, e sono stati denominati i file OutSAF. Questi dati inclusi codici ICD-9-CM diagnosi, ICD-9-CM codici di procedura, e di un codice di procedura CPT con date di accompagnamento.
Cohort Study
Un totale di 3.050 casi di cancro OP incidente con una data di diagnosi in sono stati individuati l'anno civile 2002. Il limite di età più basso per l'inclusione era di 66 anni per permettere ai soggetti di invecchiamento in Medicare a 65 anni per soddisfare i nostri criteri di copertura precedenti, lasciando 2.751 casi. Per garantire informazioni complete per la storia clinica di ciascun soggetto, i soggetti solo con una copertura da Medicare (parti A e B), ma non da un HMO durante l'anno prima della diagnosi attraverso l'anno dopo la diagnosi (o attraverso la morte per i soggetti che sono morti entro un anno dalla loro diagnosi) sono stati inclusi. A seguito di questa esclusione, 1.807 casi di cancro OP rimasti. Per i controlli non-cancro, 472,293 soggetti sono stati identificati dal file SumDenom come vivo nel 2002. A "data di pseudo-diagnosi" è stato assegnato in modo casuale, come una data nel corso dell'anno civile 2002. (Strategie di assegnazione casuale alternativi non sarebbe probabile influenza i risultati come nessun trend temporali relativi ai sinistri connessi con l'incidenza del cancro OP sono stati anticipati.) Per un totale di 368,666 controlli sono stati almeno 66 anni di età su questi dati pseudo-diagnosi. Utilizzando gli stessi criteri di inclusione /esclusione di questi soggetti per Medicare e nessuna copertura HMO alla data di pseudo-diagnosi e la sua finestra temporale corrispondente a sinistra 242,654 non-OP soggetti di controllo del cancro
. Misure di studio
tumori OP sono stati identificati utilizzando il SITO RICODIFICARE variabili dai file PEDSF. valori interi di 1-10 significavano i seguenti siti tumorali (rispettivamente): labbro; lingua; ghiandola salivare; pavimento della bocca; gomma e altri bocca; rinofaringe; tonsille; orofaringe; hypopharynx; e altre cavità orale e della faringe. Per i soggetti con più di una diagnosi primaria all'età di 66 anni o più di cancro OP, il verificarsi diagnosticati nel corso dell'anno civile 2002 è stato utilizzato. Il campione rappresentativo di individui che servivano come soggetti di controllo era costituito da osservazioni dal file SumDenom. sono stati necessari Nessuna variabile per identificarli come controlli, come la loro posizione in questo file di esempio 5% di loro appurato come un beneficiario Medicare che vive in una zona SEER che non era stato diagnosticato un cancro.
valutazione delle prestazioni dell'algoritmo attraverso varie caratteristiche demografiche è stato condotto nel processo di convalida. Le seguenti misure contenute in entrambi i file PEDSF e SumDenom sono stati utilizzati per questa analisi: fascia di età, sesso e razza ed etnia. Diagnosi e procedura codici da reclami Medicare sono stati utilizzati per l'algoritmo per predire se un individuo è stato un caso di cancro OP incidente o meno (un controllo). Le date che corrispondevano con queste diagnosi e procedure sono state trovano anche nelle rivendicazioni Medicare, e sono stati utilizzati per limitare il verificarsi di tali codici entro un anno (prima o dopo) la data potenziale di incidenza.
Costruire l'algoritmo
Per generare il nostro algoritmo, 1.807 casi di cancro OP incidente con una data della diagnosi nel 2002 calendario che soddisfatti sono stati individuati i criteri di inclusione. Un totale di 242,654 soggetti dai file SumDenom che erano vivi nel 2002 e assegnato in modo casuale una "data pseudo-diagnosi" nel corso dell'anno civile 2002. sono stati selezionati Medicare (MedPAR, NCH, e OutSAF) le richieste di questi soggetti che avevano una data entro un anno (un anno prima attraverso un anno dopo) la data di data di diagnosi /pseudo-diagnosi. codici di procedura ICD-9 e CPT codici di procedura da queste affermazioni sono state utilizzate. Un campione di 60% casuale semplice (senza sostituzione) da questi soggetti è stato selezionato per derivare l'algoritmo (n = 1.085 casi di cancro OP; n = 145,548 controlli), lasciando il restante 40% (n = 722 casi di cancro OP; n = 97,106 controlli ) disponibile per la convalida. Tabelle di contingenza sono stati generati per confrontare caratteristiche demografiche e cliniche dell'edificio algoritmo (60%) e di convalida (40%) campioni. Queste caratteristiche sono state confrontate tra i campioni che utilizzano test chi-quadrato di Pearson.
Reclami Medicare sono stati utilizzati per generare i pesi per l'algoritmo. Ogni sorgente rivendicazione (MedPAR, NCH, e OutSAF) è stato trattato separatamente nel processo che segue. Il primo passo dell'algoritmo era di ridurre il numero di tipi di attestazioni. Pertanto, utilizzando i casi OP, solo le procedure che avevano un codice di diagnosi ICD-9 per il cancro OP (valori 140.XX-149.XX) almeno il 50% delle volte che la procedura è verificato sono stati mantenuti. Successivamente, le frequenze relative di occorrenza di (almeno uno) di ciascuna di tali unici ICD-9 procedura e CPT codici rivendicazioni tra i casi OP sono stati derivati, e poi ancora tra i controlli. Il registro 2 del rapporto di queste frequenze relative (di presenza per ogni ICD-9 codice di regime e ogni codice CPT all'interno di ciascuna sorgente rivendicazione) tra i casi OP e tra i controlli è stato usato per generare un peso per ciascun codice. (Per i codici che si sono verificati solo tra i casi OP, il valore di frequenza relativo utilizzato per i soggetti di controllo era uno diviso per il numero di controlli più uno per evitare la divisione per zero.) Pesi di valore inferiore o uguale a quattro nel ICD -9 codici di procedura e codici CPT sono stati fissati pari a zero. (Questo era giustificato sulla base di bassa discriminazione tra le frequenze relative tra i casi OP rispetto ai controlli.) Un punteggio per ciascun caso OP e per ogni controllo è stato generato sommando i pesi per ciascun codice che era presente durante il loro biennale finestra intorno le loro date di diagnosi /pseudo-diagnosi. Pesi per la presenza di una diagnosi valore di codice ICD-9-140.XX 149.XX (codice OP diagnosi di cancro) sono stati generati anche prendendo il registro 2 del rapporto delle frequenze relative di occorrenza di tale codice ( in ogni fonte di dati) tra i casi OP relativi ai controlli non tumorali, quindi l'aggiunta di questo peso al punteggio di ogni soggetto. Formalmente, l'equazione per determinare ogni soggetto punteggio è stato Risultato =
Σ
x
Med ·
codice s
Med < MTR> +
Σ
x
NCH ·
codice s
NCH +
Σ
x
out ·
codice s
dove: Codici
Med
rappresentato i vari pesi dalla procedura ICD-9 e la diagnosi codici e CPT codici di procedura sopra definito dall'origine dati MedPAR e x
Med
rappresentato le variabili indicatore corrispondenti (1 se presente; 0 se non presente) per se il soggetto ha avuto il codice nelle loro richieste durante la finestra di tempo definito; Codici
NCH
e x
NCH
rappresentato questi valori per l'origine dei dati NCH; e Codici
Fuori
e x
Fuori
loro rappresentato per l'origine dati OutSAF.
Dati i punteggi ottenuti per ogni fonte di dati (MedPAR, NCH, e OutSAF ), l'algoritmo identificato soggetti casi se avessero un valore positivo in uno qualsiasi di questi tre punteggi. I soggetti con un valore di zero in tutti e tre questi punteggi sono stati identificati come non avere il cancro OP dall'algoritmo. Istogrammi dei punteggi per ogni fonte di dati e la fonte combinato sono stati presentati per i casi di cancro OP e controlli. (A causa delle dimensioni della sorgente di dati per i controlli, un campione casuale semplice [senza sostituzione] di coloro che non avere il cancro OP è stato utilizzato per selezionare i soggetti per questi istogrammi.) Ulteriori cut-punti sono stati anche esplorati e un receiver operating characteristic ( ROC) curva [13] è stato presentato. Le ulteriori cut-comprendevano la distanza euclidea minima dal punto (0%, 100%) sulla curva ROC (che rappresenta 100% di sensibilità e specificità del 100%), e uno che massimizzato specificità. Le stime di sensibilità e specificità, insieme con il loro corrispondente al 95% intervallo di confidenza [13] sono stati generati per ciascuno di questi punti di taglio.
Convalida l'algoritmo
utilizzando i pesi per ogni codice utilizzato per ricavare l'algoritmo, i punteggi sono stati generato per tutti i reclami Medicare (MedPAR, NCH, e OutSAF) per ciascun soggetto durante le finestre temporali individuali (centrata sulla loro data di diagnosi /pseudo data di diagnosi) nel campione restante 40%, chiamato il campione di convalida. I soggetti che avevano un valore positivo in uno qualsiasi di questi tre punteggi sono stati identificati dall'algoritmo un cancro OP, e quelli con un valore di zero in tutti e tre questi punteggi sono stati identificati come non avere il cancro OP. Per confronto, l'algoritmo è stato anche valutato le ulteriori cut-punti sopra descritti. L'a priori
ipotesi di ricerca è che l'algoritmo derivato avrebbe valori di sensibilità e specificità di almeno 85% e 95% rispettivamente. stime puntuali e gli intervalli di confidenza al 95% per queste sensibilità e specificità [13] sono stati generati.
variazione di sensibilità e specificità da fattori demografici è stata anche valutata. Utilizzando il campione di validazione, incondizionata modelli di regressione logistica [14] predire stato cancro come determinato dall'algoritmo sono stati generati, primo tra quelli con cancro OP (sensibilità) e quindi tra i controlli (per specificità). Backwards eliminazione è stato utilizzato per selezionare il modello utilizzando fascia di età, sesso e razza ed etnia. Tutte le interazioni possibili sono stati autorizzati, e il criterio di selezione è stato impostato su P & lt; 0.1 (test di Wald) di rimanere nel modello. L'a priori
ipotesi di ricerca è che i valori di sensibilità e specificità non varierebbero da sottogruppi demografici. probabilità previste e corrispondenti intervalli di confidenza al 95% sono stati stimati [14]. Modello in forma è stata valutata utilizzando il Hosmer-Lemeshow la bontà di adattamento di prova [14].
Valori predittivi positivi e negativi sono stati anche stimati per l'algoritmo sul campione di convalida. Questi valori rappresentati: la probabilità che un soggetto identificato dall'algoritmo come un caso di cancro OP è, infatti, un caso di cancro OP (valore predittivo positivo); e la probabilità che un soggetto indicato dall'algoritmo come soggetto di controllo veramente non hanno cancro OP (valore predittivo negativo). Poiché i controlli rappresentato soltanto un campione di 5% di quella popolazione, soggetti da questo campione sono stati pesati in un fattore 20 per ottenere una stima appropriata per questi valori. Novanta cinque intervalli di confidenza per cento [13] sono stati stimati per questo campione gonfiati per queste stime.
Questo progetto è stato approvato dal Comitato Università di soggetti Kansas Medical Center umani (HSC # 10914). versioni SAS 9.1, 9.2, e 9.3 (SAS Institute, Cary, NC) sono stati utilizzati per la gestione dei dati e analisi.
risultati
Tra i casi di cancro OP, le distribuzioni di fascia di età, sesso e razza ed etnia sono stati simile tra l'edificio algoritmo e campioni di validazione. Lo stesso valeva per i campioni di controllo pure. Questi risultati sono stati presentati nella Tabella 1 1.Table distribuzioni di frequenza (%) delle caratteristiche dei campioni di costruzione algoritmo e di validazione
Caratteristica
Algoritmo campione costruzione
convalida campione

Pearson'sx 2 test di p-value
casi di cancro OP *
1.085 (100,0)
722 (100,0)

Gruppo d'età
66-69
201 (18,5)
116 (16.1)
0,1370

70-74
271 (25,0)
184 (25.5)
75-79
266 (24.5)
195 (27,0)
80-84
205 (18,9)
114 (15,8)


85 anni e più
142 (13.1)
113 (15.7)
Sesso
Femminile
417 (38,4)
287 (39,8)
0,5738
Maschio
668 (61,6)

435 (60,3)
razza ed etnia
nero
59 (5.4)
43 (6.0)
0,8859
ispanica
17 (1.6)
9 (1.3)
Altro
49 (4.5)
30 (4.2)
Bianco
960 (88,5)
640 ( 88,6)
controlli non-cancro
145.548 (100,0)
97.106 (100,0)
Gruppo d'età
66-69
28.549 (19,6)
19.036 (19,6)
0,2610
70-74
36.729 (25,2)
Il 24.269 (25,0)
75-79
33.361 (22,9)

22.597 (23,3)
80-84
24.635 (16,9)
16.479 (17,0)

85 anni e più
22.274 (15,3)
14.725 (15,2)
Sesso
femminile

89.736 (61,7)
60.050 (61,8)
0,3564
Maschio
55.812 (38,4)
37.056 ( 38.2)
razza ed etnia
nero
10.385 (7.1)

7.148 (7,4)
0,0037
ispanica
3.685 (2,5)
2.279 (2,4)
Altro
8.681 (6,0)
5897 (6.1)
Bianco
122.797 (84,4)
81.782 (84,2)

* OP:. orale e della faringe
algoritmo integrato
i pesi di ciascuno dei codici per generare punteggi complessivi sono stati presentati (vedi file aggiuntivo 1: Appendice tabelle dC). Utilizzando il cut-point di un positivo (gt &; 0) il punteggio, la sensibilità e la specificità erano 93,9% e 96,2%, rispettivamente. Istogrammi delle distribuzioni dei punteggi tra i casi di cancro OP e controlli sono stati presentati in Figura 1. La curva ROC per varie cut-punti del punteggio algoritmo per indicare un caso di cancro OP è stato presentato in figura 2, concentrandosi solo sui valori con alta specificità (& gt; 96%). Questo dato indicato che il valore con la più piccola distanza euclidea dal punto (0%, 100%) sulla curva ROC ha elevata specificità. Questa distanza minima è verificato in cui le pretese Medicare segnare avevano un valore & gt; 5,48, e ha prodotto una sensibilità del 93,8% e una specificità del 97,1%. Usando un approccio più ad hoc della priorità la massimizzazione di specificità (a causa della relativamente rara incidenza del cancro OP), abbiamo scoperto che un cut-punto & gt; 37.43 aveva una sensibilità del 75,0% e una specificità del 99,3%. Questi risultati, insieme con i corrispondenti intervalli di confidenza al 95%, sono stati presentati nella Tabella 2. Figura 1 istogrammi dei punteggi sulla base di Medicare crediti fonte e la loro totale combinato *. * Orale e della faringe (OP) caso di cancro (magenta) e di controllo (blu) realizza; barre verticali di riferimento per: il punteggio di cut-punto iniziale (& gt; 0 che indica l'algoritmo che identifica come un caso di cancro OP) che aveva una sensibilità del 93,9% e una specificità del 96,2%, il punto di taglio minima distanza euclidea (& gt; 5.48) che aveva una sensibilità del 93,8% e una specificità del 97,1%, e per il taglio-punto che massimizzare la specificità (& gt; 37.43). che aveva 75,0% di sensibilità e 99,3% di specificità
Figura 2 receiver operating characteristic curve (ROC) per punteggi basati su Medicare crediti per individuare i casi incidenti di cancro orale e della faringe *. * Le linee di riferimento indicati: per il punteggio di cut-punto iniziale (& gt; 0 che indica l'algoritmo che identifica come un caso di cancro OP) aveva una sensibilità del 93,9% e una specificità del 96,2%; la sensibilità e la specificità per il taglio-punto di distanza euclidea minima (& gt; 5,48) erano 93,8% e 97,1%, rispettivamente; e per il cut-punto che massimizza la specificità (& gt; 37.43), la sensibilità è stata 75,0% e la specificità è stata del 99,3%
Tabella 2 Valori sensibilità e specificità per vari punteggio cut-punti per la costruzione di modelli e campioni di validazione
. Medicare reclami punteggio cut-point
Sensibilità (95% CI) *
specificità (95% CI) *
& gt; 0.00
93,9 (92,5-95,3) /95,3 (93,8-96,8)
96,2 (96,1-96,3) /96,0 (95,9-96,2)
& gt; 5.48
93,8 (92,4-95,3) /95,3 (93,8-96,8)
97,1 (97,0-97,2) /97,0 (96,9-97,1)
& gt; 37.43
75,0 (72,5-77,6) /79,8 (76,9-82,7)
99,3 (99,3-99,3) /99,3 (99,2-99,3)
*%; CI: intervallo di confidenza; valori dei campioni edificio algoritmo /valori dei campioni di validazione.
Validazione dell'algoritmo
I vari punteggi cut-point ha prodotto valori di sensibilità e specificità simili a quella del campione edificio algoritmo. Il punteggio di cut-punto iniziale (& gt; 0 che indica l'algoritmo che identifica come un caso di cancro OP) hanno avuto una sensibilità del 95,3% e una specificità del 96,0%. La sensibilità e la specificità per il taglio-punto di distanza euclidea minima (& gt; 5,48) erano 95,3% e 97,0% rispettivamente. Per il cut-punto che massimizza la specificità (& gt; 37.43), la sensibilità è stata 79,8% e la specificità del 99,3%. Questi risultati, insieme con i corrispondenti intervalli di confidenza 95%, sono stati presentati in Tabella 2.
Il modello per sensibilità indicato che la sensibilità è inferiore per i maschi che per femmine (p = 0,0531). La sensibilità stimata era del 97,2% per le femmine e 94,2% per i maschi. (Dato il numero di parametri in questo modello, il Hosmer-Lemeshow test di bontà di adattamento non poteva essere condotta.) Il modello per la specificità era più complesso. Il modello finale inclusa fascia di età (p & lt; 0,0001), il sesso (p & lt; 0,0001), razza ed etnia (p = 0.0158), e l'età del gruppo-by-gara e l'interazione etnia (p = 0,0072). No fit mancanza-di-significativo è stato rilevato per questo modello (p = 0,5155). Tutti tranne uno gruppo di età-by-sex-by-razza e origine etnica sottogruppo ha avuto un valore stimato di specificità superiori al 95%. Il gruppo con la specificità di sotto di questa soglia era ispanici maschi età di 85 anni e più, e aveva un valore pari a 94,0%. I valori di sensibilità e specificità stima e corrispondenti al 95% intervallo di confidenza da questi modelli sono stati presentati nella tabella 3. In particolare, mentre sono state rilevate variazioni statisticamente significative, i valori di sensibilità e specificità sono risultate simili tra groups.Table 3 rettificato i valori di sensibilità e specificità per il minimo euclidea distanza punto di cut per i campioni di validazione
Sensibilità (95% intervallo di confidenza)
femmine (indipendentemente dalla fascia di età e razza ed etnia)
97,2 (94,5-98,6)
Maschi (indipendentemente dalla fascia di età e razza ed etnia)
94,0 (91,4-95,9)
specificità (95% intervallo di confidenza)

età 66-69
femminile
nero
97,3 (96,4-97,9)
ispanica
98,0 (96,1-99,0)
Altro
98,2 (97,3-98,7)
Bianco
97,6 (97,4 -97,8)
Maschio
nero
96,4 (95,3-97,2)
ispanica
97.4 ( 94,9-98,7)
Altro
97,5 (96,4-98,3)
Bianco
96,8 (96,5-97,2)

età 70-74
femminile
nero
97,6 (96,8-98,2)
ispanica
98,3 (97,2-99,0)
Altro
98,2 (97,5-98,8)
Bianco
97,1 (96,9