Università del Piemonte Orientale Statistica Medica Analisi di sopravvivenza Leucemie linfatiche acute infantili per periodo di protocollo (1979-98) CUMULATIVE SURVIVAL; by regimen 1.00 01.05.1995-31.12.1998 01.03.1987-28.02.1991 01.03.1991-30.04.1995 0.75 CS 01.08.1982-28.02.1987 0.50 01.03.1979-31.07.1982 0.25 0.00 0 10 years from diagnosis LR test; pvalue<0.0001 20 CUMULATIVE SURVIVAL; by WBC 1.00 <=9999.103/ll 0.75 CS 10 000- 49 999.103/ll >=50 000 .103/l 0.50 Missing 0.25 0.00 0 10 years from diagnosis Trend test; pvalue<0.001 20 CUMULATIVE SURVIVAL; by immunophenotype 1.00 B type non T; non B 0.75 CS T type 0.50 Not spec. 0.25 0.00 0 10 years from diagnosis 20 Che cos’è l’analisi di sopravvivenza? Insieme di metodi statistici per l’analisi della distribuzione del tempo di comparsa di un evento. Quali sono le caratteristiche peculiari dell’analisi di sopravvivenza? Dati non normalmente distribuiti; Soggetti con tempi di sopravvivenza non noto (osservazioni troncate o censored). Quali sono i dati di sopravvivenza? Evento di interesse (morte; ricaduta; risposta ad un trattamento). Tempo tra l’ingresso nello studio e l’evento di interesse (Tempo o Durata di Sopravvivenza). Covariate, ad es. Caratteristiche del paziente quali età; sesso; ecc. Tempo o Durata di Sopravvivenza: Tempo tra l’ingresso nello studio e l’evento di interesse Il primo passo di un ‘analisi di sopravvivenza è il calcolo del tempo di sopravvivenza; in base alla differenza tra momento dell’evento e momento dell’ingresso nello studio Inizio studio Fine studio Data di ingresso nello studio Data di ingresso nello studio Data dell’evento Data dell’ultima osservazione (vivo alla fine dello studio) Data dell’ultima osservazione (perso) Esistono nello studio soggetti con tempi di sopravvivenza non noto (osservazioni troncate o censored). Sono i soggetti che non hanno avuto l’evento di interesse durante il periodo di osservazione (followup). Per questi soggetti il tempo di sopravvivenza non è noto ma sappiamo che sarà >= al tempo di followup. dati riferiti a soggetti con tempi di sopravvivenza non noti (osservazioni troncate o censored). Troncato Deceduto Stato Frequenza 1135 72 Esistono altre situazioni che portano a dati troncati: Il paziente ha avuto un evento differente da quello di interesse che ha reso impossibile un ulteriore follow-up (ad es. si è verificato un incidente oppure è morto per un’altra causa) Il paziente è perso al follow-up durante il periodo di studio (es. non si presenta ai controlli programmati oppure è emigrato all’estero). Il paziente non ha avuto l’evento di interesse al tempo di chiusura dello studio. Una proporzione molto alta di pazienti in questa condizione può indicare che lo studio deve proseguire con una durata di osservazione maggiore. Può anche indicare un ottimo risultato della terapia. CUMULATIVE SURVIVAL; by sex 1.00 female CS 0.75 male 0.50 0.25 0.00 0 Ad 10 years from diagnosis esempio in questo studio; con f.u. fino a 20 anni; la proporzione di vivi (guariti?) è molto alta 20 In questo caso invece il tempo di osservazione (intorno a 2 anni) potrebbe essere ancora limitato Il paziente è perso al follow-up I pazienti persi al follow-up potrebbero aver avuto l’evento di interesse dopo che li abbiamo persi di vista. Una proporzione alta di soggetti in questa condizione indica scarsa qualità dello studio. I tempi di sopravvivenza non sono normalmente distribuiti I tempi di sopravvivenza non sono normalmente distribuiti 100 80 60 40 20 Dev. Stand = 29,64 Media = 47,0 N = 1207,00 0 0 5, 13 ,0 5 12 ,0 5 11 ,0 5 10 0 , 95 0 , 85 0 , 75 0 , 65 0 , 55 0 , 45 0 , 35 0 , 25 0 , 15 0 5, Tempo (mesi) • Distribuzione di frequenza di tempi di sopravvivenza Funzioni di sopravvivenza I tempi di sopravvivenza sono dati con variazioni casuali; e formano dunque una distribuzione. La distribuzione dei tempi di sopravvivenza è descritta da tre funzioni dette Funzioni di sopravvivenza: Funzione di sopravvivenza f(t) Funzione Cumulativa di Sopravvivenza S(t) Funzione di Rischio (Hazard) λ(t) Funzione Cumulativa di Sopravvivenza S(t) S(t) = P (un individuo viva più a lungo di t) = P (T>t) =1 – P (di morte prima del tempo t) 1. S(t) è una funzione sempre positiva: S(t) = 1 per t = 0 = 0 per t = ∞ La stima delle Funzioni di sopravvivenza può essere effettuata utilizzando sia metodi parametrici che non-parametrici. Se non è nota a priori la distribuzione teorica dei tempi di sopravvivenza si ricorre ad un metodo non-parametrico. Anche quando è nota la distribuzione teorica il metodo non-parametrico fornisce comunque un valido aiuto nella scelta del modello di distribuzione. Analisi di Sopravvivenza Stima Metodi non parametrici: - Kaplan-Meier - Life Tables Comparazione Metodi non parametrici : - Logrank Test Metodo di Kaplan-Meier Si supponga di avere k pazienti che hanno l’evento di interesse nel periodo di follow-up ai tempi distinti t1<t2<…<ti-1<ti <…<tk Poiché gli eventi sono tra loro indipendenti; la probabilità cumulata di sopravvivenza al tempo ti può essere ottenuta moltiplicando la probabilità di superare il tempo ti per la probabilità di aver superato i tempi precedenti [da t1 a ti-1 ] di Si = Si −1 1 − ni Si sopravvivenza cumulativa al tempo ti di numero di eventi al tempo ti (di regola deve essere 1 o 0) ni numero di soggetti esposti a rischio al tempo ti Metodo di Kaplan-Meier Subject i Time ti ∆i 1 2 3 4 5 5 6 8 3 9 1 0 1 1 0 ∆i = 1 se il soggetto ha avuto l’evento = 0 altrimenti Ordino i soggetti per tempo di osservazione Soggetto i 4 1 2 3 5 Tempo ti 3 5 6 8 9 di = numero di eventi al tempo t i di 1 1 0 1 0 ti 0 3 5 6 8 9 ni 5 5 4 3 2 1 di 0 1 1 0 1 0 S(t) 5/5=1.0 1.0×[(5-1)/5]=0.8 0.8 × [(4-1)/4]=0.6 0.6 × [(3-0)/3]=0.6 0.6 × [(2-1)/2]=0.3 0.3×[(1-0)/1]=0.3 S(t) è costante nell’intervallo temporale tra due eventi. S(t) è dunque una funzione a gradino che cambia valore soltanto ogni volta si verifichi un evento. Metodo di Kaplan-Meier Indica i soggetti usciti vivi Funzione di sopravvivenza 1,2 1,0 sopravvivenza cumulata ,8 ,6 ,4 Funz ione di s oprav v i v enz a Tronc ata ,2 2 3 4 TEMPO 5 6 7 8 9 10 Logrank test Ipotesi nulla : che tra i gruppi non vi sia differenza nella sopravvivenza Se vale l’ipotesi nulla gli eventi osservati in ciascun intervallo di tempo sono distribuiti tra i diversi gruppi proporzionalmente al numero di soggetti a rischio. Logrank test Ad ogni intervallo, il test calcola per ciascun gruppo i il numero di eventi attesi ej e di eventi osservati oi Viene sommato per ciascun gruppo il totale degli eventi attesi (Ej) ed osservati (Oj) Il numero totale di eventi attesi Ei viene paragonato al numero totale di eventi osservati Ei n (Oi − Ei ) i =1 Ei LogRank = ∑ 2 Il risultato segue una distribuzione χ2 con gl= numero di gruppi-1 Trattamento A Ti N(a)i 0 1 2 3 4 5 6 7 8 9 Totali B D(a)i 5 5 5 5 4 4 3 2 2 1 Totale in Totale osservazione eventi N(b)i 0 0 0 1 0 1 0 0 1 0 3 D(b)i 6 6 5 4 3 3 3 2 1 1 Ni 0 1 1 1 0 0 1 1 0 0 5 Attesi e(a) Di e(b) 11 0 0 11 1 0,454545 0,545455 10 1 0,5 0 0,5 9 2 1,111111 0,888889 7 0 7 1 0,571429 0,428571 6 1 0,5 0,5 4 1 0,5 0,5 3 1 0,666667 0,333333 2 0 0 0 0 0 4,303752 3,696248 X^2 = (3-4,304)^2/4,304 + (5-3,696)^2/3,696 = =0,39495 + 0,459863 = 0,854814 CUMULATIVE SURVIVAL; by regimen 1.00 01.05.1995-31.12.1998 01.03.1987-28.02.1991 01.03.1991-30.04.1995 0.75 CS 01.08.1982-28.02.1987 0.50 01.03.1979-31.07.1982 0.25 0.00 0 10 years from diagnosis LR test; pvalue<0.0001 Trend test; pvalue<0.0001 20 CUMULATIVE SURVIVAL; by sex 1.00 female CS 0.75 male 0.50 0.25 0.00 0 10 years from diagnosis LR test; pvalue=0.1312 20 CUMULATIVE SURVIVAL; by age at diagnosis 1.00 1-9 y 0.75 CS 10-14 y 0.50 0y 0.25 0.00 0 LR test; pvalue=0.0241 10 years from diagnosis 20 CUMULATIVE SURVIVAL; by WBC 1.00 <=9999.103/ll 0.75 CS 10 000- 49 999.103/ll >=50 000 .103/l 0.50 Missing 0.25 0.00 0 10 years from diagnosis LR test; pvalue=0.0004 Trend test; pvalue<0.001 20 CUMULATIVE SURVIVAL; by immunophenotype 1.00 B type non T; non B 0.75 CS T type 0.50 Not spec. 0.25 0.00 0 10 years from diagnosis LR test; pvalue=0.0002 20 Altri indicatori comunemente usati: