L 14 Elementi di analisi della sopravvivenza

Università del Piemonte Orientale
Statistica Medica
Analisi di sopravvivenza
Leucemie linfatiche acute infantili per periodo di protocollo
(1979-98)
CUMULATIVE SURVIVAL; by regimen
1.00
01.05.1995-31.12.1998
01.03.1987-28.02.1991
01.03.1991-30.04.1995
0.75
CS
01.08.1982-28.02.1987
0.50
01.03.1979-31.07.1982
0.25
0.00
0
10
years from diagnosis
LR test; pvalue<0.0001
20
CUMULATIVE SURVIVAL; by WBC
1.00
<=9999.103/ll
0.75
CS
10 000- 49 999.103/ll
>=50 000 .103/l
0.50
Missing
0.25
0.00
0
10
years from diagnosis
Trend test; pvalue<0.001
20
CUMULATIVE SURVIVAL; by immunophenotype
1.00
B type
non T; non B
0.75
CS
T type
0.50
Not spec.
0.25
0.00
0
10
years from diagnosis
20
Che cos’è l’analisi di sopravvivenza?
Insieme di metodi statistici per l’analisi della distribuzione del
tempo di comparsa di un evento.
Quali sono le caratteristiche peculiari dell’analisi di
sopravvivenza?
Dati non normalmente distribuiti;
Soggetti con tempi di sopravvivenza non noto (osservazioni
troncate o censored).
Quali sono i dati di sopravvivenza?
Evento di interesse (morte; ricaduta; risposta ad un
trattamento).
Tempo tra l’ingresso nello studio e l’evento di
interesse (Tempo o Durata di Sopravvivenza).
Covariate, ad es. Caratteristiche del paziente quali
età; sesso; ecc.
Tempo o Durata di Sopravvivenza:
Tempo tra l’ingresso nello studio e l’evento di
interesse
Il primo passo di un ‘analisi di sopravvivenza è il
calcolo del tempo di sopravvivenza; in base alla
differenza tra momento dell’evento e momento
dell’ingresso nello studio
Inizio studio
Fine studio
Data di ingresso nello studio
Data di ingresso nello studio
Data dell’evento
Data dell’ultima
osservazione (vivo
alla fine dello studio)
Data dell’ultima
osservazione
(perso)
Esistono nello studio soggetti con tempi di
sopravvivenza non noto (osservazioni troncate o
censored).
Sono i soggetti che non hanno avuto l’evento di
interesse durante il periodo di osservazione (followup).
Per questi soggetti il tempo di sopravvivenza non è
noto ma sappiamo che sarà >= al tempo di followup.
dati riferiti a soggetti con tempi di sopravvivenza non noti
(osservazioni troncate o censored).
Troncato
Deceduto
Stato
Frequenza
1135
72
Esistono altre situazioni che portano a dati troncati:
Il paziente ha avuto un evento differente da quello di
interesse che ha reso impossibile un ulteriore follow-up (ad
es. si è verificato un incidente oppure è morto per un’altra
causa)
Il paziente è perso al follow-up durante il periodo di studio
(es. non si presenta ai controlli programmati oppure è
emigrato all’estero).
Il paziente non ha avuto l’evento di interesse al
tempo di chiusura dello studio.
Una proporzione molto alta di pazienti in questa
condizione può indicare che lo studio deve
proseguire con una durata di osservazione
maggiore.
Può anche indicare un ottimo risultato della
terapia.
CUMULATIVE SURVIVAL; by sex
1.00
female
CS
0.75
male
0.50
0.25
0.00
0
ƒAd
10
years from diagnosis
esempio in questo studio; con f.u. fino a 20 anni;
ƒla proporzione di vivi (guariti?) è molto alta
20
In questo caso invece il tempo di osservazione (intorno
a 2 anni) potrebbe essere ancora limitato
Il paziente è perso al follow-up
I pazienti persi al follow-up potrebbero aver avuto
l’evento di interesse dopo che li abbiamo persi di
vista.
Una proporzione alta di soggetti in questa
condizione indica scarsa qualità dello studio.
I tempi di sopravvivenza non sono normalmente
distribuiti
I tempi di sopravvivenza non sono normalmente distribuiti
100
80
60
40
20
Dev. Stand = 29,64
Media = 47,0
N = 1207,00
0
0
5,
13 ,0
5
12 ,0
5
11 ,0
5
10 0
,
95 0
,
85 0
,
75 0
,
65 0
,
55 0
,
45 0
,
35 0
,
25 0
,
15
0
5,
Tempo (mesi)
•
Distribuzione di frequenza di tempi di sopravvivenza
Funzioni di sopravvivenza
I tempi di sopravvivenza sono dati con variazioni casuali; e
formano dunque una distribuzione. La distribuzione dei
tempi di sopravvivenza è descritta da tre funzioni dette
Funzioni di sopravvivenza:
Funzione di sopravvivenza
f(t)
Funzione Cumulativa di Sopravvivenza
S(t)
Funzione di Rischio (Hazard)
λ(t)
Funzione Cumulativa di Sopravvivenza S(t)
S(t) = P (un individuo viva più a lungo di t)
= P (T>t)
=1 – P (di morte prima del tempo t)
1.
S(t) è una funzione sempre positiva:
S(t) = 1 per t = 0
= 0 per t = ∞
La stima delle Funzioni di sopravvivenza può
essere effettuata utilizzando sia metodi parametrici
che non-parametrici.
Se non è nota a priori la distribuzione teorica dei
tempi di sopravvivenza si ricorre ad un metodo
non-parametrico.
Anche quando è nota la distribuzione teorica il
metodo non-parametrico fornisce comunque un
valido aiuto nella scelta del modello di
distribuzione.
Analisi di Sopravvivenza
Stima
Metodi non parametrici:
- Kaplan-Meier
- Life Tables
Comparazione
Metodi non parametrici :
- Logrank Test
Metodo di Kaplan-Meier
Si supponga di avere k pazienti che hanno l’evento di interesse
nel periodo di follow-up ai tempi distinti t1<t2<…<ti-1<ti <…<tk
Poiché gli eventi sono tra loro indipendenti; la probabilità
cumulata di sopravvivenza al tempo ti può essere ottenuta
moltiplicando la probabilità di superare il tempo ti
per
la probabilità di aver superato i tempi precedenti [da t1 a ti-1 ]
 di 
Si = Si −1 1 − 
 ni 
Si sopravvivenza cumulativa al tempo ti
di numero di eventi al tempo ti (di regola deve essere 1 o 0)
ni numero di soggetti esposti a rischio al tempo ti
Metodo di Kaplan-Meier
Subject i
Time ti
∆i
1
2
3
4
5
5
6
8
3
9
1
0
1
1
0
∆i = 1 se il soggetto ha avuto l’evento
= 0 altrimenti
Ordino i soggetti per tempo di osservazione
Soggetto i
4
1
2
3
5
Tempo ti
3
5
6
8
9
di = numero di eventi al tempo t i
di
1
1
0
1
0
ti
0
3
5
6
8
9
ni
5
5
4
3
2
1
di
0
1
1
0
1
0
S(t)
5/5=1.0
1.0×[(5-1)/5]=0.8
0.8 × [(4-1)/4]=0.6
0.6 × [(3-0)/3]=0.6
0.6 × [(2-1)/2]=0.3
0.3×[(1-0)/1]=0.3
S(t) è costante nell’intervallo temporale tra due
eventi.
S(t) è dunque una funzione a gradino che cambia
valore soltanto ogni volta si verifichi un evento.
Metodo di Kaplan-Meier
ƒIndica
i soggetti usciti vivi
Funzione di sopravvivenza
1,2
1,0
sopravvivenza cumulata
,8
,6
,4
Funz ione di s oprav v i
v enz a
Tronc ata
,2
2
3
4
TEMPO
5
6
7
8
9
10
Logrank test
Ipotesi nulla : che tra i gruppi non vi sia differenza nella
sopravvivenza
Se vale l’ipotesi nulla gli eventi osservati in ciascun intervallo
di tempo sono distribuiti tra i diversi gruppi proporzionalmente
al numero di soggetti a rischio.
Logrank test
Ad ogni intervallo, il test calcola per ciascun gruppo i il
numero di eventi attesi ej e di eventi osservati oi
Viene sommato per ciascun gruppo il totale degli eventi attesi
(Ej) ed osservati (Oj)
Il numero totale di eventi attesi Ei viene paragonato al numero
totale di eventi osservati Ei
n
(Oi − Ei )
i =1
Ei
LogRank = ∑
2
Il risultato segue una distribuzione χ2 con gl= numero di gruppi-1
Trattamento
A
Ti
N(a)i
0
1
2
3
4
5
6
7
8
9
Totali
B
D(a)i
5
5
5
5
4
4
3
2
2
1
Totale in
Totale
osservazione eventi
N(b)i
0
0
0
1
0
1
0
0
1
0
3
D(b)i
6
6
5
4
3
3
3
2
1
1
Ni
0
1
1
1
0
0
1
1
0
0
5
Attesi
e(a)
Di
e(b)
11
0
0
11
1 0,454545 0,545455
10
1
0,5
0
0,5
9
2 1,111111 0,888889
7
0
7
1 0,571429 0,428571
6
1
0,5
0,5
4
1
0,5
0,5
3
1 0,666667 0,333333
2
0
0
0
0
0
4,303752 3,696248
X^2 = (3-4,304)^2/4,304 + (5-3,696)^2/3,696 =
=0,39495 + 0,459863 = 0,854814
CUMULATIVE SURVIVAL; by regimen
1.00
01.05.1995-31.12.1998
01.03.1987-28.02.1991
01.03.1991-30.04.1995
0.75
CS
01.08.1982-28.02.1987
0.50
01.03.1979-31.07.1982
0.25
0.00
0
10
years from diagnosis
LR test; pvalue<0.0001
Trend test; pvalue<0.0001
20
CUMULATIVE SURVIVAL; by sex
1.00
female
CS
0.75
male
0.50
0.25
0.00
0
10
years from diagnosis
LR test; pvalue=0.1312
20
CUMULATIVE SURVIVAL; by age at diagnosis
1.00
1-9 y
0.75
CS
10-14 y
0.50
0y
0.25
0.00
0
LR test; pvalue=0.0241
10
years from diagnosis
20
CUMULATIVE SURVIVAL; by WBC
1.00
<=9999.103/ll
0.75
CS
10 000- 49 999.103/ll
>=50 000 .103/l
0.50
Missing
0.25
0.00
0
10
years from diagnosis
LR test; pvalue=0.0004
Trend test; pvalue<0.001
20
CUMULATIVE SURVIVAL; by immunophenotype
1.00
B type
non T; non B
0.75
CS
T type
0.50
Not spec.
0.25
0.00
0
10
years from diagnosis
LR test; pvalue=0.0002
20
Altri indicatori comunemente usati: