1 Statistica Medica 2 Sequenza della ricerca clinica Tipo di trial

Sequenza della ricerca clinica
Definire l’obiettivo
della ricerca:
formulare l’ipotesi
Università degli Studi di Pavia
Department of Brain and Behavioural Sciences
Medical and Genomic Statistics Unit
Via Bassi 21- 27100 PAVIA-I
Disegnare la ricerca:
redigere protocollo
Statistica Medica 2
Eseguire la ricerca:
organizzazione e
raccolta dati
Analisi statistica :
P-value e 95%CI
modelli regressione
Mario Grassi
Università di Pavia
[email protected]
1
Formulare conclusioni:
pubblicazione risultati
2
Tipo di trial (scopo)
Trial di intervento
•Trial d’intervento: azione sui fattori di
rischio dei soggetti con “alta probabilità”
di ammalarsi (prevenzione secondaria)
Community trial
Trial preventivo
•Trial preventivi: azione sui fattori
ambientali o comunque esterni
(inquinanti, germi, tec.) per impedire che
i soggetti si ammalino
Trial di efficacia
N>S
•Trial terapeutici (clinici): procedura
terapeutica (farmaco, intervento
chirurgico ecc.) per alleviare i sintomi e
migliorare la sopravvivenza
Clinical trial
Trial di equivalenza
N=S o NS
3
4
1
Disegno a gruppi paralleli
Tipo di trial (disegno)
Hanno lo scopo di studiare l’efficacia di un
trattamento (un farmaco, un procedura
chirurgica, ecc.) su un campione di soggetti
affetti da una determinata patologia dopo un
assegnazione casuale (randomizzazione) a
due o più gruppi di trattamento:
2 o più gruppi paralleli
1 gruppo appaiato (disegno pre-post)
2 gruppi incrociati (disegno cross-over)
2x2 gruppi paralleli (disegno fattoriale)
Trattamento (S)
esito (y0)
Trattamento (N)
esito (y1)
n
5
6
Esempio 1
Esempio 2
Tabella 2x2 di un trial clinico sull’efficacia
(+=successo;  = insuccesso: mortalità entro
90g) di una nuova procedura farmacologica
(metoprolol) rispetto alla procedura standard in
pazienti con infarto acuto del miocardio
(Hjalmarson et al. Lancet 1981, ??: 823-827):
Tabella 2x2 di un trial clinico sull’efficacia
(=riduzione dal basale del numero/die di sigarette
dopo 6 settimane) di un inalatore orale (10 mg
nicotine +1 mg menthol) rispetto al placebo in
soggetti volontari fumatori (Bolliger et al. BMJ
2000; 321:329–33). N.B basale= 30 sigarette/die:
Trattamento
Trattamento
Esito
Nuovo
Standard
Totale
Esito

40=a
62=b
102=m1
media
+
658=c
635= d
1293=m0
Totale
698=n1
687=n0
1395=n
7
Attivo
Placebo
A+P
 15.6  y1
 13.4  y0
 14.5  y
varianza
2.7 2  s12
2.2 2  s02
2.52  s 2p
n
117=n1
104=n0
221
8
2
Disegno appaiato
Esempio 3
Tabella 2x2 di un trial clinico sull’efficacia
(+=successo;  =insuccesso) di due analgesici:
un gruppo di pazienti con sintomi da "dolore“
persistente vengono trattati inizialmente con il
farmaco A; finito l'effetto farmacologico, dopo
un certo periodo di tempo, sono trattati con B:
Hanno lo scopo di studiare l’efficacia di un
trattamento (un farmaco, una procedura
chirurgica, ecc.) su un campione di soggetti
affetti da una determinata patologia valutati
in tempi sucessivi:
Prima (S)
Prima (S)
esito (y0)
Dopo (N)

+
Totale

12=e
7=f
19=m1
+
5=g
16=h
21=m0
17=n1
23=n0
40=n
n
Dopo (N)
esito (y1)
Totale
9
10
Esempio 4
Disegno cross-over
Tabella 2x2 di un trial clinico sull’efficacia
(differenza medie fra tempi del numero di
piastrine×10000/mm3 nel sangue dell'aorta) del
farmaco attivo (dipridamolo) rispetto al placebo
in un gruppo di pazienti con almeno il 50% di
occlusione di una o più arterie coronariche
(Metha et al. Am. J. Card. 1981; 47: 1111-4)
Hanno lo scopo di studiare l’efficacia di un
trattamento (un farmaco, una procedura
chirurgica, ecc.) su un campione di soggetti
affetti da una determinata patologia valutati
dopo una assegnazione casuale (randomizzazione) a due o più sequenze di trattamento:
Trattamento
Esito
Dopo(N)
Prima(S)
29.4  y 0
 1.7  d
varianza 9.36 2  s12
8.09 2  s02
2.412  sd2
n
10
10
10
esito (y10)
Dopo (B)
esito (y11)
Prima (B)
esito (y20)
Dopo (A)
esito (y21)
AB
N-S
30.1  y1
media
Prima (A)
11
n
BA
12
3
Esempio 5a
Esempio 5
Tabella 2x2 di un trial clinico sulla scelta del
placebo nell’agopuntura (+=uguale sensazione
di puntura;  =non uguale): un gruppo AB di
pazienti con protesi al ginocchio vengono
sottoposti per 2 settimane ad agopuntura
inizialmente con l’ago di ‘Streitberger’
(nuovo=A) e le successive 2 settimane con un
ago convenzionale (placebo=B); e viceversa
per il gruppo BA (White et al. Pain 2003;106;
401–409):
Gruppo 1= ordine dei trattamenti AB:
Prima (A)
+
Totale


e1
f1
m11
+
g1
h1
m01
Totale
n11
n01
n1
Dopo (B)
A
B

Prima (A)
+
Totale

20
3
23
+
6
8
14
Totale
26
11
37
Dopo (B)

+
Totale

9
1
10
+
5
3
8
Totale
14
4
18
13
14
Esempio 6
Esempio 5b
Tabella 2x2 di un trial clinico sull’efficacia
(=differenza media del picco di flusso espiratorio
massimo, PFE) di inalatori (A o B) di steroidi per
il trattamento dell’asma dopo assegnazione
casuale della sequenza A nel primo mese e B nel
secondo mese, o B nel primo mese e A nel
secondo mese (Pocock SJ, 1983: p118):
Gruppo 2= ordine dei trattamenti BA:
Prima (B)
Dopo (A)

+
Totale

e2
f2
m12
+
g2
h2
m02
Totale
n12
n02
n2
periodo
Prima (B)
gruppo
Dopo (A)

+
Totale

11
1
12
+
2
5
7
Totale
13
6
19
1=1m
2=2m
1  AB 310.1  y11 343.1  y12
2  BA 335.8  y 21 339.7  y 22
15
n
n1  14
n2  13
16
4
Disegno fattoriale
Esempio 7
Hanno lo scopo di studiare l’efficacia e
l’interazione di due o più trattamenti (un
farmaco, una procedura chirurgica, ecc.) su un
campione di soggetti affetti da una determinata
patologia dopo un assegnazione casuale
(randomizzazione) alla combinazione di due o
più gruppi di trattamento:
A+B+
esito (y11)
A+B-
esito (y10)
esito (y01)
esito
n
A-B+
A-B-
Tabella 4x2 di un trial clinico sulla efficacia
(+/ = no/si mortalità a 6 mesi), indipendente
o insieme, di 300 mg/die di aspirina per
10die (A) e 1-ora di infusione intravenosa
1.5 MU di streptochinasi (B) in un gruppo di
pazienti con un ictus ischemico randomizzati
in 4 gruppi paralleli (MUST-I. Lancet 1995;
346: 1509-1514

+
A+ B+
68=a
88=b
156=n1
A+ B-
30=c
123=d
153=n2
A- B+
44=e
113=f
157=n3
A- B-
45=g
111=h
156=n4
187=m1
437=m0
622=n
totale
esito (y00)
totale
17
18
Esempio 8
Riepilogo
Tabella 4x2 di un trial clinico sulla efficacia
(=riduzione di marker biochimici alla fine del
trial), indipendente o insieme, di un maggiore
supplemento di vitamina B-6 (A) e acidi grassi
omega 3 (B) per circa 5 anni, in un gruppo di
pazienti con una storia di malattia
cardiovascolare randomizzati in 4 gruppi
paralleli (Galan et al. BMJ 2010; 341: c6273)
esito (folati, ng/ml)
media
dev.std
A+ B+
16.1
4.2
630=n1
A+ B-
15.4
5.0
633=n2
A- B+
6.4
3.5
622=n3
A- B-
6.5
2.9
626=n4
• Disegno 2 gruppi paralleli:
R1  R0 
62 40

 3.3%
687 698
P  ???
y1  y 0  13.4  ( 15.6)  2.2u
P  ???
• Disegno appaiato:
f  g 75

 5%
n
40
P  ???
y1  y 0  29.4  30.1  0.7u
P  ???
• Disegno cross-over:
f  g 36

 8 %
n
37
19
1
[( y11  y 22 )  ( y12  y 21 )]  14.6u
2
P  ???
P  ???
20
5
Riepilogo
Disegno a gruppi paralleli
• Disegno 2x2 fattoriale:
SEMPLICE E ADATTO A:
• gran parte degli studi
• patologie acute
• studi di lunga durata
R   43.6% 43.6  28.8  15.4%
R   19.6% 19.6  28.8  9.2%
R   28.0% 28.0  28.8  0.8%
R   28.8%
CONSENTE DI:
• reclutare i pazienti “nel tempo”
• ovviare a dati mancanti
• utilizzare il placebo
• evitare il “wash-out”
• applicare il disegno fattoriale
0%
I  15.4  [( 9.3)  ( 0.8)]  25.5%
y    16.1u 16.1  6.5  9.6u
y    15.4u 15.4  6.5  8.9u
y    6.4u 6.6  6.5  0.1u
y 
6.5u
LIMITI
• poco adatto a malattie rare
• necessita di molti pazienti
• “bias” di selezione (stratificazione)
• elevata variabilità “entro pazienti/centri”
0u
I  9.6  [8.9  ( 0.1)]  0.8u
21
Disegno a gruppi paralleli
22
Disegno cross-over
SEMPLICE E ADATTO A:
• gran parte degli studi
• patologie acute
• studi di lunga durata
IDEALE PER:
• situazione clinica stabile
• studi di breve durata
• studi di risposte a terapie brevi (miglioramento
a breve termine di segni o sintomi)
• malattia rara e effetto farmacologico breve
CONSENTE DI:
• reclutare i pazienti “nel tempo”
• ovviare a dati mancanti
• utilizzare il placebo
• evitare il “wash-out”
• applicare il disegno fattoriale
LIMITI:
• drop-out e dati mancanti (collaborazione
pazienti deve essere “buona”)
• malattia NON IDONEA (malattia non a breve
termine)
• “CARRY OVER” e “WASH OUT ”
LIMITI
• poco adatto a malattie rare
• necessita di molti pazienti
• “bias” di selezione (stratificazione)
• elevata variabilità “entro pazienti/centri”
DIFFICILE DA ORGANIZZARE, MA
NECESSITA POCHI PAZIENTI (metà!) e
RIDUCE AL MASSIMO LA VARIABILITA’
(confronti fra trattamenti più precisi)
23
24
6
Disegno fattoriale
Cross-over a più gruppi
Randomizzazione “stratificata” (pilotata)
che crea più gruppi paralleli di uguale
dimensione (n), esattamente bilanciati per
diversi fattori che CONSENTE DI:
Disegno a quadrato latino (disegno di Williams):
• valutare contemporaneamente terapie
concomitanti, diversi indirizzi prognostici
• stabilire l’efficacia di più trattamenti con
una minore numerosità campionaria
• evidenziare il fenomeno di interazione fra
trattamenti
Il disegno garantisce che:
1) ogni soggetto riceva tutti e 4 i trattamenti
2) ogni trattamento ricorra una volta in ogni
periodo
3) ogni coppia di trattamenti (per esempio A
seguito da C) ricorra una sola volta
• analizzare sottogruppi di pazienti
LIMITI: difficile da eseguire e analizzare
25
26
Fasi temporali di sviluppo di un
intervento/farmaco (I, IIa,IIb)
2x2x2= 8 gruppi
Fase I: primi studi su un nuovo principio
attivo condotti nell’uomo, spesso su
volontari sani (20-80 casi) per:
• Valutazione preliminare della sicurezza
• Stabilire un dosaggio accettabile e
efficace
Fase II (a,b): studi terapeutici pilota
effettuati su un numero limitato di pazienti
volontari (100-200 casi) per:
• Dimostrare l’efficacia terapeutica
• Valutare la sicurezza a breve termine
• Identificare modalità di somministrazione
27
• Identificare rapporto dose/risposta
28
7
Fasi temporali di sviluppo di un
intervento/farmaco (IIIa, IIIb)
Fasi temporali di sviluppo di un
intervento/farmaco (IV)
Fase III (a, b): studi su pazienti più
numerosi (500-1000+ casi) e possibilmente
diversificati, generalmente randomizzati e in
doppio cieco (randomized clinical trial: RCT)
per:
Fase IV: estesi studi condotti dopo la
commercializzazione del prodotto, sulla
base delle indicazioni del farmaco per
studi di:
• Farmacovigilanza
•Paragonare l’efficacia del nuovo
• Valutazione del valore terapeutico su
trattamento ai trattamenti usuali e/o al
popolazioni spesso non incluse negli
placebo
studi di fase III
•Valutare gli effetti collaterali a breve e
medio/lungo termine
Se si verifica una valutazione di nuove
Le condizioni dello studio dovrebbero
indicazioni (effetti collaterali e eventi
essere il più vicino possibile alle normali
avversi) ritorno alla fase III
condizioni d’uso del farmaco
29
Limiti degli studi registrativi
30
Randomized clinical trial
• L’immissione sul mercato di un nuovo
farmaco non rappresenta la fine della
ricerca clinica
• Spesso, per problemi di tempo e costi,
i risultati ottenuti dagli studi registrativi
(fasi 1 - 3a) sono solo sufficienti ad
ottenere la registrazione del prodotto
• Successivamente, si riscontrano
incompletezze della ricerca di tipo:
 Clinico/farmacologico
 Metodologico/statistico
31
32
8
RCT
Scambiabilità
• Lo studio clinico randomizzato
(“randomized clinical trial”:RCT)
è stato indicato come il
paradigma di riferimento per la
conduzione di studi medici e
epidemiologici osservazionali
(bisogna porsi in condizioni
“sperimentali” per il controllo
delle variabili in studio), perché:
• Se la sperimentazione clinica è
ben condotta, è valido:
• l’assunto di “scambiabilità”=
l’effetto del trattamento (N-S)
rimane lo stesso se per
ipotesi controfattuale ai
soggetti con il trattamento S
fosse somministrato il
trattamento N e viceversa !
• l’associazione esito-trattamento
eventualmente individuata non è
in generale spuria, ovvero non è
soggetta a “bias” sistematici=
vale l’assunto di “scambiabilità”
33
Bias sistematici
34
Come fare?
Si eliminano differenze sistematiche tra
gruppi di trattamento. Per esempio:
• bias legato ad altri fattori, a parte il
trattamento, che possono variare nel
tempo
È necessario limitare i fattori di
disturbo
• Legati al paziente
• Legati allo sperimentatore
Mezzi a disposizione:
• bias legato all’assegnazione del
trattamento fatta dal medico, dal
paziente o per centro/ricercatore
• Randomizzazione
• Uso di un gruppo di controllo
(placebo/trattamento standard)
• Uso del cieco
(semplice/doppio/triplo)
• bias legato a differenze nelle
caratteristiche cliniche e demografiche
nei gruppi di trattamento a confronto
35
36
9
R+P+C
Randomizzazione
• “randomizzazione” (randomization)
• “placebo” (placebo)
• “cecità” (blinding)
• Processo che permette di allocare
casualmente in 2 (o più gruppi) il
soggetto (paziente) elegibile
• Se la randomizzazione è corretta, e
la numerosità sufficiente, i 2 gruppi
tenderanno ad essere simili per ogni
confondente (conosciuto o ignoto)
permettono
• comparabilità delle popolazioni
• comparabilità degli esiti
• comparabilità delle informazioni
 confrontabilità di popolazione
37
Placebo
38
Cecità (Blinding)
• Processo per cui solo il principio
attivo (e non l’essere sotto cura,
o altri fattori confondenti)
determina l’eventuale diversità
di risultati
• Processo per cui non vi è
distorsione nel riportare o nel
registrare la misura
dell’esposizione e dell’esito
 confrontabilità di informazione
 confrontabilità di esito
(e massimo contrasto dell’
esposizione)
39
40
10
Cecità
Quanti ciechi ?
Cecità= condizione in cui il trattamento
assegnato non è noto a uno/più
partecipanti allo studio; necessaria per
mantenere l’obiettività dei processi di:
• Nessuno
• nel caso di confronto modalità di
gestione del pz / Trattamenti invasivi
(chirurgia) / Terapie alternative
• Trattamento
• Raccolta dei dati
• Gestione e analisi dei dati
•
•
•
Cecità (di chi?)
Singolo
In genere il pz
Chi valuta l’outcome
• Doppio
• Pz e clinico che gestisce il pz
• Paziente
• Staff clinico coinvolto nello studio
• Staff coinvolto gestione e analisi dati
• Triplo
• Anche chi analizza i dati
41
Mascherare il farmaco
42
Mascherare sequenza
Conoscere la sequenza di allocazione
del trattamento può introdurre un bias
di selezione (conscio o inconscio) e
potrebbe influenzare la decisione di
arruolare. SOLUZIONE:
Usare codici per i trattamenti e non nome
esplicito
Mascherare non solo nome, ma anche
modalità di somministrazione, aspetto,
sapore, odore, colore
Uso del ‘double dummy’: 2 cp insieme
• compresse verdi (tratt 1) vs capsule rosa
(placebo)
• compresse verdi (placebo) vs capsule
rosa (tratt 1)
43
• chi genera sequenza di allocazione ≠
chi verifica eligibilità
• possibilmente allocazione effettuata
all’esterno via telefono/internet
• in alternativa uso di:
 Confezioni farmaco simili e numerate
 Buste chiuse, numerate e opache
44
11
Registrazione paziente
Assegnazione casuale (1)
Perché un paziente possa essere
considerato potenzialmente idoneo
ad essere incluso nello studio si
dovrebbero verificare nell’ordine:
1. Il paziente necessita del trattamento
2. Il paziente possiede i requisiti richiesti
3. Il medico curante è disposto ad
accettare la randomizzazione
4. Il consenso del paziente è stato
ottenuto
5. Il paziente è formalmente AMMESSO
6. Assegnazione del trattamento in base
lista (piano) di RANDOMIZZAZIONE
7. Cartella clinica iniziale completata
8. Inizia il trattamento
•
Assegnazione casuale non vuol dire “a
caso”
•
Con la tecnica di randomizzazione, ogni
paziente ha una probabilità nota (in
genere uguale) di ricevere ognuno dei
trattamenti, ma il trattamento assegnato
non è prevedibile
•
Realizzazione: tabella di numeri casuali
o generatore di numeri casuali (hanno
una distribuzione predefinita)
45
46
Assegnazione casuale (2)
2 trattamenti
18 unità sperimentali eterogenee suddivise
nei gruppi sperimentali A o B nell’ordine:
• assegnazione alternata: è il modo più
semplice per procedere; consiste
nell'assegnare i soggetti che divengono
via via disponibili ad essere inclusi
nell'esperimento. Nel caso di due
trattamenti S-N: il primo S, il secondo N,
il terzo S e così via secondo una stretta
alternanza;
1B 2A 3A 4B 5A 6A 7A 8B 9A 10B 11B 12A 13B
14A 15A 16B 17B 18B
1
2
3
7
6
8
10
9
13 14
12
11
5
4
15
• randomizzazione semplice: è un metodo
più corretto del precedente. Utilizza la
tavola dei numeri casuali. Nel caso di due
trattamenti, ad esempio, leggendo numeri
di una, due o più cifre, si può assegnare il
trattamento S quando si incontra un
numero pari, assegnare il trattamento N
quando il numero è dispari
47
16
Trattamento A
17
18
Trattamento B
2
3
5
1
4
8
6
7
9
10
11
13
12
14
7
16
17
18
48
12
Assegnazione vincolata (1)
• randomizzazione vincolata: con tale
metodo viene garantito che tutti i
gruppi siano costituiti dallo stesso
numero
Si basa sulla costituzione di blocchi (=
nuove unità di assegnazione casuale)
all'interno dei quali i trattamenti
vengono assegnati in modo casuale:
Esempio:
Pazienti n= 100
Trattamenti J= 2
Blocchi K=n/J=100/2= 50
49
Assegnazione vincolata (2)
50
2 trattamenti x 2 blocchi
• La randomizzazione vincolata può
essere eseguita in due diversi modi:
• blocchi a permutazione: consiste nel
generare permutazioni semplici (K=1) o
opportune sequenze delle stesse (K>1)
dei J trattamenti; le sequenze dei
trattamenti sono assegnate ai blocchi
utilizzando la tavola dei numeri casuali
• blocchi a permutazione entro strati:
consiste nel suddividere i partecipanti in
sottogruppi relativamente omogenei
(per età, sesso, condizioni cliniche,
ecc.) detti blocchi stratificati; i
trattamenti vengono assegnati all‘
interno di ciascun blocco casualmente
51
Considerando due trattamenti (A,B) e
blocchi di due pazienti, una possibile
tecnica di assegnazione potrebbe
essere:
Sequenza
assegnazione
trattamento
Ultima cifra
numero
(tav.1)
AB
da 0 a 4
BA
da 5 a 9
52
13
1
2
3
7
6
10
9
12
11
5
4
8
Leggendo le cifre dell’ ultima colonna di tavola
numeri casuali [5, 3, 0, 6, 0, 4, 6, 9, 4, 8, 5 , 1, 5,
…, 2] si ottiene la seguente tabella dei trattamenti
usando regola AB (da 0 a 4) e BA (da 5-9)
14
13
15
16
17
18
Leggendo le cifre della prima riga tavola
numeri casuali si seleziona pz [03, 47,…,
16,…] e si ottiene la seguente tabella dei 9
blocchi:
1
2
3
4
5
6
7
8
9
03
11
10
13
12
15
9
1
2
16
14
7
8
5
18
6
17
4
1
2
3
4
5
6
7
8
9
B
A
A
B
A
B
B
A
B
A
B
B
A
B
A
A
B
A
1
2
3
4
5
6
7
8
9
03
11
10
13
12
15
9
1
2
16
14
7
8
5
18
6
17
4
Trattamento A
Trattamento B
3
53
2 trattamenti x 4 blocchi
14
7
13
5
15
9
17
2
16
11
10
8
12
18
6
1
4
54
3 trattamenti x 3 blocchi
Considerando due trattamenti (A,B) e
blocchi di quattro pazienti, una possibile
tecnica di assegnazione potrebbe
essere:
Considerando tre trattamenti (A,B,C) e
blocchi di tre pazienti, una possibile
tecnica di assegnazione potrebbe
essere:
Sequenza
assegnazione
trattamento
Ultima cifra
numero
(tav.1)
Sequenza
assegnazione
trattamento
Ultima cifra
numero
(Tav.1)
AABB
0
ABC
0
ABBA
1
ACB
1
ABAB
2
BAC
2
BBAA
3
BCA
3
BAAB
4
CAB
4
BABA
5
CBA
5
ove i numeri che terminano con le cifre 6,7,8,9 vengono
ignorati
55
ove i numeri che terminano con le cifre 6,7,8,9 vengono
ignorati
56
14
6 sottogruppi di pz
3 trattamenti x 6 blocchi
Supponiamo un gruppo di pazienti che,
per le diverse caratteristiche, sono
raggruppabili in sei diversi sottogruppi,
Considerando che devono essere
assegnati tre trattamenti, si procede
formando blocchi omogenei composti
da tre (o multipli di tre) elementi:
Unità sperimentali eterogenee
Formazione dei blocchi
57
58
Randomizzazione
Autoappaiamento
Un caso particolare è l'autoappaiamento
in cui in un blocco è incluso un solo
paziente che serve come controllo di se
stesso: ciascun paziente viene
sottoposto quindi a tutti i trattamenti in
tempi diversi con assegnazione
casuale dell'ordine dei trattamenti.
all'interno di ciascun blocco vengono
assegnati i trattamenti attraverso
un'assegnazione casuale semplice:
A
C
A
B
B
C
C
A
B
C
A
B
B
B
C
A
C
A
i=1
Assegnazione casuale dei trattamenti entro
ciascun blocco
59
i=2
i=3
i=4
i=5
i=6
t=1
A
C
A
B
B
C
t=2
C
A
B
C
A
B
t=3
B
B
C
A
C
A
60
15
Esempio
Assegnazione alternata
In un centro antidiabetico su 60 pazienti affetti da diabete
mellito si vogliono sperimentare 3 diversi trattamenti:
Assegnazione alternata: volendo procedere con tale
metodo, leggendo da sinistra a destra nella prima riga
della tavola dei numeri casuali, troviamo nell'ordine
A) insulino-terapia
B) terapia con antidiabetici orali
C) terapia con dieta ipocalorica
N.
1
2
3
Paziente
Mariotti Egisto
Marini Clara
Marsili Lina
età
66
47
29
N.
21
22
23
4
5
6
7
8
9
Mascherpa Pio
Vercesi Santa
Verdi Tina
Veronesi Ugo
Vidali Sergio
Vespa Guido
35
42
28
79
77
37
10
11
12
13
14
15
16
17
18
19
20
Villa Oreste
Viola Maria
Castelli Gino
Cavalli Lucia
Daccò Sandra
Ferrari Bruna
Fercato Andrea
Ferri Luigi
Dioli Gaetano
De Muro Franco
Ferraresi Celeste
50
21
28
66
42
47
70
46
24
34
69
[03 47 43 73 86 36 96 47 36 61 46 98 63 71 62]
età
41
69
25
N.
41
42
43
Paziente
Solda Alfredo
Sommi Germana
Soncini Piero
età
28
51
74
24
25
26
27
28
29
Paziente
Lucidi Gemma
Trabuschi Leo
Zorzoli
Giacomo
Bettini Ernesto
Gambini Alberto
Albini Lucio
Maric Ilaria
Arioli Fabio
Grante Walter
49
48
73
79
59
35
44
45
46
47
48
49
Tonelli Teresa
Trivi Maria
Ugazio Ezio
Valsecchi Rino
Vanoli Walter
Trecate Maria
79
74
29
39
22
63
30
31
32
33
34
35
36
37
38
39
40
Vigorelli Ileana
Allegri Rosita
Lombardi Lucio
Bergonzi Lidia
Baini Giancarlo
Bertassi Marco
Abba Gino
Baldi Rodolfo
Gilli Agenore
Bertoli Alfreda
Soddu Romano
59
47
65
41
71
53
77
37
38
26
57
50
51
52
53
54
55
56
57
58
59
60
Tresoldi Fulvia
Passoni Clara
Molinari Camilla
Sacchi Elma
Caccia Filippo
Buzzi Simone
Moncalieri Irene
Rustioni Pia
Sala Dina
Busoletta Clelia
Gandella Stefano
26
50
60
53
74
79
36
55
36
39
56
61
Randomizzazione semplice
per cui i trattamenti saranno assegnati con la sequenza
nell'ordine 3=C, 1=A, 2=B ottenendo la seguente
tabella di assegnazione:
C
Mariotti Egisto
A
Marini Clara
B
Marsili Lina
C
Mascherpa Pio
A
Vercesi Santa
...................
...................
B
Rustioni Pia
C
Sala Dina
A
Busoletta Clelia
B
Gandella Stefano
62
20 blocchi
Randomizzazione semplice: volendo procedere con
tale metodo si possono assumere le seguenti
convenzioni: si leggeranno i numeri tavola numeri
casuali cifra a cifra da destra a sinistra partendo
dall'ultima riga e si assegnerà il trattamento:
Randomizzazione vincolata: suddividere i pazienti
in 60/3=20 gruppi ciascuno composto da 3
individui. Partendo dalla prima riga della tavola
dei numeri casuali, si leggono i numeri e si
trascrivono in tabella ottenendo:
A per i numeri 1, 2, 3
B per i numeri 4, 5, 6
C per 7, 8, 9 scartando lo zero
le cifre lette sono: [3 3 6 7 0 0 9 8 0 9 2 3 9 6,...], alle
quali corrisponde la sequenza di trattamenti
A Mariotti Egisto
A Marini Clara
B Marsili Lina
C Mascherpa Pio
C Vercesi Santa
C Verdi Tina
C Veronesi Ugo
A Vidali Sergio
A Vespa Guido
C Villa Oreste
B Viola Maria
GRUPPI
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
03 36 26 60 10 57 32 07 50 38 54 05 49 09 44 30 34 19 02 40
47 46 16 11 24 20 37 51 13 58 12 15 35 06 23 39 04 52 08 48
43 33 45 14 42 53 27 56 55 59 31 21 22 18 01 17 25 29 28 41
....................
63
64
16
3 trattamenti
3 trattamenti x 20 blocchi
Entro ciascun blocco (gruppo) vengono assegnati i
trattamenti utilizzando, ad esempio, la seguente
tabella di assegnazione:
Sequenza assegnazione
trattamento
Leggendo le cifre della prima colonna di tavola numeri
casuali [0, 9, 1, 1, 5, 1, 8, 6, 3, 5, 1, 2, 2, 5, 3, 7, 5, 9, 1,
3, 6, 7, 2, 0, 2, 1, 1] si ottiene la seguente tabella dei
trattamenti:
Ultima cifra numero
(tav.1)
ABC
0
ACB
1
BAC
2
BCA
3
CAB
4
CBA
5
1
A
B
C
2
A
C
B
3
A
C
B
4
C
B
A
5
A
C
B
6
B
C
A
7
C
B
A
8
A
C
B
GRUPPI
9 10 11 12 13 14 15 16 17 18 19 20
B B C B C AB B A B AA
AAB C B C C AB A C C
C C AAAB A C C C B B
I pazienti saranno così trattati:
Ignorare i numeri che terminano con le cifre
6,7,8,9
A - Insulina
B - Antidiabetici
C - Dieta
03 Marsili Lina
47 Valsecchi Rinaldo
43 Soncini Piero
36 Abbà Gino
33 Bergonzi Lidia
46 Ugazio Ezio
............................
............................
............................
40 Soddu Romano
41 Solda Alfredo
48 Vanoli Walter
65
12 classi età-sesso
3 trattamenti
Randomizzazione vincolata per strati: volendo procedere
ad una assegnazione del trattamento con tale metodo si
suddividono i 60 pazienti ad esempio per sesso ed età,
ottenendo i 12 gruppi seguenti:
da 20 a 29 anni maschio - femmina
48 Vanoli Walter
11 Viola Maria
18 Dioli Gaetano
39 Bertoli Alfreda
23 Zorzoli Giacomo 50 Tresoldi Fulvia
12 Castelli Gino
6 Verdi Tina
41 Solda Alfredo
3 Marsili Lina
46 Ugazio Ezio
da 30 a 39 anni maschio - femmina
19 De Muro Franco
56 Moncalieri Irene
4 Mascherpa Pio
58 Sala Dina
29 Grante Walter
59 Busoletta Clelia
9 Vespa Guido
37 Baldi Rodolfo
38 Gilli Agenore
47 Valsecchi Rino
da 40 a 49 anni maschio - femmina
17 Ferri Luigi
21 Lucidi Gemma
25 Gambini Alberto 33 Bergonzi Lidia
24 Bettini Ernesto
5 Vercesi Santa
14 Daccò Sandra
2 Marini Clara
15 Ferrari Bruna
31 Allegri Rosita
da 50 a 59 anni maschio - femmina
10 Villa Oreste
51 Passoni Clara
35 Bertassi Marco
42 Sommi Germana
60 Gandella Stefano 53 Sacchi Elma
40 Soddu Romano
57 Rustioni Pia
28 Arioli Fabio
30 Vigorelli Ileana
da 60 a 69 anni maschio - femmina
da 70 a 79 annimaschio - femmina
16 Fercato Andrea
45 Trivi Maria
34 Baini Giancarlo
27 Maric Ilaria
26 Albini Lucio
44 Tonelli Teresa
43 Soncini Piero
54 Caccia Filippo
8 Vidali Sergio
36 Abba Gino
7 Veronesi Ugo
55 Buzzi Simone
32
1
20
22
Lombardi Lucio
Mariotti Egisto
Ferraresi Celeste
Trabuschi Leo
52 Molinari Camilla
49 Trecate Maria
13 Cavalli Lucia
66
Leggendo numeri di due cifre a partire dalla
quint’ultima riga della tavola numeri casuali si
selezionano, in modo casuale, 3 pazienti per
strato
Entro ciascun strato (blocco), formato dai 3 pz
selezionati, vengono assegnati i trattamenti
utilizzando, ad esempio, la seguente tabella di
assegnazione:
Sequenza assegnazione
trattamento
Ultima cifra numero
(Tav.1)
ABC
3
ACB
4
BAC
5
BCA
6
CAB
7
CBA
8
Ignorare i numeri che terminano con le cifre
0,1,2,9
67
68
17
Stratificazione
Piano sperimentale
I pazienti sono prima divisi in strati (1-3)
secondo uno o più fattori prognostici e poi
assegnati in modo casuale entro ciascun strato
al gruppo trattato (T) o al gruppo controllo
(C):
Entro ciascun strato (con 3 pazienti) vengono assegnati i
trattamenti leggendo le cifre della decima riga della tavola
dei numeri casuali:
[5, 7, 6, 0, 8, 6, 3, 2, 4, 4, 0, 9, 4, 7, 2, 7, 9, 6,...]
Si ottiene il seguente piano sperimentale:
da 20 a 29 anni
da 30 a 39 anni
46
Ugazio E.
B
50
Tresoldi F.
C
37
Baldi R.
B
56
MoncalierI
C
48
Vanoli W.
A
31
Allegri R.
A
19
De Muro F.
C
58
Sala D.
B
18
Dioli G.
C
39
Bertoli A.
B
4
MascherpP.
A
59
BusolettaC
A
da 40 a 49 anni
da 50 a 59 anni
24
Bettini E.
B
33
BergonziL.
A
28
Arioli F.
A
57
Rustioni P.
A
17
Ferri L.
C
21
Lucidi G.
B
60
Gandella S.
C
53
Sacchi E.
C
25
Gambini A.
A
5
Vercesi S.
C
35
Bertassi M.
B
42
Sommi G.
B
da 60 a 69 anni
da 70 a 79 anni
22
TrabuschiL.
A
49
Trecate M.
C
34
Baini G.
C
45
Trivi M.
B
32
LombardiL.
C
13
Cavalli L.
A
7
VeronesiU.
A
27
Maric I.
C
20
Ferraresi C.
B
52
MolinariC.
B
43
Soncini P.
B
44
Tonelli T.
A
NB. Campione è formato da n=J*K=12*3=36 pazienti,
non da N=60 !
69
70
Minimizzazione
Esempio
• Alternativa alla stratificazione in una
randomizzazione a schema fisso, quando
il numero di variabili per cui stratificare è
elevato
“running in”
Gruppo A
(n=20)
Gruppo B
(n=20)
Femmina
12
11
Età>50
7
5
bianca
15
15
nera
4
5
asiatica
1
0
Fumatore
6
8
Razza
•
•
Funzione delle differenze nella
distribuzione delle caratteristiche basali
fra i gruppi di trattamento
Lo scopo di ogni assegnazione del
trattamento è di minimizzare lo
sbilanciamento tra fattori multipli
Prossimo pz: femmina, 52 anni, nera, non fuma
Partecipanti con le stesse caratteristiche
71
A: 12(sex)+7(age)+4(ethnicity)+14(smoking)=37
B: 11+5+5+12=33
72
18
Esempio (continua)
Tutto semplice?
• Come assegnare trattamento bilanciando il
numero di pz con le stesse caratteristiche?
•
Semplice: al gruppo con totale più piccolo
(nell’esempio=B)
•
Metodo della moneta “truccata”:
per esempio si assegna probabilità:
 p=0.8 (gruppo più piccolo) e p=0.2
(gruppo più grande)
 uso tabella numeri 0-9 randomizzati con:
I requisiti RCT sono tutti validi all’interno
di un ‘trial farmacologico’:
• Randomizzazione Trattamenti
• Possibilità del placebo ( possibilità del
massimo contrasto)
• Possibilità effettiva del doppio cieco
• Relativa alta frequenza di eventi (alta
potenza statistica)
• Ma esistono problemi (di generalizzabilità
e applicabilità) e limiti (di natura etica)
 Regola: assegnare a gruppo con meno pz
per i numeri 0-7; assegnare a gruppo con
più pz per i numeri 8-9
73
Problemi RCT
Limiti RCT
Sono di natura etica legati alla scelta della
esposizione/trattamento
• Problemi di generalizzabilità:
 popolazione selezionata (pazienti)
 setting selezionato (ospedale)
 variabili di “contesto” non rilevabili
• Problemi di applicabilità, raramente è
possibile indagare per:




74
studi su eventi rari
studi su determinanti nocivi
studi su determinanti non manipolabili
studi valutativi (voglio studiare quello che
è accaduto, non quello che avverrà)
75
1. Limitata a fattori potenzialmente preventivi
della malattia o delle sue conseguenze
2. Entrambi trattamenti devono essere
ugualmente accettabili, tenuto conto delle
conoscenze del momento
3. Inclusione nello studio non deve privare il
paziente di terapie più efficaci e non incluse
nel protocollo
4. Bisognerebbe assicurare uguale rapporto
beneficio/danno a priori
5. Il paziente deve essere informato e deve
dare il suo consenso
Esiste un’apposita legislazione in attuazione direttiva CEE
sulle norme di buona pratica clinica: DIRETTIVA
2001/20/CEE (4 aprile 2001)
76
19
Dimensione del campione
Quanti pazienti servono?
Criteri economici e di fattibilità
Costi
Tempi di reclutamento (malattie rare)
Tempi di esecuzione
Etc
Criteri etici
Possiamo attendere tanto tempo per
trattare paziente?
Bisognerebbe assicurare uguale rapporto
beneficio/danno a priori
Etc
Criteri statistici: potenza dello studio
Tipo di misure e loro variabilità
Entità delle differenze da valutare
Errori a e b
etc
77
The Importance of Beta, the Type II Error and Sample
Size in the Design and Interpretation of the Randomized
Control Trial — Survey of 71 Negative Trials
Jennie A. Freiman, A.B., Thomas C. Chalmers, M.D., Harry
Smith, Jr., Ph.D., and Roy R. Kuebler, Ph.D.
N ENGL J MED 1978; 299: 690-694 September 28, 1978
Seventy-one "negative" randomized control trials were reexamined to determine if the investigators had studied large
enough samples to give a high probability (>0.90) of
detecting a 25 per cent and 50 per cent therapeutic
improvement in the response. Sixty-seven of the trials had a
greater than 10 per cent risk of missing a true 25 per cent
therapeutic improvement, and with the same risk, 50 of the
trials could have missed a 50 per cent improvement.
Estimates of 90 per cent confidence intervals for the true
improvement in each trial showed that in 57 of these
"negative" trials, a potential 25 per cent improvement was
possible, and 34 of the trials showed a potential 50 per cent
improvement. Many of the therapies labeled as "no different
from control" in trials using inadequate samples have not
received a fair test. Concern for the probability of missing an
important therapeutic improvement because of small sample
sizes deserves more attention in the planning of clinical
trials. (N Engl J Med 299:690–694, 1978)
79
78
Dimensione del campione
La determinazione della dimensione campione
(numero pazienti) è una parte cruciale del
disegno di studio:
Uno studio troppo piccolo da luogo a risultati
non conclusivi:
•Differenza statisticamente non significativa
•Effetto clinicamente rilevante
•Intervallo confidenza ampio
Uno studio troppo grande rappresenta uno
spreco di risorse:
•Differenza statisticamente significativa
•Effetto clinicamente non rilevante
•Intervallo confidenza ridotto
80
20
Quesiti di base
•
Esempio di Pocock (1983)
Per il calcolo della dimensione del campione
si deve rispondere a cinque quesiti di base:
1. Quale è lo scopo principale della ricerca ?
2. Quale è il criterio (outcome) principale per
misurare il risultato del trattamento ?
3. Quale test statistico si vuole utilizzare ?
4. Quali risultati si prevedono con il
trattamento standard ?
5. Quale è la minima differenza fra trattamenti
(nuovo vs. standard) che ha significato
clinico e quale “potenza “ statistica bisogna
raggiungere ?
• Sul N. Engl. J. Med. (1978) viene descritto un
disegno di una ricerca randomizzata a doppia
cecità, che confrontava l’Anturen con il
Placebo in pazienti che avevano subito un
infarto del miocardio. Per determinare “quanti
pazienti abbiamo bisogno”? Gli aa hanno
considerato:
1. Quale era lo scopo della ricerca?
Stabilire se l’Anturen fosse effice per
prevenire la mortalità dopo un infarto del
miocardio. Pur non essendo lo scopo
primario, era anche importante la prevenzione
di un reinfarto non fatale
81
Esempio (continua)
82
Esempio (continua)
2. Quale era il criterio principale per misurare
il risultato della ricerca?
La morte entro un anno per qualsiasi causa
dall’inizio del primo trattamento era
considerato il principale indicatore di
“insucesso”. La morte improvvisa viene
considerata un esito secondario.
3. Quale test utilizzare per evidenziare una
differenza fra trattamenti?
L’analisi più semplice è un test (a due code)
per il confronto di due frequenze di
“insucesso” (farmaco vs. placebo)
4. Quali risultati si prevedono con il trattamento
standard?
Nello studio il trattamento standard era il
placebo e si prevedeva il 10% di morti entro
un anno. ovvero una sopravvivenza del 90%
83
5. Quanto piccola poteva essere una differenza
fra trattamenti perché fosse giudicata
clinicamente importante e quale grado di
“potenza” statistica bisognava raggiungere?
Gli aa considerarono una riduzione
clinicamente rilevante se l’Anturen avesse
potuto dimezzare la mortalità (vale a dire il
5% delle morti in un anno).
La dimensione campionaria n doveva avere
una “potenza” statistica del 90% , ovvero lo
studio aveva una probabilità del 90% che
l’osservazione del risultato previsto (riduzione
5% mortalità) fosse statisticamente
significativo (P<0.05) ad un test statistico (a
due code) definito nel quesito 3.
• Da 1-5 è stato possibile stabilire che la ricerca
richiedeva circa 1200 pazienti (metà sotto
84
Anturen e metà sotto placebo)
21
Tabella MLE
Test-z
Modello
Parametro
Stima
[ˆ]
Varianza
[ s2ˆ ]
2 Bernoulli
  1   0
R1  R0
R1 1  R1  R0 1  R0 

n1
n0
2 Poisson
  1  0
r1  r0
2 Gauss
  1  0
y1  y 0
 2
ovvero:
2 Bernoulli
  ln( 1 /  0 )
R 
ln 1 
 R0 
1  R1 1  R0

y1
y0
ˆ = stima statistica di una misura di “diversità”
2 Bernoulli
La determinazione numerosità campionaria si
basa su un test statistico di una ipotesi nulla:
H0: nessuna differenza fra F vs. P: la
differenza osservata è dovuta al caso
Il test-z nella sua forma generale è dato da:
ˆ   0 valore osservato  valore atteso
z

variabilità valore osservato
SE (ˆ)
0 = valore atteso della stima statistica sotto H0
SE()= errore standard (“standard error”) di ˆ
85
a d 
ln

  ln(1 /  0 )  b  c 
2 Poisson
  ln(1 / 0 )
r 
ln 1 
 r0 
r
r1
 0
M1 M 0
1 1
 
 n1 n0 
1 1 1 1
  
a b c d
1
1

y1 y0
86
Valore-P (P-value)
Il valore–P è la probabilità di ottenere
i) il valore del test statistico osservato o
addirittura valori più estremi,
ii) in una lunga serie di campioni nelle
medesime condizioni del campione in
studio,
iii) supposto che sia vera l’ipotesi nulla, H0:
 due code, se H 1 : 1   0
P  Pr( Z | z || H 0 è vera )
 una coda, se H 2 : 1   0
P  Pr( Z  z | H 0 è vera )
 una coda, se H 3 : 1   0
P  Pr( Z  z | H 0 è vera )
87
88
22
95%=(1-0,05)% CI:
ˆ1
95% CI e P-value
L’intervallo di confidenza al 95% (95%
Confidence Interval: 95% CI) oltre a
definire una stima per intervallo permette
ovviamente di fare anche un test di
significatività.
ˆ2
ˆ

Valori verosimili P>0,05
Considerando un livello di significatività di
P=0.05 come soglia per rifiutare (non
rifiutare) l’ipotesi nulla, H0:  = 0 si può
adottare la seguente regola:
Valori inverosimili P<0,05
Misure assolute:
•Se valore parametro H0:  = 0 è
compreso nel 95% CI = non rifiuto H0
ˆ1  ˆ  1,96  SE (ˆ);
ˆ

 2  ˆ  1,96  SE (ˆ) 
•Se valore parametro H0:  = 0 non è
compreso nel 95% CI = rifiuto H0
Misure relative:
ˆ1  ˆ / exp1,96  SE (ln ˆ) ; 


ˆ
ˆ
ˆ
 2    exp1,96  SE (ln  )  
89
90
Dimensione del campione
Dati binari (p)
La dimensione campionaria è data da una
“conversione” del test statistico, e nella sua
forma generale si scrive:
n
variabilità parametro
(valore clinico rilevante) 2
Considerando = differenza fra “successi”
(p1= % nuovo trattamento, p0=%trattamento
standard)
 f (a , b )
z
• La “variabilità parametro” misura la
variabilità del indicatore (variabile binaria,
continua, ecc) scelto nella valutazione
del’outcome dello studio, che usualmente
si ottiene da studi precedenti o dalla
revisione della letteratura
• Il “valore clinico rilevante” è la grandezza
della differenza minima ritenuta rilevante
(dal biologo, clinico, esperto) fra i due
trattamenti a confronto
ˆ   0

SE (ˆ)
( p1  p0 )  0
p1 (1  p1 ) p0 (1  p0 )

n1
n0
Risolvendo per n=n1=n0 si ottiene:
n
91
p1 (1  p1 )  p0 (1  p0 )
 2   p1  p0 2
 f (a , b )
92
23
Errori a e b e potenza
Tabella di decisione
a = errore di I tipo: è la probabilità di
osservare una “differenza statisticamente
significativa” quando in realtà =0 (ovvero
il rischio di un risultato falso-positivo)
Nella determinazione della dimensione del
campione è utile la seguente “tabella di
decisione” riguardo ad un test statistico:
a  Pr Rifiuto H 0 H 0 è vera 
Decisione
Realtà
Non rifiuto H0
Rifiuto H0
H0 vera:
Pr: (1a
Errore di I° tipo
Pr: a
H1 vera:
Errore di II°
tipo Pr: b
Pr: (1b
b = errore di II tipo: è la probabilità di
osservare una “differenza non statisticamente
significativa” quando in realtà =*(ovvero
il rischio di un risultato falso-negativo)
b  Pr Non rifiuto H 0 H1 è vera 
(1b= potenza dello studio = probabilità
di osservare la “vera” differenza =*
93
Ipotesi H0 vs. H1
94
Distribuzione di campionamento
• Gli errori a e b sono determinati dalla conoscenza della distribuzione campionaria del
test-z sotto H0 e sotto H1 e da un valore
critico K specificato a priori
b
• Senza perdere in generalità, si considerino
le seguenti ipotesi semplici:
0
H 0 :   0 vs. H 1 :    *
L'ipotesi H0 specifica l'assenza di effetto =0,
mentre l'ipotesi H1 specifica un valore
considerato "rilevante" =* dal punto di
vista biologico o clinico o, in altri termini, un
valore "minimo rilevante" definito dalle
conoscenze del ricercatore
a
*
perciò:
a  Pr Z  K   0 e b  Pr Z  K    *
95
da cui si evidenzia immediatamente che,
aumentando il valore di K, diminuisce a ma
aumenta b e viceversa. In generale una buona
regola è scegliere K in cui entrambe le
96
probabilità di errore a e b sono piccole )
24
Valore K= f(a,b)
Esempio (continua)
p0= 90% probabilità di sopravvivenza dei
pz con trattamento standard
Si dimostra che K= f(a,b)=[Na/2Nb]2 ,
perciò i valori nella formula calcolo del
numero necessario dei pazienti sono:
= 5% la minima differenza clinicamente
rilevante (p1= p0  95%
b (errore di II tipo)
a (errore
di I tipo)
0,05
0,1
0,2
0,5
a= 0,05
0,1
10,8
8,6
6,2
2,7
b= 0,10 (potenza=0,90)
0,05
13,0
10,5
7,9
3,8
0,02
15,8
13,0
10,0
5,4
0,01
17,8
14,9
11,7
6,6
n
0,95  0,05  0,90  0,10
0,95  0,902
 10,5
 578
•Con n=578×2≈1200 ho una potenza del
90% di rilevare un risultato statisticamente
significativo (P=5%), se si osserva una
differenza clinicamente rilevante di d=5%
10,5=[N0,05/2N0,1]2  [1,961,28]2
97
Dati continui (m)
Esempio
Cockburn et al (BMJ 1980;281:11-14) per
valutare l’efficacia di un supplemento di
vitamina D somministrato alle donne in
gravidanza per la prevenzione della
ipocalcemia neonatale, considerano:
La dimensione campionaria è data da una
“conversione” del test statistico
n
variabilità parametro
(valore clinico rilevante) 2
 f (a , b )
 Quale end-point principale? y= livello di
calcemia del bambino dopo una settimana
dalla nascita
Considerando = “differenza fra medie”:
z
ˆ   0
( y1  y0 )  0

ˆ
SE ( )
1 1
 2  
 n1
 Quali valori si prevedono con il metodo
standard (pacebo)? 0=9,0 mg/100cc e =
1,8 mg/100cc nelle donne normali
n0 
 Quale aumento nella media è considerato
clinicamente rilevante? =0.5 mg/100cc
perciò si prevede 1=9,0+0,5=9,5 mg/100cc
Risolvendo per n=n1=n2 si ottiene:
n
2 2
 f (a , b )
  ( 1  0 ) 2
98
 Quali errori a e b? a=0,05 e b=0,05
(potenza=0,95)
2
99
100
25
Esempio (continua)
Dati appaiati
La dimensione dello studio è allora data da:
• Procedendo nello stesso modo, negli studi
appaiati (prima-dopo) la dimensione del
campione si ottiene:
n

2 2
 2  ( 1   0 ) 2
2  1,82
(0,5)
2
 f (a , b ) 
• per i dati continui:
 13,0  357
n
Con n=357×2≈720 ho una potenza del 95%
di rilevare un risultato statisticamente
significativo (P=5%), se si osserva una
differenza clinicamente rilevante di d=0,5
mg/100cc. Per disegnare le funzioni di
potenza posso graficare:

N ([ 0  d ]  0 )
2 2 / n  za / 2
 2  varianza differenze (y1  y0 )
• per i dati binari:
d
 f (a , b )
  ( 10   01 ) 2
 d  frequenza discordanti   10   01
n
]
facendo variare d, n o 0
2
 f (a , b )
  ( 1  0 ) 2
2
2
101
102
Potenza dello studio
Potenza dello studio (n)
1
0.9
d=0.10; p0=0.8
d=0.15; p0=0.8
0.8
0.7
0.6
potenza
Una alternativa alla “conversione” del test-z
per il calcolo della numerosità campionaria
n, è la “conversione” del test-z per la
rappresentazione grafica della potenza dello
studio (1-b) data dalla seguente formula:
0.5
0.4
zb 
valore clinico rilevante(d)
 za
variabilità parametro/n
0.3
0.2
0.1
0
0
50
100
150
200
250
300
350
400
450
500
munero pazienti (per gruppo)
che poi viene espressa in probabilità
leggendo come usuale sulla tavola della
distribuzione N(0,1) il corrispondente
valore di probabilità Pr(Z<zb)
zb 
valore clinico rilevante(d)
 za
variabilità parametro/n
Potenza  Pr( Z  z b )  N (0,1)
103
104
26
Disegno sequenziale
Potenza dello studio (d)
1
0.9
n=100; p0=0.8
n=50; p0=0.8
0.8
0.7
potenza
0.6
0.5
0.4
0.3
0.2
0.1
0
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
0.5
delta
zb 
• n viene definito dal piano sequenziale
• valido per pazienti indipendenti o “appaiati”
(“matched pairs”)
• terapia e risposta “BREVI”
• giudizio dopo trattamento di ogni paziente o
coppia paziente
• interruzione dello studio appena raggiunta la
“significatività statistica”
• limitate condizioni di applicazione
• (non registrativo: fase 1-2)
DIFFICILI CONDIZIONI DI SELEZIONE
MA RIDUCE SENSIBILMENTE IL N° E LA
VARIABILITÀ DEI PAZIENTI
valore clinico rilevante(d)
 za
variabilità parametro/n
Potenza  Pr( Z  z b )  N (0,1)
105
Dati binari
106
Modelli di regressione
107
108
27
Monitoraggio dello studio
Analisi ad interim
Valutazione della risposta del paziente:
• Baseline (prima dell’inizio trattamento):
 Stato clinico di base
 Storia clinica e caratteristiche personali
• L’analisi viene effettuata in intervalli di
tempo predefiniti dal protocollo (durata
follow-up 2 anni (24 mesi): analisi ad
interim: 6 mesi, 12 mesi, 18 mesi)
•



Risposta principale e risposte secondarie:
Sopravvivenza (morte)
Risposta alla terapia
Miglioramento parametro clinico
• Viene definita una regola di stop dello
studio (stopping rule) prima dell’inizio
dello studio, che specifica un limite per
la differenza controllo vs. trattamento,
che se superato, porta automaticamente
all’interruzione di uno o dell’altro
trattamento (a seconda della direzione
dell’effetto)
•



Altri aspetti del monitoraggio:
Deviazioni dal protocollo
Eventi avversi e effetti collaterali
Drop-out
• Diverse procedure statistiche controllo
dei test multipli e potenza dello studio
109
Fattori prognostici
110
Questioni
• Le informazioni di “baseline” (z) del paziente
possono avere attinenza (sono associati) con
la sua successiva riposta al trattamento (y),
ovviamente non sono associati al trattamento
(x) per effetto della randomizzazione (r)
• Quale è il tipo di relazione fra fattori
prognostici z e esito y?
• R: v. letteratura
• La prognosi per un paziente con un infarto del
miocardio tende ad essere peggiore se ha
avuto anche un precedente infarto
• Quale è il tipo di relazione fra fattori
prognostici z e trattamento x
• R: nulla se randomizzazione è corretta
• La risposta del tumore alla chemioterapia nel
cancro avanzato tende ad essere migliore se il
paziente prima del trattamento è ambulatoriale
e non ricoverato
• Come devo analizzare la relazione x-zy?
• R: v. metodi statistici
• Altri esempi…
111
112
28
Metodi di analisi
Regressione lineare
• Analisi per sottogruppi:
Divido i pazienti in sottogruppi e conduco
tante analisi entro gruppo
• Troppa confusione in fase di
interpretazione!
• Aumenta rischio di errore !
• Campione deve essere numeroso
• Metodi di aggiustamento
– Analisi stratificata 2x2xK
– Analisi stratificata 2xJxK
• Modelli di regressione:
– Y continua= regressione lineare
– Y binaria= regressione logistica
– Y tempo = regressione d’azzardo (Cox)
•Modello di regressione lineare semplice:
y = b0 + b1x + u
y= variabile di risposta continua= livello (o
severità) di un parametro clinico
x= variabile esplicativa continua= livello (o dose)
trattamento
u= tutti i fattori non osservabili (unobservables),
inclusi errori di misurazione, che potrebbero
influenzare y quando x è tenuto costante,
assumendo che E(u)=0 (leggi “valore atteso”=0)
b 0 ;b 1= coefficienti di regressione che misurano
legame x-y
113
114
Significato b0 e b1
Curva lineare (retta)
y ( x )  a  bx
• Se Y= livello di omocisteina totale nel plasma
(mmol/l)
• Se X= livello di supplemento (dose) di
vitamina B-6 (nmol/l)
Variabile Y
•
P=(x
i
i , yi )
E ( y | x  0)  b 0  E ( u y )  b 0
y  y( x)
Variabile X
a=intercetta=variazione di y quando x=0
b=pendenza=variazione di y quando x
aumenta da x a x+1 (incremento di 1 unità)115
b0 è il valore atteso di y=livello di omocisteina (umol/l) quando x=dose di vitamina
B-6 = 0:
•
b1 è il cambiamento atteso di y=livello di
omocisteina (umol/l) dato un cambiamento
unitario (nmol/l) di x=dose di vitamina B-6:
 y  E ( y | x  1)  E ( y | x ) 
 [ b 0  b1 ( x  1)]  [ b 0  b1 ( x )]  b1
116
29
Variabile x qualitativa (1)
Variabile x binaria
• Se Y= livello di omocisteina totale nel plasma
(mmol/l)
• Se X=trattamento (1=farmaco; 0=placebo)
•
•
b0 è il valore atteso di y= livello di omocisteina (umol/l) quando x=placebo:
Una variabile qualitativa viene ricodificata con
tante variabili indicatore quante sono le classi
della variabile qualitativa meno una
Per esempio per codificare il gruppo ematico
A, B, AB, 0 possiamo usare tre variabili xA, xB,
xAB, che hanno i seguenti valori:
E ( y | placebo)  b 0  E (u y )  b 0
xA=1 per i soggetti con gruppo ematico A, e
xA=0 per tutti gli altri
b1 è il cambiamento atteso di y= livello di
xB=1 per i soggetti con gruppo ematico B, e
xB=0 per tutti gli altri
omocisteina (mol/l) dato dalla differenza fra
farmaco=1 e placebo=0:
 y  E ( y | farmaco)  E ( y | placebo) 
 [ b 0  b1 ( x  1)]  [ b 0  b1 ( x  0)]  b1
117
Variabile x qualitativa (2)
xAB=1 per i soggetti con gruppo ematico AB, e
xAB=0 per tutti gli altri
Pertanto: E(y)= b0 + bA xA + bB xB + bAB xAB
118
p variabili x
Visti i valori delle variabili indicatore, per i
soggetti appartenenti ai quattro gruppi
ematici, l’equazione si riduce alle seguenti
quattro espressioni:
E ( gruppo A) = b0 + bA
Il modello di regressione semplice (una
variabile x) si estende ad un modello di
regressione multipla introducendo p >1
variabili esplicative:
y = b0+b1x1+b2x2+…+bpxp+u
E ( gruppo B) = b0 + bB
Il modello permette di studiare l’effetto di
una variabile xj (j=1,…,p) sulla y, al netto
dell’azione delle (dopo aver aggiustato per
le) altre variabili x; se si considera x1:
E (gruppo AB) = b0 + bAB
E ( gruppo 0) = b0
Da cui il significato dei parametri:
y –(b2x2+…+bpxp)=b0+b1x1+u
bA = E(gruppo A)  E(gruppo 0)
y*=b0+b1x1+u
bB = E(gruppo B)  E(gruppo 0)
y* è il “residuo” della variabile di risposta
y dopo aver “tolto” l’effetto di (x2,…,xp)
bAB = E(gruppo AB)  E(gruppo 0)
119
120
30
Cosa significa? (1)
•
•
•
•
•
Cosa significa? (2)
• Se valuto effetto trattamento in due soggetti
uno trattato con farmaco (x4=1) e l’altro
trattato con placebo (x4=0) con le stesse
caratteristiche (45y; M; TT) ottengo:
Y= livello omocisteina (mmol/l)
X1= età (anni)
X2= sesso (1=M; 0=F)
X3= MTHFR (1=TT; 0=CC,CT)
X4= (1=farmaco; 0=placebo)
y (1)  b 0  b1  45  b 2  b 3  ( b 4  1)
y (0)  b 0  b1  45  b 2  b 3  ( b 4  0)
• Se considero due soggetti uno trattato con
farmaco (x4=1) e l’altro trattato con placebo
(x4=0) con diverse caratteristiche (45y; M; TT
vs. 33y; F; CC) ottengo:
• Cambio le caratteristiche (33y; F; CC):
y (1)  b 0  b1  33  ( b 4  1)
y (0)  b 0  b1  33  ( b 4  0)
y (1)  b 0  b1  45  b 2  b 3  ( b 4  1)
y (0)  b 0  b1  33 
y (1)  y (0)  b 4
y (1)  y (0)  b 4
 ( b 4  0)
y (1)  y (0)  b1  12  b 2  b 3  b 4
121
• Vale per tutti i valori di x1, x2, x3 ! b4
rappresenta la differenza fra farmaco e
placebo mantenendo costante (aggiustando
per) l’azione delle altre variabili x1, x2, x3 122
Stima dei coefficenti b
Esempio
• La stima dei parametri (coefficienti di
regressione b) del modello di regressione
viene fatta utilizzando il metodo di
massima verosimiglinza (MLE) che
produce, sulla base dei dati osservati, per
ciascun b il valore più verosimile e la sua
precisione (errore standard), da cui si
possono determinare P-value e 95%CI:
• Assanelli et al. Pharmacological Research
2004; 49: 79–84
• Study design. 30 pazienti con un infarto del
miocardio acuto assegnati (15 per gruppo) a:
• Trattamento A= 15mg/die acido folico via
orale per un mese e 15 mg in giorni alterni
per 2 mesi
• Trattamento B= 15mg/die acido folico via
orale +vitamina E 900mg/die per 3 mesi
z
bˆ  b 0
 N (0,1)  P - value
SE ( bˆ )
• End-point. Variazione omocisteina (mmol/l)
fine follow-up: t(3)-t(0)
95%CI  bˆ  1,96  SE ( bˆ )
• Esistono molti software: R (free), STATA,
XLSTAT, e molti altri !
123
• Fattori prognostici. età, sesso (1=M 0=F),
livello folati (t0), MTHFR (1=TT; 0=CC,
CT); storia familiare (1=si; 0=no); e altri
124
31
t(1) vs. t(0)
XLSTAT
hcy(t1)= b0 + b1hcy(t0) +…+ u
100
90
y=x
80
70
HCY1
60
50
40
y=b0+b1x
30
20
10
0
0
10
20
30
40
50
60
70
80
90
100
HCY 0
in media si rileva una riduzione di omocisteina di
(0,157-1)/1 %= -84.3% dopo il trattamento
125
Tabella MLE
Regressione logistica
Y= HCY (t1)
(Constant)
HCY 0
FOL 0
B12 0
MTHFR
FAMIGLIA
ETA'
SESSO
trattamento
B
1.582
0.157
0.630
0.006
0.014
-0.413
0.072
-1.019
-1.962
S.E.
4.181
0.033
0.292
0.006
1.510
1.530
0.050
1.757
1.328
126
z-test P-value
0.378
0.705
4.684
0.000
2.160
0.031
1.133
0.257
0.009
0.993
-0.270
0.787
1.438
0.150
-0.580
0.562
-1.478
0.139
• Se Y=variabile binaria (esito = vivo/morto
+/-; successo/insuccesso) il modello lineare
non è adeguato, perchè: E(y)= Pr(y=1)
E(y)=b0+b1x non è compreso fra 0-1 !
• È necessaria una trasformazione (logistica)
che modifica range da 0-1 a ±infinito:
 E( y) 
ln 
  b 0  b1 x1  b 2 x2    b p x p
1  E ( y ) 
COMMENTO: non si evidenzia nessuna
differenza fra i due trattamenti (P=0.139): la
riduzione omocisteina definita dalla retta
y(dopo)-x(prima) è simile nei due gruppi a
confronto
E ( y )  Pr( y  1)  probabilità esito
E( y)
Pr( y  1)

 odds esito
1  E ( y ) Pr( y  0)
127
128
32
Significato b0 e b1
Curva logistica
• Se Y= livello di omocisteina totale nel plasma
(mmol/l)>13=1 e 0=altrimenti
• Se X= livello di supplemento (dose) di
vitamina B-6 (nmol/l)
•
b0 è il valore atteso di ln-odds(y)=
=ln[Pr(y=1)/Pr(y=0)] quando x=dose di
vitamina B-6 = 0:
E [ln(odds | x  0)]  b 0
•
ln[y/(1-y)]=a+bx, diventa nella scala y=(0;1):
b1 è il cambiamento atteso di ln-odds(y)
=ln[Pr(y=1)/Pr(y=0)] dato un cambiamento
unitario (nmol/l) di x=dose di vitamina B-6:
 odds | x  1
 y  ln 
  ln OR  b1
 odds | x 
y=exp(a+bx)/[1+exp(a+bx)]
129
Variabile x binaria
p variabili x
• Y= insorgenza di una successiva cardiopatia
ischemica (1=si; 0=no)
• X1= età
• X2= sesso (1=M; 0=F)
• X3= MTHFR (1=TT; 0=CC,CT)
• X4= (1=farmaco; 0=placebo)
• Se Y= insorgenza di una successiva
cardiopatia ischemica (1=si; 0=no)
• Se X= trattamento (1=farmaco; 0=placebo)
•
b0 è il valore atteso di ln-odds(y)=
=ln[Pr(y=1)/Pr(y=0)] quando x=placebo:
E [ln(odds | placebo)]  b 0
•
130
b1 è il cambiamento atteso di ln-odds(y)
=ln[Pr(y=1)/Pr(y=0)] dato dalla differenza fra
farmaco=1 e placebo=0:
• Se considero due soggetti uno trattato con
farmaco (x4=1) e l’altro trattato con placebo
(x4=0) con diverse caratteristiche (45y; M; TT
vs. 33y; F; CC) ottengo:
ln odds(0)  b 0  b1  45  b 2  b 3  ( b 4  1)
ln odds(1)  b 0  b1  33  ( b 4  0)
 odds | farmaco 
 y  ln 
  ln OR  b1
 odds | placebo 
ln OR  b1  12  b 2  b 3  b 4
131
132
33
Cosa significa?
Esempio
• Se valuto effetto trattamento in due soggetti
uno trattato con farmaco (x4=1) e l’altro
trattato con placebo (x4=0) con le stesse
caratteristiche (45y; M; TT) ottengo:
• WHO. Br. Heart J 1978; 40: 10689-1118
• Study design. 1400 maschi con accertata
ipercolesterolemia (livello colesterolo totale
nel siero>220 mg/dl ) furono randomizzati al
clofibrato o al placebo (700 per gruppo) per
verificare l’efficacia del farmaco a ridurre il
colesterolo nel siero
• End-point. Insorgenza di una cardiopatia
ischemica nei soggetti durante follow-up
(1=si; 0=no)
• Fattori prognostici. età, fumo (1= fumatore;
0=non fumatore); storia familiare (1=padre
morto per cardiopatia; 0= padre vivo);
pressione arteriosa sistolica (mmHg); livello
di colesterolo (mg/l) e altri…
ln odds(1)  b 0  b1  45  b 2  b 3  ( b 4  1)
ln odds(0)  b 0  b1  45  b 2  b 3  ( b 4  0)
ln OR  b 4
• Cambio le caratteristiche (33y; F; CC):
ln odds(1)  b 0  b1  33  ( b 4  1)
ln odds(0)  b 0  b1  33  ( b 4  0)
ln OR  b 4
• Vale per tutti i valori di x1, x2, x3 ! b4
rappresenta ln(OR) fra farmaco e placebo
mantenendo costante (aggiustando per)
l’azione delle altre variabili x1, x2, x3
133
XLSTAT
134
Tabella MLE
Costante
Log(Età)/2.7
Fumo
Familiarità
PAS (mmHg)
Colesterolo (mg/dl)
TRATTAMENTO
Estimate S.E
z-test
-19.6 2.4810
-7.9
1.11 0.1764
6.3
0.83 0.1221
6.8
0.64 0.1778
3.6
0.011 0.0030
3.7
0.0095 0.0017
5.6
-0.32 0.1103
-2.9
P-value
0.000000
0.000000
0.000000
0.000318
0.000216
0.000000
0.003732
COMMENTO: dopo aver aggiustato ciascuna
variabile per le altre, tutte le variabili forniscono
un contributo indipendente e significativo
(P<0.01 in ogni caso) alla probabilità (rischio)
che un paziente con ipercolesterolemia sia
colpito da una cardiopatia ischemica
135
136
34
Odds Ratios (ORs)
Costante
Log(Età)/2.7
Fumo
Familiarità
PAS (mmHg)
Colesterolo (mg/dl)
TRATTAMENTO
Rischio ( R1 )
Estimate S.E
z-test OR=exp(B)
-19.6 2.4810
-7.9
1.11 0.1764
6.3
3.038
0.83 0.1221
6.8
2.293
0.64 0.1778
3.6
1.896
0.011 0.0030
3.7
1.011
0.0095 0.0017
5.6
1.010
-0.32 0.1103
-2.9
0.726
Costante
Log(Età)/2.7
Fumo
Familiarità
PAS (mmHg)
Colesterolo (mg/dl)
TRATTAMENTO
odds | farmaco
 0.32
odds | placebo
odds | farmaco
OR 
 exp( 0.32)  0.726
odds | placebo
somma (S)
rischio (R)
odds (O)
b  ln OR  ln
95%CI( b )  0.32  1.96  0.11  ( 0.10;  0.54)
95%CI(OR)  exp( 0.10;  0.54)  (0.58; 0.90)
N.B. “exp” significa “e elevato a…”
e è il numero di Nepero e vale circa 2,71.
somma (S)
rischio (R)
odds (O)
B*X
-19.6
11.7
0.83
0.64
1.54
2.09
-0.32
-3.0839
0.0438
0.0458
R
exp( S )
exp( 3.084)

 0.0438
1  exp( S ) 1  exp( 3.084)
O
R
0.0438

 0.0458
1  R 1  0.0438
137
138
Rischio ( R0 )
Estimate paziente
Costante
-19.6 1.0000
Log(Età)/2.7
1.11
11
Fumo
0.83
1
Familiarità
0.64
1
PAS (mmHg)
0.011
140
Colesterolo (mg/dl) 0.0095
220
TRATTAMENTO
-0.32
0
Estimate paziente
-19.6 1.0000
1.11
11
0.83
1
0.64
1
0.011
140
0.0095
220
-0.32
1
Dati di sopravvivenza
• Y= durata (tempo di sopravvivenza) t di un
evento: tempo di guarigione di una ferita
chirurgica, sopravvivenza di pazienti con
miocardio trapiantato, durata di una protesi
dentaria, ecc.
B*X
-19.6
11.7
0.83
0.64
1.54
2.09
0
•
-2.7639
0.0593
0.063
R
exp( S )
exp( 2.764)

 0.0593
1  exp( S ) 1  exp( 2.764)
O
R
0.0593

 0.063
1  R 1  0.0593
La distribuzione di t viene descritta dalla
funzione di sopravvivenza:
S(t)= Pr(individuo è ancora vivo al tempo t)
• o equivalentemente dalla funzione di rischio
istantaneo (hazard risk):
h(t )  lim
 0
139
Pr(individuo muore (t   ) | vivo t )

140
35
Follow-up (1)
30
0
da cui ottengo funzione di sopravvivenza:
20
y
numero morti al tempo t
hˆt  t 
nt numero soggetti a rischio al tempo t
10
Numero identificativo dei pazienti
• Per un gruppo omogeneo posso usare
metodo del prodotto limite (detto anche
metodo di Kaplan-Meier, 1958) per
calcolare rischio istantaneo al tempo t:
40
Calcolo h( t ) e S( t )
0
Sˆt  (1  h1 )  (1  h2 )    (1  ht ) 
5
10
15
20
25
30
  (1  hs )
s t
rosso= l’evento finale d’interesse (morte, guarigione) è
accaduto nel periodo dello studio
t= ciascun tempo di sopravvivenza puntuale
(distinto) osservato nel periodo follow-up,
oppure raggruppato in classi [tj-tj+1), j=1,…,J
blu= l’evento finale d’interesse (morte, guarigione) non
è ancora accaduto alla fine dello studio
141
142
Curva di sopravvivenza
x
5
10
y
15
20
settimane
n
9
9
6
2
4
0
0
x
o
x
x
x
0
x
x
o
41
32
23
17
15
11
11
h
0.2195
0.2813
0.2609
0.1176
0.2667
0
0
25
1-h
0.7805
0.7188
0.7391
0.8824
0.7333
1
1
30
S
0.7805
0.561
0.4146
0.3659
0.2683
0.2683
0.2683
35
1.0
0.8
0.6
10
x
o
x
controllo
sperimentale
0.4
x
x
[0-5)
[5-10)
[10-15)
[15-20)
[20-25)
[25-30)
[30-35)
o
x
x
o
x
x
x
o
o
frazione di sopravvissuti
x
x
o
x
o
x
0.2
30
20
x
x
x
x
x
Dati di Gehan (1965)
o
0.0
40
o
x
o
x
x x
0
Num ero idenrtificativo dei pazienti
Follow-up (2)
x
35
settimane
0
5
10
15
20
25
30
35
settimane
143
144
36
Regressione di Cox
Variabile x binaria
• Se Y= durata (tempo di sopravvivenza) si
utilizza una regressione log-lineare di
rischio istantaneo (regressione di Cox):
• Se Y= tempo (in giorni) di una ricaduta di
cardiopatia ischemica
• Se X1= trattamento (1=farmaco; 0=placebo)
ln h (t )  ln h0 (t )  b1 x1  b 2 x2    b p x p
•
h(t) = rischio istantaneo per un soggetto
ancora in vita al tempo t
b1 è il cambiamento atteso di log-rischio
istantaneo dato dalla differenza fra farmaco=1
e placebo=0:
 h(t | farmaco) 
 y  ln 
  ln HR  b1
 h(t | placebo) 
h0(t)= rischio istantaneo
basale(background) al tempo t quando
fattori prognostici x=0
bj è il cambiamento atteso di log-rischio
istantaneo per un cambiamento unitario di
xj, ovvero da xj a (xj+1)
145
p variabili x
Perciò exp(b1)= hazard ratio (rapporto fra
rischi istantanei) = rapporto fra il rischio di
ricaduta a qualsiasi tempo t (indipendente
da t) dei pazienti trattati con farmaco
rispetto al rischio dei trattati con placebo
146
Cosa significa?
• Se valuto effetto trattamento in due soggetti
uno trattato con farmaco (x4=1) e l’altro
trattato con placebo (x4=0) con le stesse
caratteristiche (45y; M; TT) e stesso tempo t
ottengo:
• Y= tempo (in giorni) di una ricaduta di
cardiopatia ischemica
• X1= età
• X2= sesso (1=M; 0=F)
• X3= MTHFR (1=TT; 0=CC,CT)
• X4= (1=farmaco; 0=placebo)
ln h(t|1 )  ln h0(t)  b1  45  b 2  b 3  ( b 4  1)
ln h(t|0 )  ln h0(t)  b1  45  b 2  b 3  ( b 4  0)
• Se considero due soggetti uno trattato con
farmaco (x4=1) e l’altro trattato con placebo
(x4=0) con diverse caratteristiche (45y; M; TT
vs. 33y; F; CC) e stesso tempo t ottengo:
ln h(t|0 )  ln h0(t)  β1  45  β2  β3  (β4  1 )
ln h(t|1 )  ln h0(t)  β1  33  (β4  0 )
ln HR  β1  12  β2  β3  β4
147
ln HR  b 4
• Cambio le caratteristiche (33y; F; CC):
ln h(t|1 )  ln h0(t)  b1  33  ( b 4  1)
ln h(t|0 )  ln h0(t)  b1  33  ( b 4  0)
ln HR  b 4
• Vale per tutti i valori di x1, x2, x3 ! b4
rappresenta ln(HR) fra farmaco e placebo
mantenendo costante (aggiustando per)
l’azione delle altre variabili x1, x2, x3
148
37
Esempio
XLSTAT
• Dati tratti dal primo e famoso clinical trial sulla
chemioterapia+terapia ausiliaria sul tumore al colon.
Levamisole è un componente a bassa tossicità
precedentemente usato per trattare infezioni di vermi
negli animali; 5-FU è un agente chemioterapico con
moderata tossicità (come si pensava alle conoscenze
del tempo): CG Moertel et al. Levamisole and
fluorouracil for adjuvant therapy of resected colon
carcinoma. New England J of Medicine, 332: 352-358,
1990.
•
•
•
•
•
•
•
•
•
•
•
rx: Obs(ervation), Lev(amisole), Lev(amisole)+5-FU
sex: 1=male
age: in years
obstruct: obstruction of colon by tumour (1=yes)
perfor: perforation of colon (1=yes)
adhere: adherence to nearby organs (1=yes)
nodes: number of lymph nodes with detectable cancer
time: days until event or censoring
status: censoring status (1=no)
differ: differentiation of tumour (1=well, 2=moderate, 3=poor)
extent: Extent of local spread (1=submucosa, 2=muscle,
3=serosa, 4=contiguous structures)
• surg: time from surgery to registration (1=long; 0=short)
• node4: more than 4 positive lymph nodes (1=yes)
149
• Etype: event type (1=recurrence, 2=death)
Tabella MLE
rxLev
rxLev+5FU
sex
age
obstruct
perfor
adhere
nodes
differ
extent
surg
node4
150
Hazard Ratios (HRs)
Estimate SE
z-test
P-value
-0.02616
0.11091
-0.236
0.81000
-0.49988
0.12183
-4.103
0.00004
-0.13821
0.09586
-1.442
0.15000
-0.00268
0.00405
-0.662
0.51000
0.19469
0.11926
1.633
0.10000
0.21079
0.25654
0.822
0.41000
0.16039
0.12991
1.235
0.22000
0.03823
0.01508
2.535
0.01100
0.15304
0.09792
1.563
0.12000
0.45128
0.11892
3.795
0.00015
0.23995
0.10411
2.305
0.02100
0.59109
0.14122
4.186
0.00003
COMMENTO: dopo aver aggiustato ciascuna
variabile per le altre, il rischio istantaneo di
ricorrenza, indipendente da t, di un paziente
trattato con Lev+5FU rispetto a quello trattato
con placebo è più basso (di quanto?)
151
rxLev
rxLev+5FU
sex
age
obstruct
perfor
adhere
nodes
differ
extent
surg
node4
Estimate SE
z-test
HR=exp(B)
-0.02616
0.11091
-0.236
0.97418
-0.49988
0.12183
-4.103
0.60660
-0.13821
0.09586
-1.442
0.87092
-0.00268
0.00405
-0.662
0.99732
0.19469
0.11926
1.633
1.21493
0.21079
0.25654
0.822
1.23465
0.16039
0.12991
1.235
1.17397
0.03823
0.01508
2.535
1.03897
0.15304
0.09792
1.563
1.16537
0.45128
0.11892
3.795
1.57032
0.23995
0.10411
2.305
1.27119
0.59109
0.14122
4.186
1.80596
 h(t | farmaco) 
  0,50
 h(t | placebo) 
b  ln HR  ln 
HR 
h(t | farmaco)
 exp( 0,50)  0,61
h(t | placebo)
95%CI( b )  0.50  1.96  0.12  ( 0,74;  0,26)
152
95%CI( HR )  exp( 0,74;  0,26)  (0,48; 0,77)
38
Curva di sopravvivenza
Deviazioni dal protocollo
•



Survival distribution function
1
0.9
0.8
0.7
Coinvolgono il trial:
Incorretta valutazione del trattamento
Soddisfare le necessità del paziente
Farmaco non stabile (catastrofe!)
0.6
0.5
0.4
0.3
0.2
0.1
0
0
500
1000
1500
2000
2500
3000
3500
time
Lev+5FU
Obs
Lev
xi<-c(0, 60, 0, 0, 0, 4, 2, 3, 0, 0)
xj<-c(sex, age, obstruct, perfor, adhere, nodes, differ, extent, surg, node4)
• Coinvolgono singoli pazienti:
 Pazienti non eleggibili
 Non aderenza terapia
– non collaborazione
– modifica terapia
 Valutazione incompleta
– rifiuto del paziente
– giudizio clinico
– drop-out (usciti dal trial)
153
Deviazione protocollo
154
Modelli trivariati
• Intention to treat: Method of analysis for
randomised controlled trials in which all patients
are analysed as they were randomised,regardless
of behaviour or treatment received.
• As treated: Method of analysis for randomised
controlled trials in which all patients are analysed
on the basis of the treatment ultimately received,
regardless of the treatment to which they were
randomly assigned.
• Per protocol: Method of analysis for randomised
controlled trials in which individuals are included
in the analysis only if they followedthe assigned
protocol and are removed from the analysis
entirely if they do not follow protocol
• IV: Method of analysis for randomised controlled
trials in which all patients are analysed as they
were randomised and then the result adjusted for
treatment contamination by using an instrumental
variable.
155
156
39
Confondimento
Confondente (esempio)
Ogni studio osservazionale può essere
“confuso” dalla presenza di uno o più
confondenti (Z), cioè di fattori che
possono influenzare la relazione fra
fattore di rischio (X) e stato di malattia
(Y).
Y+
X+
240
X200
Y-
420
350
Y+
Z presente
X+
X165
5
X+
Z assente
Y+
Y75
195
Y-
385
X-
35
Perché una variabile Z possa apparire
come un confondente deve essere:
1) correlata al fattore di rischio (X), ma
non esserne conseguenza
2) correlata alla malattia (Y), ma non
esserne conseguenza
X
SI
?
Y
X
Z
NO
?
Y
X
Z
NO
?
Z
Y
OR 
45
165  45
 3.86
5  385
OR 
240  350
1
200  420
OR 
305
75  305
 3.35
195  35
157
Modello confondimento
158
Confondimento (glm)
1. Dati: ( y1 , x1 , z1 ), ( y 2 , x1 , z 2 ),, ( y n , xn , z n )
2. Modello lineare:
X
Y
Z
Step 1:
E ( y )  b 0*  b1* xi
Step 2:
E ( y )  a 0  a 1 zi
Step 3:
E ( y )  b 0  b1 xi  b 2 zi
2.Modello logistico:
*
*
Step 1: ln( p y1 / p y 0 )  b 0  b1 xi
Step 2: ln( p y1 / p y 0 )  a 0  a1 zi
Step 3: ln( p y1 / p y 0 )  b 0  b1 xi  b 2 zi
X= variabile indipendente
Y= variabile dipendente
Z= confondente
3.Interpretazione parametri:
se lineare: parametri (a,b=m0, MD
159
se logistico: parametri (a,b=logO, logOR 160
40
Step 1
Step 1
YX
ORYX
X
Y
X
Y
Z
Z
(Mann et al, BMJ 1968; 2: 193-199)
La variabile indipendente, X= uso di
contraccettivi orali (si=1; no=0) causa la
variabile dipendente, Y= infarto del
miocardio (si=1; no=0)
La variabile indipendente, X causa la
variabile dipendente, Y
X+
X-
Y+
a
b
Y-
c
d
OR XY
RR XY
Y+
RD XY
X+
29
X114
Y-
24
154
OR XY  2.20
z  2.74
P  0.006
161
162
Step 2
X
Step 2
Y
X
xz
Y
ORXZ
Z
Z
(Mann et al, BMJ 1968; 2: 193-199)
Il confondente, Z causa la variabile
indipendente, X
Z+
X+
s
Xt
OR XZ
Z-
u
v
RD XZ
Il confondente, Z= età donna (<40y=1; 4044y=0) causa la variabile indipendente, X=
uso di contraccettivi orali (si=1; no=0)
RR XZ
163
Z+
X+
38
X85
Z-
25
183
OR XZ  3.27
z  4.10
P  0.001
164
41
Step 3
Tabella 4x2 (OR e MD)
YX|Z
X
Y
Z
Y+
Y- odds
Z+
X+
a1
b1 O11=exp(b0+b1+b2)
Z+
X-
c1
d1 O10 =exp(b0+b2)
Z-
X+
a0
b0 O01 =exp(b0+b1)
Z-
X-
c0
d0 O00= exp(b0)
ORYX |Z 
La variabile indipendente, X causa la
variabile dipendente, Y controllando per
l’effetto del confondente, Z: YX|Z
165
Step 3
X
ORYX|Z
O11 O01

 exp( b1 )
O10 O00
my
sy media
Z+
X+
m1
s1 m11=b0+b1+b2
Z+
X-
m2
s2 m10 =b0+b2
Z-
X+
m3
s3 m01 =b0+b1
Z-
X-
m0
s0 m00=b0
MDYX |Z  m11  m10  m01  m00  b1
166
XLSTAT
Y
Z
(Mann et al, BMJ 1968; 2: 193-199)
La variabile indipendente, X= uso di
contraccettivi orali (si=1; no=0) causa la
variabile dipendente, Y= infarto del
miocardio (si=1; no=0) controllando per
il confondente, Z= età donna (<40y=1; 4044y=0)
167
168
42
Tabella MLE (OR)
(Intercept)
x
z
Confounder bias
Estimate S.E.
z -test
Pr(>|z|)
-2.6119
0.3033
-8.612
1.0266
0.3056
3.36 0.000780
1.3695
0.303
4.52 0.000006
Y+
Y-
odds
X+
21
26 O11=0.81  O11=0.806
Z+
X-
17
59 O10=0.29  O10=0.289
Z-
X+
18
88 O01=0.20  O01=0.205
Z-
X-
7
95 O00=0.07  O00=0.073
0.81 0.20

 2.79
0.29 0.07
 exp(1.0266)  2.79
ORYX |Z 
169
ln2.20
YX
YX|Z
Y
Y
bias  YX |Z  YX
var( bias)  SE (YX |Z )  SE (YX ) 2
z
YX |Z  YX
SE (YX |Z )  SE (YX )
P
170
Studio sperimentale
Confounder bias
X
X
MLE odds
Z+
ORYX |Z
X
• Il confondimento in uno studio
sperimentale avviene tra le variabili di
baseline (sesso, età, storia clinica, gravità
della malattia, noti polimorfismi genetici,
etc) e il trattamento
Y
ln2.79
X
• Con la randomizzazione si evita “bias”
sistematico di selezione : le caratteristiche
(Z) dei pazienti che possono influenzare
l’esito (Y) sono distribuite a caso fra i
trattamenti (X): Z non è associato a X !
Y
bias  ln 2.79  ln 2.20  0.240
var( bias)  0.306  0.2872  0.0182
z
ln 2.79  ln 2.20
 13.3  P  0.001
0.306  0.287
171
• Le caratteristiche Z non sono più un
confondente (manca la relazione X-Z), ma
possono essere associate all’esito (c’è la
relazione Z-Y) e sono definite variabili
(fattori) prognostici
172
43
Moderatore (esempio)
Moderazione (interazione)
Un moderatore (o modificatore d’effetto)
Z è una variabile che ha effetto sulla
forza della relazione tra fattore di rischio
(X) e stato di malattia (Y), ovvero il
legame tra X e Y dipende da una terza
variabile Z
Perché una variabile Z possa apparire
come un moderatore deve essere:
1) NON correlata al fattore di rischio X
2) intervenire (interagire) nel legame fra
il fattore di rischio X e la malattia Y:
SI
NO
Z
?
Y
Z
X35
Y-
508
617
Y+
Z presente
X+
X35
15
Y+
Z assente
X+
X32
20
Y-
32
85
Y-
476
OR 
35  85
 6.20
15  32
OR 
67  617
 2.33
35  508
532
SI
Y
Z
?
X
Y+
X+
67
Y
?
X
OR 
32  532
 1.79
20  476
X
173
Modello moderazione
174
Moderazione(glm)
1. Dati: ( y1 , x1 , z1 ), ( y 2 , x1 , z 2 ),, ( y n , xn , z n )
2. Modello lineare:
X

Step 1: E ( y )  b *  b * x
0
1 i
Y
Step 2: E ( y )  a 0  a1 zi
Step 3: E ( y )  b 0  b1 xi  b 2 zi  b 3 xzi
Z
2.Modello logistico:
Step 1: ln( p y1 / p y 0 )  b 0*  b1* xi
Step 2: ln( p y1 / p y 0 )  a 0  a1 zi
Step 3: ln( p y1 / p y 0 )  b 0  b1 xi  b 2 zi  b 3 xzi
X= variabile indipendente
Y= variabile dipendente
Z= moderatore
3.Interpretazione parametri:
se lineare: parametri (a,b=m0, MD
175
se logistico: parametri (a,b=logO, logOR 176
44
Step 1
Step 1
YX
ORYX
X
Y
X
Y
Z
Z
(McCusker et al. Lancet 2001; 357: 436-39)
La variabile indipendente, X= allele e4
APOE (si=1; no=0) causa la variabile
dipendente, Y= malattia di Alzheimer
(si=1; no=0)
La variabile indipendente, X causa la
variabile dipendente, Y
X+
X-
Y+
a
b
Y-
c
d
OR XY
RR XY
Y+
X+
125
RD XY
Y-
52
X117
183
OR XY  3.76
z  6.52
P  0.001
177
178
Step 2
X
Step 2
Y
X
xz=0;1
Y
ORXZ
Z
Z
(McCusker et al. Lancet 2001; 357: 436-39)
La variabile indipendente, X= APOE e4
(si=1; no=0) NON causa il moderatore Z=
allele TNF-a T (si=1; no=0) o viceversa
la variabile indipendente, X NON causa
il moderatore, Z o viceversa Z NON
causa X
Z+
X+
s
Xt
OR XZ
Z-
u
v
RD XZ
RR XZ
179
Z+
X+
62
X117
Z-
115
183
OR XZ  0,84
z  0,865
P  0.387
180
45
Step 3
Tabella 4x2 (OR e MD)
Y+
X
xyz

Y
Z
Y- OR
Z+
X+
a
b
OR11=exp(b1+b2+b3)
Z+
X-
c
d
OR10 =exp(b2)
Z-
X+
e
f
OR01 =exp(b1)
Z-
X-
g
h
OR00=1
IOR 
Il moderatore, Z agisce sulla relazione
fra la variabile indipendente, X e la
variabile dipendente, Y
181
Step 3
OR11
 exp( b 3 )
OR10  OR01
my
sy MD
Z+
X+
m1
s1 m11-m00=b1+b2+b3
Z+
X-
m2
s2 m10 -m00=b2
Z-
X+
m3
s3 m01 -m00=b1
Z-
X-
m0
s0 m00-m00=0
IMD  MD11  ( MD10  MD01 )  b 3
182
XLSTAT
IOR
X

Y
Z
(McCusker et al. Lancet 2001; 357: 436-39)
Il moderatore, Z= TNF-a T (si=1; no=0)
agisce sulla relazione fra la variabile
indipendente, X= APOE e4 (si=1; no=0)
e la variabile dipendente, Y= malattia di
Alzheimer (si=1; no=0)
183
184
46
ADE (Pearl, 2000)
Tabella MLE (OR)
Estimate S.E.
z -test
Pr(>|z|)
(Intercept) -0.2973
0.1495
-1.989
x
1.0035
0.2483
4.042 0.000053
z
-0.3959
0.2466
-1.605 0.108400
xz
0.9218
0.4386
2.102 0.035600
Y+
Y-
X
xyz

Y
Z
MLE OR
Z+
X+
48
14 OR11=4.62
Z+
X-
39
78 OR10=0.67
Z-
X+
77
38 OR01=2.73
Z-
X-
78
105 OR00=1
DE (0)  ln ORYX |Z  0  ln OR01  b1
DE (1)  ln ORYX |Z 1  ln OR01  ln IOR  b1  b 3
ADE  p0 DE (0)  p1 DE (1)  b1  p1b 3
dove:
4.62
IOR 
 2.51
0.67  2.73
IOR  exp( 0.9218)  2.51
p1  Pr( Z  1)  ( s  t ) / n
p0  Pr( Z  0)  (u  v ) / n
185
186
Interazione “completa”
Percentuale ADE
MRS
ln2.73+0.38·ln2.51
X

3,00
Y
infarct
heamorrhage
2,50
odds ratio
Z
OR11
2,00
1,50
1,00
p1  (62  117) / 477  0.375
0,50
p0  (115  183) / 477  0.625
0,00
OR00=1
OR01
LC1:low
DE (0)  ln 2.73  1.004
p1 ln IOR  0.375  ln 2.51  0.345
ADE  1.004  0.345  1.349 (e1.349=3.85)
ADE %  74.4%  25.6%  100%
187
OR10
LC2:high
Y=mRS: neurological deficit at 90 days
defined as 1=favorable (mRS 0 to 2) and
2=unfavorable (mRS 3 to 6)
188
47
Interazione “parziale”
Interazione “nulla”
NIHSS48h
DEAD90B
3,00
4.00
infarct
OR11
infarct
heamorrhage
3.50
heamorrhage
3.00
2,00
OR10
odds ratio
odds ratio
2,50
1,50
1,00
OR00=OR01=1
2.50
2.00
1.50
1.00
0,50
OR11
OR01
OR10
OR00=1
0.50
0,00
0.00
LC1:low
LC2:high
LC1:low
Y= NIHSSscale at 48h: early neurological
deterioration, defined as 1=an increase in
NIHSS score of 4 points or more within the
first 48 hours of hospitalization, and
0=otherwise
Y=DEAD=mortality at 90 days the case
fatality included all-cause mortality within 90
days, defined as 1=yes, and 2=no
189
La mediazione è parte del meccanismo
generativo (la via) attraverso cui la
variabile indipendente “focale” (o di
interesse), X influenza la variabile
dipendente, Y (Baron& Kenny, 1986)
X
?
Y
Z
X
Y
Z
X= variabile indipendente
Z= mediatore
Y= variabile dipendente
SI
NO
X
?
Y
Z
La variabile di mediazione Z:
1) è una variabile intermedia nella
sequenza casuale X-Z-Y;
2) non è un moderatore dell’effetto di X
su Y o viceversa X non è un moderatore
dell’effetto di Z su Y
X
190
Modello mediazione
Mediazione
NO
LC2:high
Y
Z
Baron RM, Kenny DA, JPSP 1986
191
192
48
Baron & Kenny Step 1
Mediazione (glm)
1. Dati: ( y1 , x1 , z1 ), ( y 2 , x1 , z 2 ),, ( y n , xn , z n )
YX
2. Modello lineare:
X
b 0*
E ( y) 
Step 2:
E ( y )  a 0  a 1 zi
Step 3:
E ( y )  b 0  b1 xi  b 2 zi

Y
b1* xi
Step 1:
Z
2.Modello logistico:
Step 1: ln( p1 / p0 )  b 0*  b1* xi
La variabile indipendente, X causa la
variabile dipendente, Y
Step 2: ln( p1 / p0 )  a 0  a1 zi
Step 3: ln( p1 / p0 )  b 0  b1 xi  b 2 zi
3.Interpretazione parametri:
se lineare: parametri (a,b=m0, MD
X+
Y+
a
Yb
OR XY
X-
c
d
RD XY
RR XY
se log(odds): parametri (a,b=logO, logOR193
Step 1
194
Baron & Kenny Step 2
ORYX
X
Y
X
Y
ZX
Z
Z
(Pezzini et al. Stroke 2007; 38: 3145-3151)
La variabile indipendente, X=MTHFR TT
(si=1; no=0) causa la variabile dipendente,
Y=sCAD, spontanea dissezione arteria
cervicale (si=1; no=0)
Y+
Y-
X+
33
73
X-
26
160
OR XY  2.78
z  3.44
P  0.0006
195
La variabile indipendente, X causa il
mediatore, Z
Z+
X+
s
Xt
Z-
u
v
ORZX
RRZX
RDZX
196
49
Baron & Kenny Step 3
Step 2
YX|Z
X
Y
X
Y
ORZX
YZ|X
Z
Z
(Pezzini et al. Stroke 2007; 38: 3145-3151)
La variabile indipendente, X= MTHFR
TT (si=1; no=0) causa il mediatore, Z=
emicrania con aurea (si=1; no=0)
Z+
X+
9
X13
Z-
50
220
•Il mediatore, Z causa la variabile
dipendente, Y controllando per l’effetto
della variabile indipendente, X: YZ|X
•La variabile indipendente, X causa la
variabile dipendente, Y controllando per
l’effetto del mediatore, Z: YX|Z
ORZX  3.05
z  2.42
P  0.0157
197
Step 3
198
XLSTAT
ORYX|Z
X
Y
ORYZ|X
Z
(Pezzini et al. Stroke 2007; 38: 3145-3151)
•La variabile indipendente, X= MTHFR TT
causa la variabile dipendente, Y=sCAD=
spontanea dissezione arteria cervicale,
controllando per il mediatore, Z= emicrania
con aurea
•Il mediatore, Z=emicrania con aurea causa la
variabile dipendente, Y=sCAD controllando
per la variabile indipendente, X= MTHFR TT
199
200
50
TE=DE+IE (Huang et al, 2004)
Tabella MLE (OR)
(Intercept)
x
z
Estimate S.E.
z-test
Pr(>|z|)
-0.8509
0.1457
-5.842
0.9442
0.3028
3.118 0.001820
1.0563
0.4736
2.23 0.025720
Y+
Y-
odds
X+
7
2
O11=3.50  O11=3.157
Z+
X-
7
6
O10=1.17  O10=1.228
Z-
X+
26
24 O01=1.08  O01=1.098
Z-
X-
66
154 O00=0.43  O00=0.427
3.16 1.10

 2.57  exp( b1 )
1.23 0.43
3.16 1.23


 2.88  exp( b 2 )
1.10 0.43
b2
Z
DE  b1
IE  ( q1  q0 )  b 2
TE  b1  ( q1  q0 )  b 2
s
su
t
q0  Pr( Z  1 | X  0) 
tv
q1  Pr( Z  1 | X  1) 
201
Percentuale TE (lnOR)
model=logit: parametri=lnOR
model=linear: parametri=MD
X
Y
1.06=ln2.88
202
Percentuale TE (MD)
0.94=ln2.57
(0.15-0.06)
Y
dove:
ORYX |Z 
X
b1
(q1-q0)
 MLE odds
Z+
ORYZ |X
X
b1
Y
b2
(0.15-0.06)
Z
Z
9
 0.15
9  50
13
q0 
 0.06
13  220
q1 
9
 0.15
9  50
13
q0 
 0.06
13  220
q1 
DE  0.944
IE  (0.15  0.06)  1.06  0.102
TE  0.944  0.102  1.046 (e1.046=2.85)
203
TE %  90.2%  9.8%  100%
DE  b1
IE  (0.15  0.06)  b 2
TE  b1  (0.15  0.06)  b 2
TE %  DE / TE %  IE / TE %
204
51
Modelli multivariati (sem)
Internet
 BMJ statistical series
• http://www.bmj.com/
• nella casella Search: “statistics notes”
 XLSTAT
• http://www.xlstat.com/
R
• http://cran.r-project.org/
205
206
52