Sequenza della ricerca clinica Definire l’obiettivo della ricerca: formulare l’ipotesi Università degli Studi di Pavia Department of Brain and Behavioural Sciences Medical and Genomic Statistics Unit Via Bassi 21- 27100 PAVIA-I Disegnare la ricerca: redigere protocollo Statistica Medica 2 Eseguire la ricerca: organizzazione e raccolta dati Analisi statistica : P-value e 95%CI modelli regressione Mario Grassi Università di Pavia [email protected] 1 Formulare conclusioni: pubblicazione risultati 2 Tipo di trial (scopo) Trial di intervento •Trial d’intervento: azione sui fattori di rischio dei soggetti con “alta probabilità” di ammalarsi (prevenzione secondaria) Community trial Trial preventivo •Trial preventivi: azione sui fattori ambientali o comunque esterni (inquinanti, germi, tec.) per impedire che i soggetti si ammalino Trial di efficacia N>S •Trial terapeutici (clinici): procedura terapeutica (farmaco, intervento chirurgico ecc.) per alleviare i sintomi e migliorare la sopravvivenza Clinical trial Trial di equivalenza N=S o NS 3 4 1 Disegno a gruppi paralleli Tipo di trial (disegno) Hanno lo scopo di studiare l’efficacia di un trattamento (un farmaco, un procedura chirurgica, ecc.) su un campione di soggetti affetti da una determinata patologia dopo un assegnazione casuale (randomizzazione) a due o più gruppi di trattamento: 2 o più gruppi paralleli 1 gruppo appaiato (disegno pre-post) 2 gruppi incrociati (disegno cross-over) 2x2 gruppi paralleli (disegno fattoriale) Trattamento (S) esito (y0) Trattamento (N) esito (y1) n 5 6 Esempio 1 Esempio 2 Tabella 2x2 di un trial clinico sull’efficacia (+=successo; = insuccesso: mortalità entro 90g) di una nuova procedura farmacologica (metoprolol) rispetto alla procedura standard in pazienti con infarto acuto del miocardio (Hjalmarson et al. Lancet 1981, ??: 823-827): Tabella 2x2 di un trial clinico sull’efficacia (=riduzione dal basale del numero/die di sigarette dopo 6 settimane) di un inalatore orale (10 mg nicotine +1 mg menthol) rispetto al placebo in soggetti volontari fumatori (Bolliger et al. BMJ 2000; 321:329–33). N.B basale= 30 sigarette/die: Trattamento Trattamento Esito Nuovo Standard Totale Esito 40=a 62=b 102=m1 media + 658=c 635= d 1293=m0 Totale 698=n1 687=n0 1395=n 7 Attivo Placebo A+P 15.6 y1 13.4 y0 14.5 y varianza 2.7 2 s12 2.2 2 s02 2.52 s 2p n 117=n1 104=n0 221 8 2 Disegno appaiato Esempio 3 Tabella 2x2 di un trial clinico sull’efficacia (+=successo; =insuccesso) di due analgesici: un gruppo di pazienti con sintomi da "dolore“ persistente vengono trattati inizialmente con il farmaco A; finito l'effetto farmacologico, dopo un certo periodo di tempo, sono trattati con B: Hanno lo scopo di studiare l’efficacia di un trattamento (un farmaco, una procedura chirurgica, ecc.) su un campione di soggetti affetti da una determinata patologia valutati in tempi sucessivi: Prima (S) Prima (S) esito (y0) Dopo (N) + Totale 12=e 7=f 19=m1 + 5=g 16=h 21=m0 17=n1 23=n0 40=n n Dopo (N) esito (y1) Totale 9 10 Esempio 4 Disegno cross-over Tabella 2x2 di un trial clinico sull’efficacia (differenza medie fra tempi del numero di piastrine×10000/mm3 nel sangue dell'aorta) del farmaco attivo (dipridamolo) rispetto al placebo in un gruppo di pazienti con almeno il 50% di occlusione di una o più arterie coronariche (Metha et al. Am. J. Card. 1981; 47: 1111-4) Hanno lo scopo di studiare l’efficacia di un trattamento (un farmaco, una procedura chirurgica, ecc.) su un campione di soggetti affetti da una determinata patologia valutati dopo una assegnazione casuale (randomizzazione) a due o più sequenze di trattamento: Trattamento Esito Dopo(N) Prima(S) 29.4 y 0 1.7 d varianza 9.36 2 s12 8.09 2 s02 2.412 sd2 n 10 10 10 esito (y10) Dopo (B) esito (y11) Prima (B) esito (y20) Dopo (A) esito (y21) AB N-S 30.1 y1 media Prima (A) 11 n BA 12 3 Esempio 5a Esempio 5 Tabella 2x2 di un trial clinico sulla scelta del placebo nell’agopuntura (+=uguale sensazione di puntura; =non uguale): un gruppo AB di pazienti con protesi al ginocchio vengono sottoposti per 2 settimane ad agopuntura inizialmente con l’ago di ‘Streitberger’ (nuovo=A) e le successive 2 settimane con un ago convenzionale (placebo=B); e viceversa per il gruppo BA (White et al. Pain 2003;106; 401–409): Gruppo 1= ordine dei trattamenti AB: Prima (A) + Totale e1 f1 m11 + g1 h1 m01 Totale n11 n01 n1 Dopo (B) A B Prima (A) + Totale 20 3 23 + 6 8 14 Totale 26 11 37 Dopo (B) + Totale 9 1 10 + 5 3 8 Totale 14 4 18 13 14 Esempio 6 Esempio 5b Tabella 2x2 di un trial clinico sull’efficacia (=differenza media del picco di flusso espiratorio massimo, PFE) di inalatori (A o B) di steroidi per il trattamento dell’asma dopo assegnazione casuale della sequenza A nel primo mese e B nel secondo mese, o B nel primo mese e A nel secondo mese (Pocock SJ, 1983: p118): Gruppo 2= ordine dei trattamenti BA: Prima (B) Dopo (A) + Totale e2 f2 m12 + g2 h2 m02 Totale n12 n02 n2 periodo Prima (B) gruppo Dopo (A) + Totale 11 1 12 + 2 5 7 Totale 13 6 19 1=1m 2=2m 1 AB 310.1 y11 343.1 y12 2 BA 335.8 y 21 339.7 y 22 15 n n1 14 n2 13 16 4 Disegno fattoriale Esempio 7 Hanno lo scopo di studiare l’efficacia e l’interazione di due o più trattamenti (un farmaco, una procedura chirurgica, ecc.) su un campione di soggetti affetti da una determinata patologia dopo un assegnazione casuale (randomizzazione) alla combinazione di due o più gruppi di trattamento: A+B+ esito (y11) A+B- esito (y10) esito (y01) esito n A-B+ A-B- Tabella 4x2 di un trial clinico sulla efficacia (+/ = no/si mortalità a 6 mesi), indipendente o insieme, di 300 mg/die di aspirina per 10die (A) e 1-ora di infusione intravenosa 1.5 MU di streptochinasi (B) in un gruppo di pazienti con un ictus ischemico randomizzati in 4 gruppi paralleli (MUST-I. Lancet 1995; 346: 1509-1514 + A+ B+ 68=a 88=b 156=n1 A+ B- 30=c 123=d 153=n2 A- B+ 44=e 113=f 157=n3 A- B- 45=g 111=h 156=n4 187=m1 437=m0 622=n totale esito (y00) totale 17 18 Esempio 8 Riepilogo Tabella 4x2 di un trial clinico sulla efficacia (=riduzione di marker biochimici alla fine del trial), indipendente o insieme, di un maggiore supplemento di vitamina B-6 (A) e acidi grassi omega 3 (B) per circa 5 anni, in un gruppo di pazienti con una storia di malattia cardiovascolare randomizzati in 4 gruppi paralleli (Galan et al. BMJ 2010; 341: c6273) esito (folati, ng/ml) media dev.std A+ B+ 16.1 4.2 630=n1 A+ B- 15.4 5.0 633=n2 A- B+ 6.4 3.5 622=n3 A- B- 6.5 2.9 626=n4 • Disegno 2 gruppi paralleli: R1 R0 62 40 3.3% 687 698 P ??? y1 y 0 13.4 ( 15.6) 2.2u P ??? • Disegno appaiato: f g 75 5% n 40 P ??? y1 y 0 29.4 30.1 0.7u P ??? • Disegno cross-over: f g 36 8 % n 37 19 1 [( y11 y 22 ) ( y12 y 21 )] 14.6u 2 P ??? P ??? 20 5 Riepilogo Disegno a gruppi paralleli • Disegno 2x2 fattoriale: SEMPLICE E ADATTO A: • gran parte degli studi • patologie acute • studi di lunga durata R 43.6% 43.6 28.8 15.4% R 19.6% 19.6 28.8 9.2% R 28.0% 28.0 28.8 0.8% R 28.8% CONSENTE DI: • reclutare i pazienti “nel tempo” • ovviare a dati mancanti • utilizzare il placebo • evitare il “wash-out” • applicare il disegno fattoriale 0% I 15.4 [( 9.3) ( 0.8)] 25.5% y 16.1u 16.1 6.5 9.6u y 15.4u 15.4 6.5 8.9u y 6.4u 6.6 6.5 0.1u y 6.5u LIMITI • poco adatto a malattie rare • necessita di molti pazienti • “bias” di selezione (stratificazione) • elevata variabilità “entro pazienti/centri” 0u I 9.6 [8.9 ( 0.1)] 0.8u 21 Disegno a gruppi paralleli 22 Disegno cross-over SEMPLICE E ADATTO A: • gran parte degli studi • patologie acute • studi di lunga durata IDEALE PER: • situazione clinica stabile • studi di breve durata • studi di risposte a terapie brevi (miglioramento a breve termine di segni o sintomi) • malattia rara e effetto farmacologico breve CONSENTE DI: • reclutare i pazienti “nel tempo” • ovviare a dati mancanti • utilizzare il placebo • evitare il “wash-out” • applicare il disegno fattoriale LIMITI: • drop-out e dati mancanti (collaborazione pazienti deve essere “buona”) • malattia NON IDONEA (malattia non a breve termine) • “CARRY OVER” e “WASH OUT ” LIMITI • poco adatto a malattie rare • necessita di molti pazienti • “bias” di selezione (stratificazione) • elevata variabilità “entro pazienti/centri” DIFFICILE DA ORGANIZZARE, MA NECESSITA POCHI PAZIENTI (metà!) e RIDUCE AL MASSIMO LA VARIABILITA’ (confronti fra trattamenti più precisi) 23 24 6 Disegno fattoriale Cross-over a più gruppi Randomizzazione “stratificata” (pilotata) che crea più gruppi paralleli di uguale dimensione (n), esattamente bilanciati per diversi fattori che CONSENTE DI: Disegno a quadrato latino (disegno di Williams): • valutare contemporaneamente terapie concomitanti, diversi indirizzi prognostici • stabilire l’efficacia di più trattamenti con una minore numerosità campionaria • evidenziare il fenomeno di interazione fra trattamenti Il disegno garantisce che: 1) ogni soggetto riceva tutti e 4 i trattamenti 2) ogni trattamento ricorra una volta in ogni periodo 3) ogni coppia di trattamenti (per esempio A seguito da C) ricorra una sola volta • analizzare sottogruppi di pazienti LIMITI: difficile da eseguire e analizzare 25 26 Fasi temporali di sviluppo di un intervento/farmaco (I, IIa,IIb) 2x2x2= 8 gruppi Fase I: primi studi su un nuovo principio attivo condotti nell’uomo, spesso su volontari sani (20-80 casi) per: • Valutazione preliminare della sicurezza • Stabilire un dosaggio accettabile e efficace Fase II (a,b): studi terapeutici pilota effettuati su un numero limitato di pazienti volontari (100-200 casi) per: • Dimostrare l’efficacia terapeutica • Valutare la sicurezza a breve termine • Identificare modalità di somministrazione 27 • Identificare rapporto dose/risposta 28 7 Fasi temporali di sviluppo di un intervento/farmaco (IIIa, IIIb) Fasi temporali di sviluppo di un intervento/farmaco (IV) Fase III (a, b): studi su pazienti più numerosi (500-1000+ casi) e possibilmente diversificati, generalmente randomizzati e in doppio cieco (randomized clinical trial: RCT) per: Fase IV: estesi studi condotti dopo la commercializzazione del prodotto, sulla base delle indicazioni del farmaco per studi di: • Farmacovigilanza •Paragonare l’efficacia del nuovo • Valutazione del valore terapeutico su trattamento ai trattamenti usuali e/o al popolazioni spesso non incluse negli placebo studi di fase III •Valutare gli effetti collaterali a breve e medio/lungo termine Se si verifica una valutazione di nuove Le condizioni dello studio dovrebbero indicazioni (effetti collaterali e eventi essere il più vicino possibile alle normali avversi) ritorno alla fase III condizioni d’uso del farmaco 29 Limiti degli studi registrativi 30 Randomized clinical trial • L’immissione sul mercato di un nuovo farmaco non rappresenta la fine della ricerca clinica • Spesso, per problemi di tempo e costi, i risultati ottenuti dagli studi registrativi (fasi 1 - 3a) sono solo sufficienti ad ottenere la registrazione del prodotto • Successivamente, si riscontrano incompletezze della ricerca di tipo: Clinico/farmacologico Metodologico/statistico 31 32 8 RCT Scambiabilità • Lo studio clinico randomizzato (“randomized clinical trial”:RCT) è stato indicato come il paradigma di riferimento per la conduzione di studi medici e epidemiologici osservazionali (bisogna porsi in condizioni “sperimentali” per il controllo delle variabili in studio), perché: • Se la sperimentazione clinica è ben condotta, è valido: • l’assunto di “scambiabilità”= l’effetto del trattamento (N-S) rimane lo stesso se per ipotesi controfattuale ai soggetti con il trattamento S fosse somministrato il trattamento N e viceversa ! • l’associazione esito-trattamento eventualmente individuata non è in generale spuria, ovvero non è soggetta a “bias” sistematici= vale l’assunto di “scambiabilità” 33 Bias sistematici 34 Come fare? Si eliminano differenze sistematiche tra gruppi di trattamento. Per esempio: • bias legato ad altri fattori, a parte il trattamento, che possono variare nel tempo È necessario limitare i fattori di disturbo • Legati al paziente • Legati allo sperimentatore Mezzi a disposizione: • bias legato all’assegnazione del trattamento fatta dal medico, dal paziente o per centro/ricercatore • Randomizzazione • Uso di un gruppo di controllo (placebo/trattamento standard) • Uso del cieco (semplice/doppio/triplo) • bias legato a differenze nelle caratteristiche cliniche e demografiche nei gruppi di trattamento a confronto 35 36 9 R+P+C Randomizzazione • “randomizzazione” (randomization) • “placebo” (placebo) • “cecità” (blinding) • Processo che permette di allocare casualmente in 2 (o più gruppi) il soggetto (paziente) elegibile • Se la randomizzazione è corretta, e la numerosità sufficiente, i 2 gruppi tenderanno ad essere simili per ogni confondente (conosciuto o ignoto) permettono • comparabilità delle popolazioni • comparabilità degli esiti • comparabilità delle informazioni confrontabilità di popolazione 37 Placebo 38 Cecità (Blinding) • Processo per cui solo il principio attivo (e non l’essere sotto cura, o altri fattori confondenti) determina l’eventuale diversità di risultati • Processo per cui non vi è distorsione nel riportare o nel registrare la misura dell’esposizione e dell’esito confrontabilità di informazione confrontabilità di esito (e massimo contrasto dell’ esposizione) 39 40 10 Cecità Quanti ciechi ? Cecità= condizione in cui il trattamento assegnato non è noto a uno/più partecipanti allo studio; necessaria per mantenere l’obiettività dei processi di: • Nessuno • nel caso di confronto modalità di gestione del pz / Trattamenti invasivi (chirurgia) / Terapie alternative • Trattamento • Raccolta dei dati • Gestione e analisi dei dati • • • Cecità (di chi?) Singolo In genere il pz Chi valuta l’outcome • Doppio • Pz e clinico che gestisce il pz • Paziente • Staff clinico coinvolto nello studio • Staff coinvolto gestione e analisi dati • Triplo • Anche chi analizza i dati 41 Mascherare il farmaco 42 Mascherare sequenza Conoscere la sequenza di allocazione del trattamento può introdurre un bias di selezione (conscio o inconscio) e potrebbe influenzare la decisione di arruolare. SOLUZIONE: Usare codici per i trattamenti e non nome esplicito Mascherare non solo nome, ma anche modalità di somministrazione, aspetto, sapore, odore, colore Uso del ‘double dummy’: 2 cp insieme • compresse verdi (tratt 1) vs capsule rosa (placebo) • compresse verdi (placebo) vs capsule rosa (tratt 1) 43 • chi genera sequenza di allocazione ≠ chi verifica eligibilità • possibilmente allocazione effettuata all’esterno via telefono/internet • in alternativa uso di: Confezioni farmaco simili e numerate Buste chiuse, numerate e opache 44 11 Registrazione paziente Assegnazione casuale (1) Perché un paziente possa essere considerato potenzialmente idoneo ad essere incluso nello studio si dovrebbero verificare nell’ordine: 1. Il paziente necessita del trattamento 2. Il paziente possiede i requisiti richiesti 3. Il medico curante è disposto ad accettare la randomizzazione 4. Il consenso del paziente è stato ottenuto 5. Il paziente è formalmente AMMESSO 6. Assegnazione del trattamento in base lista (piano) di RANDOMIZZAZIONE 7. Cartella clinica iniziale completata 8. Inizia il trattamento • Assegnazione casuale non vuol dire “a caso” • Con la tecnica di randomizzazione, ogni paziente ha una probabilità nota (in genere uguale) di ricevere ognuno dei trattamenti, ma il trattamento assegnato non è prevedibile • Realizzazione: tabella di numeri casuali o generatore di numeri casuali (hanno una distribuzione predefinita) 45 46 Assegnazione casuale (2) 2 trattamenti 18 unità sperimentali eterogenee suddivise nei gruppi sperimentali A o B nell’ordine: • assegnazione alternata: è il modo più semplice per procedere; consiste nell'assegnare i soggetti che divengono via via disponibili ad essere inclusi nell'esperimento. Nel caso di due trattamenti S-N: il primo S, il secondo N, il terzo S e così via secondo una stretta alternanza; 1B 2A 3A 4B 5A 6A 7A 8B 9A 10B 11B 12A 13B 14A 15A 16B 17B 18B 1 2 3 7 6 8 10 9 13 14 12 11 5 4 15 • randomizzazione semplice: è un metodo più corretto del precedente. Utilizza la tavola dei numeri casuali. Nel caso di due trattamenti, ad esempio, leggendo numeri di una, due o più cifre, si può assegnare il trattamento S quando si incontra un numero pari, assegnare il trattamento N quando il numero è dispari 47 16 Trattamento A 17 18 Trattamento B 2 3 5 1 4 8 6 7 9 10 11 13 12 14 7 16 17 18 48 12 Assegnazione vincolata (1) • randomizzazione vincolata: con tale metodo viene garantito che tutti i gruppi siano costituiti dallo stesso numero Si basa sulla costituzione di blocchi (= nuove unità di assegnazione casuale) all'interno dei quali i trattamenti vengono assegnati in modo casuale: Esempio: Pazienti n= 100 Trattamenti J= 2 Blocchi K=n/J=100/2= 50 49 Assegnazione vincolata (2) 50 2 trattamenti x 2 blocchi • La randomizzazione vincolata può essere eseguita in due diversi modi: • blocchi a permutazione: consiste nel generare permutazioni semplici (K=1) o opportune sequenze delle stesse (K>1) dei J trattamenti; le sequenze dei trattamenti sono assegnate ai blocchi utilizzando la tavola dei numeri casuali • blocchi a permutazione entro strati: consiste nel suddividere i partecipanti in sottogruppi relativamente omogenei (per età, sesso, condizioni cliniche, ecc.) detti blocchi stratificati; i trattamenti vengono assegnati all‘ interno di ciascun blocco casualmente 51 Considerando due trattamenti (A,B) e blocchi di due pazienti, una possibile tecnica di assegnazione potrebbe essere: Sequenza assegnazione trattamento Ultima cifra numero (tav.1) AB da 0 a 4 BA da 5 a 9 52 13 1 2 3 7 6 10 9 12 11 5 4 8 Leggendo le cifre dell’ ultima colonna di tavola numeri casuali [5, 3, 0, 6, 0, 4, 6, 9, 4, 8, 5 , 1, 5, …, 2] si ottiene la seguente tabella dei trattamenti usando regola AB (da 0 a 4) e BA (da 5-9) 14 13 15 16 17 18 Leggendo le cifre della prima riga tavola numeri casuali si seleziona pz [03, 47,…, 16,…] e si ottiene la seguente tabella dei 9 blocchi: 1 2 3 4 5 6 7 8 9 03 11 10 13 12 15 9 1 2 16 14 7 8 5 18 6 17 4 1 2 3 4 5 6 7 8 9 B A A B A B B A B A B B A B A A B A 1 2 3 4 5 6 7 8 9 03 11 10 13 12 15 9 1 2 16 14 7 8 5 18 6 17 4 Trattamento A Trattamento B 3 53 2 trattamenti x 4 blocchi 14 7 13 5 15 9 17 2 16 11 10 8 12 18 6 1 4 54 3 trattamenti x 3 blocchi Considerando due trattamenti (A,B) e blocchi di quattro pazienti, una possibile tecnica di assegnazione potrebbe essere: Considerando tre trattamenti (A,B,C) e blocchi di tre pazienti, una possibile tecnica di assegnazione potrebbe essere: Sequenza assegnazione trattamento Ultima cifra numero (tav.1) Sequenza assegnazione trattamento Ultima cifra numero (Tav.1) AABB 0 ABC 0 ABBA 1 ACB 1 ABAB 2 BAC 2 BBAA 3 BCA 3 BAAB 4 CAB 4 BABA 5 CBA 5 ove i numeri che terminano con le cifre 6,7,8,9 vengono ignorati 55 ove i numeri che terminano con le cifre 6,7,8,9 vengono ignorati 56 14 6 sottogruppi di pz 3 trattamenti x 6 blocchi Supponiamo un gruppo di pazienti che, per le diverse caratteristiche, sono raggruppabili in sei diversi sottogruppi, Considerando che devono essere assegnati tre trattamenti, si procede formando blocchi omogenei composti da tre (o multipli di tre) elementi: Unità sperimentali eterogenee Formazione dei blocchi 57 58 Randomizzazione Autoappaiamento Un caso particolare è l'autoappaiamento in cui in un blocco è incluso un solo paziente che serve come controllo di se stesso: ciascun paziente viene sottoposto quindi a tutti i trattamenti in tempi diversi con assegnazione casuale dell'ordine dei trattamenti. all'interno di ciascun blocco vengono assegnati i trattamenti attraverso un'assegnazione casuale semplice: A C A B B C C A B C A B B B C A C A i=1 Assegnazione casuale dei trattamenti entro ciascun blocco 59 i=2 i=3 i=4 i=5 i=6 t=1 A C A B B C t=2 C A B C A B t=3 B B C A C A 60 15 Esempio Assegnazione alternata In un centro antidiabetico su 60 pazienti affetti da diabete mellito si vogliono sperimentare 3 diversi trattamenti: Assegnazione alternata: volendo procedere con tale metodo, leggendo da sinistra a destra nella prima riga della tavola dei numeri casuali, troviamo nell'ordine A) insulino-terapia B) terapia con antidiabetici orali C) terapia con dieta ipocalorica N. 1 2 3 Paziente Mariotti Egisto Marini Clara Marsili Lina età 66 47 29 N. 21 22 23 4 5 6 7 8 9 Mascherpa Pio Vercesi Santa Verdi Tina Veronesi Ugo Vidali Sergio Vespa Guido 35 42 28 79 77 37 10 11 12 13 14 15 16 17 18 19 20 Villa Oreste Viola Maria Castelli Gino Cavalli Lucia Daccò Sandra Ferrari Bruna Fercato Andrea Ferri Luigi Dioli Gaetano De Muro Franco Ferraresi Celeste 50 21 28 66 42 47 70 46 24 34 69 [03 47 43 73 86 36 96 47 36 61 46 98 63 71 62] età 41 69 25 N. 41 42 43 Paziente Solda Alfredo Sommi Germana Soncini Piero età 28 51 74 24 25 26 27 28 29 Paziente Lucidi Gemma Trabuschi Leo Zorzoli Giacomo Bettini Ernesto Gambini Alberto Albini Lucio Maric Ilaria Arioli Fabio Grante Walter 49 48 73 79 59 35 44 45 46 47 48 49 Tonelli Teresa Trivi Maria Ugazio Ezio Valsecchi Rino Vanoli Walter Trecate Maria 79 74 29 39 22 63 30 31 32 33 34 35 36 37 38 39 40 Vigorelli Ileana Allegri Rosita Lombardi Lucio Bergonzi Lidia Baini Giancarlo Bertassi Marco Abba Gino Baldi Rodolfo Gilli Agenore Bertoli Alfreda Soddu Romano 59 47 65 41 71 53 77 37 38 26 57 50 51 52 53 54 55 56 57 58 59 60 Tresoldi Fulvia Passoni Clara Molinari Camilla Sacchi Elma Caccia Filippo Buzzi Simone Moncalieri Irene Rustioni Pia Sala Dina Busoletta Clelia Gandella Stefano 26 50 60 53 74 79 36 55 36 39 56 61 Randomizzazione semplice per cui i trattamenti saranno assegnati con la sequenza nell'ordine 3=C, 1=A, 2=B ottenendo la seguente tabella di assegnazione: C Mariotti Egisto A Marini Clara B Marsili Lina C Mascherpa Pio A Vercesi Santa ................... ................... B Rustioni Pia C Sala Dina A Busoletta Clelia B Gandella Stefano 62 20 blocchi Randomizzazione semplice: volendo procedere con tale metodo si possono assumere le seguenti convenzioni: si leggeranno i numeri tavola numeri casuali cifra a cifra da destra a sinistra partendo dall'ultima riga e si assegnerà il trattamento: Randomizzazione vincolata: suddividere i pazienti in 60/3=20 gruppi ciascuno composto da 3 individui. Partendo dalla prima riga della tavola dei numeri casuali, si leggono i numeri e si trascrivono in tabella ottenendo: A per i numeri 1, 2, 3 B per i numeri 4, 5, 6 C per 7, 8, 9 scartando lo zero le cifre lette sono: [3 3 6 7 0 0 9 8 0 9 2 3 9 6,...], alle quali corrisponde la sequenza di trattamenti A Mariotti Egisto A Marini Clara B Marsili Lina C Mascherpa Pio C Vercesi Santa C Verdi Tina C Veronesi Ugo A Vidali Sergio A Vespa Guido C Villa Oreste B Viola Maria GRUPPI 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 03 36 26 60 10 57 32 07 50 38 54 05 49 09 44 30 34 19 02 40 47 46 16 11 24 20 37 51 13 58 12 15 35 06 23 39 04 52 08 48 43 33 45 14 42 53 27 56 55 59 31 21 22 18 01 17 25 29 28 41 .................... 63 64 16 3 trattamenti 3 trattamenti x 20 blocchi Entro ciascun blocco (gruppo) vengono assegnati i trattamenti utilizzando, ad esempio, la seguente tabella di assegnazione: Sequenza assegnazione trattamento Leggendo le cifre della prima colonna di tavola numeri casuali [0, 9, 1, 1, 5, 1, 8, 6, 3, 5, 1, 2, 2, 5, 3, 7, 5, 9, 1, 3, 6, 7, 2, 0, 2, 1, 1] si ottiene la seguente tabella dei trattamenti: Ultima cifra numero (tav.1) ABC 0 ACB 1 BAC 2 BCA 3 CAB 4 CBA 5 1 A B C 2 A C B 3 A C B 4 C B A 5 A C B 6 B C A 7 C B A 8 A C B GRUPPI 9 10 11 12 13 14 15 16 17 18 19 20 B B C B C AB B A B AA AAB C B C C AB A C C C C AAAB A C C C B B I pazienti saranno così trattati: Ignorare i numeri che terminano con le cifre 6,7,8,9 A - Insulina B - Antidiabetici C - Dieta 03 Marsili Lina 47 Valsecchi Rinaldo 43 Soncini Piero 36 Abbà Gino 33 Bergonzi Lidia 46 Ugazio Ezio ............................ ............................ ............................ 40 Soddu Romano 41 Solda Alfredo 48 Vanoli Walter 65 12 classi età-sesso 3 trattamenti Randomizzazione vincolata per strati: volendo procedere ad una assegnazione del trattamento con tale metodo si suddividono i 60 pazienti ad esempio per sesso ed età, ottenendo i 12 gruppi seguenti: da 20 a 29 anni maschio - femmina 48 Vanoli Walter 11 Viola Maria 18 Dioli Gaetano 39 Bertoli Alfreda 23 Zorzoli Giacomo 50 Tresoldi Fulvia 12 Castelli Gino 6 Verdi Tina 41 Solda Alfredo 3 Marsili Lina 46 Ugazio Ezio da 30 a 39 anni maschio - femmina 19 De Muro Franco 56 Moncalieri Irene 4 Mascherpa Pio 58 Sala Dina 29 Grante Walter 59 Busoletta Clelia 9 Vespa Guido 37 Baldi Rodolfo 38 Gilli Agenore 47 Valsecchi Rino da 40 a 49 anni maschio - femmina 17 Ferri Luigi 21 Lucidi Gemma 25 Gambini Alberto 33 Bergonzi Lidia 24 Bettini Ernesto 5 Vercesi Santa 14 Daccò Sandra 2 Marini Clara 15 Ferrari Bruna 31 Allegri Rosita da 50 a 59 anni maschio - femmina 10 Villa Oreste 51 Passoni Clara 35 Bertassi Marco 42 Sommi Germana 60 Gandella Stefano 53 Sacchi Elma 40 Soddu Romano 57 Rustioni Pia 28 Arioli Fabio 30 Vigorelli Ileana da 60 a 69 anni maschio - femmina da 70 a 79 annimaschio - femmina 16 Fercato Andrea 45 Trivi Maria 34 Baini Giancarlo 27 Maric Ilaria 26 Albini Lucio 44 Tonelli Teresa 43 Soncini Piero 54 Caccia Filippo 8 Vidali Sergio 36 Abba Gino 7 Veronesi Ugo 55 Buzzi Simone 32 1 20 22 Lombardi Lucio Mariotti Egisto Ferraresi Celeste Trabuschi Leo 52 Molinari Camilla 49 Trecate Maria 13 Cavalli Lucia 66 Leggendo numeri di due cifre a partire dalla quint’ultima riga della tavola numeri casuali si selezionano, in modo casuale, 3 pazienti per strato Entro ciascun strato (blocco), formato dai 3 pz selezionati, vengono assegnati i trattamenti utilizzando, ad esempio, la seguente tabella di assegnazione: Sequenza assegnazione trattamento Ultima cifra numero (Tav.1) ABC 3 ACB 4 BAC 5 BCA 6 CAB 7 CBA 8 Ignorare i numeri che terminano con le cifre 0,1,2,9 67 68 17 Stratificazione Piano sperimentale I pazienti sono prima divisi in strati (1-3) secondo uno o più fattori prognostici e poi assegnati in modo casuale entro ciascun strato al gruppo trattato (T) o al gruppo controllo (C): Entro ciascun strato (con 3 pazienti) vengono assegnati i trattamenti leggendo le cifre della decima riga della tavola dei numeri casuali: [5, 7, 6, 0, 8, 6, 3, 2, 4, 4, 0, 9, 4, 7, 2, 7, 9, 6,...] Si ottiene il seguente piano sperimentale: da 20 a 29 anni da 30 a 39 anni 46 Ugazio E. B 50 Tresoldi F. C 37 Baldi R. B 56 MoncalierI C 48 Vanoli W. A 31 Allegri R. A 19 De Muro F. C 58 Sala D. B 18 Dioli G. C 39 Bertoli A. B 4 MascherpP. A 59 BusolettaC A da 40 a 49 anni da 50 a 59 anni 24 Bettini E. B 33 BergonziL. A 28 Arioli F. A 57 Rustioni P. A 17 Ferri L. C 21 Lucidi G. B 60 Gandella S. C 53 Sacchi E. C 25 Gambini A. A 5 Vercesi S. C 35 Bertassi M. B 42 Sommi G. B da 60 a 69 anni da 70 a 79 anni 22 TrabuschiL. A 49 Trecate M. C 34 Baini G. C 45 Trivi M. B 32 LombardiL. C 13 Cavalli L. A 7 VeronesiU. A 27 Maric I. C 20 Ferraresi C. B 52 MolinariC. B 43 Soncini P. B 44 Tonelli T. A NB. Campione è formato da n=J*K=12*3=36 pazienti, non da N=60 ! 69 70 Minimizzazione Esempio • Alternativa alla stratificazione in una randomizzazione a schema fisso, quando il numero di variabili per cui stratificare è elevato “running in” Gruppo A (n=20) Gruppo B (n=20) Femmina 12 11 Età>50 7 5 bianca 15 15 nera 4 5 asiatica 1 0 Fumatore 6 8 Razza • • Funzione delle differenze nella distribuzione delle caratteristiche basali fra i gruppi di trattamento Lo scopo di ogni assegnazione del trattamento è di minimizzare lo sbilanciamento tra fattori multipli Prossimo pz: femmina, 52 anni, nera, non fuma Partecipanti con le stesse caratteristiche 71 A: 12(sex)+7(age)+4(ethnicity)+14(smoking)=37 B: 11+5+5+12=33 72 18 Esempio (continua) Tutto semplice? • Come assegnare trattamento bilanciando il numero di pz con le stesse caratteristiche? • Semplice: al gruppo con totale più piccolo (nell’esempio=B) • Metodo della moneta “truccata”: per esempio si assegna probabilità: p=0.8 (gruppo più piccolo) e p=0.2 (gruppo più grande) uso tabella numeri 0-9 randomizzati con: I requisiti RCT sono tutti validi all’interno di un ‘trial farmacologico’: • Randomizzazione Trattamenti • Possibilità del placebo ( possibilità del massimo contrasto) • Possibilità effettiva del doppio cieco • Relativa alta frequenza di eventi (alta potenza statistica) • Ma esistono problemi (di generalizzabilità e applicabilità) e limiti (di natura etica) Regola: assegnare a gruppo con meno pz per i numeri 0-7; assegnare a gruppo con più pz per i numeri 8-9 73 Problemi RCT Limiti RCT Sono di natura etica legati alla scelta della esposizione/trattamento • Problemi di generalizzabilità: popolazione selezionata (pazienti) setting selezionato (ospedale) variabili di “contesto” non rilevabili • Problemi di applicabilità, raramente è possibile indagare per: 74 studi su eventi rari studi su determinanti nocivi studi su determinanti non manipolabili studi valutativi (voglio studiare quello che è accaduto, non quello che avverrà) 75 1. Limitata a fattori potenzialmente preventivi della malattia o delle sue conseguenze 2. Entrambi trattamenti devono essere ugualmente accettabili, tenuto conto delle conoscenze del momento 3. Inclusione nello studio non deve privare il paziente di terapie più efficaci e non incluse nel protocollo 4. Bisognerebbe assicurare uguale rapporto beneficio/danno a priori 5. Il paziente deve essere informato e deve dare il suo consenso Esiste un’apposita legislazione in attuazione direttiva CEE sulle norme di buona pratica clinica: DIRETTIVA 2001/20/CEE (4 aprile 2001) 76 19 Dimensione del campione Quanti pazienti servono? Criteri economici e di fattibilità Costi Tempi di reclutamento (malattie rare) Tempi di esecuzione Etc Criteri etici Possiamo attendere tanto tempo per trattare paziente? Bisognerebbe assicurare uguale rapporto beneficio/danno a priori Etc Criteri statistici: potenza dello studio Tipo di misure e loro variabilità Entità delle differenze da valutare Errori a e b etc 77 The Importance of Beta, the Type II Error and Sample Size in the Design and Interpretation of the Randomized Control Trial — Survey of 71 Negative Trials Jennie A. Freiman, A.B., Thomas C. Chalmers, M.D., Harry Smith, Jr., Ph.D., and Roy R. Kuebler, Ph.D. N ENGL J MED 1978; 299: 690-694 September 28, 1978 Seventy-one "negative" randomized control trials were reexamined to determine if the investigators had studied large enough samples to give a high probability (>0.90) of detecting a 25 per cent and 50 per cent therapeutic improvement in the response. Sixty-seven of the trials had a greater than 10 per cent risk of missing a true 25 per cent therapeutic improvement, and with the same risk, 50 of the trials could have missed a 50 per cent improvement. Estimates of 90 per cent confidence intervals for the true improvement in each trial showed that in 57 of these "negative" trials, a potential 25 per cent improvement was possible, and 34 of the trials showed a potential 50 per cent improvement. Many of the therapies labeled as "no different from control" in trials using inadequate samples have not received a fair test. Concern for the probability of missing an important therapeutic improvement because of small sample sizes deserves more attention in the planning of clinical trials. (N Engl J Med 299:690–694, 1978) 79 78 Dimensione del campione La determinazione della dimensione campione (numero pazienti) è una parte cruciale del disegno di studio: Uno studio troppo piccolo da luogo a risultati non conclusivi: •Differenza statisticamente non significativa •Effetto clinicamente rilevante •Intervallo confidenza ampio Uno studio troppo grande rappresenta uno spreco di risorse: •Differenza statisticamente significativa •Effetto clinicamente non rilevante •Intervallo confidenza ridotto 80 20 Quesiti di base • Esempio di Pocock (1983) Per il calcolo della dimensione del campione si deve rispondere a cinque quesiti di base: 1. Quale è lo scopo principale della ricerca ? 2. Quale è il criterio (outcome) principale per misurare il risultato del trattamento ? 3. Quale test statistico si vuole utilizzare ? 4. Quali risultati si prevedono con il trattamento standard ? 5. Quale è la minima differenza fra trattamenti (nuovo vs. standard) che ha significato clinico e quale “potenza “ statistica bisogna raggiungere ? • Sul N. Engl. J. Med. (1978) viene descritto un disegno di una ricerca randomizzata a doppia cecità, che confrontava l’Anturen con il Placebo in pazienti che avevano subito un infarto del miocardio. Per determinare “quanti pazienti abbiamo bisogno”? Gli aa hanno considerato: 1. Quale era lo scopo della ricerca? Stabilire se l’Anturen fosse effice per prevenire la mortalità dopo un infarto del miocardio. Pur non essendo lo scopo primario, era anche importante la prevenzione di un reinfarto non fatale 81 Esempio (continua) 82 Esempio (continua) 2. Quale era il criterio principale per misurare il risultato della ricerca? La morte entro un anno per qualsiasi causa dall’inizio del primo trattamento era considerato il principale indicatore di “insucesso”. La morte improvvisa viene considerata un esito secondario. 3. Quale test utilizzare per evidenziare una differenza fra trattamenti? L’analisi più semplice è un test (a due code) per il confronto di due frequenze di “insucesso” (farmaco vs. placebo) 4. Quali risultati si prevedono con il trattamento standard? Nello studio il trattamento standard era il placebo e si prevedeva il 10% di morti entro un anno. ovvero una sopravvivenza del 90% 83 5. Quanto piccola poteva essere una differenza fra trattamenti perché fosse giudicata clinicamente importante e quale grado di “potenza” statistica bisognava raggiungere? Gli aa considerarono una riduzione clinicamente rilevante se l’Anturen avesse potuto dimezzare la mortalità (vale a dire il 5% delle morti in un anno). La dimensione campionaria n doveva avere una “potenza” statistica del 90% , ovvero lo studio aveva una probabilità del 90% che l’osservazione del risultato previsto (riduzione 5% mortalità) fosse statisticamente significativo (P<0.05) ad un test statistico (a due code) definito nel quesito 3. • Da 1-5 è stato possibile stabilire che la ricerca richiedeva circa 1200 pazienti (metà sotto 84 Anturen e metà sotto placebo) 21 Tabella MLE Test-z Modello Parametro Stima [ˆ] Varianza [ s2ˆ ] 2 Bernoulli 1 0 R1 R0 R1 1 R1 R0 1 R0 n1 n0 2 Poisson 1 0 r1 r0 2 Gauss 1 0 y1 y 0 2 ovvero: 2 Bernoulli ln( 1 / 0 ) R ln 1 R0 1 R1 1 R0 y1 y0 ˆ = stima statistica di una misura di “diversità” 2 Bernoulli La determinazione numerosità campionaria si basa su un test statistico di una ipotesi nulla: H0: nessuna differenza fra F vs. P: la differenza osservata è dovuta al caso Il test-z nella sua forma generale è dato da: ˆ 0 valore osservato valore atteso z variabilità valore osservato SE (ˆ) 0 = valore atteso della stima statistica sotto H0 SE()= errore standard (“standard error”) di ˆ 85 a d ln ln(1 / 0 ) b c 2 Poisson ln(1 / 0 ) r ln 1 r0 r r1 0 M1 M 0 1 1 n1 n0 1 1 1 1 a b c d 1 1 y1 y0 86 Valore-P (P-value) Il valore–P è la probabilità di ottenere i) il valore del test statistico osservato o addirittura valori più estremi, ii) in una lunga serie di campioni nelle medesime condizioni del campione in studio, iii) supposto che sia vera l’ipotesi nulla, H0: due code, se H 1 : 1 0 P Pr( Z | z || H 0 è vera ) una coda, se H 2 : 1 0 P Pr( Z z | H 0 è vera ) una coda, se H 3 : 1 0 P Pr( Z z | H 0 è vera ) 87 88 22 95%=(1-0,05)% CI: ˆ1 95% CI e P-value L’intervallo di confidenza al 95% (95% Confidence Interval: 95% CI) oltre a definire una stima per intervallo permette ovviamente di fare anche un test di significatività. ˆ2 ˆ Valori verosimili P>0,05 Considerando un livello di significatività di P=0.05 come soglia per rifiutare (non rifiutare) l’ipotesi nulla, H0: = 0 si può adottare la seguente regola: Valori inverosimili P<0,05 Misure assolute: •Se valore parametro H0: = 0 è compreso nel 95% CI = non rifiuto H0 ˆ1 ˆ 1,96 SE (ˆ); ˆ 2 ˆ 1,96 SE (ˆ) •Se valore parametro H0: = 0 non è compreso nel 95% CI = rifiuto H0 Misure relative: ˆ1 ˆ / exp1,96 SE (ln ˆ) ; ˆ ˆ ˆ 2 exp1,96 SE (ln ) 89 90 Dimensione del campione Dati binari (p) La dimensione campionaria è data da una “conversione” del test statistico, e nella sua forma generale si scrive: n variabilità parametro (valore clinico rilevante) 2 Considerando = differenza fra “successi” (p1= % nuovo trattamento, p0=%trattamento standard) f (a , b ) z • La “variabilità parametro” misura la variabilità del indicatore (variabile binaria, continua, ecc) scelto nella valutazione del’outcome dello studio, che usualmente si ottiene da studi precedenti o dalla revisione della letteratura • Il “valore clinico rilevante” è la grandezza della differenza minima ritenuta rilevante (dal biologo, clinico, esperto) fra i due trattamenti a confronto ˆ 0 SE (ˆ) ( p1 p0 ) 0 p1 (1 p1 ) p0 (1 p0 ) n1 n0 Risolvendo per n=n1=n0 si ottiene: n 91 p1 (1 p1 ) p0 (1 p0 ) 2 p1 p0 2 f (a , b ) 92 23 Errori a e b e potenza Tabella di decisione a = errore di I tipo: è la probabilità di osservare una “differenza statisticamente significativa” quando in realtà =0 (ovvero il rischio di un risultato falso-positivo) Nella determinazione della dimensione del campione è utile la seguente “tabella di decisione” riguardo ad un test statistico: a Pr Rifiuto H 0 H 0 è vera Decisione Realtà Non rifiuto H0 Rifiuto H0 H0 vera: Pr: (1a Errore di I° tipo Pr: a H1 vera: Errore di II° tipo Pr: b Pr: (1b b = errore di II tipo: è la probabilità di osservare una “differenza non statisticamente significativa” quando in realtà =*(ovvero il rischio di un risultato falso-negativo) b Pr Non rifiuto H 0 H1 è vera (1b= potenza dello studio = probabilità di osservare la “vera” differenza =* 93 Ipotesi H0 vs. H1 94 Distribuzione di campionamento • Gli errori a e b sono determinati dalla conoscenza della distribuzione campionaria del test-z sotto H0 e sotto H1 e da un valore critico K specificato a priori b • Senza perdere in generalità, si considerino le seguenti ipotesi semplici: 0 H 0 : 0 vs. H 1 : * L'ipotesi H0 specifica l'assenza di effetto =0, mentre l'ipotesi H1 specifica un valore considerato "rilevante" =* dal punto di vista biologico o clinico o, in altri termini, un valore "minimo rilevante" definito dalle conoscenze del ricercatore a * perciò: a Pr Z K 0 e b Pr Z K * 95 da cui si evidenzia immediatamente che, aumentando il valore di K, diminuisce a ma aumenta b e viceversa. In generale una buona regola è scegliere K in cui entrambe le 96 probabilità di errore a e b sono piccole ) 24 Valore K= f(a,b) Esempio (continua) p0= 90% probabilità di sopravvivenza dei pz con trattamento standard Si dimostra che K= f(a,b)=[Na/2Nb]2 , perciò i valori nella formula calcolo del numero necessario dei pazienti sono: = 5% la minima differenza clinicamente rilevante (p1= p0 95% b (errore di II tipo) a (errore di I tipo) 0,05 0,1 0,2 0,5 a= 0,05 0,1 10,8 8,6 6,2 2,7 b= 0,10 (potenza=0,90) 0,05 13,0 10,5 7,9 3,8 0,02 15,8 13,0 10,0 5,4 0,01 17,8 14,9 11,7 6,6 n 0,95 0,05 0,90 0,10 0,95 0,902 10,5 578 •Con n=578×2≈1200 ho una potenza del 90% di rilevare un risultato statisticamente significativo (P=5%), se si osserva una differenza clinicamente rilevante di d=5% 10,5=[N0,05/2N0,1]2 [1,961,28]2 97 Dati continui (m) Esempio Cockburn et al (BMJ 1980;281:11-14) per valutare l’efficacia di un supplemento di vitamina D somministrato alle donne in gravidanza per la prevenzione della ipocalcemia neonatale, considerano: La dimensione campionaria è data da una “conversione” del test statistico n variabilità parametro (valore clinico rilevante) 2 f (a , b ) Quale end-point principale? y= livello di calcemia del bambino dopo una settimana dalla nascita Considerando = “differenza fra medie”: z ˆ 0 ( y1 y0 ) 0 ˆ SE ( ) 1 1 2 n1 Quali valori si prevedono con il metodo standard (pacebo)? 0=9,0 mg/100cc e = 1,8 mg/100cc nelle donne normali n0 Quale aumento nella media è considerato clinicamente rilevante? =0.5 mg/100cc perciò si prevede 1=9,0+0,5=9,5 mg/100cc Risolvendo per n=n1=n2 si ottiene: n 2 2 f (a , b ) ( 1 0 ) 2 98 Quali errori a e b? a=0,05 e b=0,05 (potenza=0,95) 2 99 100 25 Esempio (continua) Dati appaiati La dimensione dello studio è allora data da: • Procedendo nello stesso modo, negli studi appaiati (prima-dopo) la dimensione del campione si ottiene: n 2 2 2 ( 1 0 ) 2 2 1,82 (0,5) 2 f (a , b ) • per i dati continui: 13,0 357 n Con n=357×2≈720 ho una potenza del 95% di rilevare un risultato statisticamente significativo (P=5%), se si osserva una differenza clinicamente rilevante di d=0,5 mg/100cc. Per disegnare le funzioni di potenza posso graficare: N ([ 0 d ] 0 ) 2 2 / n za / 2 2 varianza differenze (y1 y0 ) • per i dati binari: d f (a , b ) ( 10 01 ) 2 d frequenza discordanti 10 01 n ] facendo variare d, n o 0 2 f (a , b ) ( 1 0 ) 2 2 2 101 102 Potenza dello studio Potenza dello studio (n) 1 0.9 d=0.10; p0=0.8 d=0.15; p0=0.8 0.8 0.7 0.6 potenza Una alternativa alla “conversione” del test-z per il calcolo della numerosità campionaria n, è la “conversione” del test-z per la rappresentazione grafica della potenza dello studio (1-b) data dalla seguente formula: 0.5 0.4 zb valore clinico rilevante(d) za variabilità parametro/n 0.3 0.2 0.1 0 0 50 100 150 200 250 300 350 400 450 500 munero pazienti (per gruppo) che poi viene espressa in probabilità leggendo come usuale sulla tavola della distribuzione N(0,1) il corrispondente valore di probabilità Pr(Z<zb) zb valore clinico rilevante(d) za variabilità parametro/n Potenza Pr( Z z b ) N (0,1) 103 104 26 Disegno sequenziale Potenza dello studio (d) 1 0.9 n=100; p0=0.8 n=50; p0=0.8 0.8 0.7 potenza 0.6 0.5 0.4 0.3 0.2 0.1 0 0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5 delta zb • n viene definito dal piano sequenziale • valido per pazienti indipendenti o “appaiati” (“matched pairs”) • terapia e risposta “BREVI” • giudizio dopo trattamento di ogni paziente o coppia paziente • interruzione dello studio appena raggiunta la “significatività statistica” • limitate condizioni di applicazione • (non registrativo: fase 1-2) DIFFICILI CONDIZIONI DI SELEZIONE MA RIDUCE SENSIBILMENTE IL N° E LA VARIABILITÀ DEI PAZIENTI valore clinico rilevante(d) za variabilità parametro/n Potenza Pr( Z z b ) N (0,1) 105 Dati binari 106 Modelli di regressione 107 108 27 Monitoraggio dello studio Analisi ad interim Valutazione della risposta del paziente: • Baseline (prima dell’inizio trattamento): Stato clinico di base Storia clinica e caratteristiche personali • L’analisi viene effettuata in intervalli di tempo predefiniti dal protocollo (durata follow-up 2 anni (24 mesi): analisi ad interim: 6 mesi, 12 mesi, 18 mesi) • Risposta principale e risposte secondarie: Sopravvivenza (morte) Risposta alla terapia Miglioramento parametro clinico • Viene definita una regola di stop dello studio (stopping rule) prima dell’inizio dello studio, che specifica un limite per la differenza controllo vs. trattamento, che se superato, porta automaticamente all’interruzione di uno o dell’altro trattamento (a seconda della direzione dell’effetto) • Altri aspetti del monitoraggio: Deviazioni dal protocollo Eventi avversi e effetti collaterali Drop-out • Diverse procedure statistiche controllo dei test multipli e potenza dello studio 109 Fattori prognostici 110 Questioni • Le informazioni di “baseline” (z) del paziente possono avere attinenza (sono associati) con la sua successiva riposta al trattamento (y), ovviamente non sono associati al trattamento (x) per effetto della randomizzazione (r) • Quale è il tipo di relazione fra fattori prognostici z e esito y? • R: v. letteratura • La prognosi per un paziente con un infarto del miocardio tende ad essere peggiore se ha avuto anche un precedente infarto • Quale è il tipo di relazione fra fattori prognostici z e trattamento x • R: nulla se randomizzazione è corretta • La risposta del tumore alla chemioterapia nel cancro avanzato tende ad essere migliore se il paziente prima del trattamento è ambulatoriale e non ricoverato • Come devo analizzare la relazione x-zy? • R: v. metodi statistici • Altri esempi… 111 112 28 Metodi di analisi Regressione lineare • Analisi per sottogruppi: Divido i pazienti in sottogruppi e conduco tante analisi entro gruppo • Troppa confusione in fase di interpretazione! • Aumenta rischio di errore ! • Campione deve essere numeroso • Metodi di aggiustamento – Analisi stratificata 2x2xK – Analisi stratificata 2xJxK • Modelli di regressione: – Y continua= regressione lineare – Y binaria= regressione logistica – Y tempo = regressione d’azzardo (Cox) •Modello di regressione lineare semplice: y = b0 + b1x + u y= variabile di risposta continua= livello (o severità) di un parametro clinico x= variabile esplicativa continua= livello (o dose) trattamento u= tutti i fattori non osservabili (unobservables), inclusi errori di misurazione, che potrebbero influenzare y quando x è tenuto costante, assumendo che E(u)=0 (leggi “valore atteso”=0) b 0 ;b 1= coefficienti di regressione che misurano legame x-y 113 114 Significato b0 e b1 Curva lineare (retta) y ( x ) a bx • Se Y= livello di omocisteina totale nel plasma (mmol/l) • Se X= livello di supplemento (dose) di vitamina B-6 (nmol/l) Variabile Y • P=(x i i , yi ) E ( y | x 0) b 0 E ( u y ) b 0 y y( x) Variabile X a=intercetta=variazione di y quando x=0 b=pendenza=variazione di y quando x aumenta da x a x+1 (incremento di 1 unità)115 b0 è il valore atteso di y=livello di omocisteina (umol/l) quando x=dose di vitamina B-6 = 0: • b1 è il cambiamento atteso di y=livello di omocisteina (umol/l) dato un cambiamento unitario (nmol/l) di x=dose di vitamina B-6: y E ( y | x 1) E ( y | x ) [ b 0 b1 ( x 1)] [ b 0 b1 ( x )] b1 116 29 Variabile x qualitativa (1) Variabile x binaria • Se Y= livello di omocisteina totale nel plasma (mmol/l) • Se X=trattamento (1=farmaco; 0=placebo) • • b0 è il valore atteso di y= livello di omocisteina (umol/l) quando x=placebo: Una variabile qualitativa viene ricodificata con tante variabili indicatore quante sono le classi della variabile qualitativa meno una Per esempio per codificare il gruppo ematico A, B, AB, 0 possiamo usare tre variabili xA, xB, xAB, che hanno i seguenti valori: E ( y | placebo) b 0 E (u y ) b 0 xA=1 per i soggetti con gruppo ematico A, e xA=0 per tutti gli altri b1 è il cambiamento atteso di y= livello di xB=1 per i soggetti con gruppo ematico B, e xB=0 per tutti gli altri omocisteina (mol/l) dato dalla differenza fra farmaco=1 e placebo=0: y E ( y | farmaco) E ( y | placebo) [ b 0 b1 ( x 1)] [ b 0 b1 ( x 0)] b1 117 Variabile x qualitativa (2) xAB=1 per i soggetti con gruppo ematico AB, e xAB=0 per tutti gli altri Pertanto: E(y)= b0 + bA xA + bB xB + bAB xAB 118 p variabili x Visti i valori delle variabili indicatore, per i soggetti appartenenti ai quattro gruppi ematici, l’equazione si riduce alle seguenti quattro espressioni: E ( gruppo A) = b0 + bA Il modello di regressione semplice (una variabile x) si estende ad un modello di regressione multipla introducendo p >1 variabili esplicative: y = b0+b1x1+b2x2+…+bpxp+u E ( gruppo B) = b0 + bB Il modello permette di studiare l’effetto di una variabile xj (j=1,…,p) sulla y, al netto dell’azione delle (dopo aver aggiustato per le) altre variabili x; se si considera x1: E (gruppo AB) = b0 + bAB E ( gruppo 0) = b0 Da cui il significato dei parametri: y –(b2x2+…+bpxp)=b0+b1x1+u bA = E(gruppo A) E(gruppo 0) y*=b0+b1x1+u bB = E(gruppo B) E(gruppo 0) y* è il “residuo” della variabile di risposta y dopo aver “tolto” l’effetto di (x2,…,xp) bAB = E(gruppo AB) E(gruppo 0) 119 120 30 Cosa significa? (1) • • • • • Cosa significa? (2) • Se valuto effetto trattamento in due soggetti uno trattato con farmaco (x4=1) e l’altro trattato con placebo (x4=0) con le stesse caratteristiche (45y; M; TT) ottengo: Y= livello omocisteina (mmol/l) X1= età (anni) X2= sesso (1=M; 0=F) X3= MTHFR (1=TT; 0=CC,CT) X4= (1=farmaco; 0=placebo) y (1) b 0 b1 45 b 2 b 3 ( b 4 1) y (0) b 0 b1 45 b 2 b 3 ( b 4 0) • Se considero due soggetti uno trattato con farmaco (x4=1) e l’altro trattato con placebo (x4=0) con diverse caratteristiche (45y; M; TT vs. 33y; F; CC) ottengo: • Cambio le caratteristiche (33y; F; CC): y (1) b 0 b1 33 ( b 4 1) y (0) b 0 b1 33 ( b 4 0) y (1) b 0 b1 45 b 2 b 3 ( b 4 1) y (0) b 0 b1 33 y (1) y (0) b 4 y (1) y (0) b 4 ( b 4 0) y (1) y (0) b1 12 b 2 b 3 b 4 121 • Vale per tutti i valori di x1, x2, x3 ! b4 rappresenta la differenza fra farmaco e placebo mantenendo costante (aggiustando per) l’azione delle altre variabili x1, x2, x3 122 Stima dei coefficenti b Esempio • La stima dei parametri (coefficienti di regressione b) del modello di regressione viene fatta utilizzando il metodo di massima verosimiglinza (MLE) che produce, sulla base dei dati osservati, per ciascun b il valore più verosimile e la sua precisione (errore standard), da cui si possono determinare P-value e 95%CI: • Assanelli et al. Pharmacological Research 2004; 49: 79–84 • Study design. 30 pazienti con un infarto del miocardio acuto assegnati (15 per gruppo) a: • Trattamento A= 15mg/die acido folico via orale per un mese e 15 mg in giorni alterni per 2 mesi • Trattamento B= 15mg/die acido folico via orale +vitamina E 900mg/die per 3 mesi z bˆ b 0 N (0,1) P - value SE ( bˆ ) • End-point. Variazione omocisteina (mmol/l) fine follow-up: t(3)-t(0) 95%CI bˆ 1,96 SE ( bˆ ) • Esistono molti software: R (free), STATA, XLSTAT, e molti altri ! 123 • Fattori prognostici. età, sesso (1=M 0=F), livello folati (t0), MTHFR (1=TT; 0=CC, CT); storia familiare (1=si; 0=no); e altri 124 31 t(1) vs. t(0) XLSTAT hcy(t1)= b0 + b1hcy(t0) +…+ u 100 90 y=x 80 70 HCY1 60 50 40 y=b0+b1x 30 20 10 0 0 10 20 30 40 50 60 70 80 90 100 HCY 0 in media si rileva una riduzione di omocisteina di (0,157-1)/1 %= -84.3% dopo il trattamento 125 Tabella MLE Regressione logistica Y= HCY (t1) (Constant) HCY 0 FOL 0 B12 0 MTHFR FAMIGLIA ETA' SESSO trattamento B 1.582 0.157 0.630 0.006 0.014 -0.413 0.072 -1.019 -1.962 S.E. 4.181 0.033 0.292 0.006 1.510 1.530 0.050 1.757 1.328 126 z-test P-value 0.378 0.705 4.684 0.000 2.160 0.031 1.133 0.257 0.009 0.993 -0.270 0.787 1.438 0.150 -0.580 0.562 -1.478 0.139 • Se Y=variabile binaria (esito = vivo/morto +/-; successo/insuccesso) il modello lineare non è adeguato, perchè: E(y)= Pr(y=1) E(y)=b0+b1x non è compreso fra 0-1 ! • È necessaria una trasformazione (logistica) che modifica range da 0-1 a ±infinito: E( y) ln b 0 b1 x1 b 2 x2 b p x p 1 E ( y ) COMMENTO: non si evidenzia nessuna differenza fra i due trattamenti (P=0.139): la riduzione omocisteina definita dalla retta y(dopo)-x(prima) è simile nei due gruppi a confronto E ( y ) Pr( y 1) probabilità esito E( y) Pr( y 1) odds esito 1 E ( y ) Pr( y 0) 127 128 32 Significato b0 e b1 Curva logistica • Se Y= livello di omocisteina totale nel plasma (mmol/l)>13=1 e 0=altrimenti • Se X= livello di supplemento (dose) di vitamina B-6 (nmol/l) • b0 è il valore atteso di ln-odds(y)= =ln[Pr(y=1)/Pr(y=0)] quando x=dose di vitamina B-6 = 0: E [ln(odds | x 0)] b 0 • ln[y/(1-y)]=a+bx, diventa nella scala y=(0;1): b1 è il cambiamento atteso di ln-odds(y) =ln[Pr(y=1)/Pr(y=0)] dato un cambiamento unitario (nmol/l) di x=dose di vitamina B-6: odds | x 1 y ln ln OR b1 odds | x y=exp(a+bx)/[1+exp(a+bx)] 129 Variabile x binaria p variabili x • Y= insorgenza di una successiva cardiopatia ischemica (1=si; 0=no) • X1= età • X2= sesso (1=M; 0=F) • X3= MTHFR (1=TT; 0=CC,CT) • X4= (1=farmaco; 0=placebo) • Se Y= insorgenza di una successiva cardiopatia ischemica (1=si; 0=no) • Se X= trattamento (1=farmaco; 0=placebo) • b0 è il valore atteso di ln-odds(y)= =ln[Pr(y=1)/Pr(y=0)] quando x=placebo: E [ln(odds | placebo)] b 0 • 130 b1 è il cambiamento atteso di ln-odds(y) =ln[Pr(y=1)/Pr(y=0)] dato dalla differenza fra farmaco=1 e placebo=0: • Se considero due soggetti uno trattato con farmaco (x4=1) e l’altro trattato con placebo (x4=0) con diverse caratteristiche (45y; M; TT vs. 33y; F; CC) ottengo: ln odds(0) b 0 b1 45 b 2 b 3 ( b 4 1) ln odds(1) b 0 b1 33 ( b 4 0) odds | farmaco y ln ln OR b1 odds | placebo ln OR b1 12 b 2 b 3 b 4 131 132 33 Cosa significa? Esempio • Se valuto effetto trattamento in due soggetti uno trattato con farmaco (x4=1) e l’altro trattato con placebo (x4=0) con le stesse caratteristiche (45y; M; TT) ottengo: • WHO. Br. Heart J 1978; 40: 10689-1118 • Study design. 1400 maschi con accertata ipercolesterolemia (livello colesterolo totale nel siero>220 mg/dl ) furono randomizzati al clofibrato o al placebo (700 per gruppo) per verificare l’efficacia del farmaco a ridurre il colesterolo nel siero • End-point. Insorgenza di una cardiopatia ischemica nei soggetti durante follow-up (1=si; 0=no) • Fattori prognostici. età, fumo (1= fumatore; 0=non fumatore); storia familiare (1=padre morto per cardiopatia; 0= padre vivo); pressione arteriosa sistolica (mmHg); livello di colesterolo (mg/l) e altri… ln odds(1) b 0 b1 45 b 2 b 3 ( b 4 1) ln odds(0) b 0 b1 45 b 2 b 3 ( b 4 0) ln OR b 4 • Cambio le caratteristiche (33y; F; CC): ln odds(1) b 0 b1 33 ( b 4 1) ln odds(0) b 0 b1 33 ( b 4 0) ln OR b 4 • Vale per tutti i valori di x1, x2, x3 ! b4 rappresenta ln(OR) fra farmaco e placebo mantenendo costante (aggiustando per) l’azione delle altre variabili x1, x2, x3 133 XLSTAT 134 Tabella MLE Costante Log(Età)/2.7 Fumo Familiarità PAS (mmHg) Colesterolo (mg/dl) TRATTAMENTO Estimate S.E z-test -19.6 2.4810 -7.9 1.11 0.1764 6.3 0.83 0.1221 6.8 0.64 0.1778 3.6 0.011 0.0030 3.7 0.0095 0.0017 5.6 -0.32 0.1103 -2.9 P-value 0.000000 0.000000 0.000000 0.000318 0.000216 0.000000 0.003732 COMMENTO: dopo aver aggiustato ciascuna variabile per le altre, tutte le variabili forniscono un contributo indipendente e significativo (P<0.01 in ogni caso) alla probabilità (rischio) che un paziente con ipercolesterolemia sia colpito da una cardiopatia ischemica 135 136 34 Odds Ratios (ORs) Costante Log(Età)/2.7 Fumo Familiarità PAS (mmHg) Colesterolo (mg/dl) TRATTAMENTO Rischio ( R1 ) Estimate S.E z-test OR=exp(B) -19.6 2.4810 -7.9 1.11 0.1764 6.3 3.038 0.83 0.1221 6.8 2.293 0.64 0.1778 3.6 1.896 0.011 0.0030 3.7 1.011 0.0095 0.0017 5.6 1.010 -0.32 0.1103 -2.9 0.726 Costante Log(Età)/2.7 Fumo Familiarità PAS (mmHg) Colesterolo (mg/dl) TRATTAMENTO odds | farmaco 0.32 odds | placebo odds | farmaco OR exp( 0.32) 0.726 odds | placebo somma (S) rischio (R) odds (O) b ln OR ln 95%CI( b ) 0.32 1.96 0.11 ( 0.10; 0.54) 95%CI(OR) exp( 0.10; 0.54) (0.58; 0.90) N.B. “exp” significa “e elevato a…” e è il numero di Nepero e vale circa 2,71. somma (S) rischio (R) odds (O) B*X -19.6 11.7 0.83 0.64 1.54 2.09 -0.32 -3.0839 0.0438 0.0458 R exp( S ) exp( 3.084) 0.0438 1 exp( S ) 1 exp( 3.084) O R 0.0438 0.0458 1 R 1 0.0438 137 138 Rischio ( R0 ) Estimate paziente Costante -19.6 1.0000 Log(Età)/2.7 1.11 11 Fumo 0.83 1 Familiarità 0.64 1 PAS (mmHg) 0.011 140 Colesterolo (mg/dl) 0.0095 220 TRATTAMENTO -0.32 0 Estimate paziente -19.6 1.0000 1.11 11 0.83 1 0.64 1 0.011 140 0.0095 220 -0.32 1 Dati di sopravvivenza • Y= durata (tempo di sopravvivenza) t di un evento: tempo di guarigione di una ferita chirurgica, sopravvivenza di pazienti con miocardio trapiantato, durata di una protesi dentaria, ecc. B*X -19.6 11.7 0.83 0.64 1.54 2.09 0 • -2.7639 0.0593 0.063 R exp( S ) exp( 2.764) 0.0593 1 exp( S ) 1 exp( 2.764) O R 0.0593 0.063 1 R 1 0.0593 La distribuzione di t viene descritta dalla funzione di sopravvivenza: S(t)= Pr(individuo è ancora vivo al tempo t) • o equivalentemente dalla funzione di rischio istantaneo (hazard risk): h(t ) lim 0 139 Pr(individuo muore (t ) | vivo t ) 140 35 Follow-up (1) 30 0 da cui ottengo funzione di sopravvivenza: 20 y numero morti al tempo t hˆt t nt numero soggetti a rischio al tempo t 10 Numero identificativo dei pazienti • Per un gruppo omogeneo posso usare metodo del prodotto limite (detto anche metodo di Kaplan-Meier, 1958) per calcolare rischio istantaneo al tempo t: 40 Calcolo h( t ) e S( t ) 0 Sˆt (1 h1 ) (1 h2 ) (1 ht ) 5 10 15 20 25 30 (1 hs ) s t rosso= l’evento finale d’interesse (morte, guarigione) è accaduto nel periodo dello studio t= ciascun tempo di sopravvivenza puntuale (distinto) osservato nel periodo follow-up, oppure raggruppato in classi [tj-tj+1), j=1,…,J blu= l’evento finale d’interesse (morte, guarigione) non è ancora accaduto alla fine dello studio 141 142 Curva di sopravvivenza x 5 10 y 15 20 settimane n 9 9 6 2 4 0 0 x o x x x 0 x x o 41 32 23 17 15 11 11 h 0.2195 0.2813 0.2609 0.1176 0.2667 0 0 25 1-h 0.7805 0.7188 0.7391 0.8824 0.7333 1 1 30 S 0.7805 0.561 0.4146 0.3659 0.2683 0.2683 0.2683 35 1.0 0.8 0.6 10 x o x controllo sperimentale 0.4 x x [0-5) [5-10) [10-15) [15-20) [20-25) [25-30) [30-35) o x x o x x x o o frazione di sopravvissuti x x o x o x 0.2 30 20 x x x x x Dati di Gehan (1965) o 0.0 40 o x o x x x 0 Num ero idenrtificativo dei pazienti Follow-up (2) x 35 settimane 0 5 10 15 20 25 30 35 settimane 143 144 36 Regressione di Cox Variabile x binaria • Se Y= durata (tempo di sopravvivenza) si utilizza una regressione log-lineare di rischio istantaneo (regressione di Cox): • Se Y= tempo (in giorni) di una ricaduta di cardiopatia ischemica • Se X1= trattamento (1=farmaco; 0=placebo) ln h (t ) ln h0 (t ) b1 x1 b 2 x2 b p x p • h(t) = rischio istantaneo per un soggetto ancora in vita al tempo t b1 è il cambiamento atteso di log-rischio istantaneo dato dalla differenza fra farmaco=1 e placebo=0: h(t | farmaco) y ln ln HR b1 h(t | placebo) h0(t)= rischio istantaneo basale(background) al tempo t quando fattori prognostici x=0 bj è il cambiamento atteso di log-rischio istantaneo per un cambiamento unitario di xj, ovvero da xj a (xj+1) 145 p variabili x Perciò exp(b1)= hazard ratio (rapporto fra rischi istantanei) = rapporto fra il rischio di ricaduta a qualsiasi tempo t (indipendente da t) dei pazienti trattati con farmaco rispetto al rischio dei trattati con placebo 146 Cosa significa? • Se valuto effetto trattamento in due soggetti uno trattato con farmaco (x4=1) e l’altro trattato con placebo (x4=0) con le stesse caratteristiche (45y; M; TT) e stesso tempo t ottengo: • Y= tempo (in giorni) di una ricaduta di cardiopatia ischemica • X1= età • X2= sesso (1=M; 0=F) • X3= MTHFR (1=TT; 0=CC,CT) • X4= (1=farmaco; 0=placebo) ln h(t|1 ) ln h0(t) b1 45 b 2 b 3 ( b 4 1) ln h(t|0 ) ln h0(t) b1 45 b 2 b 3 ( b 4 0) • Se considero due soggetti uno trattato con farmaco (x4=1) e l’altro trattato con placebo (x4=0) con diverse caratteristiche (45y; M; TT vs. 33y; F; CC) e stesso tempo t ottengo: ln h(t|0 ) ln h0(t) β1 45 β2 β3 (β4 1 ) ln h(t|1 ) ln h0(t) β1 33 (β4 0 ) ln HR β1 12 β2 β3 β4 147 ln HR b 4 • Cambio le caratteristiche (33y; F; CC): ln h(t|1 ) ln h0(t) b1 33 ( b 4 1) ln h(t|0 ) ln h0(t) b1 33 ( b 4 0) ln HR b 4 • Vale per tutti i valori di x1, x2, x3 ! b4 rappresenta ln(HR) fra farmaco e placebo mantenendo costante (aggiustando per) l’azione delle altre variabili x1, x2, x3 148 37 Esempio XLSTAT • Dati tratti dal primo e famoso clinical trial sulla chemioterapia+terapia ausiliaria sul tumore al colon. Levamisole è un componente a bassa tossicità precedentemente usato per trattare infezioni di vermi negli animali; 5-FU è un agente chemioterapico con moderata tossicità (come si pensava alle conoscenze del tempo): CG Moertel et al. Levamisole and fluorouracil for adjuvant therapy of resected colon carcinoma. New England J of Medicine, 332: 352-358, 1990. • • • • • • • • • • • rx: Obs(ervation), Lev(amisole), Lev(amisole)+5-FU sex: 1=male age: in years obstruct: obstruction of colon by tumour (1=yes) perfor: perforation of colon (1=yes) adhere: adherence to nearby organs (1=yes) nodes: number of lymph nodes with detectable cancer time: days until event or censoring status: censoring status (1=no) differ: differentiation of tumour (1=well, 2=moderate, 3=poor) extent: Extent of local spread (1=submucosa, 2=muscle, 3=serosa, 4=contiguous structures) • surg: time from surgery to registration (1=long; 0=short) • node4: more than 4 positive lymph nodes (1=yes) 149 • Etype: event type (1=recurrence, 2=death) Tabella MLE rxLev rxLev+5FU sex age obstruct perfor adhere nodes differ extent surg node4 150 Hazard Ratios (HRs) Estimate SE z-test P-value -0.02616 0.11091 -0.236 0.81000 -0.49988 0.12183 -4.103 0.00004 -0.13821 0.09586 -1.442 0.15000 -0.00268 0.00405 -0.662 0.51000 0.19469 0.11926 1.633 0.10000 0.21079 0.25654 0.822 0.41000 0.16039 0.12991 1.235 0.22000 0.03823 0.01508 2.535 0.01100 0.15304 0.09792 1.563 0.12000 0.45128 0.11892 3.795 0.00015 0.23995 0.10411 2.305 0.02100 0.59109 0.14122 4.186 0.00003 COMMENTO: dopo aver aggiustato ciascuna variabile per le altre, il rischio istantaneo di ricorrenza, indipendente da t, di un paziente trattato con Lev+5FU rispetto a quello trattato con placebo è più basso (di quanto?) 151 rxLev rxLev+5FU sex age obstruct perfor adhere nodes differ extent surg node4 Estimate SE z-test HR=exp(B) -0.02616 0.11091 -0.236 0.97418 -0.49988 0.12183 -4.103 0.60660 -0.13821 0.09586 -1.442 0.87092 -0.00268 0.00405 -0.662 0.99732 0.19469 0.11926 1.633 1.21493 0.21079 0.25654 0.822 1.23465 0.16039 0.12991 1.235 1.17397 0.03823 0.01508 2.535 1.03897 0.15304 0.09792 1.563 1.16537 0.45128 0.11892 3.795 1.57032 0.23995 0.10411 2.305 1.27119 0.59109 0.14122 4.186 1.80596 h(t | farmaco) 0,50 h(t | placebo) b ln HR ln HR h(t | farmaco) exp( 0,50) 0,61 h(t | placebo) 95%CI( b ) 0.50 1.96 0.12 ( 0,74; 0,26) 152 95%CI( HR ) exp( 0,74; 0,26) (0,48; 0,77) 38 Curva di sopravvivenza Deviazioni dal protocollo • Survival distribution function 1 0.9 0.8 0.7 Coinvolgono il trial: Incorretta valutazione del trattamento Soddisfare le necessità del paziente Farmaco non stabile (catastrofe!) 0.6 0.5 0.4 0.3 0.2 0.1 0 0 500 1000 1500 2000 2500 3000 3500 time Lev+5FU Obs Lev xi<-c(0, 60, 0, 0, 0, 4, 2, 3, 0, 0) xj<-c(sex, age, obstruct, perfor, adhere, nodes, differ, extent, surg, node4) • Coinvolgono singoli pazienti: Pazienti non eleggibili Non aderenza terapia – non collaborazione – modifica terapia Valutazione incompleta – rifiuto del paziente – giudizio clinico – drop-out (usciti dal trial) 153 Deviazione protocollo 154 Modelli trivariati • Intention to treat: Method of analysis for randomised controlled trials in which all patients are analysed as they were randomised,regardless of behaviour or treatment received. • As treated: Method of analysis for randomised controlled trials in which all patients are analysed on the basis of the treatment ultimately received, regardless of the treatment to which they were randomly assigned. • Per protocol: Method of analysis for randomised controlled trials in which individuals are included in the analysis only if they followedthe assigned protocol and are removed from the analysis entirely if they do not follow protocol • IV: Method of analysis for randomised controlled trials in which all patients are analysed as they were randomised and then the result adjusted for treatment contamination by using an instrumental variable. 155 156 39 Confondimento Confondente (esempio) Ogni studio osservazionale può essere “confuso” dalla presenza di uno o più confondenti (Z), cioè di fattori che possono influenzare la relazione fra fattore di rischio (X) e stato di malattia (Y). Y+ X+ 240 X200 Y- 420 350 Y+ Z presente X+ X165 5 X+ Z assente Y+ Y75 195 Y- 385 X- 35 Perché una variabile Z possa apparire come un confondente deve essere: 1) correlata al fattore di rischio (X), ma non esserne conseguenza 2) correlata alla malattia (Y), ma non esserne conseguenza X SI ? Y X Z NO ? Y X Z NO ? Z Y OR 45 165 45 3.86 5 385 OR 240 350 1 200 420 OR 305 75 305 3.35 195 35 157 Modello confondimento 158 Confondimento (glm) 1. Dati: ( y1 , x1 , z1 ), ( y 2 , x1 , z 2 ),, ( y n , xn , z n ) 2. Modello lineare: X Y Z Step 1: E ( y ) b 0* b1* xi Step 2: E ( y ) a 0 a 1 zi Step 3: E ( y ) b 0 b1 xi b 2 zi 2.Modello logistico: * * Step 1: ln( p y1 / p y 0 ) b 0 b1 xi Step 2: ln( p y1 / p y 0 ) a 0 a1 zi Step 3: ln( p y1 / p y 0 ) b 0 b1 xi b 2 zi X= variabile indipendente Y= variabile dipendente Z= confondente 3.Interpretazione parametri: se lineare: parametri (a,b=m0, MD 159 se logistico: parametri (a,b=logO, logOR 160 40 Step 1 Step 1 YX ORYX X Y X Y Z Z (Mann et al, BMJ 1968; 2: 193-199) La variabile indipendente, X= uso di contraccettivi orali (si=1; no=0) causa la variabile dipendente, Y= infarto del miocardio (si=1; no=0) La variabile indipendente, X causa la variabile dipendente, Y X+ X- Y+ a b Y- c d OR XY RR XY Y+ RD XY X+ 29 X114 Y- 24 154 OR XY 2.20 z 2.74 P 0.006 161 162 Step 2 X Step 2 Y X xz Y ORXZ Z Z (Mann et al, BMJ 1968; 2: 193-199) Il confondente, Z causa la variabile indipendente, X Z+ X+ s Xt OR XZ Z- u v RD XZ Il confondente, Z= età donna (<40y=1; 4044y=0) causa la variabile indipendente, X= uso di contraccettivi orali (si=1; no=0) RR XZ 163 Z+ X+ 38 X85 Z- 25 183 OR XZ 3.27 z 4.10 P 0.001 164 41 Step 3 Tabella 4x2 (OR e MD) YX|Z X Y Z Y+ Y- odds Z+ X+ a1 b1 O11=exp(b0+b1+b2) Z+ X- c1 d1 O10 =exp(b0+b2) Z- X+ a0 b0 O01 =exp(b0+b1) Z- X- c0 d0 O00= exp(b0) ORYX |Z La variabile indipendente, X causa la variabile dipendente, Y controllando per l’effetto del confondente, Z: YX|Z 165 Step 3 X ORYX|Z O11 O01 exp( b1 ) O10 O00 my sy media Z+ X+ m1 s1 m11=b0+b1+b2 Z+ X- m2 s2 m10 =b0+b2 Z- X+ m3 s3 m01 =b0+b1 Z- X- m0 s0 m00=b0 MDYX |Z m11 m10 m01 m00 b1 166 XLSTAT Y Z (Mann et al, BMJ 1968; 2: 193-199) La variabile indipendente, X= uso di contraccettivi orali (si=1; no=0) causa la variabile dipendente, Y= infarto del miocardio (si=1; no=0) controllando per il confondente, Z= età donna (<40y=1; 4044y=0) 167 168 42 Tabella MLE (OR) (Intercept) x z Confounder bias Estimate S.E. z -test Pr(>|z|) -2.6119 0.3033 -8.612 1.0266 0.3056 3.36 0.000780 1.3695 0.303 4.52 0.000006 Y+ Y- odds X+ 21 26 O11=0.81 O11=0.806 Z+ X- 17 59 O10=0.29 O10=0.289 Z- X+ 18 88 O01=0.20 O01=0.205 Z- X- 7 95 O00=0.07 O00=0.073 0.81 0.20 2.79 0.29 0.07 exp(1.0266) 2.79 ORYX |Z 169 ln2.20 YX YX|Z Y Y bias YX |Z YX var( bias) SE (YX |Z ) SE (YX ) 2 z YX |Z YX SE (YX |Z ) SE (YX ) P 170 Studio sperimentale Confounder bias X X MLE odds Z+ ORYX |Z X • Il confondimento in uno studio sperimentale avviene tra le variabili di baseline (sesso, età, storia clinica, gravità della malattia, noti polimorfismi genetici, etc) e il trattamento Y ln2.79 X • Con la randomizzazione si evita “bias” sistematico di selezione : le caratteristiche (Z) dei pazienti che possono influenzare l’esito (Y) sono distribuite a caso fra i trattamenti (X): Z non è associato a X ! Y bias ln 2.79 ln 2.20 0.240 var( bias) 0.306 0.2872 0.0182 z ln 2.79 ln 2.20 13.3 P 0.001 0.306 0.287 171 • Le caratteristiche Z non sono più un confondente (manca la relazione X-Z), ma possono essere associate all’esito (c’è la relazione Z-Y) e sono definite variabili (fattori) prognostici 172 43 Moderatore (esempio) Moderazione (interazione) Un moderatore (o modificatore d’effetto) Z è una variabile che ha effetto sulla forza della relazione tra fattore di rischio (X) e stato di malattia (Y), ovvero il legame tra X e Y dipende da una terza variabile Z Perché una variabile Z possa apparire come un moderatore deve essere: 1) NON correlata al fattore di rischio X 2) intervenire (interagire) nel legame fra il fattore di rischio X e la malattia Y: SI NO Z ? Y Z X35 Y- 508 617 Y+ Z presente X+ X35 15 Y+ Z assente X+ X32 20 Y- 32 85 Y- 476 OR 35 85 6.20 15 32 OR 67 617 2.33 35 508 532 SI Y Z ? X Y+ X+ 67 Y ? X OR 32 532 1.79 20 476 X 173 Modello moderazione 174 Moderazione(glm) 1. Dati: ( y1 , x1 , z1 ), ( y 2 , x1 , z 2 ),, ( y n , xn , z n ) 2. Modello lineare: X Step 1: E ( y ) b * b * x 0 1 i Y Step 2: E ( y ) a 0 a1 zi Step 3: E ( y ) b 0 b1 xi b 2 zi b 3 xzi Z 2.Modello logistico: Step 1: ln( p y1 / p y 0 ) b 0* b1* xi Step 2: ln( p y1 / p y 0 ) a 0 a1 zi Step 3: ln( p y1 / p y 0 ) b 0 b1 xi b 2 zi b 3 xzi X= variabile indipendente Y= variabile dipendente Z= moderatore 3.Interpretazione parametri: se lineare: parametri (a,b=m0, MD 175 se logistico: parametri (a,b=logO, logOR 176 44 Step 1 Step 1 YX ORYX X Y X Y Z Z (McCusker et al. Lancet 2001; 357: 436-39) La variabile indipendente, X= allele e4 APOE (si=1; no=0) causa la variabile dipendente, Y= malattia di Alzheimer (si=1; no=0) La variabile indipendente, X causa la variabile dipendente, Y X+ X- Y+ a b Y- c d OR XY RR XY Y+ X+ 125 RD XY Y- 52 X117 183 OR XY 3.76 z 6.52 P 0.001 177 178 Step 2 X Step 2 Y X xz=0;1 Y ORXZ Z Z (McCusker et al. Lancet 2001; 357: 436-39) La variabile indipendente, X= APOE e4 (si=1; no=0) NON causa il moderatore Z= allele TNF-a T (si=1; no=0) o viceversa la variabile indipendente, X NON causa il moderatore, Z o viceversa Z NON causa X Z+ X+ s Xt OR XZ Z- u v RD XZ RR XZ 179 Z+ X+ 62 X117 Z- 115 183 OR XZ 0,84 z 0,865 P 0.387 180 45 Step 3 Tabella 4x2 (OR e MD) Y+ X xyz Y Z Y- OR Z+ X+ a b OR11=exp(b1+b2+b3) Z+ X- c d OR10 =exp(b2) Z- X+ e f OR01 =exp(b1) Z- X- g h OR00=1 IOR Il moderatore, Z agisce sulla relazione fra la variabile indipendente, X e la variabile dipendente, Y 181 Step 3 OR11 exp( b 3 ) OR10 OR01 my sy MD Z+ X+ m1 s1 m11-m00=b1+b2+b3 Z+ X- m2 s2 m10 -m00=b2 Z- X+ m3 s3 m01 -m00=b1 Z- X- m0 s0 m00-m00=0 IMD MD11 ( MD10 MD01 ) b 3 182 XLSTAT IOR X Y Z (McCusker et al. Lancet 2001; 357: 436-39) Il moderatore, Z= TNF-a T (si=1; no=0) agisce sulla relazione fra la variabile indipendente, X= APOE e4 (si=1; no=0) e la variabile dipendente, Y= malattia di Alzheimer (si=1; no=0) 183 184 46 ADE (Pearl, 2000) Tabella MLE (OR) Estimate S.E. z -test Pr(>|z|) (Intercept) -0.2973 0.1495 -1.989 x 1.0035 0.2483 4.042 0.000053 z -0.3959 0.2466 -1.605 0.108400 xz 0.9218 0.4386 2.102 0.035600 Y+ Y- X xyz Y Z MLE OR Z+ X+ 48 14 OR11=4.62 Z+ X- 39 78 OR10=0.67 Z- X+ 77 38 OR01=2.73 Z- X- 78 105 OR00=1 DE (0) ln ORYX |Z 0 ln OR01 b1 DE (1) ln ORYX |Z 1 ln OR01 ln IOR b1 b 3 ADE p0 DE (0) p1 DE (1) b1 p1b 3 dove: 4.62 IOR 2.51 0.67 2.73 IOR exp( 0.9218) 2.51 p1 Pr( Z 1) ( s t ) / n p0 Pr( Z 0) (u v ) / n 185 186 Interazione “completa” Percentuale ADE MRS ln2.73+0.38·ln2.51 X 3,00 Y infarct heamorrhage 2,50 odds ratio Z OR11 2,00 1,50 1,00 p1 (62 117) / 477 0.375 0,50 p0 (115 183) / 477 0.625 0,00 OR00=1 OR01 LC1:low DE (0) ln 2.73 1.004 p1 ln IOR 0.375 ln 2.51 0.345 ADE 1.004 0.345 1.349 (e1.349=3.85) ADE % 74.4% 25.6% 100% 187 OR10 LC2:high Y=mRS: neurological deficit at 90 days defined as 1=favorable (mRS 0 to 2) and 2=unfavorable (mRS 3 to 6) 188 47 Interazione “parziale” Interazione “nulla” NIHSS48h DEAD90B 3,00 4.00 infarct OR11 infarct heamorrhage 3.50 heamorrhage 3.00 2,00 OR10 odds ratio odds ratio 2,50 1,50 1,00 OR00=OR01=1 2.50 2.00 1.50 1.00 0,50 OR11 OR01 OR10 OR00=1 0.50 0,00 0.00 LC1:low LC2:high LC1:low Y= NIHSSscale at 48h: early neurological deterioration, defined as 1=an increase in NIHSS score of 4 points or more within the first 48 hours of hospitalization, and 0=otherwise Y=DEAD=mortality at 90 days the case fatality included all-cause mortality within 90 days, defined as 1=yes, and 2=no 189 La mediazione è parte del meccanismo generativo (la via) attraverso cui la variabile indipendente “focale” (o di interesse), X influenza la variabile dipendente, Y (Baron& Kenny, 1986) X ? Y Z X Y Z X= variabile indipendente Z= mediatore Y= variabile dipendente SI NO X ? Y Z La variabile di mediazione Z: 1) è una variabile intermedia nella sequenza casuale X-Z-Y; 2) non è un moderatore dell’effetto di X su Y o viceversa X non è un moderatore dell’effetto di Z su Y X 190 Modello mediazione Mediazione NO LC2:high Y Z Baron RM, Kenny DA, JPSP 1986 191 192 48 Baron & Kenny Step 1 Mediazione (glm) 1. Dati: ( y1 , x1 , z1 ), ( y 2 , x1 , z 2 ),, ( y n , xn , z n ) YX 2. Modello lineare: X b 0* E ( y) Step 2: E ( y ) a 0 a 1 zi Step 3: E ( y ) b 0 b1 xi b 2 zi Y b1* xi Step 1: Z 2.Modello logistico: Step 1: ln( p1 / p0 ) b 0* b1* xi La variabile indipendente, X causa la variabile dipendente, Y Step 2: ln( p1 / p0 ) a 0 a1 zi Step 3: ln( p1 / p0 ) b 0 b1 xi b 2 zi 3.Interpretazione parametri: se lineare: parametri (a,b=m0, MD X+ Y+ a Yb OR XY X- c d RD XY RR XY se log(odds): parametri (a,b=logO, logOR193 Step 1 194 Baron & Kenny Step 2 ORYX X Y X Y ZX Z Z (Pezzini et al. Stroke 2007; 38: 3145-3151) La variabile indipendente, X=MTHFR TT (si=1; no=0) causa la variabile dipendente, Y=sCAD, spontanea dissezione arteria cervicale (si=1; no=0) Y+ Y- X+ 33 73 X- 26 160 OR XY 2.78 z 3.44 P 0.0006 195 La variabile indipendente, X causa il mediatore, Z Z+ X+ s Xt Z- u v ORZX RRZX RDZX 196 49 Baron & Kenny Step 3 Step 2 YX|Z X Y X Y ORZX YZ|X Z Z (Pezzini et al. Stroke 2007; 38: 3145-3151) La variabile indipendente, X= MTHFR TT (si=1; no=0) causa il mediatore, Z= emicrania con aurea (si=1; no=0) Z+ X+ 9 X13 Z- 50 220 •Il mediatore, Z causa la variabile dipendente, Y controllando per l’effetto della variabile indipendente, X: YZ|X •La variabile indipendente, X causa la variabile dipendente, Y controllando per l’effetto del mediatore, Z: YX|Z ORZX 3.05 z 2.42 P 0.0157 197 Step 3 198 XLSTAT ORYX|Z X Y ORYZ|X Z (Pezzini et al. Stroke 2007; 38: 3145-3151) •La variabile indipendente, X= MTHFR TT causa la variabile dipendente, Y=sCAD= spontanea dissezione arteria cervicale, controllando per il mediatore, Z= emicrania con aurea •Il mediatore, Z=emicrania con aurea causa la variabile dipendente, Y=sCAD controllando per la variabile indipendente, X= MTHFR TT 199 200 50 TE=DE+IE (Huang et al, 2004) Tabella MLE (OR) (Intercept) x z Estimate S.E. z-test Pr(>|z|) -0.8509 0.1457 -5.842 0.9442 0.3028 3.118 0.001820 1.0563 0.4736 2.23 0.025720 Y+ Y- odds X+ 7 2 O11=3.50 O11=3.157 Z+ X- 7 6 O10=1.17 O10=1.228 Z- X+ 26 24 O01=1.08 O01=1.098 Z- X- 66 154 O00=0.43 O00=0.427 3.16 1.10 2.57 exp( b1 ) 1.23 0.43 3.16 1.23 2.88 exp( b 2 ) 1.10 0.43 b2 Z DE b1 IE ( q1 q0 ) b 2 TE b1 ( q1 q0 ) b 2 s su t q0 Pr( Z 1 | X 0) tv q1 Pr( Z 1 | X 1) 201 Percentuale TE (lnOR) model=logit: parametri=lnOR model=linear: parametri=MD X Y 1.06=ln2.88 202 Percentuale TE (MD) 0.94=ln2.57 (0.15-0.06) Y dove: ORYX |Z X b1 (q1-q0) MLE odds Z+ ORYZ |X X b1 Y b2 (0.15-0.06) Z Z 9 0.15 9 50 13 q0 0.06 13 220 q1 9 0.15 9 50 13 q0 0.06 13 220 q1 DE 0.944 IE (0.15 0.06) 1.06 0.102 TE 0.944 0.102 1.046 (e1.046=2.85) 203 TE % 90.2% 9.8% 100% DE b1 IE (0.15 0.06) b 2 TE b1 (0.15 0.06) b 2 TE % DE / TE % IE / TE % 204 51 Modelli multivariati (sem) Internet BMJ statistical series • http://www.bmj.com/ • nella casella Search: “statistics notes” XLSTAT • http://www.xlstat.com/ R • http://cran.r-project.org/ 205 206 52