RCT sperimentazione clinica controllata RCT Sperimentazione clinica controllata Sperimentazione: studio longitudinale in cui si valuta un intervento di cui non si conosce l’esito (altrimenti inutile e non etico ma da cui ci si aspetta risultati clinicamente rilevanti Clinica: l’obiettivo primario è valutare l’efficacia clinica Efficacia clinica Efficacia farmacologica capacità di modificare la storia naturale della malattia capacità di influenzare parametri clinici, sierologici etc. (primario) Hard: di oggettiva valutazione Soft: di soggettiva valutazione (secondario) Controllata: è importante un gruppo di controllo in parallelo simultaneo - il saggio statistico dell’ipotesi richiede un elemento di riferimento - deve essere evitata la distorsione da confronto inadeguato - permette la valutazione di differenze piccole ma clinicamente rilevanti POPOLAZIONE CAMPIONE Trattamento sperimentale Trattamento standard N. Eventi N. Eventi Risultati discordanti tra studi possono dipendere da: - Distorsione provocata da errori sistematici - Distribuzione che i risultati possono avere intorno al valore vero la deviazione dipende dalla precisione delle stime (variabilità casuale ) Errore Sistematico Deriva da fonte esterna (introdotta anche se non voluta dal ricercatore), porta a distorsione sistematica delle informazioni. Si verificano in fase di progettazione ed esecuzione dello studio. I risultati ottenuti sono difficilmente correggibili attraverso più o meno sofisticate elaborazioni statistiche. Attiene alla non comparabilità dei gruppi in studio per motivi relativi a: - popolazioni - interventi - osservazioni Non comparabilità delle popolazioni Selection Bias Due gruppi a confronto dovrebbero avere un identico outcome in assenza del farmaco che si sta studiando. Contromisura: il bilanciamento dei fattori prognostici (capaci di influenzare il decorso della malattia indipendentemente dal trattamento) conosciuti e non, nei due gruppi è assicurato (ma vale la pena controllare) dalla randomizzazione. Manuale metodologico – NICE - 2009 Non comparabilità degli interventi Performance Bias Tutte le condizioni di contorno e i trattamenti accessori alla sperimentazione devono essere identiche nei due gruppi. Contromisura: l’uso del placebo e il blinding (cecità dello sperimentatore, del paziente) Non comparabilità delle osservazioni Detection Bias La conoscenza del tipo di trattamento da parte di chi assume o somministra il farmaco può influenzare il paziente che riferisce la manifestazione clinica o il ricercatore che registra le misure di esito. Possono condizionare comportamenti, stili di vita etc. Contromisura: blinding (cieco, doppio cieco etc. di colui il quale assegna l’outcome, di colui il quale analizza i dati). Non comparabilità delle perdite al follow up Attrition Bias Fattori associati all’efficacia, alla sicurezza e alla tollerabilità di un trattamento possono condizionarne l’adesione; perdite selettive modificano la distribuzione dei fattori prognostici. Contromisura: analisi di tutti i soggetti randomizzati (intention to treat) Haderslev KV, Tjellesen L, Sorensen HA, Staun M. Alendronate increases lumbar spine bone mineral density in patients with Crohn’s disease. Gastroenterology. 2000;119:639-46. One patient in the alendronate group was lost to follow up; thus data from 31 patients were available for the intention-to-treat analysis. Five patients were considered protocol violators . . . consequently 26 patients remained for the per-protocol analyses. Sistemi di bias che influenzano la validità interna ed esterna Selection Bias Validità Interna Validità Esterna problema Trattati e controlli sono differenti per i fattori prognostici I gruppi in studio e la popolazione target sono differenti soluzione Randomizzazione Appaiamento Identificazione e aggiustamento (se si può) delle caratteristiche dei soggetti esclusi o che non hanno consentito Domanda chiave La randomizzazione è adeguata ? I fattori noti rilevanti sono ugualmente distribuiti ? Sono stati considerati i principali potenziali o noti modificatori di effetto ? Sistemi di bias che influenzano la validità interna ed esterna Performance Bias Validità Interna Validità Esterna Oltre l’intervento in studio ci sono differenze nei trattamenti i trattamenti in studio non riflettono la variabilità nella gestione della malattia e nei problemi dei pazienti soluzione Uso del placebo trattamenti realistici con possibili modifiche individualizzate (trial pragmatici) Domanda chiave Sono documentati i cointerventi? gli interventi sono realistici e applicati nella pratica quotidiana ? problema Sistemi di bias che influenzano la validità interna ed esterna Attrition Bias Validità Interna Validità Esterna problema tassi di drop out differenti tra i gruppi o grandi perdite al follow up motivazione e compliance differenti tra gruppi in studio e popolazione target soluzione analisi secondo “intention to treat” (perdite > 10% comportano alto rischio di bias) valutazione e controllo della compliance Domanda chiave E’ documentato il tasso di drop out ? L’analisi è adeguata ? sono noti i motivi di drop out ? questi motivi hanno impatto sulla praticabilità, la compliance e la sicurezza ? Sistemi di bias che influenzano la validità interna ed esterna Detection Bias problema differenze nelle misure e nella percezione degli esiti tra i gruppi misure di esito e lunghezza del follow up non rilevanti per i problemi dei pazienti soluzione valutazione in cieco. due valutazioni indipendenti. misure oggettive esiti rilevanti e lunghezza del follow up adeguati le valutazioni sono in cieco ? chi valuta è indipendente da chi tratta ? gli esiti sono centrati sul paziente ? la lunghezza del follow up è adeguata ? le differenze sono rilevanti ? Domanda chiave Errore Casuale Errore non eliminabile che ridimensiona le nostre certezze. Ci obbliga ad esprimerci in termini di probabilità e a misurare il nostro livello di precisione. L’idea chiave su cui si basa l’analisi statistica degli studi clinici è che si possono eseguire osservazioni su un campione di soggetti e poi compiere inferenze sulla popolazione da cui il campione è stato tratto. L’inferenza implica la ineliminabilità dell’errore Significatività statistica e dimensione del campione • Negli studi campionari tutte le differenze possono essere il risultato del caso: le distribuzioni campionarie di studi di una data dimensione individuano il valore di probabilità del 5% sotto il quale si assume convenzionalmente il rischio di attribuire le differenze al trattamento; un livello di probabilità sopra il 5% non mi consente di attribuire le differenze al trattamento. • Più le differenze sono grandi meno è probabile che siano casuali • Più i campioni sono piccoli più è probabile avere grandi differenze per caso • Più i campioni sono grandi più è probabile che differenze piccole e irrilevanti siano statisticamente significative Inferenza Specificare l’ipotesi alternativa: Il farmaco A è più efficace del farmaco B nel ridurre la glicemia Specificare l’ipotesi nulla: Definisco il risultato che falsifica l’ipotesi alternativa (il farmaco A non è più efficace del farmaco B nel ridurre la glicemia) Definire le regole dell’inferenza: Fisso il limite oltre il quale la verità dell’ipotesi nulla è da considerarsi improbabile (5% è la misura più frequentemente utilizzata) trattati con farmaco B trattati con farmaco A 110 110 120 Farmaco A Glicemia media Farmaco B Glicemia media Glicemia 130 125 Randomizzazione 130 …120 …115 Tipi di errore Ipotesi alternativa: Il farmaco A è più efficace del farmaco B nel ridurre la glicemia Ipotesi nulla: Il farmaco A non è più efficace del farmaco B nel ridurre la glicemia Realtà Ipotesi nulla (A = B) Falsa Studio campionario Ipotesi nulla (A = B) errore Falsa Vera Vera errore Significatività statistica e dimensione del campione • RCT 100 soggetti 50 15 eventi p 0.3 50 10 eventi RR 0.67 (0.33 – 1.34) • RCT 200 soggetti 100 30 eventi p 0.1 100 20 eventi RR 0.67 (0.41 – 1.09) • RCT 400 soggetti 200 60 eventi p 0.02 200 40 eventi RR 0.67 (0.47 – 0.94) Abuso del test di ipotesi Il limite del 5% è convenzionale (scegliere il limite più ragionevole). La dicotomizzazione di un risultato in due esiti alternativi S/NS non esprime la realtà dei risultati. Due studi identici con un p di 0.045 e 0.052, forniscono elementi per prendere decisioni alternative? I risultati sono praticamente uguali. L’uso esclusivo del “p” tende ad enfatizzare il significato e soprattutto ad equipararla pericolosamente all’importanza clinica o alla rilevanza biologica. In realtà un ricercatore/lettore è interessato alla grandezza delle differenze tra i trattamenti e alla precisione di questa stima. Uso degli Intervalli di Confidenza - I.C. L’intervallo di confidenza esprime (con una probabilità del 9095-99%) il range dei valori entro il quale è compreso il valore vero Vantaggi degli I.C. Permettono di valutare: - entità della grandezza della differenza (stima puntuale) -il livello di precisione (range dei valori) all’interno del range dei valori la stima puntuale ha la maggiore probabilità di essere il valore vero Esempio Trattamento A = 100 pazienti; PA media 146.4 mmHg Trattamento B = 100 pazienti; Differenza = 6 mmHg (1.1 – 10.9) PA media 140.4 mmHg Trattamento A = 50 pazienti; PA media 146.4 mmHg Trattamento B = 50 pazienti; PA media 140.4 mmHg Differenza = 6 mmHg (- 1.0 – 13.9) Presentazione dei risultati Misure: relative R.R. (cambiamento del rischio/protezione nel gruppo esposti rispetto al gruppo dei controlli). assolute R.A. (numero assoluto di eventi causati/evitati nel gruppo esposti rispetto al gruppo dei controlli). Esempio n° Trattati eventi rischio nel periodo (5 anni) 15000 1800 1800/15000=0.12 Controlli 15000 R.R. = 0.60 3000 3000/15000=0.20 RR RA 0.12/0.20=0.60 0.20-0.12=0.08 1-R.R = 1-0.60 = 0.40 Il trattamento riduce del 40% il rischio nei soggetti trattati per 5 anni. R.A. = 0.08 Il trattamento evita 8 eventi a 100 persone trattate per 5 anni. NNT (informazione di immediata comprensione clinica) 1/0.08 = 13 occorrono 13 trattamenti per 5 anni per evitare un evento. Esempio (pazienti meno gravi) n° Trattati eventi rischio nel periodo (5 anni) 15000 135 135/15000=0.009 Controlli 15000 R.R. = 0.60 225 225/15000=0.015 RR RA 0.009/0.015 =0.6 0.015-0.009 =0.006 1-R.R = 1-0.60 = 0.40 (Il rischio relativo è uguale) Il trattamento riduce del 40% il rischio nei soggetti trattati per 5 anni. RA = 0.006 Il trattamento evita 6 eventi a 1000 (mille) persone trattate per 5 anni. NNT = 1/0.006 = 167 occorrono 167 trattamenti per 5 anni per evitare un evento. Il Rischio Relativo (RR) non è influenzato dalla grandezza assoluta dei fenomeni. RR = Idesposti = 0.002 / Idnon esposti = 0.001 = 0.002 / 0.001 = 2 RR = Idesposti = 0.2 / Idnon esposti = 0.1 = 0.2 / 0.1 = 2 Il RR esprime la forza dell’associazione, indipendentemente dalla frequenza della malattia, è utile in contesti sperimentali RA = Idesposti = 0.002 - Idnon esposti = 0.001 = 0.002 - 0.001 = 0.001 RA = Idesposti = 0.2 - Idnon esposti = 0.1 = 0.2 - 0.1 = 0.1 Il RA incorpora l’informazione sulla frequenza della malattia, è utile in contesti di sanità pubblica Randomizzazione Allocazione random significa che un paziente ha la stessa probabilità di avere uno dei trattamenti, ma il tipo di trattamento non può essere previsto. Come randomizzare: - Randomizzazione semplice - Randomizzazione a blocchi (per avere un bilanciamento progressivo dei gruppi a confronto) - Randomizzazione stratificata (per ridurre il rischio di sbilanciamento per fattori prognostici) Randomizzazione Perché nascondere l’allocazione al trattamento Ridurre il rischio che i ricercatori possono essere influenzati dalla conoscenza del trattamento in modo conscio o inconscio nel determinare: • l’eleggibilità • la partecipazione • la comunicazione al paziente • l’allocazione La conoscenza del trattamento prima dell’allocazione tende a sovrastimare l’effetto del trattamento. Randomizzazione Come nascondere l’allocazione al trattamento Metodo di scelta: chi genera l’allocazione è diverso da chi determina l’eleggibilità e l’adesione al trial (meglio se esterno al trial) es. sistema centralizzato telefonico Metodo alternativo: buste sigillate e con numerazione progressiva Analisi Intention to treat Una strategia che confronta i pazienti nei gruppi in cui sono stati assegnati in origine dalla randomizzazione indipendentemente da quello che succede dopo l’allocazione: • evidenza di false inclusioni • non compliance • deviazioni dal protocollo • co-interventi • perdite al follow-up Analisi Obiettivi principali dell’analisi intention to treat • proteggere la validità interna (la randomizzazione) • proteggere la validità esterna (avvicinare la valutazione dell’efficacia a quello che di fatto avviene nella pratica) Analisi Sbilanciamenti delle caratteristiche dei pazienti tra i gruppi dopo la randomizzazione (chance bias) Strategie: • definire in anticipo (in fase di disegno) i fattori che sappiamo influenzano l’esito • valutare l’effetto indipendente della caratteristica sull’esito • aggiustare Analisi Analisi per sottogruppi Sono condotte per valutare l’effetto di un trattamento in gruppi di pazienti individuati in base alla presenza di una specifica caratteristica Servono a indagare la consistenza dei risultati in sottogruppi della popolazione individuati in base alla presenza di specifiche caratteristiche Analisi Analisi per sottogruppi L’analisi per sottogruppi aumenta la probabilità di risultati falsamente positivi quindi Tali analisi devono essere numericamente contenute Devono essere pre-specificate nel protocollo dello studio Wang R, et al., NEJM, 2007 Casi particolari - Cluster RCT - RCT pragmatici - RCT di non inferiorità Cluster RCT The CONSORT statement focused on reporting parallel group randomised trials in which individual participants are randomly assigned to study groups. …randomly assign groups of individuals (such as families or medical practices) rather than individuals. I cluster RCT sono più complessi nel disegno, richiedono una maggiore dimensione del campione (per ottenere una stessa potenza statistica) e richiedono una analisi più complessa. Cluster RCT Esempi di cluster: pazienti di MMG, famiglie, classi scolastiche, ecc. Le osservazioni fatte sui membri di ciascun cluster tendono a somigliarsi (correlare), quindi la dimensione effettiva del campione è inferiore a quella ottenibile mediante la randomizzazione di singoli individui Questo inconveniente ha una dimensione che dipende dalla dimensione dei cluster e dal grado di somiglianza tra i membri del cluster (coefficiente di correlazione intraclassi o intracluster) BMJ 2004;328;702-708 RCT pragmatici Nessun follow up dedicato, ma uso di database, registri, ecc Outcome clinicamente rilevante e senza centralizzazione della misura Nessuna strategia per il miglioramento della compliance Le procedure su come utilizzare il trattamento sperimentale sono altamente flessibili e affidate agli erogatori Criteri di elegibilità ampi, senza selezioni per rischio, comorbidità, ecc RCT di non inferiorità Poiché la prova di uguaglianza perfetta non è possibile, per gli RCT di non inferiorità, è pre-fissato un margine di non inferiorità per l’effetto del trattamento sull’outcome primario. Gli studi di equivalenza sono simili eccetto per il fatto che il margine di equivalenza è fissato tra − e + RCT di non inferiorità JAMA. 2006;295:1152-1160