RCT sperimentazione clinica controllata

RCT
sperimentazione clinica controllata
RCT
Sperimentazione clinica controllata
Sperimentazione: studio longitudinale in cui si valuta un
intervento di cui non si conosce l’esito (altrimenti inutile e
non etico ma da cui ci si aspetta risultati clinicamente
rilevanti
Clinica: l’obiettivo primario è valutare l’efficacia clinica
Efficacia clinica
Efficacia farmacologica
capacità di modificare la
storia naturale della
malattia
capacità di influenzare parametri
clinici, sierologici etc.
(primario)
Hard: di oggettiva valutazione
Soft: di soggettiva valutazione
(secondario)
Controllata:
è importante un gruppo di controllo in parallelo
simultaneo
- il saggio statistico dell’ipotesi richiede un elemento di
riferimento
- deve essere evitata la distorsione da confronto inadeguato
- permette la valutazione di differenze piccole ma clinicamente
rilevanti
POPOLAZIONE
CAMPIONE
Trattamento sperimentale
Trattamento standard
N. Eventi
N. Eventi
Risultati discordanti tra studi possono dipendere da:
- Distorsione provocata da errori sistematici
- Distribuzione che i risultati possono avere intorno al valore vero
la deviazione dipende dalla precisione delle stime (variabilità casuale )
Errore Sistematico
Deriva da fonte esterna (introdotta anche se non voluta dal
ricercatore), porta a distorsione sistematica delle informazioni.
Si verificano in fase di progettazione ed esecuzione dello
studio. I risultati ottenuti sono difficilmente correggibili
attraverso più o meno sofisticate elaborazioni statistiche.
Attiene alla non comparabilità dei gruppi in studio per motivi
relativi a:
- popolazioni
- interventi
- osservazioni
Non comparabilità delle popolazioni
Selection Bias
Due gruppi a confronto dovrebbero avere un identico outcome in
assenza del farmaco che si sta studiando.
Contromisura: il bilanciamento dei fattori prognostici (capaci di
influenzare il decorso della malattia indipendentemente dal
trattamento) conosciuti e non, nei due gruppi è assicurato (ma
vale la pena controllare) dalla randomizzazione.
Manuale metodologico – NICE - 2009
Non comparabilità degli interventi
Performance Bias
Tutte le condizioni di contorno e i trattamenti accessori alla
sperimentazione devono essere identiche nei due gruppi.
Contromisura: l’uso del placebo e il blinding (cecità dello
sperimentatore, del paziente)
Non comparabilità delle osservazioni
Detection Bias
La conoscenza del tipo di trattamento da parte di chi assume o
somministra il farmaco può influenzare il paziente che
riferisce la manifestazione clinica o il ricercatore che registra
le misure di esito. Possono condizionare comportamenti, stili
di vita etc.
Contromisura: blinding (cieco, doppio cieco etc. di colui il quale
assegna l’outcome, di colui il quale analizza i dati).
Non comparabilità delle perdite al follow up
Attrition Bias
Fattori associati all’efficacia, alla sicurezza e alla
tollerabilità di un trattamento possono condizionarne
l’adesione; perdite selettive modificano la distribuzione
dei fattori prognostici.
Contromisura: analisi di tutti i soggetti randomizzati
(intention to treat)
Haderslev KV, Tjellesen L, Sorensen HA, Staun M.
Alendronate increases lumbar spine bone mineral density in patients with Crohn’s
disease. Gastroenterology. 2000;119:639-46.
One patient in the alendronate group was lost to follow
up; thus data from 31 patients were available for the
intention-to-treat analysis.
Five patients were considered protocol violators . . .
consequently 26 patients remained for the per-protocol
analyses.
Sistemi di bias che influenzano la validità interna ed esterna
Selection Bias
Validità Interna
Validità Esterna
problema
Trattati e controlli sono
differenti per i fattori
prognostici
I gruppi in studio e la popolazione
target sono differenti
soluzione
Randomizzazione
Appaiamento
Identificazione e aggiustamento (se si
può) delle caratteristiche dei soggetti
esclusi o che non hanno consentito
Domanda
chiave
La randomizzazione è
adeguata ?
I fattori noti rilevanti sono
ugualmente distribuiti ?
Sono stati considerati i principali
potenziali o noti modificatori di
effetto ?
Sistemi di bias che influenzano la validità interna ed esterna
Performance Bias
Validità Interna
Validità Esterna
Oltre l’intervento in
studio ci sono differenze
nei trattamenti
i trattamenti in studio non riflettono
la variabilità nella gestione della
malattia e nei problemi dei pazienti
soluzione
Uso del placebo
trattamenti realistici con possibili
modifiche individualizzate (trial
pragmatici)
Domanda
chiave
Sono documentati i cointerventi?
gli interventi sono realistici e
applicati nella pratica quotidiana ?
problema
Sistemi di bias che influenzano la validità interna ed esterna
Attrition Bias
Validità Interna
Validità Esterna
problema
tassi di drop out differenti tra i
gruppi o grandi perdite al follow
up
motivazione e compliance
differenti tra gruppi in studio e
popolazione target
soluzione
analisi secondo “intention to
treat” (perdite > 10%
comportano alto rischio di bias)
valutazione e controllo della
compliance
Domanda
chiave
E’ documentato il tasso di drop
out ?
L’analisi è adeguata ?
sono noti i motivi di drop out ?
questi motivi hanno impatto sulla
praticabilità, la compliance e la
sicurezza ?
Sistemi di bias che influenzano la validità interna ed esterna
Detection Bias
problema
differenze nelle misure e nella
percezione degli esiti tra i
gruppi
misure di esito e lunghezza del
follow up non rilevanti per i
problemi dei pazienti
soluzione
valutazione in cieco.
due valutazioni indipendenti.
misure oggettive
esiti rilevanti e lunghezza del
follow up adeguati
le valutazioni sono in cieco ?
chi valuta è indipendente da
chi tratta ?
gli esiti sono centrati sul
paziente ?
la lunghezza del follow up è
adeguata ?
le differenze sono rilevanti ?
Domanda
chiave
Errore Casuale
Errore non eliminabile che ridimensiona le nostre certezze.
Ci obbliga ad esprimerci in termini di probabilità e a misurare il
nostro livello di precisione.
L’idea chiave su cui si basa l’analisi statistica degli studi clinici
è che si possono eseguire osservazioni su un campione di
soggetti e poi compiere inferenze sulla popolazione da cui il
campione è stato tratto.
L’inferenza implica la ineliminabilità dell’errore
Significatività statistica e dimensione del campione
• Negli studi campionari tutte le differenze possono essere il
risultato del caso: le distribuzioni campionarie di studi di una data
dimensione individuano il valore di probabilità del 5% sotto il
quale si assume convenzionalmente il rischio di attribuire le
differenze al trattamento; un livello di probabilità sopra il 5% non
mi consente di attribuire le differenze al trattamento.
• Più le differenze sono grandi meno è probabile che siano casuali
• Più i campioni sono piccoli più è probabile avere grandi
differenze per caso
• Più i campioni sono grandi più è probabile che differenze piccole
e irrilevanti siano statisticamente significative
Inferenza
Specificare l’ipotesi alternativa:
Il farmaco A è più efficace del farmaco B nel ridurre la glicemia
Specificare l’ipotesi nulla:
Definisco il risultato che falsifica l’ipotesi alternativa
(il farmaco A non è più efficace del farmaco B nel ridurre la glicemia)
Definire le regole dell’inferenza:
Fisso il limite oltre il quale la verità dell’ipotesi nulla è da considerarsi
improbabile (5% è la misura più frequentemente utilizzata)
trattati con farmaco B
trattati con farmaco A
110
110
120
Farmaco A
Glicemia media
Farmaco B
Glicemia media
Glicemia
130
125
Randomizzazione
130
…120
…115
Tipi di errore
Ipotesi alternativa: Il farmaco A è più efficace del farmaco B nel ridurre
la glicemia
Ipotesi nulla: Il farmaco A non è più efficace del farmaco B nel ridurre la
glicemia
Realtà
Ipotesi nulla (A = B)
Falsa
Studio campionario
Ipotesi nulla
(A = B)
errore Falsa
Vera
Vera
errore Significatività statistica e dimensione del campione
•
RCT 100 soggetti
50 15 eventi p 0.3
50 10 eventi RR 0.67 (0.33 – 1.34)
•
RCT 200 soggetti
100 30 eventi p 0.1
100 20 eventi RR 0.67 (0.41 – 1.09)
•
RCT 400 soggetti
200 60 eventi p 0.02
200 40 eventi RR 0.67 (0.47 – 0.94)
Abuso del test di ipotesi
Il limite del 5% è convenzionale (scegliere il limite più ragionevole).
La dicotomizzazione di un risultato in due esiti alternativi S/NS non
esprime la realtà dei risultati.
Due studi identici con un p di 0.045 e 0.052, forniscono elementi per
prendere decisioni alternative? I risultati sono praticamente uguali.
L’uso esclusivo del “p” tende ad enfatizzare il significato e soprattutto
ad equipararla pericolosamente all’importanza clinica o alla rilevanza
biologica.
In realtà un ricercatore/lettore è interessato alla grandezza delle
differenze tra i trattamenti e alla precisione di questa stima.
Uso degli Intervalli di Confidenza - I.C.
L’intervallo di confidenza esprime (con una probabilità del 9095-99%) il range dei valori entro il quale è compreso il valore
vero
Vantaggi degli I.C.
Permettono di valutare:
- entità della grandezza della differenza (stima puntuale)
-il livello di precisione (range dei valori)
all’interno del range dei valori la stima puntuale ha la maggiore
probabilità di essere il valore vero
Esempio
Trattamento A = 100 pazienti;
PA media 146.4 mmHg
Trattamento B = 100 pazienti;
Differenza = 6 mmHg (1.1 – 10.9)
PA media 140.4 mmHg
Trattamento A = 50 pazienti;
PA media 146.4 mmHg
Trattamento B = 50 pazienti;
PA media 140.4 mmHg
Differenza = 6 mmHg (- 1.0 – 13.9)
Presentazione dei risultati
Misure:
relative R.R. (cambiamento del rischio/protezione nel
gruppo esposti rispetto al gruppo dei controlli).
assolute R.A. (numero assoluto di eventi causati/evitati
nel gruppo esposti rispetto al gruppo dei controlli).
Esempio
n°
Trattati
eventi rischio nel periodo
(5 anni)
15000 1800 1800/15000=0.12
Controlli 15000
R.R. = 0.60
3000
3000/15000=0.20
RR
RA
0.12/0.20=0.60 0.20-0.12=0.08
1-R.R = 1-0.60 = 0.40
Il trattamento riduce del 40% il rischio nei soggetti trattati per 5 anni.
R.A. = 0.08
Il trattamento evita 8 eventi a 100 persone trattate per 5 anni.
NNT (informazione di immediata comprensione clinica) 1/0.08 = 13
occorrono 13 trattamenti per 5 anni per evitare un evento.
Esempio (pazienti meno gravi)
n°
Trattati
eventi rischio nel periodo
(5 anni)
15000 135 135/15000=0.009
Controlli 15000
R.R. = 0.60
225
225/15000=0.015
RR
RA
0.009/0.015
=0.6
0.015-0.009
=0.006
1-R.R = 1-0.60 = 0.40 (Il rischio relativo è uguale)
Il trattamento riduce del 40% il rischio nei soggetti trattati per 5 anni.
RA = 0.006
Il trattamento evita 6 eventi a 1000 (mille) persone trattate per 5 anni.
NNT = 1/0.006 = 167
occorrono 167 trattamenti per 5 anni per evitare un evento.
Il Rischio Relativo (RR) non è influenzato dalla grandezza
assoluta dei fenomeni.
RR = Idesposti = 0.002 / Idnon esposti = 0.001 = 0.002 / 0.001 = 2
RR = Idesposti = 0.2 / Idnon esposti = 0.1 = 0.2 / 0.1 = 2
Il RR esprime la forza dell’associazione, indipendentemente dalla
frequenza della malattia, è utile in contesti sperimentali
RA = Idesposti = 0.002 - Idnon esposti = 0.001 = 0.002 - 0.001 = 0.001
RA = Idesposti = 0.2 - Idnon esposti = 0.1 = 0.2 - 0.1 = 0.1
Il RA incorpora l’informazione sulla frequenza della malattia, è utile in
contesti di sanità pubblica
Randomizzazione
Allocazione random significa che un paziente ha la stessa
probabilità di avere uno dei trattamenti, ma il tipo di trattamento
non può essere previsto.
Come randomizzare:
- Randomizzazione semplice
- Randomizzazione a blocchi (per avere un bilanciamento
progressivo dei gruppi a confronto)
- Randomizzazione stratificata (per ridurre il rischio di
sbilanciamento per fattori prognostici)
Randomizzazione
Perché nascondere l’allocazione al trattamento
Ridurre il rischio che i ricercatori possono essere influenzati dalla
conoscenza del trattamento in modo conscio o inconscio nel determinare:
• l’eleggibilità
• la partecipazione
• la comunicazione al paziente
• l’allocazione
La conoscenza del trattamento prima dell’allocazione tende a
sovrastimare l’effetto del trattamento.
Randomizzazione
Come nascondere l’allocazione al trattamento
Metodo di scelta:
chi genera l’allocazione è diverso da chi determina
l’eleggibilità e l’adesione al trial (meglio se esterno al trial) es.
sistema centralizzato telefonico
Metodo alternativo:
buste sigillate e con numerazione progressiva
Analisi
Intention to treat
Una strategia che confronta i pazienti nei gruppi in cui sono
stati
assegnati
in
origine
dalla
randomizzazione
indipendentemente da quello che succede dopo l’allocazione:
• evidenza di false inclusioni
• non compliance
• deviazioni dal protocollo
• co-interventi
• perdite al follow-up
Analisi
Obiettivi principali dell’analisi intention to treat
• proteggere la validità interna (la randomizzazione)
• proteggere la validità esterna (avvicinare la valutazione
dell’efficacia a quello che di fatto avviene nella pratica)
Analisi
Sbilanciamenti delle caratteristiche dei pazienti tra i gruppi
dopo la randomizzazione (chance bias)
Strategie:
• definire in anticipo (in fase di disegno) i fattori che
sappiamo influenzano l’esito
• valutare l’effetto indipendente della caratteristica sull’esito
• aggiustare
Analisi
Analisi per sottogruppi
Sono condotte per valutare l’effetto di un trattamento in
gruppi di pazienti individuati in base alla presenza di una
specifica caratteristica
Servono a indagare la consistenza dei risultati in sottogruppi
della popolazione individuati in base alla presenza di
specifiche caratteristiche
Analisi
Analisi per sottogruppi
L’analisi per sottogruppi aumenta la probabilità di risultati
falsamente positivi
quindi
Tali analisi devono essere numericamente contenute
Devono essere pre-specificate nel protocollo dello studio
Wang R, et al., NEJM, 2007
Casi particolari
- Cluster RCT
- RCT pragmatici
- RCT di non inferiorità
Cluster RCT
The CONSORT statement focused on reporting parallel group
randomised trials in which individual participants are randomly
assigned to study groups.
…randomly assign groups of individuals (such as families or
medical practices) rather than individuals.
I cluster RCT sono più complessi nel disegno, richiedono una
maggiore dimensione del campione (per ottenere una stessa
potenza statistica) e richiedono una analisi più complessa.
Cluster RCT
Esempi di cluster: pazienti di MMG, famiglie, classi scolastiche,
ecc.
Le osservazioni fatte sui membri di ciascun cluster tendono a
somigliarsi (correlare), quindi la dimensione effettiva del
campione è inferiore a quella ottenibile mediante la
randomizzazione di singoli individui
Questo inconveniente ha una dimensione che dipende dalla
dimensione dei cluster e dal grado di somiglianza tra i membri
del cluster (coefficiente di correlazione intraclassi o intracluster)
BMJ 2004;328;702-708
RCT pragmatici
Nessun follow up
dedicato, ma uso di
database, registri, ecc
Outcome clinicamente
rilevante e senza
centralizzazione della
misura
Nessuna strategia per
il miglioramento della
compliance
Le procedure su come
utilizzare il trattamento
sperimentale sono altamente
flessibili e affidate agli
erogatori
Criteri di elegibilità
ampi, senza selezioni per
rischio, comorbidità, ecc
RCT di non inferiorità
Poiché la prova di uguaglianza perfetta non è possibile, per gli RCT di
non inferiorità, è pre-fissato un margine di non inferiorità per
l’effetto del trattamento sull’outcome primario.
Gli studi di equivalenza sono simili eccetto per il fatto che il margine
di equivalenza è fissato tra − e +
RCT di non inferiorità
JAMA. 2006;295:1152-1160