Caratteristiche degli RCT
Randomizzazione: finalità e limiti
Scelta del gruppo di controllo
Studi “in cieco” vs. studi “in aperto”
scelta degli indicatori di esito
Oreste Capelli
Perché adottare un nuovo intervento
(terapeutico, diagnostico, etc.)?
Rischio
+
Beneficio
Cosa mi aspetto dal nuovo intervento?
• Funziona?
• Funziona in pratica?”
• Ne vale la pena?”
• EFFICACY
• EFFECTIVENESS
• EFFICIENCY
Hanes B. BMJ 1999;319:652-3
• “Funziona?” [efficacy]
in circostanze ideali l’intervento produce più effetti positivi che
negativi
validità interna
(riproducibilità dello studio)
•“Funziona in pratica?” [effectiveness]
gli effetti che l’intervento produce in circostanze di pratica clinica
abituale
validità esterna
(trasferibilità dei risultati)
•“Ne vale la pena?” [efficiency]
effetti che l’intervento produce in relazione alle risorse che
utilizza
Rapporto costo/beneficio
L’ESPERIMENTO DEL LATTE NEL LANARKSHIRE
(RIFERITO DA “STUDENT”, 1931)
• Nel 1930 si realizzò un esperimento consistente nella somministrazione nelle scuole
di 3/4 di pinta di latte al giorno a 10.000 ragazzi; altri 10.000 ragazzi nelle stesse
scuole non ricevevano questa somministrazione.
• L’obiettivo dell’esperimento era di verificare se il supplemento di latte portava a un
maggior accrescimento ponderale e nella statura.
• Inizialmente fu deciso di effettuare l’assegnazione dei bambini all’uno o all’altro
gruppo in modo casuale in alcune scuole, e in ordine alfabetico in altre.
• Si decise poi, per evitare una sproporzione numerica tra i due gruppi, di affidare agli
insegnanti il compito di integrare l’uno o l’altro gruppo con altri bambini.
• Verosimilmente a causa del senso di umanità degli insegnanti, che li portava ad
assegnare al gruppo cui era destinato il latte i bambini più malnutriti, il risultato finale
fu che il gruppo di controllo risultò superiore in una misura corrispondente a circa 3
mesi di crescita ponderale e 4 mesi di crescita in statura.
Il primo RCT
Ê
1948: Primo studio clinico randomizzato
valuta l’efficacia della streptomicina nel
trattamento della tubercolosi versus
“bed rest”
Medical Research Council Streptomycin in Tuberculosis Trials Committee.
Streptomycin treatment for pulmonary tuberculosis. BMJ 1948;ii:769.82.
Controlled trial of streptomycin
in the treatment of pulmonary tubercolosis
Values are numbers (%) of patients followed for 6 months
Condition on radiological examination
Treatment
Dead
Deteriorated
Unchanged
Slightly
improved
Considerably
improved
Bed rest (n=52)
14 (27)
18 (34)
3 (6)
13 (25)
4 (8)
4 (7)
10 (18)
3 (6)
10 (18)
28 (51)
Bed rest plus 2 g
streptomycin-4 hourly
(n=55)
BMJ 1948; ii:769-82
Come leggere (criticamente) un RCT
le domande principali
1. La domanda/ipotesi dello studio
•
•
Sample size e differenze attese
PICO
2. La validità interna – come è stato fatto e
sua affidabilità
•
•
•
Randomizzazione
Scelta dei partecipanti
Risultati (benefici e rischi) e loro presentazione
(differenze relative e assolute)
Come leggere (criticamente) un RCT
le domande principali
3. La trasferibilità
•
Domanda: i miei pazienti sono simili a quelli dello
studio?
4. Gli altri studi disponibili (coerenza tra gli
studi disponibili)
5. Interpretazione … e quindi … cosa
cambia
RCT
disegno e validità interna
Cosa caratterizza uno studio clinico (RCT
Popolazione di
riferimento
Popolazione
studiata
tempo
RANDOMIZZAZIONE
Farmaco
da studiare
VALIDITÀ ESTERNA
è condizionata da:
trasferibilità
• setting dello studio
generalizzabilità
• selezione dei pazienti
applicabilità
• differenza tra ciò che
(effectiveness
)
prevede
il protocollo
e la pratica clinica
• rilevanza degli esiti
“end- point” scelti
VALIDITÁ INTERNA
Controllo
Placebo,
nessun trattamento
migliore terapia
disponibile
altra terapia
disponibile
(efficacy)
Esempio di
una flow
chart di un
RCT
Randomizzazione e aderenza al
protocollo
• i partecipanti allo studio potrebbero
completare lo studio senza aver aderito
strettamente allo schema iniziale di
randomizzazione
• motivi: effetti collaterali, mancati benefici,
preferenza del paziente (in caso di non
cecità), ecc
Chi ha maggiore probabilità di
seguire il protocollo di studio?
• chi trae benefici dal trattamento ricevuto
• chi non riceve danni dal trattamento
ricevuto
• chi riesce ad avere una migliore
compliance
Randomizzazione:
finalità e limiti
Randomizzazione
Lo scopo della randomizzazione (assegnazione
casuale) è:
1. ottenere due gruppi di pazienti simili per tutti i
fattori prognostici noti e non noti
2. eliminare i bias di selezione nella assegnazione
dei trattamenti
È la componente più importante degli RCT!
Altman DG et al. The revised CONSORT statement
Ann Intern Med 2001;134:663-94
Back to basics: Cochrane
“L’idea di base, come tutte le cose buone, è semplice.
Gli studi randomizzati affrontano il problema della
confrontabilità di due gruppi a rovescio: l’idea non
è di preoccuparsi delle caratteristiche dei pazienti, ma
di essere sicuri che la divisione dei pazienti nei 2
gruppi sia fatta in modo indipendente dalla volontà
dello sperimentatore.”
L’uso di popolazioni non selezionate riduce i
problemi di generalizzabilità.
Come effettuare una
randomizzazione corretta
La generazione delle liste di
randomizzazione deve avvenire attraverso
un processo realmente random
(ed essere trasparente e dichiarata)
miglior metodo = liste generate tramite computer
o tavole di numeri casuali (centralizzata)
metodi meno validi = utilizzare numeri alternati,
numeri di cartella clinica, data di nascita, buste
opache e sigillate ecc.
Randomizzazione: 2 fasi
1a fase: produzione di una sequenza di
assegnazione dei trattamenti non prevedibile
2a fase: occultamento di questa sequenza agli
sperimentatori che reclutano i partecipanti allo
studio
Altman DG et al. The revised CONSORT statement
Ann Intern Med 2001;134:663-94
Tipi di randomizzazione
1. Semplice
sequenza singola di assegnazioni casuali
2. Ristretta
definisce diverse procedure controllate per
raggiungere un bilanciamento tra gruppi, in
termini di dimensioni o altre caratteristiche
• a blocchi (bilanciati di 4 -10 pz)
• stratificata (per età, gravità, ecc.)
Ha funzionato la randomizzazione?
Generalmente la tabella 1 degli
studi riporta le caratteristiche dei
due gruppi alla partenza (baseline)
che dovrebbero risultare simili per i
principali fattori prognostici
(caratteristiche dei pazienti)
Ha funzionato la randomizzazione?
Tab 1.
Altman DG et al. The revised CONSORT statement
Ann Intern Med 2001;134:663-94
Ha funzionato
la randomizzazione?
Tabella 1
(Studio SHEP)
Aspetti da considerare nella
lettura/valutazione di uno studio
1 PICO
2 sample size, ipotesi, disegno dello studio
3 randomizzazione, baseline (Tab. 1)
4 dal reclutamento al follow-up (ev. protocollo)
5 risultati (esiti principali), eventi avversi
6 interpretazione dei risultati, trasferibilità
La randomizzazione:
è etica?
quando?
Cos’è il principio di incertezza
negli Studi Randomizzati Controllati?
il non sapere, a priori, quale trattamento sia il
migliore fra:
⇒ quello standard (in uso)
⇒ il placebo (in assenza di un trattamento standard)
⇒ il nuovo trattamento da studiare
La base etica di questi studi è rappresentata dall’incertezza
su quale trattamento possa essere preferibile o appropriato
in ogni singolo paziente reclutato nello studio. Se il medico
(o il paziente) ha una marcata preferenza o timore nei
confronti di uno dei trattamenti previsti nello studio il
principio di incertezza non è rispettato e il paziente non
dovrebbe partecipare allo studio
RCT e principio di incertezza
BMJ 2000
L’incertezza è il prerequisito morale di uno studio
randomizzato. Se si è convinti di quello che si deve
fare lo si deve fare e non studiare (randomizzare).
la randomizzazione
è accettabile /etica
se il medico è sostanzialmente
incerto su quale dei trattamenti
in esame sia il più efficace
rispetto al quadro clinico
presente
la randomizzazione
NON è accettabile/etica
e nessun paziente dovrebbe essere
coinvolto in RCT se il medico e/o il
paziente pensano che uno dei
trattamenti in esame sia inappropriato
(meno efficace e/o più rischioso) rispetto
ad altri trattamenti disponibili (nello trial
stesso o nella pratica corrente) o rispetto al
NON trattare
Scelta del
gruppo di controllo
Cosa caratterizza uno studio clinico (RCT)
Popolazione
studiata
tempo
RANDOMIZZAZIONE
Farmaco
Controllo
da studiare
Placebo,
nessun trattamento
migliore terapia
disponibile
altra terapia
disponibile
domande fondamentali
Ê
Il trattamento del gruppo di controllo è il
migliore disponibile?
Ê
I trattamenti previsti e la lunghezza del
follow-up sono adeguati per rispondere al
quesito clinico?
SCELTA DEI TRATTAMENTI
FDA - Guidance for Industry
E 10 Choice of Control Group and Related Issues
in Clinical Trials May 2001
Ê Placebo
Ê Nessun
trattamento
Ê Differente
farmaco attivo
Ê Differenti
dosi o schemi terapeutici
dello stesso farmaco
http://www.fda.gov/cder/guidance/index.htm
Gruppo di controllo:
i ‘pro’ del placebo
Ê
“gli ortodossi del placebo”
Ê
Ê
Ê
considerano metodologicamente importanti e
necessari gli studi con placebo
Permettono numeri più piccoli di pazienti,
esponendo minor numero di pazienti a
potenziali rischi
Permettono una più chiara distinzione tra
l’effetto placebo e gli effetti avversi
J. EMANUEL, N Engl J Med, Vol. 345,N .12 ·September 20, 2001
Gruppo di controllo:
i ‘contro’ del placebo
“gli ortodossi del controllo attivo”
accusano gli ortodossi del placebo di sacrificare l’etica,
i diritti e la salute dei pazienti a fronte di un presunto
rigore scientifico
Ê
Se esiste un intervento efficace per una certa
condizione, questo deve essere utilizzato nel gruppo
di controllo.
→ Il nuovo farmaco è meglio del trattamento standard?
Dichiarazione di Helsinki (ott. 2000)
Ê
I benefici, i rischi, gli aggravi e l’efficacia di un
nuovo metodo devono essere valutati in
confronto con quelli dei migliori metodi
preventivi, diagnostici e terapeutici
attualmente in uso.
Ê
Ciò non esclude l’impiego di placebo, o
l’assenza di trattamento, negli studi dove
non esistono metodi comprovati di
prevenzione, diagnosi o terapia.
È corretto l’uso del placebo?
Original Contributions
Prevention of stroke by antihypertensive drug treatment in
older persons with isolated systolic hypertension
Final results of the Systolic Hypertension in the Elderly Program
(SHEP)
SHEP Cooperative Research Group
JAMA, 1991;265:3255-64
Conclusioni
In persone di età > 60 anni con ipertensione sistolica isolata, una terapia
anti-ipertensiva per gradi, iniziata con clortalidone a basse dosi, ha
ridotto l’incidenza globale di ictus del 36%, con un beneficio assoluto a 5
anni di 30 eventi per 1.000.
Il beneficio assoluto a 5 anni per eventi cardiovascolari maggiori, è stato
di 55 eventi per 1.000.
È corretto l’uso del placebo?
Articles
Randomized, double-blind, comparison of placebo and
active treatment for older patients with isolated systolic
hypertension
Staessen JA, et al. for the Systolic Hypertension in Europe
(Syst-Eur) Trial Investigators
Lancet 1997;350:757-64
Conclusioni
Nei pazienti anziani con ipertensione sistolica isolata, un trattamento
anti-ipertensivo iniziato con nitrendipina riduce il rischio di
complicanze cardiovascolari.
Trattando 1.000 pazienti con questo farmaco, in 5 anni si possono
prevenire 29 ictus o 53 eventi cardiovascolari maggiori.
NON è etico randomizzare
contro placebo
9
quando esiste un trattamento di
riconosciuta efficacia per il quadro clinico di
interesse
9
è documentato un uso eccessivo del placebo
per “scopi registrativi”
Rothman KJ, Michels KB. The continuing unethical use of
placebo controls. NEJM 1994;331:394-8
“Nessun trattamento” come
controllo: l’esempio del GISSI 1
Ê
Obiettivo dello studio: valutazione di efficacia
del trattamento trombolitico con streptochinasi
(SK) sulla mortalità intraospedaliera di pazienti
con infarto miocardico acuto (AMI)
Ê
per il tipo di esito considerato (mortalità) la
presenza di un gruppo di controllo (placebo)
venne ritenuta superflua
Il farmaco di confronto riflette le dosi
usualmente utilizzate nella pratica?
Original Contributions
Randomized, double-blind, comparative study of
grepafloxacin and amoxycillin in the treatment of
patients with community-acquired pneumonia
O’Doherty B, et al.
J Antimicrob Chemother, 1997;40 Suppl.A:73-81
Conclusioni
Grepafloxacina (600mg/die per 7-10 gg.) e amoxicillina (500 mg x
3/die per 7-10 gg.) si sono dimostrate di pari efficacia nel
raggiungimento di una risposta clinica e microbiologica in pazienti con
polmonite extra-ospedaliera.
Il farmaco di confronto riflette le dosi
usualmente utilizzate nella pratica?
1
Studio CLASS pubblicato su JAMA
7968 pazienti randomizzati
in tre gruppi
PAZIENTI: età media 60 anni; 69% donne; 73% con Osteoartrosi
durata media trattamento: 4,2 mesi (massimo 6 mesi)
20% in terapia con ASA a bassa dose (< 325 mg/die)
CELECOXIB
400 mg x 2
IBUPROFENE
800 mg x 3
DICLOFENAC
75 mg x 2
N=3987
N=1985
N=1996
Studi “in cieco”
vs.
studi “in aperto”
“Cecità”: di chi?
Molti studi sono descritti come “doppio-cieco”.
Anche se questo termine significa che né il
medico né il paziente conoscono il
trattamento assegnato è ambiguo per quanto
riguarda la cecità di altre persone in
particolare coloro che valutano gli esiti.
“Cecità”: di chi ?
• Gli Autori dovrebbero dichiarare chi era cieco
(pazienti, sperimentatori, valutatori, monitor,
statistici) e i meccanismi della cecità.
•
E’ importante per valutare correttamente
esiti soggettivi (dolore, sonno)
• E’ meno importante per esiti oggettivi come
la mortalità o un dato di laboratorio
indipendente
Esistono davvero gli studi “in cieco”?
Esempi:
• calcio-antagonista versus beta-bloccante
• SSRI versus antidepressivi triciclici
È più importante la randomizzazione
o la cecità?
A questo punto dovrebbe essere chiaro ...
che la randomizzazione è più
importante della cecità!
scelta degli
indicatori di esito
Scelta degli indicatori appropriati
di esito “end point”
Ogni studio presenta:
- 1 (o più) esiti principali
- una serie di esiti secondari
Gli indicatori di esiti possono essere:
surrogati
semplici
clinicamente rilevanti
compositi
Indicatori di esito
• esiti clinicamente rilevanti: (mortalità totale o causa-specifica, eventi non fatali,
quali infarto, ictus, etc, morbidità)
• esiti surrogati: ↓ pressione arteriosa,
↓ colesterolemia, etc.
• qualità della vita (problema della
validazione degli strumenti/questionari)
Esiti Surrogati
surrogate o secondary outcomes
DEFINIZIONE
Un esito surrogato può essere definito come “una misura di laboratorio
o un segno obiettivo o strumentale usato come sostituto di un esito
clinicamente significativo, che misura direttamente le sensazioni
soggettive o le funzioni di un paziente.”
L’uso di esiti surrogati è indispensabile per la valutazione dei
farmaci in studi di fase 2 e all’inizio della fase 3, per stabilire i
benefici annunciati del farmaco
Esiti Surrogati
Vantaggi e svantaggi
L’uso di un esito surrogato, in determinate condizioni
cliniche, ha il vantaggio di poter condurre alla rapida
e appropriata diffusione di nuovi trattamenti
Per esempio, la decisione della FDA di approvare nuovi
farmaci anti-retrovirali, basata sulle informazioni ricavate da
trial che usano esiti surrogati, ha tenuto presente l’enorme
esigenza di terapie efficaci per i pazienti con l’infezione da
HIV.
Indicatori di esito
• Hard: determinati in modo inequivocabile ed
oggettivo (mortalità, diagnosi di malattia, n° giorni
di ricovero, etc)
• Soft: determinazione meno sicura
(es. miglioramento-peggioramento della qualità di
vita, dolore, sintomi vari, etc)
• “indiretti” es. utilizzo dei servizi sanitari
Indicatori di esito
efficacia clinica vs efficacia farmacologica
• es. cardiovascolare: per concludere che
un farmaco antiipertensivo è efficace, è
sufficiente che abbassi la pressione
arteriosa?
• es. AIDS: per valutare l’efficacia di una
terapia, è sufficiente che aumenti il livello di
linfociti CD4?
Esiti Surrogati vs clinic. rilevanti
esempi
ESITI SURROGATI
ESITI clinic. rilevanti
• Densità minerale ossea
Fratture osteoporotiche
• Pressione arteriosa
Ictus cerebrale
• Grado di stenosi carotidea
Ictus cerebrale
• Livelli ematici LDL-colesterolo
Infarto miocardico
• Grado di stenosi all’angiografia
coronarica
Infarto miocardico
• Conta delle cellule CD4
Mortalità da AIDS
Indicatori di esito
• semplici: costituiti da un solo esito (hard o soft)
es. morte cardiovascolare, infarto miocardico,
↓ pressione arteriosa
• composti: somma di più esiti (hard e/o soft)
es. morte cardiovascolare + IMA + ictus
oppure
morte cardiovascolare + IMA + ictus + ischemia
ricorrente
Background.
Studi precedenti hanno dimostrato che, in pazienti con
scompenso cardiaco, l’ibopamina (dopamino-agonista) riduce
la concentrazione plasmatica di noradrenalina, di attività
reninica e di aldosterone [surrogati]
[van Velduisen DJ, et al. Effects of ibopamine on the increase in plasma norepinephrine levels during
exercise in congestive heart failure. Am J Cardiol 1993; 71:992-4]
Studi clinici hanno riportato che l’ibopamina migliora i sintomi
ed ha effetti simili al captopril sulla tolleranza all’esercizio
[surrogato] in pazienti con scompenso lieve-moderato.
[Barabino A, et al. Comparative effects of long-term therapy with captopril and ibopamine in chronic congestive heart
failure in old patients. Cardiology 1991; 78:243–56]
BRIEF REPORTS
Effects of Ibopamine on the Increase in Plasma Norepinephrine Levels During Exercise in Congestive
Heart Failure
Dirk J. van Veldhuisen, MD, Armand R. J. Girbes, MD, Stan A. J. van den Broek, MD, Pieter A. de Graeff, MD,
Wiek H. van Gilst, PhD, and K. I. Lie, MD
Am J Cardiol 1993; 71:992-4
FIGURE 2. Plasma
norepinepluine at rest and
during peak exercise, at
baseline and after 6 weeks of
treatment with ibopamine.
Both resting and exercise values are significanfly reduced.
Note that scale for
norepinephrine levels are
different.
Intervento. 2200 pazienti con scompenso cardiaco severo (NYHA III-IV) e
severa disfunzione del ventricolo sinistro, già in trattamento ottimale per lo
scompenso, sono stati randomizzati a: ibopamina (100 mg t.i.d.) o placebo
Misura di esito:
mortalità per tutte le cause
Risultati. Al reclutamento di
1906 pazienti lo studio è stato
interrotto precocemente per
un eccesso di morti nei
pazienti trattati con
ibopamina.
25% ibopamina vs
20% placebo
RR = 1,26 (1.04-1.53)
NNH = 24 (13-278)
Migliora la densità ossea, ma..
peggiorano le fratture non vertebrali
Effect of fluoride treatment on the fracture rate
in postmenopausal women with osteoporosis
BL Riggs, SF Hodgson, WM O'Fallon, EY Chao, HW Wahner, JM Muhs, SL Cedel, and LJ Melton
Volume 322:802-809 March 22,1990 Number 12
Misure di esito
• densità minerale ossea
• incidenza di fratture vertebrali e non vertebrali
Intervento
•
•
•
fluoruro di sodio (75 mg/d)
placebo
supplemento di calcio (1,5 g/d) in tutte le donne
per 4 anni in 202 donne in post-menopausa con fratture vertebrali
Esiti
Confronto Fluoruro
vs Placebo
P-value
Vertebra lombare
+35%
<0.001
Collo femorale
+12%
<0.001
Trocantere
+10%
<0.001
-4%
<0.02
163 vs 136
NS
72 vs 24
<0.01
54 vs 24
<0.01
Densità ossea:
Radio
Fratture:
Vertebrali
Non Vertebrali
Effetti avversi
Densità ossea (surrogato) e fratture osteoporotiche (principale)
Non cambia la densità ossea, ma..
Migliorano le fratture non vertebrali
Misure di esito: densità minerale ossea,
markers biochimici del metabolismo osseo e
incidenza di fratture non vertebrali
Intervento: supplementazione orale di
500 mg calcio plus 700 IU vit. D3
(colecalciferolo) pro die
Vs placebo x 3 anni
in 176 uomini e 213 donne di età >65 anni
Risultati sulla densità
minerale ossea
Risultati sulle fratture
non vertebrali
Numero di fratture nei due gruppi:
•Ca + vit D
11/187 = 6%
•Placebo
26/202 = 13%
RR = 0,4 (0,2-0,9)
NNT = 14 (8-79)
Densità ossea (surrogato) e fratture osteoporotiche (principale)
Migliora la densità ossea, e
Migliorano le fratture vertebrali
Volume 333
November 30, 1995
Misure di esito: densità minerale ossea
e incidenza di fratture vertebrali
Intervento:
alendronato (5-10 mg/d x 3aa
o 20 mg/d x 2aa + 5 mg x 1aa)
Vs
placebo
in 994 donne post-menopausali con osteoporosi
Number 22
Volume 333
Risultati sulla densità
minerale ossea
November 30, 1995
Number 22
Volume 333
Risultati sulle
fratture vertebrali
NNT = 34 (17-2704)
November 30, 1995
Number 22
Conclusioni
• La misura di esito surrogato non sempre
predice l’esito principale
• L’uso terapeutico di un farmaco a partire da
dimostrazioni di efficacia sull’esito surrogato
può avere effetti benefici, nulli o addirittura
dannosi
• Nella pratica clinica, l’uso terapeutico di un
farmaco dovrebbe basarsi su dimostrazioni di
efficacia sull’esito principale o clinicamente
importante per il paziente
Validità interna:
i 3 principi fondamentamentali
9Random division of the
patients
9selection of an appropriate
primary outcome measure
Sir Austin Bradford Hill
9sample size calculation
1. Randomizzazione
2. Scelta di un indicatore appropriato di esito
3. Dimensione del campione e disegno