METODOLOGIA CLINICA
Necessita di:
Quantificazione
Formalizzazione matematica
EPIDEMIOLOGIA
Ha come oggetto lo studio della
distribuzione delle malattie in un
popolazione e dei fattori che la
influenzano e fornisce i dati che
sono di guida al procedimento
clinico
STATISTICA
E’ il mezzo oggettivo per
la pianificazione delle
indagini e l’interpretazione
dei risultati
…forniscimi i
risultati!
…per piacere!!!
STUDIO EPIDEMIOLOGICO
Assegnazione
Controllata
Non controllata
SPERIMENTALE
OSSERVAZIONALE
Campionamento
Non
randomizzato
STUDI SU
COMUNITA’
Randomizzato
SPERIMENTAZIONI
CLINICHE
Malattia
o
Effetto
TRASVERSALE
O
RETROSPETTIVO
Esposizione o
caratteristica
al momento dello
studio
(TRASVERSALE)
Esposizione
o
Causa
PROSPETTICO
studi relativi
ad un periodo
di tempo
Storia dell’esposizione o
caratteristica
precedenti al momento
dello studio
(RETROSPETTIVO)
FONTI DI DATI
EPIDEMIOLOGICI E STATISTICI
Le fonti di dati correnti si basano su un sistema misto con finalità
generali, di carattere socio- demografiche, economiche e sanitarie
La raccolta dei dati avviene a livello locale, regionale e nazionale
con modalità e frequenza di rilevazione specifiche in base alle
quali si possono distinguere:
• fonti universali e continue (mortalità e sue cause, infortuni sul lavoro …)
•fonti universali e sporadiche (censimenti)
•fonti campionarie e continue (registri di patologia, SDO, ….)
•fonti campionarie e sporadiche (indagini osservazionali, sperimentali)
Descrittiva
Si occupa della
presentazione e sintesi
dei dati
Inferenziale
Permette di trasferire le
informazioni ottenute su
un campione all’intera
popolazione
La variabile è ciò che viene osservato o misurato e può
assumere uno tra una serie definita di possibili valori
Quanto ciò che rileviamo su un campione rispecchia ciò che
avviene nella popolazione?
Oppure:
Con che probabilità le misure rilevate sul campione (stime)
sono i veri valori della popolazione
( parametri)
CAMPIONE
Stime
Media
Varianza
Conteggi
Percentuali
…
Estrazione del
campione
POPOLAZIONE
Parametri
Leggi della probabilità
Statistica inferenziale
SPECULARE
UNIVERSO
PARAMETRI
P
R
O
G
R Campionamento
A
M Disegno
M Sperimentale
A
R
E
CAMPIONE
Stima di
intervallo
Test di
ipotesi
DESCRIVERE
STATISTICHE
D
E
C
I
D
E
R
E
Negli studi clinici i ricercatori dovrebbero generalmente essere
interessati a determinare la grandezza di una differenza dell’esito
misurato fra gruppi di soggetti, piuttosto che ottenere una
semplice indicazione della significatività o meno di tale differenza
Di quanto la malattia ha modificato le concentrazioni
ematiche medie?
Di quanto il nuovo trattamento ha modificato la prognosi?
Non solo la significatività statistica
Non bisogna equiparare la significatività statistica con
l’importanza clinica o la rilevanza biologica.
piccole differenze, che pur rivestono uno scarso interesse,
possono risultare statisticamente significative solo perché il
campione studiato era di ampie dimensioni
effetti importanti dal punto di vista clinico possono risultare
non significativi solo perché il numero di soggetti studiati era
piccolo
E’ possibile stimare, al momento della pianificazione di uno
studio la dimensione del campione più adeguata
STIME E LORO AFFIDABILITA’
L’idea chiave su cui si basa l’analisi statistica è che si possono
eseguire osservazioni su un campione di soggetti e che da
questo si possono compiere inferenze sulla popolazione
rappresentata da tutti i soggetti con caratteristiche analoghe a
quelle del campione
Anche se ben pianificato uno studio può dare solo una idea della
risposta cercata, a causa essenzialmente della variabilità casuale
del campione stesso strettamente collegata, tra l’altro, al numero
di soggetti inclusi in uno studio
Le quantità statistiche ottenute (medie, proporzioni, odds,
coefficienti di regressione, etc.) sono stime imprecise dei veri
valori nella popolazione generale
STIMA
Una misura descrittiva calcolata dai dati di una
popolazione è detta parametro.
Una misura descrittiva calcolata dai dati di un
campione è detta stima del parametro.
L’insieme dei metodi che ci consentono di estendere i risultati
ottenuti dal campione a tutta la popolazione oggetto dello
studio costituiscono la inferenza statistica.
Stima dei parametri
Verifica delle ipotesi
La stima è il calcolo, dai dati di un campione, di una qualche
statistica, ed è una approssimazione del corrispondente parametro
della popolazione da cui il campione è stato estratto.
 Stima puntuale: si calcola un singolo valore numerico per
stimare il corrispondente parametro. Es. una media, una
proporzione, una deviazione standard.
 Stima di intervallo: si calcola un intervallo di valori che, con un
certo grado di probabilità, conterrà il parametro da stimare.
Popolazione
Campione
(parametro)
(stima)
Media
Varianza
m
2
S2
INTERVALLI DI CONFIDENZA
Le stime di intervallo forniscono informazioni sia sul valore
numerico del parametro incognito che sul grado di
attendibilità della stima.
La procedura di calcolo degli intervalli, detti di confidenza, si
basa sulla determinazione di due limiti entro i quali, con una
probabilità 1- , è contenuto il parametro, a partire dalle
informazioni campionarie.
1- = P(L1
L2) con 0
1
L1 e L2 dipendenti dalla dimensione del campione
1- grado di attendibilità della stima ed è detto livello di
confidenza
stima
(fattore di correzione
errore della stima)
Lo scopo principale degli intervalli di confidenza è quello di
indicare la Imprecisione delle stime campionarie come
rappresentazione dei valori della popolazione
L’imprecisione della stima campionaria è indicata dall’ampiezza
degli intervalli:
Più ampi sono gli intervalli  Minore è la precisione
L’ampiezza dipende essenzialmente da tre fattori:
• dal numero di soggetti studiati
(campioni poco numerosi, conclusioni inattendibili)
• dalla variabilità dei soggetti in studio
(minore variabilità, stima più precisa)
• dal livello di confidenza
(maggiore è il livello di confidenza, tanto più ampi sono gli intervalli)
mmHg
Ipertensione no
Ipertensione si
250
230
210
190
170
150
130
110
90
70
50
Stato ipertensivo non noto
Stato ipertensivo noto
All’aumentare della numerosità campionaria l’ampiezza dell’intervallo si restringe
mmHg
180
N=900
N=100
170
160
150
140
130
120
110
100
90
Cardiopatia ipertensiva assente
Cardiopatia ipertensiva presente
All’aumentare del livello di confidenza l’ampiezza dell’intervallo aumenta
mmHg
155
150
145
140
135
130
125
120
Livello di confidenza: 90%
Livello di confidenza: 95% Livello di confidenza: 99%
All’aumentare del livello di confidenza l’ampiezza dell’intervallo aumenta
mmHg
22
20
18
16
14
12
10
8
6
4
2
Livello di confidenza: 90%
Livello di confidenza: 95%
Livello di confidenza: 99%
SIGNIFICATIVITA’ STATISTICA
Confronto tra il farmaco A e il farmaco B
1. Il farmaco A potrebbe essere effettivamente superiore al
farmaco B
2. Qualche fattore che non è stato assolutamente controllato,
per esempio l’età dei pazienti, può essere responsabile della
differenza (in questo caso si avrebbe un confronto viziato)
3. La differenza potrebbe essere dovuta alla variazione casuale
Soltanto dopo aver escluso che sussistono i motivi 2 e 3,
potremo concludere che A è superiore a B
IL VALORE P
Molte volte il ricercatore indica il più basso livello di significatività al
quale l’ipotesi di ricerca (ipotesi nulla) può essere respinta.
Questo livello è chiamato “valore p” ed esprime la probabilità che
una differenza come quella osservata sia causata dal solo caso.
L’affermazione “p<0.01” significa che è piccolissima la probabilità
che la variazione casuale sia da sola responsabile della differenza,
cosicché intendiamo in realtà affermare che il risultato è
statisticamente significativo.
Inversamente l’affermazione “p>0.10” implica che soltanto il caso
può realmente spiegare la differenza osservata, la quale dovrà
perciò essere catalogata come statisticamente non significativa.
Dimensione del campione
e interpretazione dell’assenza di significatività
Una differenza statisticamente significativa è tale in quanto non può
essere giustificata dal solo caso.
Al contrario una differenza statisticamente non significativa non deve
essere necessariamente attribuibile soltanto al caso.
Di fronte ad una differenza non significativa l’entità del campione è
molto importante: con un campione piccolo è infatti probabile che
l’errore di campionamento sia elevato, il che conduce spesso ad una
non significatività, anche quando la differenza osservata è tutt’altro
che casuale.
E’ per questa ragione che un risultato statisticamente non
significativo dovrebbe essere considerato quasi sempre come non
conclusivo, piuttosto che come segno dell’assenza di una vera
differenza tra i gruppi confrontati.
Significatività clinica e significatività statistica
E’ importante tenere sempre presente che un’etichetta di
significatività statistica non significa necessariamente
che la differenza sia significativa dal punto di vista
clinico.
Con campioni di cospicua entità, piccolissime
differenze, che possiedono poca o nessuna
importanza clinica, possono rivelarsi statisticamente
significative.
Le implicazioni pratiche di qualsiasi risultato
devono essere valutate su basi diverse da quelle
esclusivamente statistiche.
La caratteristica essenziale di uno studio clinico è
di usare i risultati ottenuti su un
Campione
di pazienti, per fare inferenza circa gli effetti del
trattamento su una
Popolazione
di individui con caratteristiche patologiche tali da
richiedere quel tipo di trattamento
IL DISEGNO DELLA
RICERCA CLINICA
Prima di iniziare una ricerca è indispensabile
effettuare una progettazione accurata e un disegno
adeguato, definendo in dettaglio le domande a cui la
ricerca deve dare una risposta
DEFINIRE LO SCOPO DELLO STUDIO
SPECIFICARE GLI OBIETTIVI E LE IPOTESI DI LAVORO
DISEGNARE LO STUDIO
SCRIVERE IL PROTOCOLLO
CONDURRE LO STUDIO
DEFINIRE UNA BUONA ORGANIZZAZIONE
ANALIZZARE I DATI
UTILIZZO DELLA STATISTICA DESCRITTIVA E DEI TESTS DI
VERIFICA DELLE IPOTESI
TRARRE LE CONCLUSIONI
PUBBLICARE I RISULTATI
PER IMPOSTARE UNA SPERIMENTAZIONE BISOGNA
POTER RISPONDERE ALLE SEGUENTI DOMANDE:
1. Qual è l’obiettivo primario della ricerca
2. Esiste un protocollo scritto che indichi le procedure e i dati con
cui raggiungere l’obiettivo
3. L’obiettivo primario è rilevante sotto il profilo scientifico,
affronta problemi ancora irrisolti, aggiunge qualcosa al sapere
scientifico attuale
4. Quali sono gli obiettivi secondari
5. Sono rispettate le normative che guidano la ricerca sperimentale
(good laboratory practice o GLP), è garantita la protezione dei
soggetti e la confidenzialità dei loro dati in ottemperanza alla
dichiarazione di helsinki e alla good clinical practice GCP
QUANTI PAZIENTI DEVONO ESSERE RECLUTATI PER
UNA SPECIFICA SPERIMENTAZIONE CLINICA
1. Dipende dalla dimensione degli effetti che
Verranno osservati
2. Dipende dalle caratteristiche degli errori
di I tipo e di II tipo utili per la definizione della dimensione e
della potenza del test
3. Dipende dalla particolare misura che si vuole effettuare
(risposta in termini di successo o fallimento, risposta in termini di
tempo intercorso fra due eventi critici)
VERIFICA DELLE IPOTESI
 Obiettivo: guidare il clinico, il ricercatore o l’amministratore
a prendere una decisione riguardo ad un parametro della
popolazione esaminando un campione di quella popolazione.
L’osservazione dei fenomeni porta alla formulazione di teorie che
richiedono un conferma basata su una metodologia scientifica.
IPOTESI
di
RICERCA
IPOTESI
STATISTICA
Le ipotesi statistiche sono una formulazione delle ipotesi di
ricerca in modo tale da poter essere valutate con opportune
tecniche statistiche.
VERIFICA DELLE IPOTESI
Analisi dei dati
Assunzioni sul modello probabilistico , sui parametri,
sul campione
Formulazione dell’ipotesi :
nulla H0 e alternativa H1
Costruzione della statistica test e della sua distribuzione
Definizione della Regola di Decisione e valutazione degli errori:
rifiutare l’ipotesi nulla vera
accettare l’ipotesi nulla falsa
Decisione statistica e decisione clinica
ERRORE ALFA O ERRORE DI I TIPO
L’espressione ‘p<’ indica la probabilita’ di
una conclusione falsamente positiva (Un
trattamento risulta migliore dell’altro quando
in realtà non lo è)
tanto più piccolo è il valore di ‘p’ tanto
meno probabile è che i trattamenti posti
a confronto abbiano un effetto simile
ERRORE BETA O ERRORE DI II TIPO
Commettendo l’errore beta si afferma che i
trattamenti sono uguali quando in realtà essi
sono differenti (falso negativo) l’errore beta si
verifica solitamente in caso di campioni di
piccole dimensioni non si evidenzia un effetto
favorevole quando questo è presente
0,05
H0
Sani
0,045
H1
Malati
0,04
Potenza del test:
Probabilità di rifiutare
l’ipotesi nulla falsa
0,035
0,03
0,025
1-
1-
0,02
0,015
0,01
0,005
0
0
10
20
30
Falsi negativi
Errore di secondo tipo:
rischio di non rifiutare
l’ipotesi nulla falsa
40
50
60
70
80
ETA’
90
Falsi positivi
Errore di primo tipo:
rischio di rifiutare l’ipotesi nulla vera
RISCHIO DI ERRORI
Ipotesi
accolta
dopo il
test
Ipotesi vera
Ipotesi
nulla H0
Ipotesi
alternativa
H1
Ipotesi nulla H0
Esatta
(1- )
Errore II
specie
Ipotesi alternativa H1
Errore I
specie
Esatta
(1- )
 Rischio di prima specie o tipo:

Respingere l’ipotesi H0 quando essa è vera
 = livello di significatività
Rischio di seconda specie o tipo:
Accettare l’ipotesi H0 quando è vera H1
Potenza del test : 1Respingere l’ipotesi H0 quando è vera l’ipotesi alternativa H1
POTENZA DI UNO STUDIO CLINICO
La potenza di uno studio clinico è la sua capacità di fare
emergere un effetto se questo esiste realmente
Uno studio clinico con una bassa potenza è privo di ogni
utilità in quanto avrà una probabilità molto scarsa di
raggiungere l’obiettivo che lo sperimentatore si prefigge
Quando si parla di potenza di uno studio clinico ci si riferisce alla potenza
statistica 1-ß che rappresenta la probabilità che la differenza attesa possa
essere scoperta ad un predefinito livello di significativita’
Più alta è la potenza maggiore è la possibilità che la differenza minima
attesa tra i gruppi in trattamento possa essere dimostrata
LA POTENZA DI UN TEST HA UN
IMPATTO DIRETTO SULLA DIMENSIONE
DEL CAMPIONE
PIU’ GRANDE E’ LA POTENZA
è ragionevole che non sia inferiore a 0.80
PIU’ GRANDE E’ LA DIMENSIONE DEL
CAMPIONE
Generalmente un test ad una coda è più potente del
corrispondente test a due code.
Il test ad una coda va utilizzato solo se si è del tutto
sicuri che una particolare disuguaglianza (direzione) è
sempre dovuta al caso e perciò valutata come non
significativa, per quanto ampia essa sia
Raramente, comunque, ciò si verifica nella pratica
VERIFICA DELLE IPOTESI
METODI PARAMETRICI
METODI NON
PARAMETRICI
Esistenza di distribuzioni
TESTS t-student
Analisi della varianza
Confronto proporzioni
Correlazione
Coefficiente di Pearson
Non esistenza
di distribuzioni
CONFRONTO
TRA GRUPPI
TESTS sui RANGHI
(Wilcoxon)
Analisi della varianza
non parametrica
LEGAMI
TRA VARIABILI
Correlazione
Coefficiente di Spearman
Tabelle di contingenza
Regressione
Verifica di ipotesi su medie
Due gruppi
Indipendenti
Distribuzione
di Gauss
Distribuzione
non di Gauss
Distribuzione
di Gauss
Distribuzione
non di Gauss
Test parametrici
Test non parametrici
Test parametrici
Test non parametrici
Wilcoxon
Somma dei Ranghi
t - Student
Wilcoxon
Ranghi con segno
t - Student
(varianze omogenee)
t
( x1 x2 ) (
S
2
p
n1
Non indipendenti
1
S
t - Student
(varianze non omogenee)
2
)
t
2
p
n2
t
( x1 x2 ) (
S12
n1
1
S 22
n2
2
)
d
Sd
d
n
Verifica di ipotesi
su medie
più di due gruppi
Indipendenti
Non indipendenti
Distribuzione
di Gauss
Distribuzione
non di Gauss
Distribuzione
di Gauss
Distribuzione
non di Gauss
Test parametrico
Test non parametrici
Test parametrici
Test non parametrici
Analisi della Varianza
test F-Fisher
Analisi della Varianza
non parametrica
Kruskal - Wallis
Analisi della Varianza
per misure ripetute
Analisi della Varianza
per misure ripetute
test di Friedman
VERIFICA DI IPOTESI SULLE PROPORZIONI
Confronto tra due
proporzioni
Campioni indipendenti
Distribuzione binomiale
approssimabile ad
una Gauss
Campioni non
indipendenti
Campione di piccole
dimensioni
SI
NO
Frequenza bassa
nelle celle
Test z
Test chi-quadro
Test esatto di Fisher
Test di McNemar
RELAZIONI TRA VARIABILI
Variabili
Qualitativa
Quantitativa
Tabelle di contingenza
Test del chi-quadro
Una variabile dipendente
Vs
Una o più variabili indipendenti
Con relazione “causa-effetto”
Nessuna variabile
dipendente
Relazione del tipo
“interdipendenza”
Regressione
Correlazione