Gestione ed Analisi Statistica dei dati 12 giugno 14

Master in “Evidence Based Practice e
Metodologia della Ricerca clinico-assistenziale”
Gestione ed Analisi Statistica dei dati
Daniela Fortuna
12 giugno 2014
ALMA MATER STUDIORUM – Università di Bologna
TEST di ipotesi
Finora abbiamo visto come l’uso degli intervalli di
confidenza permettono di estendere i risultati di un
campione alla popolazione di riferimento.
Il passo successivo nell’analisi statistica è
mettere a confronto due o più gruppi,
oppure
mettere a confronto un risultato ottenuto
dal campione e un valore atteso.
ALMA MATER STUDIORUM – Università di Bologna
TEST di IPOTESI: Significatività Statistica
Si mettono a confronto due misure, allo scopo di verificare
se la loro differenza è probabilmente dovuta al caso
oppure no.
Se la differenza NON è CASUALE cioè non è dovuta al
caso, si dice che è
«statisticamente
significativa».
La metodologia utilizzata è quella del Test
di ipotesi
ALMA MATER STUDIORUM – Università di Bologna
TEST di ipotesi
TEST significa prova, verifica, accertamento
Tutti i Test (test di gravidanza, test elettorale, test di
ammissione, test statistico, ecc.) si basano sulla
verifica di una certa condizione ipotizzata.
La verifica non avviene mai in modo diretto ma attraverso la
valutazione di fenomeni strettamente correlati.
ALMA MATER STUDIORUM – Università di Bologna
TEST di ipotesi
Quindi l'esito del test
Statistico non da certezza,
ma solo una fiducia
valutabile in termini di
In statistica la verifica si
effettua mediante dati
campionari e poiché manca
l’evidenza diretta, non avremo
certezza ma solo una fiducia
più o meno grande nel fatto
che la condizione esista.
probabilità.
ALMA MATER STUDIORUM – Università di Bologna
EPIDEMIOLOGIA: il TEST diagnostico
Risultato di un test
Positivo
Negativo
Condizione
Clinica ignota
Sano
falso positivo
Malato
vero positivo falso negativo
vero negativo
sensibilità del test la frequenza di risultati veri-positivi
specificità del test la frequenza di veri-negativi
α la frequenza di falsi-positivi (errore del 1° tipo)
β la frequenza di falsi-negativi (errore del 2° tipo)
ALMA MATER STUDIORUM – Università di Bologna
EPIDEMIOLOGIA: il TEST diagnostico
Sensibilità e β sono complementari cioè
veri-positivi e falsi-negativi sono complementari.
Infatti se un test è sempre giustamente positivo (100% di veri-positivi)
non segnalerà mai negatività per errore (0% di falsi negativi).
Specificità e α sono complementari
cioè
veri-negativi e falsi-positivi sono complementari.
Infatti se un test è specifico con il 100% di veri-negativi non segnalerà mai positività
per errore (0% di falsi-positivi).
Quindi dire che un test è specifico è come dire che ha una
bassa probabilità di falsi positivi, cioè che α è piccolo
ALMA MATER STUDIORUM – Università di Bologna
EPIDEMIOLOGIA: il TEST diagnostico
In sintesi
Risultato del test
Positivo
Negativo
Condizione
Clinica reale
ignota
H0: Sano
H1:
Malato
falsi positivi
errore α (di 1° tipo)
veri negativi
Specificità
veri positivi
falsi negativi
errore β (di 2° tipo)
Sensibilità
Un test per essere affidabile deve possedere sia un'alta specificità che
un'alta sensibilità.
ALMA MATER STUDIORUM – Università di Bologna
STATISTICA: il TEST d’ipotesi
Lo schema del test statistico è simile a quello del test
diagnostico ma ha la peculiarità di privilegiare l’evidenza
dei falsi-positivi rispetto ai falsi-negativi
L’ipotesi di partenza è l’ ipotesi nulla H0
(cioè l’ipotesi dello scettico) quella che nega
il
risultato, attribuendo le differenze
osservate alla naturale variabilità dei
fenomeni o al campionamento.
ALMA MATER STUDIORUM – Università di Bologna
STATISTICA: il TEST d’ipotesi
Ipotesi nulla H0: le differenze osservate sono dovute al caso
l'ipotesi nulla viene mantenuta fino a che le prove o i dati in
nostro possesso non siano tali da costringerci a rifiutarla
Concediamo quindi fiducia all‘ ipotesi nulla, rifiutandola solo
quando l'evidenza dei risultati sia macroscopica, cioè quando la
probabilità di falsi-positivi α sia minore del 5%.
ALMA MATER STUDIORUM – Università di Bologna
Risultato del TEST statistico
Il risultato di un test statistico è
α ovvero il p-value
Risultato del test statistico
se α<5%
H0 rifiutata
se α>=5%
H0 accettata
Dato significativo
Dato non significativo
H0
falsi positivi
errore di 1° tipo
valutato con α
veri negativi
nessun errore
H1
veri positivi
nessun errore
falsi negativi
errore di 2° tipo
valutato con β
Ipotesi nulla
Condizione
reale ignota
Ipotesi alternativa
ALMA MATER STUDIORUM – Università di Bologna
TEST di ipotesi
Ad esempio :
• Da un indagine campionaria su 50 soggetti, si
è rilevato un tasso di colesterolemia medio
pari a 270 mg/dl e deviazione standard =79 ,
sapendo che il tasso medio in soggetti normali
è 210 mg/dl vogliamo verificare se questa
differenza è dovuta al caso oppure no
ALMA MATER STUDIORUM – Università di Bologna
IPOTESI NULLA H0
Per verificare se la colesterolemia media rilevata nel
campione, 270 mg/dl sia significativamente diversa dal valore
normale 210 mg/dl , si parte dall’ipotesi che i due valori medi
siano uguali e che la loro differenza è semplicemente dovuta
al caso, cioè all’ errore casuale.
Questa ipotesi di partenza viene chiamata IPOTESI NULLA e
viene indicata come H0 quindi:
IPOTESI NULLA H0
I due valori sono uguali e la
loro differenza è dovuta al
caso
ALMA MATER STUDIORUM – Università di Bologna
Il test d’ipotesi quindi consiste nel dimostrare se
H0 è vera
Si considera una distribuzione teorica di probabilità e si verifica se la media
campionaria è all’interno dell’intervallo a cui corrisponde il 95% di probabilità
oppure è fuori da questo intervallo
Regione di
rifiuto di H0
Regione di
rifiuto di H0
Regione di
accettazione
di H0
Regione di
accettazione
di H0
210
Media normale
Regione di
rifiuto di H0
Regione di
rifiuto di H0
?
270 270
Media campionaria
ALMA MATER STUDIORUM – Università di Bologna
La logica del TEST di IPOTESI
IPOTESI NULLA H0
Non c’è nessuna differenza, ovvero
la differenza osservata è dovuta al caso
Accetto o rifiuto l’ipotesi nulla?
Per rispondere effettuo un
TEST DI IPOTESI
ALMA MATER STUDIORUM – Università di Bologna
Errore di 1° tipo: livello di
significatività di un test statistico
• Il livello di significatività di un test statistico è α
la probabilità di commettere un errore di 1° tipo
ovvero è la probabilità di rifiutare l’ipotesi nulla,
quando questa è vera
Livello di significatività α = P(errore di 1° tipo ) =
P(rifiutare H0 quando H0 è vera)
ALMA MATER STUDIORUM – Università di Bologna
Errore di 1° tipo: livello di
significatività di un test statistico
Il livello di significatività 5% viene adottato molto
frequentemente in quanto si ritiene che il rapporto
1/20 (cioè 0.05) sia sufficientemente piccolo da poter
concludere che sia piuttosto improbabile che la
differenza osservata sia dovuta al semplice caso
Ovviamente, se si vuole escludere con maggiore
probabilità l'effetto del caso, si adotterà un livello di
significatività inferiore (es. 1% )
ALMA MATER STUDIORUM – Università di Bologna
Test d’ipotesi tra 2 medie
Per effettuare il test utilizzo una formula chiamata Statistica Test.
• Nel caso del confronto tra 2 medie la statistica test è la t di
Student definita come:
t=
m 1 – m2
ES
Dove
m1 ed m2 sono le due medie a confronto
ES è l’Errore Standard calcolato come deviazione standard divisa la
radice della numerosità campionaria: DS/√ n
ALMA MATER STUDIORUM – Università di Bologna
TEST di IPOTESI tra 2 medie: test t di Student
confronto tra una media campionaria e una media attesa
Esempio
• Da un indagine campionaria su 50 soggetti, si è rilevato un tasso di colesterolemia medio pari a
270 mg/dl e deviazione standard =79 , sapendo che il tasso medio in soggetti normali è
210mg/dl vogliamo verificare se questa differenza è dovuta al caso oppure no
m1 – m2
t=
=
ES
(270-210)
79/√50
60
=
7,1
= 8,45
Gradi di libertà: n-1=50-1=49
Significatività
Valore critico t
di student per
49 gradi di
liberà
90%
1.299
95%
1.676
97.5%
2.009
99%
2.403
99.5%
2.678
99.75%
2.937
99.9%
3.261
99.95%
3.496
Rifiuto l’ipotesi nulla H0:
La differenza è statisticamente significatica
-1.7
1.7
8,45
ALMA MATER STUDIORUM – Università di Bologna
In sintesi
•
il risultato del Test di ipotesi va confrontato con un
VALORE CRITICO tabulato in apposite tabelle già definite, che riportano
i valori della distribuzione di probabilità per diversi livelli di
significatività α e gradi di libertà
•
Se il risultato del test di ipotesi SUPERA il valore critico, allora la
differenza fra i gruppi viene dichiarata statisticamente significativa e,
quindi,
•
l'IPOTESI NULLA viene RESPINTA.
Se il risultato del test di ipotesi È INFERIORE al valore critico, allora
la differenza fra i gruppi viene dichiarata statisticamente NON
significativa e, quindi, l'IPOTESI NULLA viene ACCETTATA.
ALMA MATER STUDIORUM – Università di Bologna
Ma cosa sono i gradi di libertà?
i gradi di libertà rappresentano il numero di possibilità
che i dati che compongono un campione hanno di variare
liberamente.
In generale si calcolano togliendo dal numero delle unità del
campione il numero delle condizioni cui essi sono vincolati.
Nel nostro esempio abbiamo 50 valori di colesterolemia,
ciascuno dei quali può assumere un valore qualsiasi ed un
vincolo, la media deve essere 270, io posso assegnare un
valore qualsiasi ai primi 50-1 =49 numeri, ma l'ultimo sarà
vincolato dal fatto che la media deve essere 270, quindi in
questo caso, i gradi di libertà sono 50-1=49.
ALMA MATER STUDIORUM – Università di Bologna
La t di Student e i gradi di libertà
La distribuzione della t di Student cambia al variare dei
gradi di libertà: all’aumentare dei gradi di libertà la curva
diventa più stretta e più alta!.
Per questo motivo quando
applichiamo il test t di
Student, per trovare il valore
critico con cui confrontare il
valore della statica test
abbiamo bisogno di calcolare
i gradi di libertà. Esistono
quindi tanti valori critici a
seconda dei gradi di libertà
ALMA MATER STUDIORUM – Università di Bologna
TEST di IPOTESI :test t di Student
confronto tra 2 medie campionarie
Es. Sono stati rilevati i tempi di ventilazione meccanica, espressi in ore, in due
Terapie Intensive post-chirurgiche e si vuole valutare se differiscono in modo
significativo.
TI a:
5
7
9
7
5
15
6
8
4
7
4
TI b:
11
10
8
0
17
4
0
22
6
24
0
ma =6,7 e mb=9,3
Applicando questa formula
na=13 e nb=11
5
5
s=5,76
Gradi di libertà:(na -1 )+ (nb-1)=22
Risulta: t=1,09 e confrontando questo
valore con quello critico della t di Student
corrispondente a 22 gradi di libertà che è
2,07 possiamo dire che la differenza
NON è statisticamente significativa con
p=0.14
ALMA MATER STUDIORUM – Università di Bologna
TEST di IPOTESI :test t di Student
confronto tra 2 medie campionarie
Il valore della statistica test t di Student è inferiore al valore critico quindi:
L’ipotesi nulla viene accettata. Questo significa che la differenza nei tempi medi di
ventilazione meccanica rilevati nelle due Terapie Intensive è dovuta al caso
Risulta: t=1,09 e confrontando questo
valore con quello critico della t di Student
corrispondente a 22 gradi di libertà che è
2,07 possiamo dire che la differenza
NON è statisticamente significativa con
p=0.14
- 2,07
1,09
2,07
ALMA MATER STUDIORUM – Università di Bologna
Sintesi TEST di IPOTESI
IPOTESI NULLA H0
La differenza è dovuta al caso
Accetto o rifiuto l’ipotesi nulla?
Per rispondere effettuo un
TEST DI IPOTESI
Confronto il valore ottenuto dal TEST
con dei valori critici già calcolati su apposite tabelle
Ipotesi nulla
RIFIUTATA
differenza
significativa
Valore del test
maggiore
Valore critico
Valore del test
minore
Valore critico
Ipotesi nulla
ACCETTATA
differenza
NON
significativa
ALMA MATER STUDIORUM – Università di Bologna
Test t di student con SPSS
SPSS
Click Analizza
Confronta medie
Test t campioni indipendenti
ALMA MATER STUDIORUM – Università di Bologna
TEST di IPOTESI :test Chi-quadrato
Esempio: Si vuole verificare l’efficacia di due diversi farmaci:
le differenze sono statisticamente significative,
ad un livello di significatività α del 5%?
farmaco 1
farmaco2
totali
guariti non guariti totali
52
10
62
40
92
21
31
61
123
guariti (farmaco1)=52/62=84%
guariti (farmaco2)= 40/61=66%
Totale guariti=92/123=74,8%
IPOTESI NULLA H0 : la differenza delle % di guariti è dovuta al CASO,
I due farmaci sono ugualmente efficaci
Ipotesi Nulla
Dati attesi
percentuale di guariti
del 74,8% per entrambi i farmaci
farmaco 1
farmaco2
totali
guariti non guariti totali
46
16
62
46
15
61
92
31
123
ALMA MATER STUDIORUM – Università di Bologna
TEST di IPOTESI :test Chi-quadrato
Esempio:
Si vuole verificare l’efficacia di due diversi farmaci:
le differenze sono statisticamente significative, ad un livello di significatività α del 5%?
Dati campionari rilevati
guariti non guariti totali
farmaco 1
52
10
62
farmaco2
totali
40
92
21
31
61
123
Dati attesi sotto l’ipotesi nulla
farmaco 1
farmaco2
totali
guariti non guariti totali
46
16
62
46
15
61
92
31
123
Per ciascuna combinazione farmaco guariti si calcola
ALMA MATER STUDIORUM – Università di Bologna
TEST di IPOTESI :test Chi-quadrato
Ora, confrontando il nostro valore
(5.46) con quelli tabulati, notiamo
che esso è >3.841 e <6.635. Ciò
consente di ritenere che la differenza
fra i due gruppi sia significativa al
livello di significatività α 5% ma non
al livello di significatività 1%.
Nel nostro caso, il valore ottenuto è un chiquadrato con «1 grado di libertà»;
infatti, per tabelle come quella che stiamo
studiando,
il grado di libertà è uguale a
(numero di righe-1)x(numero di colonne-1).
ALMA MATER STUDIORUM – Università di Bologna
Osservazioni
Nell’esempio precedente è stato scelto un livello di significatività α del 5%, cioè si è
scelto che il rischio massimo accettabile, di commettere l’errore rifiutando l’ipotesi
nulla, quando questa è vera, è il 5%.
la probabilità corrispondente al valore del chi-quadrato 5.46, in corrispondenza di 1
grado di libertà è 0.019 e questo valore prende il nome di p-value.
Quindi il p-value della differenza di efficacia dei nostri due farmaci messi a confronto è:
p=0.019 che è minore di α=0.05
In sintesi: il p-value p=0.019 minore di 0.05 (del 5%) significa che la probabilità
che la differenza riscontrata sia dovuta al caso è minore del 5% ovvero
la probabilità che la differenza sia statisticamente significativa è del 95%.
Se avessimo scelto un livello di significatività inferiore, ad esempio dell’1%
non avremmo riscontrato alcuna differenza significativa
nell’efficacia dei due farmaci messi a confronto.
ALMA MATER STUDIORUM – Università di Bologna
IL CHI_QUADRATO e i GRADI DI LIBERTA’
Anche il chi-quadrato come la t di Student varia al variare dei gradi di libertà.
All’aumentare dei gradi di libertà la curva diventa più bassa e più larga!
ALMA MATER STUDIORUM – Università di Bologna
Test CHI-QUADRATO con SPSS
SPSS
Click Analizza
Statistiche descrittive
Tavole di contingenza
Statistiche
click Chi-quadrato
ALMA MATER STUDIORUM – Università di Bologna
Studio di efficacia: ODDS RATIO
Negli studi di efficacia di un trattamento spesso è necessario mettere a confronto gli
esiti del gruppo di trattamento con quelli del gruppo di controllo espressi come
ODDS Ratio. In questo caso il test di ipotesi deve verificare se l’ODDS RATIO è
significativamente diverso da 1
Esempio: studio di efficacia di un nuovo trattamento per la prevenzione delle lesioni
da pressione
Trattati
LDP
Sì
No
19
121
Controlli
17
115
Odds Ratio
OR=(19/121)/(17/115)=0,157/0,148=1,06
ALMA MATER STUDIORUM – Università di Bologna
TEST per verificare la significatività degli
ODDS RATIO
Il test d’ipotesi utilizzato per verificare se un odds
ratio è significativamente diverso da 1 e con quale
probabilità (p-value) è il test di Cochran MantelHeanszel, che è una variante del test chi-quadrato
SPSS
Click Analizza
Statistiche descrittive
Tavole di contingenza
Statistiche
click Chi-quadrato
click Statistiche di Cochran e Mantel-Heanszel
ALMA MATER STUDIORUM – Università di Bologna
TEST per verificare la significatività degli ODDS RATIO
OUTPUT di SPSS
Stima di Mantel-Haenszel del rapporto odds comune
Stima
1,062
ln(stima)
,060
Errore standard di ln(stima)
,358
Significatività asintotica (2 sensi)
,866
Intervallo di
confidenza al 95%
asintotico
Rapporto odds
comune
ln(rapporto odds
comune)
Limite
inferiore
,526
Limite
superiore
2,144
Limite
inferiore
-,642
Limite
superiore
,763
La stima di Mantel-Haenszel del rapporto odds comune viene
distribuita in modo asintotico e normale in base al rapporto odds
comune dell'assunzione 1,000, in modo analogo al log naturale della
stima.
ODDS RATIO
p-value
Intervallo di confidenza
Poichè il pvalue=0,866 ed è
superiore a 0,05
l’odds ratio non è
significativamente
diverso da 1
Il rischio di LDP è lo stesso nei due trattamenti
ALMA MATER STUDIORUM – Università di Bologna
In sintesi
per il
confronto
tra 2 MEDIE
Test
t di Student
per il
confronto
tra 2 PROPORZIONI o
percentuali
per la
Significatività
degli ODDS RATIO
Test
Chi-quadrato
Test
di Cochran Mantel Heanszel
ALMA MATER STUDIORUM – Università di Bologna
Il confronto delle medie tra più di 2 gruppi
Esempio: su 272 pazienti sottoposti ad intervento chirurgico si vuole valutare se
la degenza media e significativamente diversa tra le classi di età
Età
N°
Degenza
media
Std Dev
Minimum
Maximum
18-30 anni
14
6.6
5.7
2
18
30-40 anni
28
6.4
4.2
2
24
40-50 anni
55
7.9
3.9
3
18
50-60 anni
54
10.9
10.4
2
53
60-70 anni
71
10.5
7.0
3
41
70-80 anni
41
11.8
8.3
2
42
80-90anni
9
15.9
8.5
4
31
Il Test t di Student può essere utilizzato solo per
il confronto tra 2 medie
ALMA MATER STUDIORUM – Università di Bologna
Il confronto delle medie tra più di 2 gruppi:
Analisi della Varianza (ANOVA)
L’analisi della varianza (in inglese:
Analysis of Variance, abbreviata con
l’acronimo ANOVA) è utilizzata per
testare la significatività statistica delle
differenze tra medie campionarie sulla
base delle rispettive varianze.
ALMA MATER STUDIORUM – Università di Bologna
Analisi della Varianza (ANOVA)
Il principio alla base di questo test è quello di stabilire se
due o più medie campionarie possono derivare da
popolazioni che hanno la stessa media.
Quando le medie sono solamente due è
indifferente usare l’ANOVA o il test t di Student,
mentre dobbiamo necessariamente utilizzare
l’ANOVA quando le medie sono più di due.
ALMA MATER STUDIORUM – Università di Bologna
La logica dell’ANOVA
L'ipotesi alla base dell'analisi della varianza è che :
dati n gruppi, la varianza totale può essere suddivisa in due
componenti: Varianza interna ai gruppi (anche detta Within) e
Varianza tra i gruppi (Between).
Varianza totale = Varianza within + Varianza between
Ipotesi nulla
H0
Varianza between < Varianza within
e quindi la differenza tra i gruppi è
dovuta alla sola variabilità interna
ALMA MATER STUDIORUM – Università di Bologna
Analisi della Varianza (ANOVA)
Quindi l’analisi della varianza si basa sul rapporto
Varianza tra i gruppi (Between)
Varianza interna ai gruppi (Within)
e la significatività è verificata mediante il test F
di Fisher
ALMA MATER STUDIORUM – Università di Bologna
ANOVA in SPSS
SPSS
Click Analizza
Confronta medie
ANOVA univariata
Il risultato SPSS per l’ANOVA sulle degenze medie per gruppi di età
ANOVA
durata della degenza (in giorni)
Fra gruppi
Entro gruppi
Totale
Somma dei
quadrati
1275.054
14192.226
15467.279
df
6
265
271
Media dei
quadrati
212.509
53.556
F
3.968
Sig.
.001
le degenze medie sono significativamente diverse tra le classi di età
considerate
ALMA MATER STUDIORUM – Università di Bologna
ALMA MATER STUDIORUM – Università di Bologna