Università del Piemonte Orientale
Corso di laurea in biotecnologia
Corso di Statistica Medica
Test di ipotesi
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
1
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
2
Inferenza statistica : ‘…indurre o inferire proprietà di un universo
[parametri] sulla base dei dati conosciuti relativi ad un campione
[statistiche].’ (H.M.Blalock).
Solo eccezionalmente conosciamo direttamente le caratteristiche della
popolazione, di solito dobbiamo stimarle in base alle caratteristiche
dei campioni che sono stati estratti dalla popolazione.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
3
Possiamo trarre conclusioni sul valore del parametro nella
popolazione a partire dai dati campionari seguendo due percorsi:
1. Il calcolo dell'intervallo di confidenza
2. Il test dell'ipotesi
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
4
Il test dell'ipotesi verifica se il campione è compatibile con un’ipotesi
relativa alle caratteristiche della popolazione.
Il campione non interessa di per sé ma solo in quanto consente di
stimare le caratteristiche della popolazione.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
5
La verifica (o test) dell’ipotesi è un procedimento logico.
Il procedimento prevede dapprima la formulazione dell’ipotesi e quindi
la valutazione della probabilità di ottenere il campione dato se l’ipotesi
è vera.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
6
Che cos'è un’ipotesi?
‘Un ipotesi è un’affermazione relativa ad un evento futuro, o
comunque ad un evento il cui risultato è sconosciuto al momento in
cui l’affermazione viene fatta, costruita in modo da poter risultare non
vera e pertanto da respinta.’ (H.M.Blalock).
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
7
Dal punto di vista filosofico il concetto essenziale è quello della
provvisorietà dei risultati scientifici: una affermazione relativa ad un
fenomeno scientifico è un’ipotesi di lavoro, che resta provvisoriamente
valida fino a quando si osservano risultati sperimentali incompatibili
con essa.
A quel punto l’ipotesi di lavoro viene lasciata cadere perchè
inadeguata e sarà necessario sviluppare ipotesi diverse o più
complesse per spiegare il fenomeno.
Tali ipotesi saranno altrettanto provvisorie e sottoposte a verifica
sperimentale, ripetendo ciclicamente lo stesso percorso.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
8
Intuitivamente si vorrebbe formulare le ipotesi in modo da
confermarle.
“Se la mia ipotesi è vera potrò ripetere molte volte gli stessi
esperimenti ed i loro risultati ripetuti la confermeranno”.
Se così fosse, la ripetizione di un esperimento consentirebbe di
confermare l'ipotesi. Sarebbe quindi utile condurre ripetuti
esperimenti al solo scopo di confermare un'ipotesi che si ritiene
valida.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
9
Alcuni filosofi, in particolare Karl Popper hanno invece
evidenziato come la semplice reiterazione di un risultato non sia
di per sé conferma di una teoria.
Una teoria non può essere confermata ma soltanto rifiutata. Si
giunge al rifiuto quando le conclusioni basate sulla toria non
sono più compatibili con risultati sperimentali.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
10
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
11
Pertanto secondo Popper, il ricercatore deve formulare una
teoria compatibile con tutte le conoscenze già disponibili e
condurre esperimenti per “metterla in crisi”.
- La funzione dell'esperimento è solo di mettere in crisi una
teoria, portando fatti nuovi in contraddizione con essa.
- Ripetere esperimenti relativi ad una teoria già confutata è
inutile.
- Cercare di confermare una teoria ripetendo esperimenti che
sono la replica di esperimenti precedenti è altrettanto inutile.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
12
Come può il ricercatore che lavora dopo questa rivoluzione
epistemologica sostenere una teoria? Attraverso il
procedimento di verifica dell'ipotesi.
L'ipotesi che corrisponde alla teoria è detta ipotesi di lavoro.
Abbiamo visto che la semplice ripetizione di esperimenti non
basta a confermare una teoria e la corrispondente ipotesi di
lavoro.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
13
L'unica soluzione che rimane è quindi formulare un'ipotesi
contrastante con essa e cercare di negarla con evidenze
sperimentali.
Questa ipotesi costruita ad arte è detta ipotesi nulla.
L’esperimento non ha la funzione di ‘sostenere’ l’ipotesi di
lavoro ma, all’opposto ha la funzione di cercare di negare
un’ipotesi simmetrica ed opposta ad essa, costruita
appositamente e detta ipotesi nulla.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
14
Il procedimento prevede un percorso analogo a quello delle
dimostrazioni per assurdo usate spesso in matematica ed in
geometria.
Se l’esperimento nega l’ipotesi nulla, la teoria (ipotesi di lavoro)
resta corroborata (attenzione: non “provata”!).
La teoria resta provvisoriamente valida fino a quando un diverso
esperimento entrerà in contraddizione con essa.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
15
Se invece l’esperimento non nega l’ipotesi nulla, sarà l’ipotesi di
lavoro (quindi la teoria da cui deriva) a dover essere rivista.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
16
La realtà non è perfetta ed esistono errori 'giudiziari'.
Realtà
Verdetto
Colpevole
Innocente
Colpevole
Corretto
Non corretto
Innocente
Non corretto
Corretto
In statistica questi errori accadono in conseguenza della
variabilità casuale.
Lo statistico indica il rischio che considera accettabile di fornire una
conclusione diversa dalla realtà (ignota).
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
17
Nel procedimento di verifica delle ipotesi applichiamo metodi
probabilistici e quindi possiamo trovarci a rifiutare l’ipotesi nulla
quando essa è vera.
Si parla in questo caso di Errore di 1° tipo o Errore α.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
18
Ipotesi nulla
Statistico
Rifiuta
Non rifiuta
falsa
vera
Corretto
Non corretto
Non corretto
Corretto
Ipotesi nulla
Statistico
falsa
vera
Rifiuta
Corretto
Errore α
Non rifiuta
Errore β
Corretto
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
19
Di solito l’errore di primo tipo è fissato al 5% (α = 0.05).
Questo significa che ripetendo molte volte un esperimento, nella
situazione in cui H0 è vera, ci troveremo a rifiutarla nel 5% degli
esperimenti.
Come può accadere?
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
20
Basta che il nostro campione sia uno di questi!
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
21
Le fasi del procedimento di verifica dell’ipotesi:
1. Il ricercatore formula un’ipotesi di lavoro, che costituisce la
spiegazione di un fenomeno o indica il valore di un parametro.
2. Viene formulata l’ipotesi nulla, cioè l’affermazione che il ricercatore
intende sottoporre a verifica, costruita in modo simmetrico all’ipotesi
di lavoro e formulata in modo tale da poter essere negata
dall’esperimento programmato.
3. Viene valutato dal ricercatore quanto è grande il rischio per lui
accettabile di fornire una conclusione diversa dalla realtà (a lui
ignota).
4. Viene disegnato l’esperimento e viene definita la dimensione del
campione.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
22
5. Vengono delineati tutti i possibili risultati dell’esperimento e viene
calcolata la probabilità associata a ciascun risultato, data l’ipotesi
nulla.
6. Viene scelto il test statistico appropriato.
7. Viene condotto l’esperimento.
8. Il risultato dell’esperimento viene letto e confrontato con la
distribuzione di probabilità precedentemente calcolata. Se la
probabilità di ottenere il risultato osservato (data l’ipotesi nulla) è
inferiore alla soglia definita al punto 3 precedente, si conclude per il
rifiuto dell’ipotesi nulla.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
23
Il percorso logico del test dell'ipotesi è comune a tutti i test
statistici. Ricostruiamolo con il seguente esempio per il
confronto della media.
1.Ipotizzo in base all’osservazione clinica sui miei pazienti che il
fumo di tabacco modifica i valori pressori nei forti fumatori (H1: i
forti fumatori hanno pressione media diversa rispetto alla
popolazione non fumatrice).
2. H0: 'i forti fumatori hanno la stessa pressione media della
popolazione'.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
24
Il valore medio nella popolazione è 145, conosciuto da studi
precedenti.
ll valore della deviazione standard nella popolazione, conosciuto
da studi precedenti, è 8,5.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
25
3. fisso l'errore α al 5%; sono interessato ad eventuali
scostamenti in entrambe le direzioni (test di ipotesi bilaterale o
'a 2 code').
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
26
4. Programmo uno studio in cui viene misurata la pressione
arteriosa sistolica a 23 soggetti.
5. La variabile 'pressione arteriosa' nella popolazione ha
distribuzione gaussiana. Pertanto la distribuzione di probabilità
delle medie campionarie è data dalla distribuzione gaussiana
anche se il campione è piccolo.
6. Il test statistico è il test z. (Il test mi indicherà la probabilità
che i soggetti studiati siano un campione casuale estratto da
una popolazione con i valori dati di media e deviazione
standard).
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
27
7. Conduco lo studio ed ottengo i seguenti risultati.
Media = 148,5
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
28
8a Calcolo del test .
Media campione = 148,5
media popolazione = 145
Deviazione standard popolazione = 8,5
n = 23
8b Interpreto il risultato ottenuto con l’uso delle tavole della
distribuzione normale standard.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
29
8a Calcolo del test .
z = (Media campione – media popolazione) / Errore standard =
(148,5 – 145) / (8,5 / radq(23)) = 3,5 / 1,772 = 1,97
8b Interpreto il risultato ottenuto con l’uso delle tavole della
distribuzione normale standard.
La probabilità che il campione sia stato estratto da una
popolazione con media pari a 145 mmHg è < 0,05.
Rifiuto l’ipotesi nulla che il campione sia stato estratto da una
popolazione con tale media.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
30
ESEMPIO 2.
Il caso della distribuzione binomiale
Esaminiamo i diversi punti sviluppando la semplice situazione della
verifica di un’ipotesi relativa al bilanciamento di una moneta.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
1. Il
31
ricercatore formula un’ipotesi di lavoro, che costituisce la
spiegazione di un fenomeno o il valore di un parametro.
Il processo che porta alla formulazione della teoria e quindi dell’ipotesi
di lavoro non è statistico ma entrano in gioco molteplici elementi, tra
cui:
- studio delle precedenti teorie (la ricerca di letteratura);
- conoscenze su altri fenomeni collegati a quello che si vuole
indagare (es. studi di laboratorio, informazioni su meccanismi di
azione);
- osservazioni empiriche (es. osservazioni cliniche ripetute).
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
32
Questo percorso non è codificato: un aspetto importante è costituito
da inventiva e capacità del ricercatore e dalla capacità di riconoscere
aspetti che non corrispondono alle previsioni basate sulle ipotesi di
lavoro correnti.
E’ importante la rivalutazione sotto nuove prospettive delle
conoscenze già acquisite.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
33
Esempio.
Descrizione delle conoscenze e del contesto che ha generato l’ipotesi.
Al tavolo da gioco (lancio di una moneta) si osserva un giocatore
particolarmente fortunato la cui moneta viene frequentemente lanciata
in modo a lui favorevole.
L’ipotesi di lavoro che viene formulata è che la moneta sia alterata e
quindi uno dei possibili risultati (testa) compaia con frequenza diversa
da quanto sarebbe atteso da una moneta bilanciata.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
34
I controlli di laboratorio che abbiamo potuto effettuare non sono stati
indicativi sulla simmetria e sul bilanciamento della moneta.
Non possono essere escluse altre ipotesi, quali l’abilità del giocatore o
il caso.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
35
2. Viene formulata l’ipotesi nulla, cioè l’affermazione che il ricercatore
intende sottoporre a verifica
La formulazione è simmetrica a quella dell’ipotesi di lavoro.
Ipotesi di lavoro (anche detta Ipotesi alternativa).
H1: ‘la moneta è alterata in modo tale che un risultato si verifichi con
frequenza diversa rispetto all'altro’.
Ipotesi nulla.
H0: ‘la moneta è bilanciata. L'attesa è che i due risultati si verifichino
con eguale frequenza’.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
36
H0 è formulata in modo tale da poter essere negata dall’esperimento
programmato.
Le conseguenze dell’affermazione dell’ipotesi nulla sono quantificabili
(se la moneta è bilanciata si applica la distribuzione binomiale con
π=0.5), pertanto l’ipotesi nulla è formulata in modo tale da poter
essere negata.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
37
3. Lo statistico indica il rischio accettabile di fornire una conclusione
diversa dalla realtà (a lui ignota).
a. Nel procedimento di verifica delle ipotesi applichiamo metodi
probabilistici e quindi possiamo trovarci a rifiutare l’ipotesi nulla
quando essa è vera.
Si parla in questo caso di Errore di 1° tipo o Errore α.
Di solito l’errore di primo tipo è fissato al 5% (α = 0.05).
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
38
Ipotesi nulla
Statistico
Rifiuta
Non rifiuta
falsa
vera
Corretto
Non corretto
Non corretto
Corretto
Ipotesi nulla
Statistico
falsa
vera
Rifiuta
Corretto
Errore α
Non rifiuta
Errore β
Corretto
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
39
Calcoliamo le combinazioni di teste e croci che corrispondono al rifiuto
dell’ipotesi nulla, con errore di primo tipo inferiore al 5%
Croci
Teste
0
10
1
9
2
8
3
7
4
6
5
5
6
4
7
3
8
2
9
1
10
0
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
p
40
P(r successi su N prove) =
( NR ) (π) (1-π)
r
(N-r)
( NR ) = N! / [r! (N-r)!]
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
41
Se fissiamo l'errore α a 0,05, rifiuteremo l'ipotesi nulla solo se
l'esperimento di 10 lanci ha dato uno tra i seguenti risultati:
0 teste
1 testa
9 teste
10 teste
Se l'ipotesi nulla è vera, questi sono i valori (simmetrici nelle due
code) la cui probabilità sommata è < 0,05.
Sono evenienze remote, sempre che l'ipotesi nulla sia vera.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
42
Distribuzione binomiale N=10
0,300
0,250
probabilità
0,200
0,150
0,100
0,050
0,000
0,500
0
1
2
3
4
5
6
7
8
9
10
0,001
0,010
0,044
0,117
0,205
0,246
0,205
0,117
0,044
0,010
0,001
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
43
Nel caso si voglia essere maggiormente ‘conservativi’ nella difesa
dell’ipotesi nulla si sceglie α = 0.01
Nel caso si voglia essere maggiormente ‘favorevoli’ all’ipotesi di lavoro
si sceglie α = 0.10
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
44
b. Lo statistico misura anche il rischio di non rifiutare l’ipotesi nulla
quando essa è falsa.
Si parla in questo caso di Errore di 2° tipo o Errore β.
Complementare all'errore β abbiamo la potenza dello studio:
Potenza = 1 – (Errore β)
45
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
Ipotesi nulla
Statistico
Rifiuta
Non rifiuta
falsa
vera
Corretto
Non corretto
Non corretto
Corretto
Ipotesi nulla
Statistico
falsa
vera
Rifiuta
Corretto
Errore α
Non rifiuta
Errore β
Corretto
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
46
Di solito si disegna l'esperimento in modo che la potenza sia tra 80%
e 90% (rispettivamente: β = 0.20 o β = 0.10).
In alternativa possiamo misurare l'errore β corrispondente ad una data
numerosità campionaria.
47
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
Supponiamo che la realtà sia di una monetina sbilanciata, con π=0.75
e (1-π)=0.25. Questa è la distribuzione di probabilità.
distribuzione binomiale n=10
0,300
0,250
probabilità
0,200
0,150
0,100
0,050
0,000
0,750
0
1
2
3
4
5
6
7
8
9
10
0,000
0,000
0,000
0,003
0,016
0,058
0,146
0,250
0,282
0,188
0,056
numero successi
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
48
Possiamo quantificare l'errore β misurando la probabilità di estrarre
uno dei valori per cui non rifiuteremmo l'ipotesi nulla.
49
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
L’istogramma presenta la distribuzione di probabilità binomiale per (N=10, π=0,5) e (N=10, π=0,75).
Si noti l’ampia sovrapposizione. Diversi risultati sono compatibili con entrambe le distribuzioni
Distribuzione binomiale N=10
0,300
0,250
probabilità
0,200
0,150
0,100
0,050
0,000
0
1
2
3
4
5
6
7
8
9
10
0,500
0,001
0,010
0,044
0,117
0,205
0,246
0,205
0,117
0,044
0,010
0,001
0,750
0,000
0,000
0,000
0,003
0,016
0,058
0,146
0,250
0,282
0,188
0,056
numero di successi
Risultati che portano al rifiuto dell'ipotesi
nulla
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
50
In questo caso l'errore β è molto alto:
0,282+0,250+0,146+0,058+0,016+0,003 = 0,755
Conclusione: l'esperimento è mal disegnato. Lo studio è inadeguato a
mettere in evidenza una differenza elevata (0,75 vs. 0,5) nella
probabilità di ottenere testa al lancio della moneta.
51
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
Come possiamo procedere?
Solo aumentando le dimensioni del campione possiamo ridurre sia
l’errore α sia l’errore β (l’argomento sarà ripreso in seguito).
Se le dimensioni del campione non cambiano:
diminuendo α aumenta β
e viceversa.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
52
Senza anticipare la lezione sulla potenza dello studio, consideriamo
nei prossimi lucidi la sovrapposizione tra due distribuzioni di
probabilità binomiali con il variare di N.
53
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
L’istogramma presenta la distribuzione di probabilità binomiale per (N=10, π=0,5) e (N=10,
π=0,75). Si noti l’ampia sovrapposizione. Diversi risultati dell'esperimento sono compatibili con
entrambe le distribuzioni
Distribuzione binomiale N=10
0,300
0,250
probabilità
0,200
0,150
0,100
0,050
0,000
0
1
2
3
4
5
6
7
8
9
10
0,500
0,001
0,010
0,044
0,117
0,205
0,246
0,205
0,117
0,044
0,010
0,001
0,750
0,000
0,000
0,000
0,003
0,016
0,058
0,146
0,250
0,282
0,188
0,056
numero di successi
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
54
L’istogramma presenta la distribuzione di probabilità binomiale per (N=50, π=0,5) e (N=50,
π=0,75). Si noti che la sovrapposizione è inferiore a quanto osservato nella figura precedente.
distribuzione binomiale n=50
0,14
0,12
0,500
0,750
probabilità
0,1
0,08
0,06
0,04
0,02
0
0
2
4
6
8
1
0
1
2
1
4
1
6
1
8
2
0
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
2
2
2
4
2
6
n. successi
2
8
3
0
3
2
3
4
3
6
3
8
4
0
4
2
4
4
4
6
4
8
5
0
55
In questo caso l'errore β è:
0,01482+0,00765+0,00365+0,00160+0,00065+0,00024+
0,00001= 0,02862 =
2,862 %
Conclusione: l'esperimento è ben disegnato. Lo studio ha una potenza
elevata per mettere in evidenza la differenza (0,75 vs. 0,5) nella
probabilità di ottenere testa al lancio della moneta.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
56
Attenzione quando parliamo di errori di 1° e 2° tipo ci riferiamo solo
agli errori campionari, cioè agli effetti della variabilità casuale, che
porta a differenze tra i diversi campioni.
Non esistono metodi statistici per ovviare agli errori sistematici.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
57
4. Viene disegnato l’esperimento e viene definita la dimensione del
campione.
Si ricorda qui che il termine ‘esperimento’ non si riferisce ai soli
esperimenti di laboratorio ma include anche gli studi epidemiologici
(osservazionali).
La dimensione del campione dipenderà dal risultato atteso dello
studio e dagli errori di primo e di secondo tipo. Il calcolo della
dimensione del campione sarà affrontato nelle successive lezioni.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
58
5. Vengono delineati tutti i possibili risultati dell’esperimento e viene
calcolata la probabilità associata a ciascun risultato, data l’ipotesi
nulla.
Si tratta qui di enumerare tutti i possibili risultati e quindi di calcolare la
probabilità associata a ciascun risultato, data H0.
Nell’esempio considerato, la funzioni di probabilità è la funzione
binomiale.
59
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
P(r successi su N prove) =
( NR ) (π) (1-π)
r
(N-r)
( NR ) = N! / [r! (N-r)!]
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
60
Distribuzione binomiale N=10, p=0.5
0,300
0,250
0,200
0,150
0,100
0,050
0,000
0,500
0
1
2
3
4
5
6
7
8
9
10
0,001
0,010
0,044
0,117
0,205
0,246
0,205
0,117
0,044
0,010
0,001
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
61
‘Qual è la probabilità di avere almeno un certo numero di successi (r)
dato un certo numero di prove (N)’?
In questo caso:
1 Calcolo la probabilità per tutti i numeri interi compresi tra r ed N
(inclusi)
2 Sommo la probabilità per ciascuno degli interi compresi tra r ed N
P(r’>=r in N prove) = p(r) + p(r+1) + …+ p(N-1) + p(N)
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
62
7. Viene scelto il test statistico appropriato.
Il test statistico serve a calcolare la probabilità associata al risultato
osservato dall’esperimento
Nell’esempio dato il test appropriato è il calcolo della distribuzione di
probabilità binomiale, che fornisce direttamente un valore di
probabilità.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
63
A quale delle due situazioni seguenti siamo interessati?
- valore di probabilità cumulativo del singolo risultato e di tutti i
risultati che si allontanano maggiormente dall’ipotesi nulla,
considerando soltanto una direzione (test di ipotesi
monolaterali).
- valore di probabilità cumulativo del singolo risultato e di tutti i
risultati che si allontanano maggiormente dall’ipotesi nulla,
considerando entrambe le direzioni (test di ipotesi bilaterali).
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
64
Il grafico illustra la coda di sinistra (probabilità cumulativa <=0.05) della distribuzione di probabilità binomiale
con π = 0.5 ed n=50. Si noti che, trattandosi di una variabile discreta la probabilità cumulativa per i valori
considerati è non è esattamente uguale a 0.05 ma è lievemente inferiore.
65
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
0,12
0,500
Serie1
0,1
0,08
0,06
0,04
0,02
0
0 1
2 3
4 5
6 7
8 9
1 1
0 1
1 1
2 3
1 1
4 5
1 1
6 7
1 1
8 9
2 2
0 1
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
2 2
2 3
2 2 2
4 5 6
2 2
7 8
2 3
9 0
3 3
1 2
3 3
3 4
3 3
5 6
3 3
7 8
66
3 4
9 0
4 4
1 2
4 4
3 4
4 4
5 6
4 4
7 8
4 5
9 0
Il grafico illustra la coda di destra (probabilità cumulativa => 0.95) della distribuzione di probabilità binomiale
con π = 0.5 ed n=50. Si noti che, trattandosi di una variabile discreta la probabilità cumulativa per i valori
considerati è lievemente inferiore a 0.05.
67
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
0,12
0,500
Serie1
0,1
0,08
0,06
0,04
0,02
0
0 1
2 3
4 5
6 7
8 9
1 1
0 1
1 1
2 3
1 1
4 5
1 1
6 7
1 1
8 9
2 2
0 1
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
2 2
2 3
2 2 2
4 5 6
2 2
7 8
2 3
9 0
3 3
1 2
3 3
3 4
3 3
5 6
3 3
7 8
68
3 4
9 0
4 4
1 2
4 4
3 4
4 4
5 6
4 4
7 8
4 5
9 0
Il grafico illustra le due code (probabilità cumulativa <=0.05, equamente ripartita) della distribuzione di
probabilità binomiale con π = 0.5 ed n=50. Si noti che, trattandosi di una variabile discreta la probabilità
cumulativa per i valori considerati è lievemente inferiore a 0.05 .
69
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
0,12
0,500
Serie1
0,1
0,08
0,06
0,04
0,02
0
0 1
2 3
4 5
6 7
8 9
1 1
0 1
1 1
2 3
1 1
4 5
1 1
6 7
1 1
8 9
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
2 2
0 1
2 2
2 3
2 2 2
4 5 6
2 2
7 8
2 3
9 0
3 3
1 2
3 3
3 4
3 3
5 6
70
3 3
7 8
3 4
9 0
4 4
1 2
4 4
3 4
4 4
5 6
4 4
7 8
4 5
9 0
8. Viene condotto l’esperimento.
Nell’esempio l’esperimento consiste semplicemente nel lancio della
moneta in oggetto per N volte (n=dimensione del campione).
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
71
Il risultato dell’esperimento viene letto e confrontato con la
distribuzione di probabilità precedentemente calcolata. Se la
probabilità di ottenere il risultato osservato (data l’ipotesi nulla) è
inferiore alla soglia definita al punto precedente, si conclude per il
rifiuto dell’ipotesi nulla.
Altrimenti si conclude per il 'non rifiuto' dell'ipotesi nulla.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
72
Il risultato dell’esperimento condotto con n=10 ha indicato 3 teste e
7 croci.
Il test a due code fornisce per tale risultato un valore di probabilità
cumulativa pari a 0,172 * 2 = 0,344.
La soglia era fissata a 0,05
L’ipotesi nulla non viene negata.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
73
Esercizio 1
A quale conclusione saremmo giunti con 15 teste e 35 croci in un
esperimento con 50 lanci?
Esercizio 2
A quale conclusione saremmo giunti con 8 teste in un esperimento
con 20 lanci?
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
74
Esempio 3
Il caso in cui è necessario usare la distribuzione t di Student
Il percorso logico del test dell'ipotesi è comune a tutti i tests statistici.
Ricostruiamolo con il seguente esempio per il confronto della media.
1.Ipotizzo in base a dati di laboratorio che il fumo di tabacco aumenti i
valori pressori nei forti fumatori (H1).
2. H0: 'i forti fumatori hanno la stessa pressione media della popolazione'.
3. fisso l'errore α al 5%; sono interessato ad eventuali scostamenti in
entrambe le direzioni (test di ipotesi bilaterale o 'a 2 code')
4. Programmo uno studio in cui viene misurata la pressione arteriosa
sistolica a 23 soggetti.
75
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
5. La variabile 'pressione arteriosa' nella popolazione ha distribuzione
gaussiana.
Pertanto
la
distribuzione
di
probabilità
delle
medie
campionarie è data dalla distribuzione gaussiana anche se il campione è
piccolo. I valore medio nella popolazione è 145. Non conosco il valore
della deviazione standard nella popolazione.
6. Il test statistico è il test t di student. (Il test mi indicherà la probabilità che
i soggetti studiati siano un campione casuale estratto da una popolazione
con media della pressione arteriosa sistolica pari a 145).
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
76
7. Conduco lo studio ed ottengo i seguenti risultati.
Media campionaria = 148,5
Deviazione standard campionaria = 8,5
L’errore standard sarà quindi = 1,772
8a Calcolo del test .
t = (Media campione – media popolazione) / Errore standard =
(148,5 – 145) / 1,772 = 1,974
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
77
8b Interpreto il risultato ottenuto con l’uso delle tavole della distribuzione t
di student con 22 g.l.
La probabilità che il campione sia stato estratto da una popolazione con
media pari a 145 mmHg è > 0,05.
Non escludo pertanto l’ipotesi nulla che il campione sia stato estratto da
una popolazione con tale media.
Discussione: Perchè il risultato discorda rispetto a quello ottenuto dal
precedente esempio 1?
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
78
Applichiamo le stesse tecniche in 3 situazioni distinte:
- campionamento casuale da popolazione definita
- campionamento da popolazione non enumerabile o non definita
- campionamento ‘immaginario’ avendo considerato tutti i soggetti
con caratteristiche idonee ma sapendo che essi sono solo parte
di una ‘popolazione teorica’.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
79
Test dell'ipotesi ed intervallo di confidenza sono strettamente
associati:
Ripetendo un campionamento dalla stessa popolazione, se vale l’ipotesi
nulla la proporzione di campioni il cui intervallo di confidenza non
comprende l’ ipotesi nulla è pari al valore dell’errore di 1° tipo.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
80
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
81
Cerchiamo di ricostruire il percorso dell’inferenza statistica in un articolo
pubblicato.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
82
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
83
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
84
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
85
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
86
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
87
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
88
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
89
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
90
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
91
Esercizi sul testo
p 194 es. 1
p 194 es. 2
p 194 es. 3
p 194 es. 4
p 194 es. 6
p 194 es. 9 + calcolo dell'intervallo di confidenza al 95% ed al 99%
p 195 es. 11
p 195 es. 12
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi
92