Università del Piemonte Orientale
Corso di Laurea in Igiene Dentale
Corso di Statistica per la ricerca
sperimentale e tecnologica
Test d'ipotesi
Corso di laurea triennale di Igiene Dentale - Corso di Statistica - Test di ipotesi
1
Solo eccezionalmente conosciamo direttamente le
caratteristiche della popolazione, di solito dobbiamo stimarle
in base alle caratteristiche dei campioni estratti dalla
popolazione.
Inferenza statistica: ‘…indurre o inferire proprietà di un
universo [parametri] sulla base dei dati conosciuti relativi ad
un campione [statistiche].’ (H.M.Blalock).
Corso di laurea triennale di Igiene Dentale - Corso di Statistica - Test di ipotesi
2
Possiamo trarre conclusioni sul valore del parametro
nella popolazione a partire dai dati campionari
seguendo due percorsi:
1.
Il calcolo dell'intervallo di confidenza
2.
Il test dell'ipotesi
Corso di laurea triennale di Igiene Dentale - Corso di Statistica - Test di ipotesi
3
Test dell'ipotesi:
Verifica se il campione è compatibile con un’ipotesi relativa
alle caratteristiche della popolazione.
Il procedimento prevede dapprima la formulazione
dell’ipotesi e quindi la valutazione della probabilità di
ottenere il campione dato se l’ipotesi è vera.
Se questa probabilità è bassa concluderemo che il
campione verosimilmente proviene da una popolazione
con diverse caratteristiche
Corso di laurea triennale di Igiene Dentale - Corso di Statistica - Test di ipotesi
4
Cos'è un’ipotesi?
‘Un’ ipotesi è un’affermazione relativa ad un evento
futuro, o comunque ad un evento il cui risultato è
sconosciuto al momento in cui avviene l’affermazione
ed è costruita in modo da poter risultare non vera e
pertanto respinta.’ (H.M.Blalock).
Corso di laurea triennale di Igiene Dentale - Corso di Statistica - Test di ipotesi
5
Intuitivamente si vorrebbe procedere cercando di
confermare le ipotesi.
'Se la mia ipotesi è vera potrò ripetere molti esperimenti
ed i loro risultati ripetuti la confermeranno'.
In tal modo la funzione dell'esperimento sarebbe quella
di confermare l'ipotesi. Sarebbe quindi utile condurre
ripetuti esperimenti al solo scopo di confermare
un'ipotesi che si ritiene valida.
Corso di laurea triennale di Igiene Dentale - Corso di Statistica - Test di ipotesi
6
Purtroppo alcuni filosofi, in particolare Karl Popper, hanno
evidenziato come la semplice reiterazione di un risultato non
sia di per sé conferma di una teoria.
Una teoria non può essere confermata ma soltanto rifiutata
quando le sue conclusioni non sono più compatibili con
risultati sperimentali.
Corso di laurea triennale di Igiene Dentale - Corso di Statistica - Test di ipotesi
7
Come può il ricercatore che lavora dopo questa 'rivoluzione
epistemologica' sostenere una teoria? Attraverso il
procedimento di verifica dell'ipotesi.
L'ipotesi che corrisponde alla teoria è detta ipotesi di lavoro.
Abbiamo visto che la semplice ripetizione di esperimenti non
basta a confermarla.
L'unica soluzione che rimane è quindi formulare un'ipotesi
simmetrica ed opposta ad essa e cercare di negarla con
evidenze sperimentali.
Corso di laurea triennale di Igiene Dentale - Corso di Statistica - Test di ipotesi
8
Questa ipotesi 'costruita ad arte' è detta ipotesi nulla.
L’esperimento non ha la funzione di ‘sostenere’ l’ipotesi di
lavoro che il ricercatore ha sviluppato ma, all’opposto ha la
funzione di cercare di negare l’ipotesi nulla.
Corso di laurea triennale di Igiene Dentale - Corso di Statistica - Test di ipotesi
9
Il procedimento prevede un percorso analogo a quello
delle dimostrazioni ‘per assurdo’ usate spesso in
matematica ed in geometria.
Se l’esperimento nega l’ipotesi nulla, la teoria resta
corroborata (attenzione: non “provata”!).
La teoria resta provvisoriamente valida fino a quando un
diverso esperimento entrerà in contraddizione con essa.
Se invece l’esperimento non nega l’ipotesi nulla, sarà
l’ipotesi di lavoro (quindi la teoria da cui deriva) a dover
essere rivista.
Corso di laurea triennale di Igiene Dentale - Corso di Statistica - Test di ipotesi
10
La realtà non è perfetta ed esistono errori 'giudiziari'.
Realtà
Verdetto
Colpevole
Innocente
Colpevole
Corretto
Non corretto
Innocente
Non corretto
Corretto
In statistica questi errori accadono in conseguenza della
variabilità casuale.
Corso di laurea triennale di Igiene Dentale - Corso di Statistica - Test di ipotesi
11
Nel procedimento di verifica delle ipotesi applichiamo
metodi probabilistici e quindi possiamo trovarci:
- a rifiutare l’ipotesi nulla quando essa è vera Errore di
1°tipo o Errore α;
- a non rifiutare l’ipotesi nulla quando essa è falsa Errore
di II tipo o Errore β.
Lo statistico indica il rischio che considera accettabile di
fornire una conclusione diversa dalla realtà (ignota).
Corso di laurea triennale di Igiene Dentale - Corso di Statistica - Test di ipotesi
12
Ipotesi nulla
Statistico
Rifiuta
Non rifiuta
falsa
vera
Corretto
Non corretto
Non corretto
Corretto
Ipotesi nulla
Statistico
falsa
vera
Rifiuta
Corretto
Errore α
Non rifiuta
Errore β
Corretto
Corso di laurea triennale di Igiene Dentale - Corso di Statistica - Test di ipotesi
13
Le fasi del procedimento di verifica dell’ipotesi:
1.
Il ricercatore formula un’ipotesi di lavoro, che costituisce
la spiegazione di un fenomeno o indica il valore di un
parametro.
2.
Viene formulata l’ipotesi nulla, cioè l’affermazione che il
ricercatore intende sottoporre a verifica, costruita in
modo simmetrico all’ipotesi di lavoro e formulata in
modo tale da poter essere negata dall’esperimento
programmato.
3.
Viene valutato dal ricercatore quanto è grande il rischio
per lui accettabile di fornire una conclusione diversa
dalla realtà (a lui ignota).
4.
Viene disegnato l’esperimento e viene definita la
dimensione del campione.
Corso di laurea triennale di Igiene Dentale - Corso di Statistica - Test di ipotesi
14
5.
Vengono delineati tutti i possibili risultati
dell’esperimento e viene calcolata la probabilità
associata a ciascun risultato, data l’ipotesi nulla.
6.
Viene scelto il test statistico appropriato.
7.
Viene condotto l’esperimento.
8.
Il risultato dell’esperimento viene letto e confrontato
con la distribuzione di probabilità precedentemente
calcolata. Se la probabilità di ottenere il risultato
osservato (data l’ipotesi nulla) è inferiore alla soglia
definita al punto 3 precedente, si conclude per il
rifiuto dell’ipotesi nulla.
Corso di laurea triennale di Igiene Dentale - Corso di Statistica - Test di ipotesi
15
Ricostruiamo il percorso logico del test dell'ipotesi con il
seguente esempio per il confronto della media.
1. Ipotizzo in base all’osservazione clinica sui miei pazienti che
il fumo di tabacco modifica i valori pressori nei forti fumatori
(H1: i forti fumatori hanno pressione media diversa rispetto alla
popolazione non fumatrice).
2. H0: 'i forti fumatori hanno la stessa pressione media della
popolazione'.
Il valore medio nella popolazione è 145, conosciuto da studi
precedenti.
ll valore della deviazione standard nella popolazione,
conosciuto da studi precedenti, è 8,5.
Corso di laurea triennale di Igiene Dentale - Corso di Statistica - Test di ipotesi
16
3. fisso l'errore α al 5%; sono interessato ad eventuali
scostamenti in entrambe le direzioni (test di ipotesi bilaterale
o 'a 2 code').
4. Programmo uno studio in cui viene misurata la pressione
arteriosa sistolica a 23 soggetti.
5. La variabile 'pressione arteriosa' nella popolazione ha
distribuzione gaussiana. Pertanto la distribuzione di
probabilità delle medie campionarie è data dalla distribuzione
gaussiana anche se il campione è piccolo.
6. Il test statistico è il test z. (Il test mi indicherà la probabilità
che i soggetti studiati siano un campione casuale estratto da
una popolazione con i valori dati di media e deviazione
standard).
Corso di laurea triennale di Igiene Dentale - Corso di Statistica - Test di ipotesi
17
7. Conduco lo studio ed ottengo i seguenti risultati.
Media = 148,5
8a. Calcolo del test .
z = (Media campione – media popolazione) / Errore standard
=(148,5 – 145) / (8,5 / radq(23)) = 3,5 / 1,772 = 1,97
8b. Interpreto il risultato ottenuto con l’uso delle tavole della
distribuzione normale standard.
La probabilità che il campione sia stato estratto da una
popolazione con media pari a 145 mmHg è < 0,05.
Rifiuto l’ipotesi nulla che il campione sia stato estratto da una
popolazione con tale media.
Corso di laurea triennale di Igiene Dentale - Corso di Statistica - Test di ipotesi
18
Errore di II tipo o Errore β.
Complementare all'errore β abbiamo la potenza dello studio:
Potenza = 1 – (Errore β)
Di solito si disegna l'esperimento in modo che la potenza sia tra 80%
e 90% (rispettivamente: β = 0.20 o β = 0.10).
In alternativa possiamo misurare l'errore β corrispondente ad una data
numerosità campionaria.
Corso di laurea triennale di Igiene Dentale - Corso di Statistica - Test di ipotesi
19
Supponiamo che si abbia una monetina sbilanciata, con
π=0.75 e (1-π)=0.25.
Distribuzione di probabilità:
distribuzione binomiale n=10
0,300
0,250
probabilità
0,200
0,150
0,100
0,050
0,000
0,750
0
1
2
3
4
5
6
7
8
9
10
0,000
0,000
0,000
0,003
0,016
0,058
0,146
0,250
0,282
0,188
0,056
numero successi
Possiamo quantificare l'errore β misurando la probabilità di
estrarre uno dei valori per cui non rifiuteremmo l'ipotesi nulla.
Corso di laurea triennale di Igiene Dentale - Corso di Statistica - Test di ipotesi
20
L’istogramma presenta la distribuzione di probabilità binomiale
per (N=10, π=0,5) e (N=10, π=0,75).
Si noti l’ampia sovrapposizione.
Diversi risultati sono compatibili con entrambe le distribuzioni
Distribuzione binomiale N=10
0,300
0,250
probabilità
0,200
0,150
0,100
0,050
0,000
0
1
2
3
4
5
6
7
8
9
10
0,500
0,001
0,010
0,044
0,117
0,205
0,246
0,205
0,117
0,044
0,010
0,001
0,750
0,000
0,000
0,000
0,003
0,016
0,058
0,146
0,250
0,282
0,188
0,056
numero di successi
Corso di laurea triennale di Igiene Dentale - Corso di Statistica - Test di ipotesi
21
In questo caso l'errore β è molto alto:
0,282+0,250+0,146+0,058+0,016+0,003 = 0,755
La potenza è ridotta: 1-0,755= 0,245=24.5%
Conclusione: l'esperimento è mal disegnato.
Lo studio è inadeguato a mettere in evidenza una differenza
elevata (0,75 vs. 0,5) nella probabilità di ottenere testa al lancio
della moneta.
Come possiamo procedere?
Solo aumentando le dimensioni del campione possiamo ridurre sia
l’errore α sia l’errore β (l’argomento sarà ripreso in seguito).
Se le dimensioni del campione non cambiano:
diminuendo α aumenta β e viceversa.
Corso di laurea triennale di Igiene Dentale - Corso di Statistica - Test di ipotesi
22
Distribuzione di probabilità binomiale per (N=50, π=0,5) e (N=50,
π=0,75).
La sovrapposizione è inferiore a quanto osservato nella figura
precedente.
distribuzione binomiale n=50
0,14
0,12
0,500
0,750
probabilità
0,1
0,08
0,06
0,04
0,02
0
0
2
4
6
8
1
0
1
2
1
4
1
6
1
8
2
0
2
2
2
4
2
6
2
8
3
0
3
2
3
4
3
6
3
8
4
0
4
2
4
4
4
6
4
8
5
0
n. successi
In questo caso l'errore β è: 0,01482+0,00765+0,00365+0,00160+
0,00065+0,00024+0,00001= 0,02862 =2,862 %
Potenza= 1-0,02862= 0,97138 =97,138%
Corso di laurea triennale di Igiene Dentale - Corso di Statistica - Test di ipotesi
23
Esercizi consigliati
da: Fowler et al, ed Edises.
•
•
•
•
Cap 11 (p 229) es 1
Cap 11 (p 229) es 2
Cap 11 (p 229) es 3
Cap 11 (p 229) es 7
Corso di laurea triennale di Igiene Dentale - Corso di Statistica - Test di ipotesi
24