Unità 5
Test di significatività e di ipotesi
Ipotesi nulla e ipotesi alternativa
Errore di I tipo e di II tipo
Livello di significatività e potenza
1
DECISIONI STATISTICHE
Spesso è necessario prendere decisioni relative a popolazioni
sulla base di informazioni ottenute dall’analisi di un campione.
Ad esempio, sulla base di dati campionari ci può interessare di
decidere se una tecnica risulta migliore di un’altra per
diagnosticare una malattia oppure se una nuova terapia è efficace
per curare una determinata patologia.
Decisioni di questo genere sono dette decisioni statistiche.
2
IPOTESI STATISTICHE
Nel tentativo di pervenire ad una decisione statistica è utile fare
assunzioni circa la popolazione presa in esame, ad esempio circa la
sua densità di probabilità.
Tali assunzioni, che possono risultare vere o false, sono dette ipotesi
statistiche.
Ad esempio, volendo decidere se una moneta è truccata si formula
l’ipotesi che non lo sia ponendo uguali fra loro le probabilità che,
lanciando la moneta, si presenti testa o croce (cioè P = 0,5).
Allo stesso modo, quando si vuole decidere se una terapia dia risultati
diversi da un’altra, si ipotizza che non vi sia differenza fra le due
terapie, ovvero che le differenze che si osservano fra i campioni siano
dovute al caso, cioè al campionamento operato su un’identica
popolazione.
3
IPOTESI NULLA E IPOTESI ALTERNATIVA
In termini tecnici l'ipotesi statistica da verificare si chiama ipotesi
nulla e si indica con H0.
Qualunque ipotesi che differisce dall’ipotesi statistica fatta è detta
ipotesi alternativa e viene indicata con H1.
Ad esempio, se facciamo l’ipotesi statistica che lanciando una moneta
si presenti testa con probabilità P = 0,5 (ipotesi nulla), le ipotesi che P
sia 0,8 oppure 0,3 o, più semplicemente, che P sia diversa da 0,5
sono alternative.
4
Quando si confrontano i dati ottenuti su campioni l’ipotesi
nulla è in genere un’ipotesi di casualità.
Esempio
H0: le differenze di altezza osservate nei due campioni di piante
sono dovute a variazioni casuali.
H1: le differenze di altezza osservate nei due campioni di piante
sono dovute alla “superiorità” dei semi ottenuti da impollinazione
incrociata.
5
TEST DI IPOTESI E DI SIGNIFICATIVITÀ
Se, supponendo che un’ipotesi statistica HO sia vera, si trova che i
risultati osservati sui dati campionari sono fortemente in
contrasto con quelli che, per puro effetto del caso, ci
saremmo aspettati sulla base dell’ipotesi formulata, si dirà
che le differenze osservate sono “significative” e si deciderà
di rigettare l’ipotesi fatta.
Così, ad esempio, se su 80 lanci di una moneta si ottiene 71 volte
testa, saremo favorevoli a rifiutare l’ipotesi che la moneta non sia
truccata, sebbene sia possibile che facendo tale scelta si stia
sbagliando.
Procedure che permettono di decidere se accettare o rigettare
una certa ipotesi o di determinare se un campione osservato
differisce in maniera significativa dai risultati attesi sono dette test
di ipotesi, test di significatività o regole di decisione.
6
ERRORI DI I TIPO E DI II TIPO
Se l’ipotesi fatta che avrebbe dovuto essere accettata viene
rifiutata, si dirà di aver commesso un errore di I tipo o di I
specie.
Al contrario, quando si accetta un’ipotesi che avrebbe dovuto
essere rigettata, si dirà di aver commesso un errore di II tipo o
di II specie.
In entrambi i casi si è presa una decisione sbagliata e quindi si è
commesso un errore di giudizio.
7
Perché una regola di decisione sia buona, essa deve essere
costruita in modo da minimizzare gli errori di decisione.
Ciò non è semplice poiché, per una data grandezza del
campione, i tentativi di diminuire gli errori di un tipo sono in
genere accompagnati da un aumento di errori dell’altro tipo.
Dal momento che in pratica un tipo di errore può essere più
pericoloso di un altro, è naturale cercare il compromesso in modo
da limitare l’errore più importante senza eccedere nell’altro
senso.
Il solo modo per ridurre entrambi gli errori è quello di
aumentare la grandezza del campione. Ciò però non è sempre
possibile.
8
LIVELLO DI SIGNIFICATIVITÀ
Nell’operare un test di ipotesi, la massima probabilità con la
quale si è disposti a rischiare un errore di I tipo è detta
livello di significatività del test. Questa probabilità è spesso
indicata con la lettera α.
Di solito il livello di significatività α è scelto pari a 0,05 (cioè 5%)
oppure 0,01 (cioè 1%).
Ad esempio, scegliendo α = 0,05 ci saranno 5 probabilità su 100
di commettere un errore di I tipo, cioè di rigettare l’ipotesi
statistica che avrebbe dovuto essere accettata.
9
IL CONCETTO DI POTENZA STATISTICA
Si è visto che, nell’analizzare i risultati di uno studio, si può
commettere un errore di II tipo.
La probabilità di commettere questo tipo di errore è
indicata con la lettera .
La potenza dello studio è uguale 1-.
Quindi un test di ipotesi è tanto più potente quanto più è in
grado di minimizzare la probabilità di errore di II tipo, ovvero
quanto più è in grado di evidenziare differenze significative
tra piccole serie di dati.
10
ESEMPIO
Si è visto che, data una variabile
X normalmente distribuita con
media  e deviazione standard ,
la distribuzione campionaria della
media di campioni di numerosità
n segue la curva di Gauss con
media  e deviazione standard
pari a  n .
Per quanto detto sulla curva di
Gauss possiamo essere fiduciosi
al 95% che la media m di un
generico campione di numerosità
n estratto dalla popolazione di
studio cada dentro l’intervallo
[ – 1,96  n ,  + 1,96  n ].
11
Quindi:
se analizzando un campione del quale non si conosce la
provenienza troviamo che il corrispondente valore di m
cade al di fuori di questo intervallo, concluderemo che un
simile evento potrebbe verificarsi con una probabilità minore
del 5% se il campione stesso fosse stato tratto dalla
popolazione di studio (ipotesi nulla).
Potremmo allora asserire che la media campionaria trovata
differisce significativamente (con probabilità di errore di I
tipo inferiore al 5%) da quello che ci aspettavamo sulla base
dell’ipotesi nulla e saremmo propensi a rigettare l’ipotesi nulla
stessa.
12
ALCUNE CONSIDERAZIONI
L’esempio precedente ci dà lo spunto per fare alcune
considerazioni sui test di ipotesi.
Quando ci si propone di confrontare due o più campioni,
si parte dall’ipotesi che essi differiscano solo per l’effetto
del caso (ipotesi nulla).
Il test statistico ci permetterà di verificare la validità di questa
ipotesi, evidenziando quelle situazioni in cui è ragionevole
(altamente probabile) che l’ipotesi nulla sia da rigettare.
Per chiarire le idee si considerino due possibili esempi
applicativi.
13
ESEMPIO A
Presi due campioni di pazienti, prima di effettuare un trattamento
terapeutico in fase di studio ed uno di controllo, si vuole valutare,
per la corretta impostazione statistica, se le due casistiche di
partenza sono omogenee, ossia se le differenze basali che si
riscontrano sono con alta probabilità da imputarsi solo al caso
(ipotesi nulla).
Questo è un classico problema di verifica dell’omogeneità
basale dei gruppi.
In questo caso, se il test applicato non ci permette di rigettare
l’ipotesi nulla, si può ragionevolmente supporre che i due
campioni provengano dalla stessa popolazione e quindi, dopo il
periodo di trattamento, si può passare al punto riportato nel
successivo esempio B.
14
ESEMPIO B
Considerati gli stessi campioni dopo il trattamento, si applica
nuovamente il test per valutare se si può ancora
ragionevolmente supporre che le due casistiche differiscano solo
per effetto del caso (ipotesi nulla).
In questo caso, se il test suggerisce di rigettare l’ipotesi
nulla, si può ipotizzare che i due trattamenti analizzati diano
risultati differenti.
Al contrario, nel caso in cui il test non ci permetta di rifiutare
l’ipotesi nulla, si potrà asserire che i due trattamenti non
portano a risultati significativamente diversi.
15
NOTA BENE
Comunque avvengano dette verifiche, l’ipotesi nulla sarà
sempre respinta o non respinta con una certa probabilità.
La decisione presa non sarà mai certa, dal momento che per
avere la certezza occorrerebbe studiare l’intera popolazione e
non campioni.
Il rischio di sbagliare è comunque valutabile, in particolare:

Il test permette di calcolare la probabilità di errore di I tipo.
 La probabilità di errore di II tipo è legata alla potenza del
test.
16
CONCLUSIONE
I test di ipotesi permettono di giungere ad una
decisione statistica ragionevole, ma non certa.
17
TEST A UNA CODA E A DUE CODE
Nell’esempio considerato in precedenza, per rigettare o meno
l’ipotesi nulla, si è valutato se i valori del riassunto campionario
m cadevano al di fuori o all’interno dell’intervallo [ –1,96  n ,
 +1,96  n ], atteso con probabilità del 95%.
Con riferimento alla figura sotto, si è quindi preso in esame le
due code (quella di destra e quella di sinistra) della
distribuzione campionaria del riassunto, a ciascuna delle
quali corrisponde un’area pari a 0,025.
Un test di questo tipo è detto test a due code o
bidirezionale.
0,95
0,025




0,025

x
18
Alcune volte si è tuttavia interessati a valutare solo se il
riassunto va a cadere in una delle code della distribuzione
(coda di destra oppure di sinistra).
Ciò può accadere, ad esempio, quando siamo certi che due
terapie diano risultati diversi e sottoponiamo a test l’ipotesi
che una terapia sia migliore di un’altra, che è una cosa
diversa dal sottoporre a test l’ipotesi che una terapia sia
diversa (migliore o peggiore) di un’altra.
Test di questo genere sono detti test a una coda o
unidirezionali (o monodirezionali), poiché in questo caso la
regione critica è una regione posta da un solo lato (destro o
sinistro) della distribuzione con un’area uguale al livello di
significatività prescelto.
19