note PDF

1. Verifica di ipotesi: parte seconda
1.1. Verifica di ipotesi per due campioni. Quando abbiamo due insiemi di dati
possiamo chiederci, a seconda della loro natura, se i campioni sono simili oppure no. Ci
due casi principali che possono presentarsi. Il primo caso riguarda le proporzioni. Se
abbiamo un campione di ampiezza n1 su cui abbiamo rilevato una proporzione di successi
p̂1 = x1 /n1 ed un campione di ampiezza n2 con la rispettiva proporzione p̂2 = x2 /n2
possiamo chiederci se l’eventuale differenza riscontrare tra p̂1 e p̂2 sia dovuta al caso oppure
no. Si pensi ad esempio a due gruppi di pazienti sottoposti ad un farmaco sperimentale
o ad un placebo dove p̂i rappresenta la proporzione di guarigioni nel gruppo i di pazienti.
L’ipotesi nulla da sottoporre a test è H0 : p1 = p2 contro un’alternativa che può essere
H1 : p1 6= p2 per un test a due code, oppure un’alternativa del tipo H1 : p1 > p2 o
H1 : p 1 < p 2 .
+x2
La statistica test viene costruita come segue: si pone p̂ = nx11 +n
, cioè si calcola la pro2
porzione totale di successi considerando i due gruppi come fossero uno solo e si costruisce
z come segue
p̂1 − p̂2
z=r
p̂(1 − p̂) n11 + n12
La statistica z cosı̀ costruita si distribuisce come una variabile Gaussiana standard e
quindi si può procedere come con un qualsiasi test z.
1
2
Test per il confronto tra proporzioni
Se p̂1 = x1 /n1 e p̂2 = x2 /n2 sono le proporzioni di successo su due campioni di ampiezza
n1 ed n2 rispettivamente, si può costruire un test z per testare l’ipotesi nulla H0 : p1 = p2
contro le usuali alternative come segue:
p̂1 − p̂2
z=r
1
1
p̂(1 − p̂) n1 + n2
con p̂ = (x1 + x2 )/(n1 + n2 ). Il test di livello α corrisponde alle seguenti regole di decisione
quando H1 : p1 =
6 p2 , Rifiutare H0 se |z| > z1− α2
quando H1 : p1 > p2 , Rifiutare H0 se z > z1−α
quando H1 : p1 < p2 , Rifiutare H0 se z < zα
Vediamo un esempio: molti anni fa venne condotto uno studio epidemiologico per studiare gli effetti positivi dell’uso di aspirina sulla prevenzione degli attacchi cardiaci. Da un
insieme di 22071 medici volontari vennero formati due gruppi: il gruppo di trattamento
e quello di controllo. Gli individui del gruppo di trattamento ricevevano una dose quotidiana di aspirina mentre quelli di controllo un farmaco placebo, cioè identico all’aspirina
e non contenente alcun principio attivo. Lo studio venne condotto per un periodo di 5
anni osservando il numero di decessi per infarto. Si ottennero i seguenti risultati
Esito Infartuati Non Infartuati Totali
Farmaco
Placebo
Aspirina
239
139
378
10795
10898
21693
11034
11037
22071
Prendiamo come p̂1 la percentuale di persone colpite da infarto nel gruppo di controllo,
quindi p̂1 = 239/11034 = 0.0217 e di conseguenza p̂2 = 0.0126. Come si vede il numero
di infartuati è circa il doppio tra chi non subisce il trattamento rispetto a chi ha ricevuto
il farmaco. Verifichiamo se la differenza tra p̂1 e p̂2 è significativa oppure no. Il valore di
p̂ lo otteniamo semplicemente: p̂ = 239+139
= 0.0171 e quindi
22071
p̂1 − p̂2
p̂(1 − p̂) n11 +
z=r
1
n2
0.0217 − 0.0126
=q
1
0.0171 · (1 − 0.0171) 11034
+
0.0091
0.00175
= 5.2
=
1
11037
1. VERIFICA DI IPOTESI: PARTE SECONDA
3
Eseguiamo un test ad una coda del tipo H1 : p1 > p2 poiché vogliamo stabilire anche la
direzione in cui si manifesta una differenza tra gli effetti della somministrazione dei due
farmaci. Se il test rifiuta l’ipotesi nulla vuol dire che il non somministrare aspirina aumenta
la probabilità di contrarre un infarto. Confrontiamo z = 5.2 con quantile z1−α = z0.99 =
2.33. Poiché z > z1−α il test rifiuta l’ipotesi nulla e gli sperimentatori concluderanno che
vi è un effetto protettivo del principio attivo contenuto nell’aspirina rispetto al rischio di
infarto cardiaco.
Come nota finale resta da dire che la sperimentazione non durò in realtà 5 anni ma
venne interrotta per tempo poiché gli sperimentatori non potereno far finta di ignorare
che il numero di infartuati del gruppo di controllo era statisticamente più elevato di quello
del gruppo di trattamento.
Un caso analogo si ha quando si vuole valutare la differenza tra le medie in due
campioni anziché tra le proporzioni. La strategia è la sempre la stessa. Indichiamo con
x̄1 e x̄2 le medie di due gruppi di ampiezza n1 ed n2 . Si costruisce un test t per verificare
l’uguaglianza delle medie come segue
x̄1 − x̄2
t= q
s̄ n11 + n12
dove
s
s̄ =
(n1 − 1)s̄21 + (n2 − 1)s̄22
n1 + n2 − 2
con s̄21 e s̄22 le varianze campionarie dei due campioni. Questa statistica test t si distribuisce
come una t di Student con n1 + n2 − 2 gradi di libertà. Si procederà ad effettuare un test
come nel caso di un qualsiasi test t dove però si deve tener conto dei differenti gradi di
libertà.
4
Test per il confronto tra medie
Se x̄1 , x̄2 , s̄21 e s̄22 sono le medie e le varianze campionarie di due campioni di ampiezza n1
ed n2 , si può costruire un test t per verificare l’ipotesi nulla H0 : µ1 = µ2 contro le usuali
alternative come segue:
x̄1 − x̄2
t= q
s̄ n11 + n12
dove
s
(n1 − 1)s̄21 + (n2 − 1)s̄22
n1 + n2 − 2
Il test di livello α corrisponde alle seguenti regole di decisione
s̄ =
quando H1 : µ1 6= µ2 , Rifiutare H0 se |t| > tg1− α
2
quando H1 : µ1 > µ2 , Rifiutare H0 se t > tg1−α
quando H1 : µ1 < µ2 , Rifiutare H0 se t < tgα
con g = n1 + n2 − 2.
Esercizio 1. Su due campioni di autovetture guidate nel primo gruppo da uomini e
nel secondo da donne sono stati calcolati i seguenti parametri di spesa annuale: la spesa
media per riparazioni e il relativo scostamento medio campionario. Per il primo gruppo
di n1 = 5 uomini si è avuto x̄1 = 540¤ con s̄1 = 299¤ e nel secondo gruppo di n2 = 7
donne si è riscontrato x̄2 = 300¤ con s̄2 = 238¤. C’è differenza significativa tra i due
gruppi di guidatori in termini di spesa?
Si tratta di un test t come quello introdotto sopra. Quindi calcoliamo tutte le quantità
in gioco:
r
(5 − 1) · 2992 + (7 − 1) · 2382
s̄ =
= 264
7+5−2
Quindi
540 − 300
q
= 1.552
t=
264 15 + 71
Se vogliamo testare l’ipotesi alternativa H1 : µ1 > µ2 dobbiamo calcolare il valore soglia
(n1 +n2 −2)
t1−α
. Se α = 5% otteniamo t10
0.95 = 1.81 e quindi t < 1.81 e non rifiutiamo l’ipotesi
nulla in favore del fatto che i guidatori uomini producono danni alle autovetture che sono
più costosi, in media, di quelli prodotti dal gruppo delle donne.
Esercizio 2 (Grasso è bello). Il peso medio di 50 studenti assidui frequentatori di
palestre sportive e campi da gioco è pari a 68.2 kg con scarto quadratico medio associato
pari a 2.5 kg. Altri 50 studenti pantofolai hanno invece un peso medio di 67.5 kg con
1. VERIFICA DI IPOTESI: PARTE SECONDA
5
scarto quadratico medio associato pari a 2.8 kg. Sottoporre a verifica l’ipotesi H0 : “lo
sport fa ingrassare”.
Si tratta di eseguire un test con H0 : µ1 = µ2 contro l’alternativa H1 : µ > µ2 dove il
campione numero 1 è quello degli sportivi. Calcoliamo quindi la statistica t
x̄1 − x̄2
t= q
s̄ n11 + n12
dove
r
s̄ =
(50 − 1) · 2.52 + (50 − 1) · 2.82
= 2.654
50 + 50 − 2
quindi
t=
68.2 − 67.5
0.7
q
= 1.32
=
0.531
2
s̄ 50
il quantile di t9 81−α per α = 0.05 viene approssimato con z0 .95 = 1.65. Poiché t = 1.32
è inferiore al valore soglia 1.65, il test non consente di rifiutare l’ipotesi nulla. Dunque
concludiamo che non ci sono elementi per dire che lo “sport fa ingrassare”.