1. Verifica di ipotesi: parte seconda 1.1. Verifica di ipotesi per due campioni. Quando abbiamo due insiemi di dati possiamo chiederci, a seconda della loro natura, se i campioni sono simili oppure no. Ci due casi principali che possono presentarsi. Il primo caso riguarda le proporzioni. Se abbiamo un campione di ampiezza n1 su cui abbiamo rilevato una proporzione di successi p̂1 = x1 /n1 ed un campione di ampiezza n2 con la rispettiva proporzione p̂2 = x2 /n2 possiamo chiederci se l’eventuale differenza riscontrare tra p̂1 e p̂2 sia dovuta al caso oppure no. Si pensi ad esempio a due gruppi di pazienti sottoposti ad un farmaco sperimentale o ad un placebo dove p̂i rappresenta la proporzione di guarigioni nel gruppo i di pazienti. L’ipotesi nulla da sottoporre a test è H0 : p1 = p2 contro un’alternativa che può essere H1 : p1 6= p2 per un test a due code, oppure un’alternativa del tipo H1 : p1 > p2 o H1 : p 1 < p 2 . +x2 La statistica test viene costruita come segue: si pone p̂ = nx11 +n , cioè si calcola la pro2 porzione totale di successi considerando i due gruppi come fossero uno solo e si costruisce z come segue p̂1 − p̂2 z=r p̂(1 − p̂) n11 + n12 La statistica z cosı̀ costruita si distribuisce come una variabile Gaussiana standard e quindi si può procedere come con un qualsiasi test z. 1 2 Test per il confronto tra proporzioni Se p̂1 = x1 /n1 e p̂2 = x2 /n2 sono le proporzioni di successo su due campioni di ampiezza n1 ed n2 rispettivamente, si può costruire un test z per testare l’ipotesi nulla H0 : p1 = p2 contro le usuali alternative come segue: p̂1 − p̂2 z=r 1 1 p̂(1 − p̂) n1 + n2 con p̂ = (x1 + x2 )/(n1 + n2 ). Il test di livello α corrisponde alle seguenti regole di decisione quando H1 : p1 = 6 p2 , Rifiutare H0 se |z| > z1− α2 quando H1 : p1 > p2 , Rifiutare H0 se z > z1−α quando H1 : p1 < p2 , Rifiutare H0 se z < zα Vediamo un esempio: molti anni fa venne condotto uno studio epidemiologico per studiare gli effetti positivi dell’uso di aspirina sulla prevenzione degli attacchi cardiaci. Da un insieme di 22071 medici volontari vennero formati due gruppi: il gruppo di trattamento e quello di controllo. Gli individui del gruppo di trattamento ricevevano una dose quotidiana di aspirina mentre quelli di controllo un farmaco placebo, cioè identico all’aspirina e non contenente alcun principio attivo. Lo studio venne condotto per un periodo di 5 anni osservando il numero di decessi per infarto. Si ottennero i seguenti risultati Esito Infartuati Non Infartuati Totali Farmaco Placebo Aspirina 239 139 378 10795 10898 21693 11034 11037 22071 Prendiamo come p̂1 la percentuale di persone colpite da infarto nel gruppo di controllo, quindi p̂1 = 239/11034 = 0.0217 e di conseguenza p̂2 = 0.0126. Come si vede il numero di infartuati è circa il doppio tra chi non subisce il trattamento rispetto a chi ha ricevuto il farmaco. Verifichiamo se la differenza tra p̂1 e p̂2 è significativa oppure no. Il valore di p̂ lo otteniamo semplicemente: p̂ = 239+139 = 0.0171 e quindi 22071 p̂1 − p̂2 p̂(1 − p̂) n11 + z=r 1 n2 0.0217 − 0.0126 =q 1 0.0171 · (1 − 0.0171) 11034 + 0.0091 0.00175 = 5.2 = 1 11037 1. VERIFICA DI IPOTESI: PARTE SECONDA 3 Eseguiamo un test ad una coda del tipo H1 : p1 > p2 poiché vogliamo stabilire anche la direzione in cui si manifesta una differenza tra gli effetti della somministrazione dei due farmaci. Se il test rifiuta l’ipotesi nulla vuol dire che il non somministrare aspirina aumenta la probabilità di contrarre un infarto. Confrontiamo z = 5.2 con quantile z1−α = z0.99 = 2.33. Poiché z > z1−α il test rifiuta l’ipotesi nulla e gli sperimentatori concluderanno che vi è un effetto protettivo del principio attivo contenuto nell’aspirina rispetto al rischio di infarto cardiaco. Come nota finale resta da dire che la sperimentazione non durò in realtà 5 anni ma venne interrotta per tempo poiché gli sperimentatori non potereno far finta di ignorare che il numero di infartuati del gruppo di controllo era statisticamente più elevato di quello del gruppo di trattamento. Un caso analogo si ha quando si vuole valutare la differenza tra le medie in due campioni anziché tra le proporzioni. La strategia è la sempre la stessa. Indichiamo con x̄1 e x̄2 le medie di due gruppi di ampiezza n1 ed n2 . Si costruisce un test t per verificare l’uguaglianza delle medie come segue x̄1 − x̄2 t= q s̄ n11 + n12 dove s s̄ = (n1 − 1)s̄21 + (n2 − 1)s̄22 n1 + n2 − 2 con s̄21 e s̄22 le varianze campionarie dei due campioni. Questa statistica test t si distribuisce come una t di Student con n1 + n2 − 2 gradi di libertà. Si procederà ad effettuare un test come nel caso di un qualsiasi test t dove però si deve tener conto dei differenti gradi di libertà. 4 Test per il confronto tra medie Se x̄1 , x̄2 , s̄21 e s̄22 sono le medie e le varianze campionarie di due campioni di ampiezza n1 ed n2 , si può costruire un test t per verificare l’ipotesi nulla H0 : µ1 = µ2 contro le usuali alternative come segue: x̄1 − x̄2 t= q s̄ n11 + n12 dove s (n1 − 1)s̄21 + (n2 − 1)s̄22 n1 + n2 − 2 Il test di livello α corrisponde alle seguenti regole di decisione s̄ = quando H1 : µ1 6= µ2 , Rifiutare H0 se |t| > tg1− α 2 quando H1 : µ1 > µ2 , Rifiutare H0 se t > tg1−α quando H1 : µ1 < µ2 , Rifiutare H0 se t < tgα con g = n1 + n2 − 2. Esercizio 1. Su due campioni di autovetture guidate nel primo gruppo da uomini e nel secondo da donne sono stati calcolati i seguenti parametri di spesa annuale: la spesa media per riparazioni e il relativo scostamento medio campionario. Per il primo gruppo di n1 = 5 uomini si è avuto x̄1 = 540¤ con s̄1 = 299¤ e nel secondo gruppo di n2 = 7 donne si è riscontrato x̄2 = 300¤ con s̄2 = 238¤. C’è differenza significativa tra i due gruppi di guidatori in termini di spesa? Si tratta di un test t come quello introdotto sopra. Quindi calcoliamo tutte le quantità in gioco: r (5 − 1) · 2992 + (7 − 1) · 2382 s̄ = = 264 7+5−2 Quindi 540 − 300 q = 1.552 t= 264 15 + 71 Se vogliamo testare l’ipotesi alternativa H1 : µ1 > µ2 dobbiamo calcolare il valore soglia (n1 +n2 −2) t1−α . Se α = 5% otteniamo t10 0.95 = 1.81 e quindi t < 1.81 e non rifiutiamo l’ipotesi nulla in favore del fatto che i guidatori uomini producono danni alle autovetture che sono più costosi, in media, di quelli prodotti dal gruppo delle donne. Esercizio 2 (Grasso è bello). Il peso medio di 50 studenti assidui frequentatori di palestre sportive e campi da gioco è pari a 68.2 kg con scarto quadratico medio associato pari a 2.5 kg. Altri 50 studenti pantofolai hanno invece un peso medio di 67.5 kg con 1. VERIFICA DI IPOTESI: PARTE SECONDA 5 scarto quadratico medio associato pari a 2.8 kg. Sottoporre a verifica l’ipotesi H0 : “lo sport fa ingrassare”. Si tratta di eseguire un test con H0 : µ1 = µ2 contro l’alternativa H1 : µ > µ2 dove il campione numero 1 è quello degli sportivi. Calcoliamo quindi la statistica t x̄1 − x̄2 t= q s̄ n11 + n12 dove r s̄ = (50 − 1) · 2.52 + (50 − 1) · 2.82 = 2.654 50 + 50 − 2 quindi t= 68.2 − 67.5 0.7 q = 1.32 = 0.531 2 s̄ 50 il quantile di t9 81−α per α = 0.05 viene approssimato con z0 .95 = 1.65. Poiché t = 1.32 è inferiore al valore soglia 1.65, il test non consente di rifiutare l’ipotesi nulla. Dunque concludiamo che non ci sono elementi per dire che lo “sport fa ingrassare”.