Approfondimento 3.3 Approssimazione della distribuzione binomiale alla normale Come aveva notato de Moivre, se il numero di prove è sufficientemente ampio e la probabilità del successo π sufficientemente maggiore di zero − anche se nessuno, poi, ha mai specificato cosa intende per “numero di prove sufficientemente ampio” (alcuni riferiscono maggiore di 5, altri di 10, altri ancora di 30…) e “probabilità di successo π sufficientemente maggiore di zero” − la distribuzione binomiale può essere approssimata alla normale. Solani (2008) suggerisce che questa operazione è possibile date le seguenti condizioni: • Se π < ,05 o π ≥ ,95 e n ≥ 100 • Se ,05 ≤ π < ,10 o ,90 ≤ π < ,95 e n ≥ 50 • Se ,10 ≤ π < ,90 e n ≥ 20 mentre Borra e Di Ciaccio (2008) indicano che la numerosità può considerarsi adeguata quando n × π ≥ 5 e n × (1 − π) ≥ 5. Vediamo come questo sia possibile nella Figura 3.3.1 Con n = 1 prove e p = ,50, la distribuzione è rettangolare, poiché tutti gli esiti possibili hanno probabilità uguale a 0,5. Con n = 2 prove, invece, la distribuzione è triangolare, così come n = 3, ma più andiamo avanti e più la distribuzione comincia a prendere una forma a campana, e in effetti per n = 10 la forma assomiglia a quella della distribuzione normale n = 2, p = ,50 ,60 ,60 ,50 ,50 ,40 ,40 Probabilità Probabilità n = 1, p = ,50 ,30 ,20 ,10 ,30 ,20 ,10 ,00 ,00 -1 0 1 Numero di successi 2 -1 0 Numero di1 successi 2 n = 3, p = ,50 n = 4, p = ,50 ,50 ,50 ,40 ,40 ,20 Probabilità ,60 Probabilità ,60 ,10 ,10 ,30 ,00 -1 3 ,30 ,20 0 1 di successi 2 Numero n = 5, p = ,50 3 4 ,00 -1 0 1 3 Numero di2 successi 4 5 n = 10, p = ,50 Carlo Chiorri, Fondamenti di psicometria – Copyright ©2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia ,60 ,50 ,50 ,40 ,40 Probabilità Probabilità ,60 ,30 ,30 ,20 ,20 ,10 ,10 ,00 -1 ,00 -1 0 1 Numero 2 di successi 3 4 5 6 0 1 2 3 4 5 6 7 8 9 10 11 Numero di successi n = 20, p = ,50 n = 30, p = ,50 ,30 ,20 ,15 Probabilità Probabilità ,20 ,10 ,10 ,05 ,00 -1 0 1 2 3 4 5 6 7 8 9 10111213141516171819202122 Numero di successi ,00 Numero di successi -1 0 1 2 3 4 5 6 7 8 9 1011121314151617181920212223242526272829303132 Figura 3.3.1 Approssimazioni successive della distribuzione binomiale alla normale per p = ,50 L’approssimazione alla normale della distribuzione binomiale vale anche per probabilità di successo diverse da ,50, e quindi distribuzioni binomiali asimmetriche. In questo caso, però, la distribuzione binomiale ha bisogno di un numero maggiore di prove per approssimarsi adeguatamente alla normale. La Figura 3.3.2 e 3.3.3 mostrano i casi di p = ,33 e p =,10 n = 1, p = ,33 n = 2, p = ,33 ,70 ,50 ,40 Probabilità Probabilità ,50 ,30 ,10 ,20 ,10 ,00 -,10 -1 ,30 0 1 Numero di successi n = 3, p = ,33 2 -1 0 Numero di1 successi 2 3 n = 4, p = ,33 Carlo Chiorri, Fondamenti di psicometria – Copyright ©2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia ,50 ,50 ,40 ,40 ,20 Probabilità ,60 Probabilità ,60 ,10 ,10 ,30 ,30 ,20 ,00 -1 0 1 di successi 2 Numero 3 4 ,00 -1 0 1 3 Numero di2 successi 5 n = 10, p = ,33 ,60 ,50 ,50 ,40 ,40 ,30 ,30 ,20 ,20 ,10 ,10 ,00 -1 ,00 -1 Probabilità ,60 Probabilità n = 5, p = ,33 4 0 1 Numero 2 di successi 3 4 5 6 n = 20, p = ,33 0 1 2 Numero 3 4 di5 successi 6 7 8 9 10 11 n = 30, p = ,33 ,30 ,20 ,15 Probabilità Probabilità ,20 ,10 ,10 ,05 ,00 -1 0 1 2 3 4 5 6 7 8 9 10111213141516171819202122 Numero di successi ,00 Numero di successi -1 0 1 2 3 4 5 6 7 8 9 1011121314151617181920212223242526272829303132 Figura 3.3.2 Approssimazioni successive della distribuzione binomiale alla normale per p = ,33 n = 2, p = ,10 1,00 1,00 ,80 ,80 Probabilità Probabilità n = 1, p = ,10 ,60 ,40 ,40 ,20 ,20 ,00 ,00 -1 ,60 0 1 Numero di successi n = 3, p = ,10 2 -1 0 Numero di1 successi 2 3 n = 4, p = ,10 Carlo Chiorri, Fondamenti di psicometria – Copyright ©2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia ,80 ,80 Probabilità 1,00 Probabilità 1,00 ,60 ,60 ,40 ,40 ,20 ,20 ,00 -1 0 1 di successi 2 Numero 3 4 ,00 -1 0 n = 5, p = ,10 1 3 Numero di2 successi 4 5 n = 10, p = ,10 1,00 ,60 ,80 ,50 Probabilità Probabilità ,40 ,60 ,30 ,40 ,20 ,20 ,10 ,00 -1 ,00 -1 0 1Numero 2 di successi 3 4 5 6 n = 20, p = ,10 ,30 0 1 2 Numero 3 4 di5 successi 6 7 8 9 10 11 n = 30, p = ,10 ,30 ,25 ,20 Probabilità Probabilità ,20 ,15 ,10 ,10 ,05 ,00 -1 0 1 2 3 4 5 6 7 8 9 10111213141516171819202122 Numero di successi ,00 Numero di successi -1 0 1 2 3 4 5 6 7 8 9 1011121314151617181920212223242526272829303132 Figura 3.3.3 Approssimazioni successive della distribuzione binomiale alla normale per p = ,10 Supponiamo quindi che ci venga chiesto di determinare quale è la probabilità di ottenere, con una moneta onesta, un numero di teste compreso fra 233 e 260 su 500 lanci. Naturalmente potremmo 500 233 500−233 ,50 ,50 , munirci di (molta) pazienza e metterci a calcolare tutti i vari p(233) = 233 500 234 500−234 500 235 500−235 ,50 ,50 ,50 ,50 p(234) = , p(235) = ,…, 234 235 500 2600 500−260 ,50 ,50 p(260) = , e sommare tutti i risultati, ma comprendente bene che, a meno di 260 farlo fare al computer, è un’impresa improba. Possiamo però sfruttare l’approssimazione della normale alla binomiale, e considerare l’intervallo 233-260 come un intervallo di classe i cui limiti reali siano 232,5 e 260,5. Questa operazione si chiama correzione di continuità, perché non dimenticate che stiamo approssimando ad una distribuzione continua una distribuzione che per sua natura è invece discreta. A questo punto dobbiamo trasformare in punti z i valori 233,5 e 260,5. La Carlo Chiorri, Fondamenti di psicometria – Copyright ©2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia distribuzione binomiale ha media µ = n × p e deviazione standard σ = n × p × q = n × p × (1 − p) , per cui, visto che stiamo considerando il caso di n = 500 lanci, avremo che µ = 500 × 0,50 = 250 e σ = 500×,50×,50 = 11,18. Per cui i punti z corrispondenti sono: 232,5 − 250 104 − 100 z1 = = −1,56 z2 = = 0,94 11,18 15 A questo punto il procedimento è identico a quello già visto nel caso della distribuzione normale standardizzata. Dobbiamo calcolare la somma delle due aree della Figura 3.3.4 Figura 3.3.4 Area di probabilità compresa fra 233 e 260 successi Le aree si ricavano dalla tavola dei punti z (Figura 3.3.5): Figura 3.3.5 Valori di probabilità per punteggi z compresi fra la media e -1,56 e fra la media e 0,94 Carlo Chiorri, Fondamenti di psicometria – Copyright ©2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia Poiché i due valori di area sono ,4406 e ,3264, la soluzione è: p(233 < successi < 260) → p(-1,56 < z < 0,94) = p(-1,56 < z < 0) + p(0 < z < 0,94) = ,4406 + ,3264 = ,7670 La probabilità di estrarre un punteggio ottenere un numero di teste compreso fra 233 e 260 con una moneta onesta è dunque del 76,70%. Se avessimo calcolato tutte le probabilità esatte con le formule viste nel paragrafo 2.1 di questo capitolo il risultato sarebbe stato 76,75%. Carlo Chiorri, Fondamenti di psicometria – Copyright ©2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia