Laboratorio di Didattica di elaborazione dati – 3A LA DISTRIBUZIONE DI BERNOULLI (BINOMIALE) LA DISTRIBUZIONE DI POISSON La distribuzione binomiale rappresenta la distribuzione di probabilità di prove ripetute indipendenti quando i risultati di ciascuna prova sono solo due. Questa distribuzione può essere utilizzata per descrivere tutti i casi in cui gli esiti possibili di una prova (come in lancio di una moneta) possono essere ridotti a due. Indichiamo con p la probabilità di successo in ciascuna prova (costante per tutte le prove). Con q=1-p indichiamo la probabilità di insuccesso in ciascuna prova. X è la variabile aleatoria binomiale che indica il numero di successi in n prove, X può assumere i valori 0 (nessun successo), 1 (esattamente 1 successo), ..., n (successi in tutte le prove), quindi abbiamo una distribuzione discrete. La probabilità di ottenere esattamente x successi è: P X =x = n p x q n− x , x dove nx= n−xn!! x! . Ad esempio in un lancio di un dado possiamo indicare con successo l'uscita della faccia contrassegnata 6 e con insuccesso l'uscita di qualsiasi altra faccia, ottenendo p=1/6 e q=5/6. Usando la formula sopra possiamo calcolare la probabilità di ottenere, ad esempio, 4 successi (x=4) in 7 prove (n=7), calcolando P(X=4). Nota che le probabilità non cambiano e le prove sono indipendenti. La speranza matematica (che indicharemo con μ o E(X)) è un valore numerico costante che si ottiene calcolando la media aritmetica pesata di tutti i valori della variabile. I pesi utilizzati nel calcolo sono le probabilità associate ad ogni singolo valore che la variabile può assumere (P(X=x)). Qundi la speranza matematica si esprime con: n =E X = ∑ x P X = x . x=0 La speranza matematica permette di definire la localizzazione della distribuzione. Per la distribuzione di Bernoulli per la speranza matematica si ottiene semplicemente =np. Laboratorio di Didattica di elaborazione dati 2008-2009, Jacek Dziedzic 1. Vedi sopra come si esprime (per la distribuzione di Bernoulli) la probabilità di ottenere x successi nelle n prove, se in ogni prova la probabilità di un successo è p. Cerca di calcolarla usando Excel, per alcuni x, n e p dati nelle tre seguenti celle. All'inizio prova a metterlo in modo manuale, cioè digita la formula opportuna. Il fattoriale di un numero ti restituisce la funzione FATTORIALE(). Poi, verifica la tua formula usando la funzione DISTRIB.BINOM(). Questa funzione prende 4 argomenti, il primo è x, il secondo – n, il terzo – p. Il quarto argomento è un valore logico, che specifica se vogliamo calcolare la probabilità cumulativa o no. Mettendo FALSO, possiamo calcolare la probabilità di ottenere esattamente x successi: P(X=x). Mettendo VERO, la funzione restituirà la probabilità di ottenere al massimo x successi: P(X≤x). Hai ottenuto gli stessi risultati? Verifica cosa succederà quando il numero di prove è maggiore a 170. Qual è la causa? 2. L'emofilia è una malattia ereditaria, caratterizzata da una ritardata coagulazione del sangue. Nella maggioranza dei casi l'emofilia si manifesta esclusivamente nei maschi, le donne possono solo trasmettere la malattia1. Si stima che approsivamente tra 5000 uomini ci sia un uomo emofilico. In un convitto maschile abitano 140 ragazzi. Assumendo che lo stato di salute di ciascun ragazzo è indipendente dallo stato di salute dei altri ragazzi, usa Excel per calcolare: a. La probabilità che non ci sia uno studente emofilico in questo convitto (tutti siano sani). b. La probabilità che ci sia esattamente uno studente emofilico in questo convitto. c. La probabilità che ci siano esattamente due studenti emofilici in questo convitto. d. La probabilità che ci siano al massimo tre studenti emofilici in questo convitto. e. La probabilità che ci siano al minimo due studenti emofilici in questo convitto. Io ho ottenuto: a) 97.2%, b) 2.72%, c) 0.038%, d) 99.9999976%, e) 0.03821%. 1 Infatti un padre emofilico ed una madre che trasmette emofilia possono avere una figlia emofilica, ma questo succede molto raramente. Laboratorio di Didattica di elaborazione dati 2008-2009, Jacek Dziedzic 3. Il daltonismo consiste in un'inabilità a percepire i colori (tipicamente si confonda il rosso con il verde). Circa 8% degli maschi soffre di daltonismo. Crea un grafico della probabilità P(X=x) che x studenti nel nostro convitto soffrono di daltonismo, assumendo la distribuzione di Bernoulli. Solitamente per visualizzare tali dati si usa l'istogramma, però nel programma Excel questo tipo di grafico ha tante limitazioni (per esempio l'asse X deve cominciare dall'uno, mentre noi vogliamo che cominci dallo zero). Per questo motivo, useremo il grafico X-Y. Inserisci il grafico e limita il raggio sull'asse X dalla destra affinché se ne possa leggere di più. Leggi dal grafico o dalla tabella il numero più probabile dei ragazzi che soffrono di daltonismo (la moda). Ricorda la formula per la speranza matematica di una variabile binomiale e calcola il numero medio dei ragazzi daltonici (arrotondalo a 0 cifre dopo la virgola, perché non vogliamo avere "frazioni di ragazzi"). Non digitare i valori di x a mano, usa una formula! Laboratorio di Didattica di elaborazione dati 2008-2009, Jacek Dziedzic 4. È interessante notare che solo il 4% degli uomini di colore soffrano di daltonismo. Sovrapponi al nostro grafico un grafico che mostra la stessa dipendenza, ma assumendo che tutti i ragazzi nello convitto sono di colore. Quale grafico ha un'assimetria maggiore? Leggi dal grafico la moda. Calcola la speranza matematica. Verifica se il valore medio (la speranza matematica) è uguale alla moda, o no. È possibile mostrare che quando n → ∞ e p → 0 (un numero grande delle prove e piccola probabiltà di un succeso), la probabilità P(X=x) di ottenere x successi è data con: P X =x = 1 x −x e , x! dove =np , il valore medio. Questa distribuzione si chiama la distribuzione di Poisson o la distribuzione degli eventi rari (perché la probabilità di un successo è molto piccola). Assumendo la distribuzione di Poisson è possibile ottenere una notevole semplificazione dei calcoli, è per questo motivo si spesso aprossima la distribuzione di Bernoulii con la distribuzione di Poisson, ma solo quando le seguenti condizioni sono soddisfatte: ● la probabilità di successo è molto piccola, ● il numero delle prove è molto elevato, ● il prodotto np è una quantita finita. Ora ci occupiamo solo con il caso in cui tutti i ragazzi nel convitto sono di colore (e, quindi, p=0.04) Verifica se le condizioni date sopra sono soddisfatte nel nostro caso. Nella colonna seguente calcola le stesse probabilità, ma usando la distribuzione di Poisson. Usa la funzione POISSON(), che prende tre argomenti. Il primo è il numero degli eventi (x), il secondo – la speranza matematica (λ=np). L'ultimo argomento ha lo stesso significato della distribuzione di Bernoulli. Aggiungi i valori ottenuti al grafico. Secondo te, la distribuzione di Poisson approsima bene la distribuzione di Bernoulli in questo caso? Laboratorio di Didattica di elaborazione dati 2008-2009, Jacek Dziedzic Nelle due colonne seguenti calcola: l'errore (scarto) assoluto che abbiamo fatto aprossimando la distribuzione di Bernoulli con la distribuzione di Poisson (cioè PPoisson(X=x)-PBernoulli(X=x)) e l'errore relativo (percentuale) (cioè lo stesso diviso PBernoulli(X=x)). Secondo te, utilizzando la distribuzione di Poisson al posto della distribuzione di Bernouli commetiamo un errore significativo? (in questo caso) 5. Nel ristorante “Americana” si fa la pizza in 16 forni elettrici, di cui ciascuno consuma 4 kW di potenza elettrica. I fusibili globali del ristorante saltano con la corrente che corrisponde alla potenza di 50 kW. Ogni forno viene usato in media per 12 minuti all'ora (tranne l'ora di pranzo) oppure per 30 minuti durante l'ora di pranzo (il picco). Qualora i forni fossero utilizzati indipendentemente, quale sarebbe la probabilità, per qualsiasi ora (a) tranne il picco, (b) durante il picco che le fusibili venissero saltati? Laboratorio di Didattica di elaborazione dati 2008-2009, Jacek Dziedzic