Esercizio 3A (26.02.2009, circa 1.5 ore)

annuncio pubblicitario
Laboratorio di Didattica di elaborazione dati – 3A
LA DISTRIBUZIONE DI BERNOULLI (BINOMIALE)
LA DISTRIBUZIONE DI POISSON
La distribuzione binomiale rappresenta la distribuzione di probabilità di prove ripetute indipendenti
quando i risultati di ciascuna prova sono solo due. Questa distribuzione può essere utilizzata per
descrivere tutti i casi in cui gli esiti possibili di una prova (come in lancio di una moneta) possono
essere ridotti a due. Indichiamo con p la probabilità di successo in ciascuna prova (costante per
tutte le prove). Con q=1-p indichiamo la probabilità di insuccesso in ciascuna prova. X è la
variabile aleatoria binomiale che indica il numero di successi in n prove, X può assumere i valori 0
(nessun successo), 1 (esattamente 1 successo), ..., n (successi in tutte le prove), quindi abbiamo una
distribuzione discrete. La probabilità di ottenere esattamente x successi è:

P  X =x = n p x q n− x ,
x
dove
nx= n−xn!! x! .
Ad esempio in un lancio di un dado possiamo indicare con successo l'uscita della faccia
contrassegnata 6 e con insuccesso l'uscita di qualsiasi altra faccia, ottenendo p=1/6 e q=5/6.
Usando la formula sopra possiamo calcolare la probabilità di ottenere, ad esempio, 4 successi
(x=4) in 7 prove (n=7), calcolando P(X=4). Nota che le probabilità non cambiano e le prove sono
indipendenti.
La speranza matematica (che indicharemo con μ o E(X)) è un valore numerico costante che si
ottiene calcolando la media aritmetica pesata di tutti i valori della variabile. I pesi utilizzati nel
calcolo sono le probabilità associate ad ogni singolo valore che la variabile può assumere (P(X=x)).
Qundi la speranza matematica si esprime con:
n
=E  X = ∑ x P  X = x .
x=0
La speranza matematica permette di definire la localizzazione della distribuzione. Per la
distribuzione di Bernoulli per la speranza matematica si ottiene semplicemente =np.
Laboratorio di Didattica di elaborazione dati
2008-2009, Jacek Dziedzic
1. Vedi sopra come si esprime (per la distribuzione di
Bernoulli) la probabilità di ottenere x successi nelle
n prove, se in ogni prova la probabilità di un successo
è p. Cerca di calcolarla usando Excel, per alcuni x, n e
p dati nelle tre seguenti celle. All'inizio prova a
metterlo in modo manuale, cioè digita la formula
opportuna. Il fattoriale di un numero ti restituisce la
funzione FATTORIALE(). Poi, verifica la tua formula usando la funzione DISTRIB.BINOM().
Questa funzione prende 4 argomenti, il primo è x, il secondo – n, il terzo – p. Il quarto
argomento è un valore logico, che specifica se vogliamo calcolare la probabilità cumulativa
o no. Mettendo FALSO, possiamo calcolare la probabilità di ottenere esattamente x successi:
P(X=x). Mettendo VERO, la funzione restituirà la probabilità di ottenere al massimo x successi:
P(X≤x). Hai ottenuto gli stessi risultati? Verifica cosa succederà quando il numero di prove
è maggiore a 170. Qual è la causa?
2. L'emofilia è una malattia ereditaria, caratterizzata da una ritardata coagulazione del sangue.
Nella maggioranza dei casi l'emofilia si manifesta esclusivamente nei maschi, le donne
possono solo trasmettere la malattia1. Si stima che approsivamente tra 5000 uomini ci sia un
uomo emofilico. In un convitto maschile abitano 140 ragazzi. Assumendo che lo stato di
salute di ciascun ragazzo è indipendente dallo stato di salute dei altri ragazzi, usa Excel per
calcolare:
a. La probabilità che non ci sia uno studente emofilico in questo convitto (tutti siano sani).
b. La probabilità che ci sia esattamente uno studente emofilico in questo convitto.
c. La probabilità che ci siano esattamente due studenti emofilici in questo convitto.
d. La probabilità che ci siano al massimo tre studenti emofilici in questo convitto.
e. La probabilità che ci siano al minimo due studenti emofilici in questo convitto.
Io ho ottenuto: a) 97.2%, b) 2.72%, c) 0.038%, d) 99.9999976%, e) 0.03821%.
1 Infatti un padre emofilico ed una madre che trasmette emofilia possono avere una figlia emofilica, ma questo succede
molto raramente.
Laboratorio di Didattica di elaborazione dati
2008-2009, Jacek Dziedzic
3. Il daltonismo consiste in un'inabilità a percepire i colori (tipicamente si confonda il rosso con
il verde). Circa 8% degli maschi soffre di daltonismo. Crea un grafico della probabilità
P(X=x) che x studenti nel nostro convitto soffrono di daltonismo, assumendo la distribuzione
di Bernoulli. Solitamente per visualizzare tali dati si usa l'istogramma, però nel programma
Excel questo tipo di grafico ha tante limitazioni (per esempio l'asse X deve cominciare
dall'uno, mentre noi vogliamo che cominci dallo zero). Per questo motivo, useremo il grafico
X-Y. Inserisci il grafico e limita il raggio sull'asse X dalla destra affinché se ne possa leggere
di più. Leggi dal grafico o dalla tabella il numero più probabile dei ragazzi che soffrono di
daltonismo (la moda). Ricorda la formula per la speranza matematica di una variabile
binomiale e calcola il numero medio dei ragazzi daltonici (arrotondalo a 0 cifre dopo la
virgola, perché non vogliamo avere "frazioni di ragazzi").
Non digitare i valori
di x a mano, usa una
formula!
Laboratorio di Didattica di elaborazione dati
2008-2009, Jacek Dziedzic
4. È interessante notare che solo il 4% degli uomini di colore soffrano di daltonismo.
Sovrapponi al nostro grafico un grafico che mostra la stessa dipendenza, ma assumendo che
tutti i ragazzi nello convitto sono di colore. Quale grafico ha un'assimetria maggiore? Leggi
dal grafico la moda. Calcola la speranza matematica. Verifica se il valore medio (la speranza
matematica) è uguale alla moda, o no.
È possibile mostrare che quando n → ∞ e p → 0 (un numero grande delle prove e piccola
probabiltà di un succeso), la probabilità P(X=x) di ottenere x successi è data con:
P  X =x =
1 x −x
 e ,
x!
dove =np , il valore medio. Questa distribuzione si chiama la distribuzione di Poisson o la
distribuzione degli eventi rari (perché la probabilità di un successo è molto piccola). Assumendo la
distribuzione di Poisson è possibile ottenere una notevole semplificazione dei calcoli, è per questo
motivo si spesso aprossima la distribuzione di Bernoulii con la distribuzione di Poisson, ma solo
quando le seguenti condizioni sono soddisfatte:
● la probabilità di successo è molto piccola,
● il numero delle prove è molto elevato,
● il prodotto np è una quantita finita.
Ora ci occupiamo solo con il caso in cui tutti i ragazzi nel convitto sono di colore (e, quindi, p=0.04)
Verifica se le condizioni date sopra sono soddisfatte nel nostro caso. Nella colonna seguente calcola
le stesse probabilità, ma usando la distribuzione di Poisson. Usa la funzione POISSON(), che prende
tre argomenti. Il primo è il numero degli eventi (x), il secondo – la speranza matematica (λ=np).
L'ultimo argomento ha lo stesso significato della distribuzione di Bernoulli. Aggiungi i valori
ottenuti al grafico. Secondo te, la distribuzione di Poisson approsima bene la distribuzione di
Bernoulli in questo caso?
Laboratorio di Didattica di elaborazione dati
2008-2009, Jacek Dziedzic
Nelle due colonne seguenti calcola: l'errore (scarto) assoluto che abbiamo fatto aprossimando la
distribuzione di Bernoulli con la distribuzione di Poisson (cioè PPoisson(X=x)-PBernoulli(X=x)) e l'errore
relativo (percentuale) (cioè lo stesso diviso PBernoulli(X=x)). Secondo te, utilizzando la distribuzione di
Poisson al posto della distribuzione di Bernouli commetiamo un errore significativo? (in questo caso)
5. Nel ristorante “Americana” si fa la pizza in 16 forni elettrici, di cui ciascuno consuma 4 kW
di potenza elettrica. I fusibili globali del ristorante saltano con la corrente che corrisponde alla
potenza di 50 kW. Ogni forno viene usato in media per 12 minuti all'ora (tranne l'ora di
pranzo) oppure per 30 minuti durante l'ora di pranzo (il picco). Qualora i forni fossero
utilizzati indipendentemente, quale sarebbe la probabilità, per qualsiasi ora (a) tranne il picco,
(b) durante il picco che le fusibili venissero saltati?
Laboratorio di Didattica di elaborazione dati
2008-2009, Jacek Dziedzic
Scarica