Università del Piemonte Orientale Corso di laurea in biotecnologie Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale 1 In questa lezione parleremo di: Distribuzioni teoriche di probabilità. Distribuzione di probabilità binomiale Calcolo del valore di probabilità di un evento secondo il modello binomiale Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale 2 Riprendiamo alcune definizioni: Qualsiasi caratteristica che può essere misurata o categorizzata: Variabile Variabile che può assumere diversi valori per effetto del caso: Variabile casuale Le variabili possono essere categoriche (binarie, nominali, ordinali) o numeriche (discrete, continue). Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale 3 Abbiamo visto che possiamo costruire in modo empirico la distribuzione di frequenza di una variabile in un gruppo di soggetti. es. 0.06 0.04 0.02 0.00 26 34 42 50 58 66 74 82 90 ETA Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale 4 Potremmo compiere un passo successivo se potessimo identificare una curva matematica che descrive l'andamento del grafico. In tal modo potremmo: - descrivere la distribuzione dei dati senza bisogno di mostrarli ma solo in base ai parametri della curva matematica. - usare i parametri delle rispettive curve per confrontare gruppi di soggetti diversi. - costruire una distribuzione di frequenza attesa, sulla base dei valori dei parametri. Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale 5 0.06 0.04 0.02 0.00 26 34 42 50 58 66 74 82 90 ETA Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale 6 L'uso di modelli matematici è comune alla maggior parte delle discipline: ad esempio, la curva esponenziale può essere usata per descrivere la crescita del numero di batteri in laboratorio, in assenza di condizioni limitanti y = ae bt - I parametri sono a (numero iniziale) e b (velocità di crescita). Stimati questi parametri possiamo stimare il numero di batteri a determinati intervalli (t) dall'inizio dell'esperimento. - il parametro b corrisponde alla velocità di accrescimento, che possiamo confrontare per ceppi diversi di ceppi diversi Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale 7 curve di crescita esponenziale 9000 8000 b=0,4 b=0,5 7000 6000 n 5000 4000 3000 2000 1000 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 t Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale 8 La funzione matematica che descrive un fenomeno (biologico, statistico ecc ) è definita 'MODELLO'. In questo caso possiamo parlare di Modello esponenziale della crescita batterica. - Un modello adeguato è un modello che descrive gli aspetti importanti del fenomeno che vogliamo studiare, senza entrare in dettagli inutili. Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale 9 - curve di crescita esponenziale 9000 8000 b=0,4 b=0,5 7000 6000 n 5000 4000 3000 2000 1000 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 t Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale 10 Anche in statistica possiamo identificare dei modelli che costituiscono una rappresentazione sintetica dei dati o del fenomeno che vogliamo studiare. Spesso però è difficile trovare un modello che descrive esattamente i dati. Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale 11 0.06 0.04 0.02 0.00 26 34 42 50 58 66 74 82 90 ETA Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale 12 In questo caso una curva a campana potrebbe essere un buon modello, anche se non perfettamente soddisfacente (la curva che interpola l'istogramma non è simmetrica ) 0.06 0.04 0.02 0.00 26 34 42 50 58 66 74 82 90 ETA Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale 13 Quale modello si applica alla distribuzione di eventi discreti? ad esempio: quanti sono i bambini maschi in famiglie con 4 figli?. % frequenza relativa di figli maschi in famiglie di 4 figli 40,0% 35,0% 30,0% 25,0% 20,0% 15,0% 10,0% 5,0% 0,0% 0 1 2 3 4 numero maschi Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale 14 La distribuzione binomiale si usa per rispondere a problemi di questo tipo: ‘Qual è la probabilità di avere un certo numero di successi (r) dato un certo numero di prove (N)’? Il problema viene condotto ad una formulazione binaria (successo / insuccesso). Debbo conoscere la probabilità di successo (π) La probabilità di insuccesso (1-π) Tali probabilità sono costanti, corrispondendo ad eventi indipendenti. Il parametro che definisce la funzione è π. (viene utilizzata una lettera greca quando ci si riferisce alla probabilità calcolata sulla popolazione). Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale 15 La funzione binomiale, in modo analogo alle altre funzioni di probabilità, consente di prevedere la probabilità associata ad un dato evento. La previsione è, come sempre, condizionata alla correttezza delle assunzioni di partenza (scelta della funzione più appropriata, valore dei parametri della distribuzione). Nelle lezioni successive vedremo come si possono confrontare le probabilità (o le frequenze) osservate con quelle attese. Adesso vediamo come si calcola la frequenza attesa quando si può applicare il modello di probabilità binomiale. Incominciamo in modo empirico esaminando la forma della distribuzione binomiale al variare del numero di prove e della probabilità di successo. Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale 16 Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale 17 Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale 18 Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale 19 Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale 20 Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale 21 In sintesi: La distribuzione è simmetrica per π = 0,5 e diventa progressivamente asimmetrica per valori di π inferiori o superiori. La distribuzione assume progressivamente una forma a campana ('di Gauss') con l'aumento del numero di prove. Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale 22 Costruiamo la formula della distribuzione di probabilità binomiale Un fenomeno ha una probabilità di verificarsi (probabilità di successo)= π L'evento complementare ha una probabilità di verificarsi (probabilità di insuccesso)= 1-π Nel caso di una estrazione, la probabilità di successo sarà = π Nel caso di due estrazioni, i cui risultati sono indipendenti, la probabilità di successo ad entrambe sarà = π * π = π2 Nel caso di tre estrazioni, i cui risultati sono indipendenti, la probabilità di successo ad entrambe sarà = π * π * π = π3 ecc. ecc. Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale 23 Allo stesso modo possiamo calcolare la probabilità di insuccesso su diverse prove. Nel caso di una estrazione, la probabilità di insuccesso sarà = 1-π Nel caso di due estrazioni, i cui risultati sono indipendenti, la probabilità di insuccesso ad entrambe sarà = (1-π) * (1-π) = (1-π)2 Nel caso di tre estrazioni, i cui risultati sono indipendenti, la probabilità di insuccesso a tutte sarà = (1-π) * (1-π) *(1-π) = (1-π)3 ecc. ecc. Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale 24 Possiamo generalizzare e giungere alla formula che ci consente di calcolare la probabilità di un qualsiasi numero (r) di successi in un qualsiasi numero (N) di prove. (π)r (1-π)(N-r) La probabilità di un ‘successo’ è elevata al numero di ‘successi’ e moltiplicata alla probabilità di ‘insuccesso’ elevata al numero di ‘insuccessi’. Si applica pertanto la regola della probabilità di eventi indipendenti. Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale 25 Esiste un ultimo problema: lo stesso numero di successi si può ottenere con diverse sequenze di risultati. Es 2 successi in 3 prove: aab aba baa La seguente tabella ricostruisce lo spazio campionario di un esperimento con 3 prove. Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale 26 Numero Primo figlio Secondo f. Terzo f. figli maschi F F F 0 M F F 1 F M F 1 F F M 1 M M F 2 M F M 2 F M M 2 M M M 3 Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale 27 Numero Primo figlio Secondo f. Terzo f. In quanti modi si figli maschi ottiene lo stesso numero di successi F F F 0 M F F 1 F M F 1 F F M 1 M M F 2 M F M 2 F M M 2 M M M 3 Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale 1 3 3 1 28 Il coefficiente binomiale indica il numero di modi in cui possiamo ottenere r successi in N prove. N r ( ) : Coefficiente Binomiale. N r ( ) = N! r!×( N − r )! N! = N * (N-1) * .... * 4 * 3 * 2 * 1 Viene indicato come ‘fattoriale di N’ Attenzione 0! = 1 Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale 29 Numero Coefficiente Primo figlio Secondo f. Terzo f. figli maschi binomiale F F F 0 M F F 1 F M F 1 F F M 1 M M F 2 M F M 2 F M M 2 M M M 3 Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale 1 3 3 1 30 La formula complessiva è: P(r successi su N prove) = (N) r (π)r (1-π)(N-r) Coefficiente binomiale Probabilità degli insuccessi Probabilità dei successi Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale 31 Numero Primo figlio Secondo f. Terzo f. figli maschi probabilità F F F 0 (1-p) (1-p) (1-p) M F F 1 p (1-p) (1-p) F M F 1 (1-p) p (1-p) F F M 1 (1-p) (1-p) p M M F 2 p p (1-p) M F M 2 p (1-p) p F M M 2 (1-p) p p M M M 3 ppp Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale 32 Numero Coeff. bin. Primo figlio Secondo f. Terzo f. figli maschi F F F 0 M F F 1 F M F 1 F F M 1 M M F 2 M F M 2 F M M 2 M M M 3 probabilità 1 (1-p) (1-p) (1-p) 3 (1-p) (1-p) p 3 (1-p) p p 1 ppp Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale 33 Es. Probabilità di ottenere 4 croci su 10 lanci di moneta (π)= 0,5 (1-π) = 0,5 r= 4 n = 10 p(r=4 su N=10) = [10! / (4! 6! )] x 0,54 x 0,56 = 210 * 0,0625 * 0,015625 = 0,205 Interpretazione: ‘Se la moneta è equilibrata e quindi tale per cui la probabilità di un dato risultato (es. testa) a ciascun lancio è pari a 0,5 (π = 0,5) la probabilità di avere 4 risultati in una serie di 10 lanci è 0,205’ Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale 34 Questa tabella riassume i valori di probabilità associati a ciascuno dei possibili risultati di un esperimento di 10 lanci di moneta. r=croce π=0.5 N r 10 10 10 10 10 10 10 10 10 10 10 0 1 2 3 4 5 6 7 8 9 10 N-r Coefficiente Binomiale 10 1 9 10 8 45 7 120 6 210 5 252 4 210 3 120 2 45 1 10 0 1 1-π=0,5 π^r (1-π)^(N-r) 1,0000000000 0,5000000000 0,2500000000 0,1250000000 0,0625000000 0,0312500000 0,0156250000 0,0078125000 0,0039062500 0,0019531250 0,0009765625 0,0009765625 0,0019531250 0,0039062500 0,0078125000 0,0156250000 0,0312500000 0,0625000000 0,1250000000 0,2500000000 0,5000000000 1,0000000000 Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale Valore di probabilità 0,001 0,010 0,044 0,117 0,205 0,246 0,205 0,117 0,044 0,010 0,001 35 Distribuzione binomiale N=10, p=0.5 0,300 0,250 0,200 0,150 prob 0,100 0,050 0,000 0 1 2 3 4 5 6 7 Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale 8 9 10 36 distribuzione binomiale con densità e probabilità cumulativa 1,000 0,900 0,800 probabilità 0,700 0,600 0,500 0,400 0,300 0,200 0,100 0,000 0 1 2 3 4 5 6 7 8 9 10 0,500 0,001 0,010 0,044 0,117 0,205 0,246 0,205 0,117 0,044 0,010 0,001 pcum 0,001 0,011 0,055 0,172 0,377 0,623 0,828 0,945 0,989 0,999 1,000 successi Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale 37 La tabella seguente mostra l’effetto della variazione del parametro (π) π=0,75 N r 10 10 10 10 10 10 10 10 10 10 10 0 1 2 3 4 5 6 7 8 9 10 N-r Coefficiente Binomiale 10 1 9 10 8 45 7 120 6 210 5 252 4 210 3 120 2 45 1 10 0 1 1-π=0,25 π^r (1-π)^(N-r) 1,0000000000 0,7500000000 0,5625000000 0,4218750000 0,3164062500 0,2373046875 0,1779785156 0,1334838867 0,1001129150 0,0750846863 0,0563135147 0,0000009537 0,0000038147 0,0000152588 0,0000610352 0,0002441406 0,0009765625 0,0039062500 0,0156250000 0,0625000000 0,2500000000 1,0000000000 Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale Valore di probabilità 0,000 0,000 0,000 0,003 0,016 0,058 0,146 0,250 0,282 0,188 0,056 38 Distribuzione binomiale N=10, p=0.75 0,300 0,250 0,200 0,150 0,100 0,050 0,000 0 1 2 3 4 5 6 7 8 9 Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale 10 39 Spesso la domanda posta è: ‘Qual è la probabilità di avere almeno un certo numero di successi (r) dato un certo numero di prove (N)’? In questo caso: 1 Calcolo la probabilità per tutti i numeri interi (r’) compresi tra r ed N (inclusi) 2 Sommo la probabilità per ciascuno degli interi compresi tra r ed N P(r’>=r in N prove) = p(r) + p(r+1) + …+ p(N-1) + p(N) Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale 40 Ad esempio: probabilità di 8 o più successi su 10 prove con p=0,5 0 1 2 3 4 5 6 7 8 9 10 0,000977 0,009766 0,043945 0,117188 0,205078 0,246094 0,205078 0,117188 0,043945 0,009766 0,000977 Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale 41 0,300 0,250 0,200 0,150 0,100 0,050 0,000 0 1 2 3 4 5 6 7 Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale 8 9 1 0 42 Probabilità di 32 o più successi con 50 prove e p=0,5 0,12 0,1 0,08 0,06 0,04 0,02 0 0 2 4 6 8 1 0 1 2 1 4 1 6 1 8 2 0 2 2 2 4 2 6 2 8 3 0 3 2 3 4 3 6 3 8 4 0 Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale 4 2 4 4 4 6 4 8 5 0 43 Esercizi. - Quali sono i tre presupposti per poter applicare correttamente il modello di distribuzione binomiale? - p. 148, n.10 - p. 148, n.11 Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale 44