Università del Piemonte Orientale
Corso di laurea in biotecnologie
Corso di Statistica Medica
Le distribuzioni teoriche di probabilità.
La distribuzione di probabilità binomiale
Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale
1
In questa lezione parleremo di:
Distribuzioni teoriche di probabilità.
Distribuzione di probabilità binomiale
Calcolo del valore di probabilità di un evento secondo il modello binomiale
Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale
2
Riprendiamo alcune definizioni:
Qualsiasi caratteristica che può essere misurata o categorizzata: Variabile
Variabile che può assumere diversi valori per effetto del caso: Variabile casuale
Le variabili possono essere categoriche (binarie, nominali, ordinali) o numeriche
(discrete, continue).
Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale
3
Abbiamo visto che possiamo costruire in modo empirico la distribuzione di frequenza di
una variabile in un gruppo di soggetti.
es.
0.06
0.04
0.02
0.00
26
34
42
50
58
66
74
82
90
ETA
Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale
4
Potremmo compiere un passo successivo se potessimo identificare una curva
matematica che descrive l'andamento del grafico.
In tal modo potremmo:
- descrivere la distribuzione dei dati senza bisogno di mostrarli ma solo in base ai
parametri della curva matematica.
- usare i parametri delle rispettive curve per confrontare gruppi di soggetti diversi.
- costruire una distribuzione di frequenza attesa, sulla base dei valori dei parametri.
Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale
5
0.06
0.04
0.02
0.00
26
34
42
50
58
66
74
82
90
ETA
Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale
6
L'uso di modelli matematici è comune alla maggior parte delle discipline: ad
esempio, la curva esponenziale può essere usata per descrivere la crescita del
numero di batteri in laboratorio, in assenza di condizioni limitanti
y = ae
bt
- I parametri sono a (numero iniziale) e b (velocità di crescita). Stimati questi
parametri possiamo stimare il numero di batteri a determinati intervalli (t) dall'inizio
dell'esperimento.
- il parametro b corrisponde alla velocità di accrescimento, che possiamo
confrontare per ceppi diversi di ceppi diversi
Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale
7
curve di crescita esponenziale
9000
8000
b=0,4
b=0,5
7000
6000
n
5000
4000
3000
2000
1000
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
t
Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale
8
La funzione matematica che descrive un fenomeno (biologico, statistico ecc ) è definita
'MODELLO'. In questo caso possiamo parlare di Modello esponenziale della crescita
batterica.
-
Un modello adeguato è un modello che descrive gli aspetti importanti del fenomeno che
vogliamo studiare, senza entrare in dettagli inutili.
Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale
9
-
curve di crescita esponenziale
9000
8000
b=0,4
b=0,5
7000
6000
n
5000
4000
3000
2000
1000
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
t
Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale
10
Anche in statistica possiamo identificare dei modelli che costituiscono una
rappresentazione sintetica dei dati o del fenomeno che vogliamo studiare.
Spesso però è difficile trovare un modello che descrive esattamente i dati.
Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale
11
0.06
0.04
0.02
0.00
26
34
42
50
58
66
74
82
90
ETA
Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale
12
In questo caso una curva a campana potrebbe essere un buon modello, anche se
non perfettamente soddisfacente (la curva che interpola l'istogramma non è
simmetrica )
0.06
0.04
0.02
0.00
26
34
42
50
58
66
74
82
90
ETA
Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale
13
Quale modello si applica alla distribuzione di eventi discreti?
ad esempio: quanti sono i bambini maschi in famiglie con 4 figli?.
%
frequenza relativa di figli maschi in famiglie di 4
figli
40,0%
35,0%
30,0%
25,0%
20,0%
15,0%
10,0%
5,0%
0,0%
0
1
2
3
4
numero maschi
Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale
14
La distribuzione binomiale si usa per rispondere a problemi di questo tipo:
‘Qual è la probabilità di avere un certo numero di successi (r) dato un certo numero di
prove (N)’?
Il problema viene condotto ad una formulazione binaria (successo / insuccesso).
Debbo conoscere la probabilità di successo (π)
La probabilità di insuccesso (1-π)
Tali probabilità sono costanti, corrispondendo ad eventi indipendenti.
Il parametro che definisce la funzione è π.
(viene utilizzata una lettera greca quando ci si riferisce alla probabilità calcolata sulla
popolazione).
Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale
15
La funzione binomiale, in modo analogo alle altre funzioni di probabilità, consente di
prevedere la probabilità associata ad un dato evento.
La previsione è, come sempre, condizionata alla correttezza delle assunzioni di partenza
(scelta della funzione più appropriata, valore dei parametri della distribuzione).
Nelle lezioni successive vedremo come si possono confrontare le probabilità (o le
frequenze) osservate con quelle attese.
Adesso vediamo come si calcola la frequenza attesa quando si può applicare il modello
di probabilità binomiale.
Incominciamo in modo empirico esaminando la forma della distribuzione binomiale al
variare del numero di prove e della probabilità di successo.
Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale
16
Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale
17
Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale
18
Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale
19
Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale
20
Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale
21
In sintesi:
La distribuzione è simmetrica per π = 0,5 e diventa progressivamente asimmetrica per
valori di π inferiori o superiori.
La distribuzione assume progressivamente una forma a campana ('di Gauss') con
l'aumento del numero di prove.
Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale
22
Costruiamo la formula della distribuzione di probabilità binomiale
Un fenomeno ha una probabilità di verificarsi (probabilità di successo)= π
L'evento complementare ha una probabilità di verificarsi (probabilità di insuccesso)= 1-π
Nel caso di una estrazione, la probabilità di successo sarà = π
Nel caso di due estrazioni, i cui risultati sono indipendenti, la probabilità di successo ad
entrambe sarà = π * π = π2
Nel caso di tre estrazioni, i cui risultati sono indipendenti, la probabilità di successo ad
entrambe sarà = π * π * π = π3
ecc. ecc.
Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale
23
Allo stesso modo possiamo calcolare la probabilità di insuccesso su diverse prove.
Nel caso di una estrazione, la probabilità di insuccesso sarà = 1-π
Nel caso di due estrazioni, i cui risultati sono indipendenti, la probabilità di insuccesso ad
entrambe sarà = (1-π) * (1-π) = (1-π)2
Nel caso di tre estrazioni, i cui risultati sono indipendenti, la probabilità di insuccesso a
tutte sarà = (1-π) * (1-π) *(1-π) = (1-π)3
ecc. ecc.
Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale
24
Possiamo generalizzare e giungere alla formula che ci consente di calcolare la probabilità
di un qualsiasi numero (r) di successi in un qualsiasi numero (N) di prove.
(π)r (1-π)(N-r)
La probabilità di un ‘successo’ è elevata al numero di ‘successi’ e moltiplicata alla
probabilità di ‘insuccesso’ elevata al numero di ‘insuccessi’.
Si applica pertanto la regola della probabilità di eventi indipendenti.
Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale
25
Esiste un ultimo problema: lo stesso numero di successi si può ottenere con diverse
sequenze di risultati.
Es 2 successi in 3 prove:
aab
aba
baa
La seguente tabella ricostruisce lo spazio campionario di un esperimento con 3 prove.
Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale
26
Numero
Primo figlio
Secondo f.
Terzo f.
figli maschi
F
F
F
0
M
F
F
1
F
M
F
1
F
F
M
1
M
M
F
2
M
F
M
2
F
M
M
2
M
M
M
3
Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale
27
Numero
Primo figlio
Secondo f.
Terzo f.
In quanti modi si
figli maschi ottiene lo stesso
numero di successi
F
F
F
0
M
F
F
1
F
M
F
1
F
F
M
1
M
M
F
2
M
F
M
2
F
M
M
2
M
M
M
3
Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale
1
3
3
1
28
Il coefficiente binomiale indica il numero di modi in cui possiamo ottenere r successi in N
prove.
N
r
( )
: Coefficiente Binomiale.
N
r
( )
=
N!
r!×( N − r )!
N! = N * (N-1) * .... * 4 * 3 * 2 * 1
Viene indicato come ‘fattoriale di N’
Attenzione 0! = 1
Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale
29
Numero
Coefficiente
Primo figlio
Secondo f.
Terzo f.
figli maschi binomiale
F
F
F
0
M
F
F
1
F
M
F
1
F
F
M
1
M
M
F
2
M
F
M
2
F
M
M
2
M
M
M
3
Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale
1
3
3
1
30
La formula complessiva è:
P(r successi su N prove) =
(N)
r
(π)r (1-π)(N-r)
Coefficiente
binomiale
Probabilità degli
insuccessi
Probabilità dei
successi
Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale
31
Numero
Primo figlio
Secondo f.
Terzo f.
figli maschi probabilità
F
F
F
0
(1-p) (1-p) (1-p)
M
F
F
1
p (1-p) (1-p)
F
M
F
1
(1-p) p (1-p)
F
F
M
1
(1-p) (1-p) p
M
M
F
2
p p (1-p)
M
F
M
2
p (1-p) p
F
M
M
2
(1-p) p p
M
M
M
3
ppp
Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale
32
Numero
Coeff.
bin.
Primo figlio
Secondo f.
Terzo f.
figli maschi
F
F
F
0
M
F
F
1
F
M
F
1
F
F
M
1
M
M
F
2
M
F
M
2
F
M
M
2
M
M
M
3
probabilità
1
(1-p) (1-p) (1-p)
3
(1-p) (1-p) p
3
(1-p) p p
1
ppp
Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale
33
Es. Probabilità di ottenere 4 croci su 10 lanci di moneta
(π)= 0,5
(1-π) = 0,5
r= 4
n = 10
p(r=4 su N=10) = [10! / (4! 6! )] x 0,54 x 0,56 = 210 * 0,0625 * 0,015625 = 0,205
Interpretazione:
‘Se la moneta è equilibrata e quindi tale per cui la probabilità di un dato risultato (es.
testa) a ciascun lancio è pari a 0,5 (π = 0,5) la probabilità di avere 4 risultati in una serie
di 10 lanci è 0,205’
Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale
34
Questa tabella riassume i valori di probabilità associati a ciascuno dei possibili risultati di
un esperimento di 10 lanci di moneta. r=croce
π=0.5
N
r
10
10
10
10
10
10
10
10
10
10
10
0
1
2
3
4
5
6
7
8
9
10
N-r Coefficiente
Binomiale
10
1
9
10
8
45
7
120
6
210
5
252
4
210
3
120
2
45
1
10
0
1
1-π=0,5
π^r
(1-π)^(N-r)
1,0000000000
0,5000000000
0,2500000000
0,1250000000
0,0625000000
0,0312500000
0,0156250000
0,0078125000
0,0039062500
0,0019531250
0,0009765625
0,0009765625
0,0019531250
0,0039062500
0,0078125000
0,0156250000
0,0312500000
0,0625000000
0,1250000000
0,2500000000
0,5000000000
1,0000000000
Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale
Valore di
probabilità
0,001
0,010
0,044
0,117
0,205
0,246
0,205
0,117
0,044
0,010
0,001
35
Distribuzione binomiale N=10, p=0.5
0,300
0,250
0,200
0,150
prob
0,100
0,050
0,000
0
1
2
3
4
5
6
7
Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale
8
9
10
36
distribuzione binomiale con densità e probabilità cumulativa
1,000
0,900
0,800
probabilità
0,700
0,600
0,500
0,400
0,300
0,200
0,100
0,000
0
1
2
3
4
5
6
7
8
9
10
0,500
0,001
0,010
0,044
0,117
0,205
0,246
0,205
0,117
0,044
0,010
0,001
pcum
0,001
0,011
0,055
0,172
0,377
0,623
0,828
0,945
0,989
0,999
1,000
successi
Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale
37
La tabella seguente mostra l’effetto della variazione del parametro (π)
π=0,75
N
r
10
10
10
10
10
10
10
10
10
10
10
0
1
2
3
4
5
6
7
8
9
10
N-r Coefficiente
Binomiale
10
1
9
10
8
45
7
120
6
210
5
252
4
210
3
120
2
45
1
10
0
1
1-π=0,25
π^r
(1-π)^(N-r)
1,0000000000
0,7500000000
0,5625000000
0,4218750000
0,3164062500
0,2373046875
0,1779785156
0,1334838867
0,1001129150
0,0750846863
0,0563135147
0,0000009537
0,0000038147
0,0000152588
0,0000610352
0,0002441406
0,0009765625
0,0039062500
0,0156250000
0,0625000000
0,2500000000
1,0000000000
Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale
Valore di
probabilità
0,000
0,000
0,000
0,003
0,016
0,058
0,146
0,250
0,282
0,188
0,056
38
Distribuzione binomiale N=10, p=0.75
0,300
0,250
0,200
0,150
0,100
0,050
0,000
0
1
2
3
4
5
6
7
8
9
Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale
10
39
Spesso la domanda posta è: ‘Qual è la probabilità di avere almeno un certo numero di
successi (r) dato un certo numero di prove (N)’?
In questo caso:
1 Calcolo la probabilità per tutti i numeri interi (r’) compresi tra r ed N (inclusi)
2 Sommo la probabilità per ciascuno degli interi compresi tra r ed N
P(r’>=r in N prove) = p(r) + p(r+1) + …+ p(N-1) + p(N)
Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale
40
Ad esempio: probabilità di 8 o più successi su 10 prove con p=0,5
0
1
2
3
4
5
6
7
8
9
10
0,000977
0,009766
0,043945
0,117188
0,205078
0,246094
0,205078
0,117188
0,043945
0,009766
0,000977
Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale
41
0,300
0,250
0,200
0,150
0,100
0,050
0,000
0
1
2
3
4
5
6
7
Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale
8
9
1
0
42
Probabilità di 32 o più successi con 50 prove e p=0,5
0,12
0,1
0,08
0,06
0,04
0,02
0
0
2
4
6
8
1
0
1
2
1
4
1
6
1
8
2
0
2
2
2
4
2
6
2
8
3
0
3
2
3
4
3
6
3
8
4
0
Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale
4
2
4
4
4
6
4
8
5
0
43
Esercizi.
- Quali sono i tre presupposti per poter applicare correttamente il modello di
distribuzione binomiale?
- p. 148, n.10
- p. 148, n.11
Corso di laurea in biotecnologie - Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale
44