OD
PROBABILITÀ
94
OD
FENOMENI CASUALI
La probabilità si occupa di
fenomeni casuali
fenomeni di cui, a priori, non si sa quale esito si
verificherà.
Esempio Lancio di una moneta
Testa o Croce ?
95
OD
DEFINIZIONI DI PROBABILITÀ
PROBABILITÀ CLASSICA o A PRIORI
È calcolata con ragionamento astratto, non
sperimentalmente.
La probabilità p(E) di un evento casuale E è data
da:
p(E ) =
m
n ° casi − favorevoli
=
N
n ° casi − possibili
I casi possibili sono mutuamente esclusivi,
equiprobabili e numerabili.
Esempio
Qual è la probabilità di ottenere 5 lanciando un
dado?
p( E ) =
m 1
= = 0.167 = 16.7%
N 6
96
OD
PROBABILITÀ A POSTERIORI o
FREQUENZA RELATIVA
È calcolata a posteriori dopo aver ripetuto più
volte lo stesso esperimento.
Esempio
Lanciamo una moneta N volte e calcoliamo
quante volte (m) si verifica l’evento “Testa”.
La frequenza relativa di T è
P(T) = m/N.
Se N=100 e m=43
m
43
p (T ) =
=
= 0 . 43
N
100
Prima dell’esperimento ci si aspettava che
P(T) = P(C) = 0.50.
97
OD
PROBABILITÀ CLASSICA E
PROBABILITÀ FREQUENTISTA
Per N tendente a infinito P(T) = P(C) = 0.50.
La probabilità p(E) di un evento casuale E è il
valore limite cui tende la sua frequenza relativa
all’aumentare del numero di osservazioni.
m
p ( E ) = lim
N → ∞ N
98
OD
99
OD
DISTRIBUZIONI
DI PROBABILITÀ
100
OD
DISTRIBUZIONI DI PROBABILITÀ
Dagli archivi del reparto di ostetricia di un piccolo
ospedale di provincia risulta che la probabilità che si
verifichino 0, 1, 2, 3, 4 o più nascite in una
settimana è rispettivamente uguale a 0.72, 0.14, 0.07,
0.06 e 0.01.
È possibile sintetizzare la situazione come segue:
Numero di nascite (X=x) Probabilità (X=x)
0
0.72
1
0.14
2
0.07
3
0.06
≥4
0.01
La tabella è un esempio di distribuzione di
probabilità.
101
OD
La distribuzione di probabilità di una
variabile casuale (X) è un elenco di tutti i
possibili valori che la variabile può assumere e
delle relative probabilità.
La somma di queste probabilità è uguale a 1,
poiché i possibili esiti (1 nascita, 2 nascite, …)
sono mutuamente esclusivi ed esaustivi.
Una distribuzione di probabilità può essere
illustrata anche da un grafico.
0,8
0,7
0,6
P(X)
0,5
0,4
0,3
0,2
0,1
0
0
1
2
3
≥4
N° di nati / settimana (X)
102
OD
Un altro esempio
Lanciando un dado qual è la probabilità che esca 1,
che esca 2, …., che esca 6?
N° uscito (X)
1
2
3
4
5
6
P(X)
1/6=0.17
1/6=0.17
1/6=0.17
1/6=0.17
1/6=0.17
1/6=0.17
0,20
P(X)
0,15
0,10
0,05
0,00
1
2
3
4
5
6
N° uscito (X)
103
OD
DISTRIBUZIONI DI PROBABILITÀ
EMPIRICHE
IPOTETICHE
(o teoretiche)
Descrivono set di dati
realmente osservati
(primo esempio).
Descrivono dati che si
può
prevedere
di
osservare, sotto date
condizioni
(secondo esempio).
N.B.: una distribuzione di
frequenza
diventa
distribuzione di probabilità
per
un
numero
di
esperimenti tendente ad
infinito.
104
OD
DISTRIBUZIONI DI
PROBABILITÀ
DI VARIABILI CONTINUE
LA DISTRIBUZIONE NORMALE
105
OD
DISTRIBUZIONI DI PROBABILITÀ
DI VARIABILI CONTINUE
VARIABILI DISCRETE
VARIABILI CONTINUE
Possono
assumere
solo Possono assumere qualsiasi valore
particolari valori entro un entro un dato intervallo.
dato intervallo.
Grafico: diagramma a colonne Grafico: istogramma o poligono di
distanziate
frequenza
↓
↓
tante colonne quanti i valori tante colonne quanti i valori assunti
assunti
infiniti valori → infinite colonne
↓
all’aumentare del n° di osservazioni
il profilo del poligono di frequenza
tende a diventare “liscio”
f
(
f(x)
x
x
106
OD
L’AREA SOTTESA ALLA CURVA
f(x )
x
La probabilità che la variabile assuma un ben
determinato valore puntuale è nulla:
n° eventi favorevoli
Pr (X=x) = —————————— =
n° totale eventi
1
—=0
∞
Tuttavia è possibile chiedersi:
qual è la probabilità che una osservazione sia
minore (o maggiore) di un certo valore, o sia
compresa tra due valori?
107
OD
1. Pr(X<x0)
Dato un valore x0, la probabilità che la variabile
X assuma un valore minore di x0 è la parte di area
che sta prima di x0.
f(x )
x0
x
2. Pr(X>x0)
Dato un valore x0, la probabilità che la variabile
X assuma un valore maggiore di x0 è la parte di
area che sta dopo x0.
f(x )
x0
x
108
OD
3. Pr(x0<X<x1)
Dati due valori x0 e x1, la probabilità che la
variabile X assuma un valore compreso tra x0 e
x1 è la parte di area compresa tra x0 e x1.
f(x )
x0 x1
x
109
OD
LA DISTRIBUZIONE NORMALE
È una particolare distribuzione di probabilità continua.
f(x)
Area = 1
σ
σ
µ= moda = mediana
x
Asse di simmetria x = µ
•
•
•
•
Ha forma a campana;
è simmetrica rispetto ad un asse centrale x = µ;
media µ, moda e mediana coincidono;
la deviazione standard σ della variabile è una
misura di dispersione della campana;
• la distribuzione normale è completamente
determinata dai parametri µ e σ;
• area sottesa alla curva = 1.
Molte variabili biomediche (PAS/PAD, Altezza. Peso, Livelli
ematici) seguono una distribuzione approssimativamente normale.
110
OD
µeσ
Parametri della Distribuzione Normale
N(0,1.8)
N(-5,1.8)
N(5,1.8)
0,25
0,2
0,15
0,1
0,05
0
-12
-10
-8
-6
-4
-2
0
2
µ variabile
4
6
8
10
12
σ costante
N(0,2)
N(0,1)
N(0,0.5)
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
-5
-4
-3
-2
-1
µ costante
0
1
2
3
4
5
σ variabile
111
OD
SUDDIVISIONE DELL’AREA
SOTTO LA CURVA NORMALE
µ ± σ → 68%
0.68
σ
µ-σ
σ
µ+σ
µ
x
µ ± 2σ → 95%
0.95
2σ
µ - 2σ
2σ
µ + 2σ
µ
x
µ ± 3σ → 99.7%
0.997
3σ
µ - 3σ
3σ
µ
µ + 3σ
x
112
OD
DISTRIBUZIONE NORMALE
STANDARDIZZATA
Una distribuzione normale si dice “standard” se
se
µ=0
e
σ=1
0,4
0,3
0,2
0,1
0
-4
-3
-2
-1
0
1
2
3
4
µ = Moda = Mediana = 0
Punti di inflessione alle ascisse + 1
Area sottesa alla curva = 1
Asse di simmetria → x = 0
113
OD
DALLA DISTRIBUZIONE NORMALE
ALLA
NORMALE STANDARDIZZATA
È possibile standardizzare una variabile casuale
normale X mediante la trasformazione:
Z=
X−µ
σ
Molti testi contengono le cosiddette Tavole della
distribuzione normale, dove, per una griglia
discreta di valori z, sono riportate le probabilità
P(Z < z) sotto la normale standard.
114
OD
APPLICAZIONI DELLA DISTRIBUZIONE
NORMALE
Quando si sa (o si può assumere) che variabili casuali
sono, almeno approssimativamente, distribuite in
modo normale è possibile rispondere a domande di
tipo probabilistico su di esse.
Esempio 1
Pr(X<x0)
(Daniel 4.7.1 pag.102)
Da uno studio condotto sulla malattia di Alzheimer,
Dusheiko ha riportato i dati che sono compatibili con
l’ipotesi che il peso del cervello delle vittime della
malattia si distribuisca normalmente. Dai dati
possiamo calcolare una media di 1076.80 grammi e
una deviazione standard di 105.76 grammi.
Se assumiamo che questi risultati siano applicabili a
tutte le vittime della malattia di Alzheimer, trova la
probabilità che una vittima della malattia, scelta a
caso, abbia un cervello che pesa meno di 800 grammi.
115
OD
Soluzione
In primo luogo è utile rappresentare graficamente
la distribuzione, tratteggiando l’area che
corrisponde alla probabilità richiesta.
f (x)
x
800
µ=1076.80
Peso cervello(g)
Se la distribuzione fosse normale standard,
potremmo facilmente determinare la probabilità
richiesta, usando le tavole apposite.
Trasformiamo i valori di x nei corrispondenti
valori di z usando la seguente formula:
z=
x−µ
σ
800 − 1076.80
=
= −2.62
105.76
116
OD
Rappresentiamo graficamente:
f (x)
x
800
µ=1076.80
Peso cervello(g)
z
-2,62
0
Dalle tavole risulta che l’area a sinistra di z=-2.62
è 0.0044.
P(x<800) = P(z<-2.62) = 0.0044
La probabilità che un paziente scelto a caso abbia
un peso del cervello minore di 800 grammi è
uguale a 0.0044 (0.44%).
117
OD
Esempio 2
Pr(x0<X<x1)
(Daniel 4.7.2 pag.104)
Supponiamo di conoscere che la statura di una certa
popolazione di individui sia approssimativamente
distribuita come una normale con media di 70 pollici
e deviazione standard di 3 pollici.
Qual è la probabilità che una persona estratta a caso
da questo gruppo sia alta fra 65 e 74 pollici?
Calcoliamo gli opportuni valori di z e rappresentiamo
graficamente:
z1 =
x1 − µ
σ
=
65 − 70
= −1,67
3
z2 =
x2 − µ
σ
=
74 − 70
= 1,33
3
f (x)
Pr(65<x<74) = ?
x
0
65
70
74
Statura (pollici)
z
-1,67
0
+1,33
118
OD
Dalle tavole risulta che
l’area tra - ∞ e 1.33 è 0.9082
l’area tra - ∞ e –1.67 è 0.0475.
L’area richiesta è la loro differenza:
P(65<x<74)
= P(-1,67<z<1,33) =
= P(z<1,33) - P(z<-1,67) =
= 0,9082-0,0475=0,8607=86.07%.
119
OD
Esempio 3
Pr(X>x0)
(Daniel 4.7.3 pag.105)
Determinare la probabilità che una persona scelta a
caso dalla popolazione sia alta 77 pollici o più.
Calcoliamo il
graficamente:
z =
x − µ
σ
=
valore
di
z
e
rappresentiamo
77 − 70
= 2 , 33
3
f (x)
Pr(x>77) =1 –Pr(x<77) = ?
x
0
70
77
Statura (pollici)
z
0
+2,33
Poiché le tavole riportano le aree comprese tra -∞ e un dato
valore (cioè la probabilità che z sia minore di un dato
valore), possiamo calcolare la probabilità richiesta nel
modo seguente:
P(x>77)
= 1 - P(x<77) = 1 - P(z<2,33)
= 1 - 0,9901 = 0,0099 = 0.99%
120