Calcolo delle Probabilità
Che collegamento c’è tra gli strumenti statistici visti fino ad
ora per lo studio dei fenomeni reali e il calcolo delle
probabilità?
Non sempre la conoscenza delle caratteristiche di un fenomeno può
essere conseguita osservando tutta la popolazione ma deve essere
estratto un campione (rilevazione parziale)
La STATISTICA INDUTTIVA o INFERENZIALE
intende descrivere non tanto ciò che traspare dalle manifestazioni
osservate (rilevazioni parziali), ma quello che emergerebbe qualora la
rilevazione fosse estesa all’insieme di tutte le manifestazione del
fenomeno.
L’incertezza che deriva dalla parzialità della rilevazione
è dominata dalla TEORIA DELLE PROBABILITÀ
1
TERMINOLOGIA
EVENTI: entità caratterizzate da aleatorietà, qualcosa che può
verificarsi oppure no
La Juventus vincerà il campionato anche quest’anno?
Gli eventi si indicano con le lettere maiuscole dell’alfabeto latino
E1 =“La Juventus vincerà il campionato anche quest’anno”
Si chiama evento complementare ad E il verificarsi di
tutto ciò che non è E e si indica con E
E1 =“La Juventus non vincerà il campionato quest’anno”
Si indica con la lettera dell’alfabeto greco Ω l’insieme di tutti i
possibili risultati di un esperimento, per esperimento si intende una
prova il cui esito è incerto. Viene anche chiamato evento certo o
spazio campionario
E1=Vince la Juve, E2=Vince la Lazio, E3=Vince la Roma, E4=Vince il Parma,
E5=Vince il Milan…. Ω è l’insieme di tutti gli eventi Ei, per i=1,….,20
NOTA: quando sono state fatte queste slides, ovviamente la Juve era in serie A
TERMINOLOGIA
Al verificarsi di un evento viene associata una PROBABILITA’
P(E1)=Probabilità che la Juventus vinca il campionato
Se chiedessimo di assegnare questa probabilità a un
tifoso della Juve, a un tifoso dell’Inter (che pensa
sempre che quest’anno sia quello buono), a un tifoso del
Torino, o a una persona oggettiva, tecnicamente
preparata a livello calcistico otterremmo 4 valori diversi
di probabilità
Come è possibile assegnare correttamente la probabilità
agli eventi?
2
PROPRIETA’ FORMALI
La probabilità non è mai un numero negativo, verrà
assegnata probabilità 0 agli eventi che ci si aspetta che
non si verifichino (evento quasi impossibile) e
probabilità 1 all’eventi che ci si aspetta che si
verifichino (evento quasi certo)
Siccome ogni evento è contenuto in Ω
( Ei
⊂ Ω)
0 < P(Ei) < P(Ω) =1
P(Ω)=P(“tutto quello che può accadere”)=P(“evento
certo”)=1
PROPRIETA’ FORMALI
Se due eventi E1 e E2 non possono verificarsi
contemporaneamente (la loro intersezione coincide con
l’insieme vuoto) diremo che sono incompartibili,
E1 ∩ E 2 = ∅ ⇔ P ( E1 ∩ E 2 ) = 0
Probabilità che vinca il campionato la Juve e anche l’Inter?
Siccome non possono vincere entrambe, gli eventi sono incompatibili, la
probabilità della loro intersezione è uguale a 0
3
PROPRIETA’ FORMALI
Se si vuole calcolare la probabilità che si verifichi
l’evento E1 oppure l’evento E2 (E1 unito E2) e i due
eventi sono incompatibili allora la probabilità
dell’unione è uguale alla somma delle probabilità
P ( E 1 ∪ E 2 ) = P ( E1 ) + P ( E 2 )
Probabilità che vinca il campionato una squadra romana?
Siccome non possono vincere entrambe, gli eventi sono
incompatibili, la probabilità della loro unione è uguale alla
probabilità che vinca la Roma, più la probabilità che vinca la
Lazio.
ASSIOMI
E’ possibile riassumere quanto visto fino
ad ora negli assiomi di Kolmogorov
1. ∀E ⊂ Ω, P(E) ≥ 0
2. P(Ω) = 1
3. Se E1 ∩ E2 = ∅ allora P(E1 ∪ E2 ) = P(E1) + P(E2 )
4
ALCUNE REGOLE
E ∪ E = Ω quindi P( E ) + P( E ) = 1
e dunque P( E ) = 1 − P( E )
Se E1 ∩ E2 ≠ ∅
allora
P( E1 ∪ E2 ) = P( E1 ) + P( E2 ) − P ( E1 ∩ E2 )
EVENTI ELEMENTARI
Insiemi contenenti un solo elemento
In generale lo spazio campionario viene descritto in termini di eventi
elementari
Ω = {ω1 , ω2 ,..., ωn }
Se gli eventi elementari sono tutti equiprobabili, cioè
P ({ω1}) = P ({ω2 }) = ........ = P ({ωn } )
Allora la probabilità di un evento qualsiasi E composto da più
eventi elementari
P(E) =
# casi favorevoli (all'evento)
# casi possibili (dell'esperimento)
5
PROBABILITA’ CONDIZIONATA
Se abbiamo due eventi E1 e E2 e ne conoscono le probabilità P(E1) e
P(E2) chi chiediamo se la probabilità del verificarsi dell’uno varia
sapendo che si è verificato l’altro
P ( E1 | E 2 ) =
P ( E1 ∩ E 2 )
co n P ( E 2 ) > 0
P (E2 )
ESEMPIO:
Lancio di un dado
E1 = ‘estrarre un numero pari’ ; E2 = ‘estrarre un numero >=4’
P(E1) =3/6 ; P(E2)=3/6
La probabilità di estrarre un numero pari cambia se si sa che il numero estratto è >=4?
P ( E1 | E 2 ) =
P ({4 ,6 })
P ( E1 ∩ E 2 )
2/6
2
1
=
=
= ≠
P (E2 )
P ({4,5,6 } )
3 6
3
2
EVENTI INDIPENDENTI
Due eventi E1 e E2 si diranno indipendenti se la probabilità del verificarsi
dell’uno rimane invariata sapendo che si è verificato l’altro, cioè
P ( E1 | E 2 ) = P ( E1 ) e P ( E 2 | E1 ) = P ( E 2 )
Se due eventi sono indipendenti
Infatti P ( E1 | E 2 ) =
Eventi compatibili ma
Eventi
compatibili ma
indipendenti!
indipendenti!
P ( E1 ∩ E 2 ) = P ( E1 ) ⋅ P ( E 2 )
P ( E1 ∩ E 2 )
P ( E1 ∩ E 2 )
= P ( E1 ) e P ( E 2 | E1 ) =
= P ( E2 )
P ( E2 )
P ( E1 )
ESEMPIO: Mazzo di 40 carte
E1 = ‘estrarre una carta di denari’ P(E1) = 10/40 ; E2 = ‘estrarre un asso’ P(E2)=4/40
La probabilità di estrarre una carta di denari cambia se si sa che la carta estratta è un asso?
P ( E1 | E 2 ) =
P ( E1 ∩ E 2 )
1 40
1
10
P (a s so d i d e n ari)
=
=
=
=
4 40
4
40
P(E2 )
P (a ss o )
P ( E1 ∩ E 2 ) = P ( E1 ) ⋅ P ( E 2 ) =
10 4
1
⋅
=
40 40
40
6
EVENTI INDIPENDENTI
Eventi compatibili ma indipendenti!
Eventi compatibili ma indipendenti!
ESEMPIO 2: Mazzo di 40 carte
E1 = ‘estrarre una carta di denari’ P(E1) = 10/40 ; E2 = ‘estrarre una figura’ P(E2)=12/40
La probabilità di estrarre una carta di denari cambia se si sa che la carta estratta è una figura?
P ( E1 | E 2 ) =
P ( E1 ∩ E 2 )
P (fig u ra d i d en ari)
3 40
3
10
=
=
=
=
P (E2 )
P (fig u ra)
12 40 12
40
P ( E1 ∩ E 2 ) = P ( E1 ) ⋅ P ( E 2 ) =
10 12
3
⋅
=
40 40
40
LEGGI DI DE MORGAN
E1 ∩ E2 = E1 ∪ E2
E1 ∪ E2 = E1 ∩ E2
L’operazione di “complementazione”
scambia l’operazione di unione con
l’operazione di intersezione e viceversa
7
SCHEMI DI CAMPIONAMENTO
Si supponga di estrarre una pallina da un urna
a) Estrazione con rimessa, la probabilità di
estrazione di una singola pallina rimane costante in
ogni estrazione
b) Estrazione senza rimessa, la probabilità di
estrazione di una singola pallina cambia
Si supponga di estrarre una unità da una popolazione
a) Campionamento con ripetizione (eventi indipendenti)
b) Campionamento senza ripetizione (eventi condizionati)
COEFFICIENTE BINOMIALE
In quanti modo posso estrarre in blocco (senza rimessa) k
elementi da un’insieme di n elementi?
Combinazioni di n elementi presi k alla volta
n
n!
=
 
 k  ( n − k )!k !
dove n ! = n ⋅ ( n − 1) ⋅ ( n − 2 ) ⋅ ........ ⋅ 2 ⋅1
Proprietà:
n
 n
n  n 
0! = 1,   = 1,   = n,   = 

0
1
k  n−k 
8
ESEMPIO: COEFFICIENTE BINOMIALE
Nell’aula oggi ci sono 20 studenti: 10 di SPO, 7 di SAM e 3 di SIE.
Decido di chiamare alla lavagna 3 studenti.
1.
Quante sono le possibili combinazioni?
2.
Qual è la probabilità che siano tutti di SPO?
3.
Se ne chiamo 1 per corso di laurea, quante sono le possibili combinazioni?
4.
Qual è la probabilità che siano uno per ognuno dei tre corsi di laurea?
 20 
1)   = 1140
3
10 
 
3
120
10 9 8
= 0.105 che è uguale a
⋅ ⋅
2)   =
20 19 18
 20  1140
 
3
10  7  3 
3)     = 210
 1  1  1 
10  7  3 
   
1 1 1
210
 10 ⋅ 7 ⋅ 3 
4)     =
= 0.184 che è uguale a 3!

1140
 20 
 20 ⋅19 ⋅18 
 
3
SAM,SPO,SIE;
SAM, SIE,SPO;
SPO,SAM,SIE;
SPO,SIE,SAM;
SIE,SPO,SAM;
SIE,SAM,SPO
ESERCIZIO: ESTRAZIONE SENZA RIMESSA
Da un’urna contenente 15 palline (5 rosse, 5 verdi e 5 blu), se ne estraggono 2
senza reimmissione; calcolare la probabilità che queste siano dello stesso colore.
Soluzione:
N=15
5 rosse; 5 verdi; 5 blu
n=2 (senza reimmissione)
Trattandosi di estrazioni senza reimmissione non vi è l’indipendenza delle prove, infatti
la composizione dell’urna si modifica ad ogni estrazione. Inoltre viene chiesta la
probabilità che si estraggano due palline dello stesso colore e non di un colore
particolare. Si fa osservare che nell’urna vi sono palline di tre colori differenti presenti
in pari numero (5 rosse; 5 verdi; 5 blu), pertanto la probabilità cercata sarà data dalla
seguente espressione:
Pr{“2 dello stesso colore”} = 3 ⋅
5 4
⋅
= 0.285714
15 14
9
PRINCIPIO DELLE PROBABILITA’ TOTALI
Se A1, A2 , ..., Ak sono una partizione di Ω ed E è un qualsiasi altro evento
k
P( E) = ∑ P ( E | Ai ) P ( Ai )
i =1
Se si conoscono le probabilità degli eventi di una partizione (a priori) e si conoscono le
Se
si conoscono
le probabilità
degli eventi
di qualsiasi
una partizione
(a priori)
si conoscono
probabilità
condizionate
del verificarsi
di un
altro evento
aglie eventi
della le
probabilità
condizionate
del
verificarsi
di
un
qualsiasi
altro
evento
agli
eventi
partizione, si è sempre in grado di calcolare la probabilità dell’evento stesso della
partizione, si è sempre in grado di calcolare la probabilità dell’evento stesso
Partizione di W
k eventi A1, A2 , ..., Ak sono una partizione se e solo se
k
U Ai = Ω
i
e scelti a caso due eventi Ai e Aj allora Ai ∩ Aj =∅
FORMULA DI BAYES
Se A1 , A2 , ..., Ak sono una partizione di Ω ed E è un qualsiasi altro evento
P ( Ai | E ) =
P ( E | Ai ) P ( Ai )
k
∑ P ( E | Ai ) P ( Ai )
i =1
Se si sa che si è verificato l’evento E si è in grado di calcolare la probabilità
Se si sa che si è verificato l’evento E si è in grado di calcolare la probabilità
che si sia verificato l’evento Ai. Dato l’effetto è possibile calcolare la
che si sia verificato l’evento Ai. Dato l’effetto è possibile calcolare la
probabilità della causa che lo ha generato
(probabilità a posteriori). E’ come
probabilità della causa che lo ha generato (probabilità a posteriori). E’ come
se le conoscenze a priori su Ai a seguito del verificarsi dell’evento E
se le conoscenze a priori su Ai a seguito del verificarsi dell’evento E
venissero aggiornate
venissero aggiornate
La probabilità a priori P(Ai) diventa una probabilità a posteriori P(Ai|E)
La probabilità a priori P(Ai) diventa una probabilità a posteriori P(Ai|E)
10
ESEMPIO
ESEMPIO
N° cubetti
esaminati
IMPIANTO A
IMPIANTO B
IMPIANTO C
A1
A2
A3
300
400
700
N°
cubetti
difettosi
10
20
25
P(Ai)
P(E|Ai)
0.21
0.03
0.29
0.05
0.50
0.04
1400
a) Probabilità totali
P(E) = P(E|A1)P(A1) + P(E|A2)P(A2) + P(E|A3)P(A3) = 0.04
b) Formula di Bayes
P(A1|E) = [P(E|A1)P(A1)]/P(E) = 0.18
11