MATEMATICA
a.a. 2014/15
5. Introduzione alla probabilità:
Probabilità condizionata. Eventi indipendenti. Teorema
di Bayes
Probabilità condizionata
Ogni probabilità è subordinata all’informazione corrente
Urna
1
1
2
3
3
4
Probabilità che esca un numero <3 =
Supponiamo di sapere che è uscito un numero pari
Urna
1
1
2
3
3
4
Probabilità che esca un numero <3 sapendo che è uscito un numero pari =
Probabilità condizionata
Spazio campionario ridotto
A= esce un numero <3
1
1
3
3
2
B= esce un numero pari
4
1
1
2
3
3
4
3
Probabilità condizionata
Se A e B sono due eventi dello spazio degli eventi Ω e P(B)>0,
allora la probabilità condizionata di A dato B è:
Evento condizionante
Con spazi finiti, la definizione è intuitivamente ovvia: se B si è
verificato, il nuovo spazio di riferimento si “restringe” proprio
ad B e la probabilità che si verifichi A sarà data dal rapporto
tra la massa di probabilità contenuta nell’intersezione A ∩ B e
quella contenuta in B.
La probabilità condizionata è la probabilità di un evento
condizionata al verificarsi di un altro evento
4
Regola del prodotto
(Teorema della Probabilità Composte)
Quindi la probabilità che si verifichino contemporaneamente
due eventi A e B è
P(A ∩ B) = P(A) ⋅ P(B A) = P(B) ⋅ P(A B)
ossia la probabilità che si verifichi il primo per la probabilità
che si verifichi il secondo dato il primo
La regola del prodotto generalizzata permette di trovare la probabilità che si verifichino
due eventi anche quando sono dipendenti.
5
6
7
EVENTI INDIPENDENTI
Due eventi A e B si dicono indipendenti se il verificarsi di B
non influenza la probabilità del verificarsi di A e il verificarsi
di A non influenza la probabilità di B.
P( A / B ) = P( A)
P( B / A) = P( B )
da cui:
P( A ∩ B)
P( A / B )=
= P ( A) ⇒ P( A ∩ B ) = P( A) ⋅ P( B)
P( B)
Se due eventi sono indipendenti la probabilità che si verifichino entrambi
(probabilità dell’intersezione dei due eventi) è data dal prodotto delle due
probabilità
8
EVENTI INDIPENDENTI
Nel lancio di dadi: se si lancia due volte consecutivamente lo stesso dado a 6 facce non
truccato, la probabilità che il primo lancio dia 3 è 1/6.
Qual è la probabilità che si abbia 3 anche dal risultato del secondo lancio consecutivo?
La probabilità è sempre 1/6, indipendentemente dal fatto che il risultato del primo lancio
sia stato 3 o no.
Poiché il risultato del primo lancio non influenza la probabilità di ottenere 3 nel secondo
lancio, possiamo dire che i due eventi sono indipendenti.
Due eventi sono indipendenti se il verificarsi di uno dei due non influenza la
probabilità che si verifichi l’altro
La regola del prodotto
Quando due eventi sono indipendenti, la probabilità che si verifichino entrambi
(probabilità dell’intersezione di due eventi) è data dal prodotto della probabilità del
primo evento per la probabilità del secondo.
Questa proprietà consente di stabilire se due (o più) variabili sono associate. 9
Esempi con una tabella doppia
Intenzione di acquisto e acquisto effettivo
Intenzione
di acquisto
Acquisto
effettivo
Tot
Tot
si
no
si
200
50
250
no
100
650
750
300
700
1000
Gli eventi “intenzione di
acquisto”, “intenzione di
non acquisto”, “acquisto
effettivo”, “non acquisto
effettivo” sono eventi
elementari
L’evento “intenzione di
non acquisto” è l’evento
complementare di
“intenzione di acquisto”
L’evento “intenzione di
acquisto” e “acquisto
effettivo” è un evento
congiunto
10
Probabilità marginali
Intenzione
di acquisto
Acquisto
effettivo
A
B
B
200
50
Tot
P(A) =
250
= 0,25
1000
Probabilità di
pianificare
l’acquisto
250
P(A) =
750
= 0,75 = 1 − P(A)
1000 Probabilità di non
pianificare
l’acquisto
A
100
650
750
P(B) =
300
= 0,30
1000
Probabilità di
acquistare
Tot
300
700
1000
P(B ) =
Le prob marginali sono le freq rel
dell’ultima riga e dell’ultima colonna
700
= 0,70 = 1 − P(B)
1000 Probabilità di non
acquistare
11
Probabilità congiunte
Intenzione
di acquisto
Acquisto
effettivo
Tot
A
A
Tot
B
B
200
50
250
100
650
750
300
700
P(A e B) =
200
= 0,20
1000
P(A ∩ B) Probabilità di
1000
pianificare
l’acquisto e di
effettuare
l’acquisto
P(A e B ) =
P(A ∩ B )
Le prob congiunte sono le freq rel
delle caselle interne
50
= 0,05
1000
Probabilità di
pianificare
l’acquisto e di
non effettuare
l’acquisto
12
Probabilità condizionate
Intenzione
di acquisto
Acquisto
effettivo
Tot
A
A
Tot
B
B
200
50
250
100
650
750
300
700
1000
L’acquisto effettivo dipende
dall’intenzione di acquisto
P(B | A) =
P(A ∩ B) 0,20
=
= 0,8
P(A)
0,25
Probabilità di
acquistare dato che
si è pianificato
l’acquisto
La probabilità di
effettuare l’acquisto
cresce se si conosce
che l’acquisto è stato
pianificato
P(B | A) = 0,80 > P(B) = 0,30
13
Probabilità condizionate
Intenzione
di acquisto
Acquisto
effettivo
Tot
A
A
Tot
B
B
200
50
250
100
650
750
300
700
1000
Per calcolare probabilità
condizionate ad A, si
suppone che A si sia
verificato.
Questo restringe il
numero delle
osservazioni da 1000 a
250
P(B | A) =
200
= 0,8
250
P(B | A) =
50
= 0,2
250
14
Probabilità condizionate come freq rel
di riga
Acquisto
effettivo
Tot
Intenzione
di acquisto
B
Tot
B
P(B | A) P(B | A)
A = 0,80 = 0,20
P(B | A) P(B | A)
A = 0,13
= 0,87
1
1
Allo stesso modo,
condizionandoci all’evento
complementare di A
100
P(B | A) =
= 0,13
750
650
P(B | A) =
= 0,87
750
Le probabilità condizionate ad A coincidono con le
frequenze relative della prima riga.
Le probabilità condizionate ad A complementare
coincidono con le frequenze relative della seconda riga
15
Esempio
Uno studio (dati pubblicati su un comunicato stampa della American Society for
Microbiology pubblicato il 15 settembre 2003) ha stimato che la probabilità che un uomo
si lavi le mani dopo aver usato il bagno è pari a 0.74, mentre questa probabilità è pari a
0.83 per una donna.
Una grande stanza contiene 40 uomini e 60 donne. Supponete che uomini e donne
abbiano un’uguale probabilità di usare il bagno. Qual è la probabilità che il prossimo
individuo – uomo o donna – che utilizza il bagno si lavi le mani.
P (lavarsi le mani) = P ( Lm U ) ⋅ P (U ) + P ( Lm D ) =
= 0.74 × 0.40 + 0.83 × 0.60 = 0.794
Legge della probabilità totale:
P (X ) =
∑ P (Y ) P ( X Y )
i
i
i
16
Legge della probabilità totale:
P (X ) =
∑ P (Y ) P ( X Y )
i
i
i
La legge della probabilità totale permette di calcolare la probabilità
di un evento X in base a tutte le probabilità condizionate di
quell’evento.
Nella legge si somma, per tutte le possibili condizioni Yi, la
probabilità di quella condizione P(Yi) moltipilicata per la probabilità
condizionata dell’evento X data quella condizione Pr(X/Yi)
17
Un’importante relazione matematica sulla probabilità condizionata è data dal
Teorema di Bayes
18
Il Teorema di Bayes
Nota: P(A/B) è diversa da P(B/A)
P(febbre/influenza)
P(influenza/febbre)
Il teorema di Bayes consente di calcolare l’una dall’altra
19
Il Teorema di Bayes
Supponiamo che
l’incidenza totale dell’influenza sia pari all’1%
un soggetto con l’influenza ha una probabilità del 90% di
probabilità di avere la febbre
un soggetto senza influenza ha il 5% di probabilità di avere
la febbre
Il teorema di Bayes permette di sapere qual è la probabilità di
avere l’influenza se si ha la febbre
Traduzione
I= avere l’influenza F= avere la febbre
P(I)=0,01
P(F/I)=0,90
P(F/non I)=0,05
Attenzione: P(F/non I) è diversa da 1-P(F/I)
Il Teorema di Bayes
Qual è la probabilità di avere la febbre?
P(F) = P(F I)P(I) + P(F I)P(I)
I e non I (avere l’influenza e non avere l’influenza)
sono due eventi incompatibili ed esaustivi
P ( F ) = 0,90 ⋅ 0,01 + 0,05 ⋅ 0,99 = 0,0585
Il teorema di Bayes permette di conoscere qual è la probabilità
di avere l’influenza dato che si ha la febbre
P(I ∩ F) P(F I)P(I)
0, 009
P(I F) =
=
=
= 0,154
P(F)
P(F)
0, 0585
Il Teorema di Bayes
Approccio logico-intuitivo
Supponiamo che un dato evento B appartenente a Ω
sia necessariamente
prodotto da una delle “cause” A , A ,....., A ,incompatibili
1
2
k
(non si possono presentare insieme) ed esaustive (una
di esse deve presentarsi). Tali eventi costituiscono una
Partizione dello spazio campionario.
La probabilità che la “causa” Ai si presenti è data da
P(Ai ) = 1 ) e la probabilità che, essendosi
P(Ai ) (con
presentata, produca l’evento B è data da P(B Ai ) .
∑
A posteriori, si sa che l’evento B si è verificato: qual è la
probabilità che sia stato prodotto dalla “causa” Ai?
22
Schema per la formula di Bayes
A1
Ω
B
B ∩ A1
B ∩ A3
B ∩ A2
A2
Ω = A1 ∪ A2 ∪ A3
A3
Ai ∩ A j = ∅
∀i,j
B = B ∩ Ω = (B ∩ A1 ) ∪ (B ∩ A2 ) ∪ (B ∩ A3 )
P(B) = P(B ∩ A1 ) + P(B ∩ A2 ) + P(B ∩ A3 ) =
= P(A1 ) ⋅ P(B A1 ) + P(A2 ) ⋅ P(B A2 ) + P(A3 ) ⋅ P(B A3 )
23
Poiché:
P(Ai ∩ B)
P(Ai B) =
P(B)
si ottiene la formula di Bayes:
P(A i | B) =
P(A i ) ⋅ P(B | A i )
k
i = 1,2,..., k
∑ P(A ) ⋅ P(B | A )
i
i
i=1
P(A i ) prob. a priori
P(B | Ai )
prob. condizionate o verosimiglianze
P(A i | B) prob. a posteriori (o aggiornate)
24
Teorema di Bayes: un’applicazione
Il responsabile
l’opportunità di
vino passito.
Da quello che è
solo il 40% dei
avuto successo
P(S) = 0,40
di un’azienda vinicola valuta
lancio sul mercato di un nuovo
accaduto in passato, è noto che
prodotti lanciati sul mercato ha
P(S) = 0,60
S è l’evento “il prodotto ha
successo sul mercato”
S è l’evento complementare “il
prodotto non ha successo sul
mercato”
S e S costituiscono una partizione di Ω
Sono eventi incompatibili ed esaustivi
25
Teorema di Bayes: un’applicazione
Prima del lancio, un esperto enologo analizza le
caratteristiche del prodotto e emette un giudizio
(favorevole/non favorevole all’introduzione sul
mercato)
Sempre da ciò che si è verificato in passato, è
noto che l’80% dei prodotti di successo avevano
ricevuto un giudizio positivo, mentre solo il 30%
dei prodotti che non hanno avuto successo erano
stati giudicati positivamente
P(F | S) = 0,80
F è l’evento “giudizio favorevole”
P(F | S) = 0,30
F|S è l’evento “giudizio favorevole”
sapendo che il prodotto ha avuto successo
26
Teorema di Bayes: un’applicazione
Per il nuovo vino passito, gli esperti di
marketing hanno espresso un giudizio
favorevole.
Qual è la probabilità che il prodotto abbia
successo?
P(S | F) = ?
P(F | S) ⋅ P(S)
P(S | F) =
P(F | S) ⋅ P(S) + P(F | S) ⋅ P(S)
0,80 ⋅ 0,40
=
= 0,64
0,80 ⋅ 0,40 + 0,30 ⋅ 0,60
27
Applicazione ad un problema medico
(esempio tratto dal testo di Borra-Di Ciaccio, pag. 207)
Si è a conoscenza che in una certa popolazione il
10% degli individui è affetto da una determinata
patologia.
Un test diagnostico deve essere effettuato per
verificare o meno la presenza della patologia.
Però è anche noto che il test risulta negativo per il
10% dei malati e risulta positivo per il 20% dei
sani.
Allora ci si chiede ma se il test risulta positivo qual
è la probabilità che l’individuo sia effettivamente
malato?
28
Applicazione ad un problema medico
(esempio tratto dal testo di Borra-Di Ciaccio, pag. 207)
Probabilità a priori di essere affetto da una patologia:
P(malato)=0,1
Probabilità condizionate:
P(test positivo| non malato) =0, 2
P(test negativo|malato) =0, 1
devo trovare la probabilità a posteriori ovvero P(malato|test
positivo):
P(malato)*P(test positivo|malato)=0,1*0,9
P(malato)* P(test positivo|malato)+P(non malato)*P(positivo|non
malato)=0,1*0,9+0,9*0,2
P(malato|test positivo)=0,33
29