Problemi e formula di Bayes Daniela Valen), Treccani Scuola 1 Problemi ‘antichi’
1. Lancio una volta un dado
A1: Esce 6
B1: NON esce 6
1
6
5
P( B1 ) =
6
P( A1 ) =
€ un dado
2. Lancio più volte
Sapere l’esito del primo lancio non modifica la probabilità
€ esca 6 anche al secondo lancio. Ogni
che esca o non
lancio è indipendente dai precedenti.
Ecco un video che illustra due classici problemi sul lancio
ripetuto di dadi.
Le scommesse del Cavalier De Méré
https://www.youtube.com/watch?v=_buZhEQ0Upk
Daniela Valen), Treccani Scuola 2 Riflessioni sul primo problema
Ecco il problema dei quattro lanci di dadi successivi schematizzato
con un diagramma ad albero
1
A1: Esce 6
6
5
P
B
=
B1: NON esce 6 ( 1 ) 6
€
P( A1 ) =
€ di un dado
Riflettiamo sulla probabilità dei seguenti eventi in 4 lanci
⎛ 5 ⎞ 4
5
5
5
5
C.‘Non esce 6 per 4 volte’ C = B1 ∩ B2 ∩ B3 ∩ B4 ⇒ P(C) = ⋅ ⋅ ⋅ = ⎜ ⎟
6 6 6 6 ⎝ 6 ⎠
⎛ 5 ⎞ 4
D. ‘Esce 6 almeno una volta’ D = C ⇒ P( D) = 1− ⎜ ⎟ ≅ 0,5177
⎝ 6 ⎠
Per risolvere il problema applico:
la probabilità composta e la probabilità dell’evento complementare
€
€
Daniela Valen), Treccani Scuola 3 Riflessioni sul secondo problema
Estendo il procedimento a 24 lanci di 2 di dadi
Una figura per visualizzare le 36 alternative nel lancio di 2 dadi
A1: Esce doppio 6
P( A1 ) =
1
36
35
P
B
=
B1: NON esce doppio 6 ( 1 )
36
€
€
Riflettiamo sulla probabilità dei seguenti eventi relativi a 24 lanci di 2 dadi
C.‘Non esce doppio 6 per 24 volte’
⎛ 35 ⎞24
P(C) = ⎜ ⎟
⎝ 36 ⎠
⎛ 35 ⎞24
D. ‘Esce doppio 6 almeno una volta’ D = C ⇒ P( D) = 1− ⎜⎝ ⎟⎠ ≅ 0, 4914
36
€
Daniela Valen), Treccani Scuola 4 Altre riflessioni sul secondo problema
Che succede se lancio i due dadi più di 24 volte, ad esempio 26 volte?
A1: Esce doppio 6
P( A1 ) =
1
36
B1: NON esce doppio 6 P( B1 ) =
35
36
€
⎛ 35 ⎞26
P( D) = 1− ⎜ ⎟ ≅ 0, 5193
⎝ 36 ⎠
€
Lancio i 2 dadi 26 volte e punto
sull’uscita di almeno un doppio 6.
È più probabile vincere che perdere
Anche per risolvere il secondo problema applico:
la probabilità composta e la probabilità dell’evento complementare
Daniela Valen), Treccani Scuola 5 Un problema attuale
Un notevole fastidio della posta elettronica (email) è
l’arrivo di messaggi indesiderati (spam).
Perciò molti gestori di email propongono un software
(filtro antispam) che cerca parole frequenti nelle mail già
ricevute e classificate come spam.
Con gli esiti di questa ricerca, il filtro
- valuta la probabilità P che sia una spam ogni nuovo messaggio;
- mostra il messaggio solo se P è inferiore a dato un valore, ad esempio 0,9.
Scopriamo, a partire da un esempio, il procedimento per
calcolare la probabilità P e le sue numerose applicazioni nei più
vari settori della realtà scientifica e sociale.
Daniela Valen), Treccani Scuola 6 Un filtro antispam
Un filtro antispam ha analizzato 5000 mail ricevute e ha trovato che:
- il 30% delle mail ricevute è stata classificata spam dall’utente;
- l’80% delle spam conteneva la parola ‘acquista’;
- solo il 2% dei messaggi validi conteneva la parola ‘acquista’.
Queste informazioni portano a valutare statisticamente la probabilità
dei seguenti eventi:
A. Il messaggio è spam
Ā. Il messaggio NON è spam (è valido)
B. Trovo la parola ‘acquista’ nel messaggio
B I A. Trovo la parola ‘acquista’ nel messaggio che è spam
B I Ā. Trovo la parola ‘acquista’ nel messaggio che NON è spam
Debbo quindi calcolare la probabilità che un messaggio sia spam,
sapendo che contiene la parola ‘acquista’, cioè P(A I B).
Quali probabilità conosco e come organizzo il calcolo?
Daniela Valen), Treccani Scuola 7 Filtro antispam: probabilità note
Eventi da esaminare
A. Il messaggio è spam
Ā. Il messaggio non è spam (è valido)
B. Il messaggio contiene la parola ‘acquista’
30
P(A) =
Prima valutazione statistica di probabilità:
il 30% dei messaggi è classificata spam
100
= 0, 3
P(A ) = 1− P(A) = 0, 7
Altre due informazioni da considerare:
€
- nell’80% delle spam ho trovato ‘acquista’
P(B A) =
€
- nel 2% delle NON spam ho trovato ‘acquista’
P(B A ) =
€
80
= 0,8
100
2
= 0, 02
100
Da tutte queste informazioni debbo ricavare la probabilità che sia spam un
messaggio che contiene la parola ‘acquista’, cioè debbo calcolare
P( A ∩€B)
P(A B) =
Daniela Valen), Treccani Scuola P( B)
8 Filtro antispam: calcolare P(A I B)
Un diagramma ad albero per organizzare il calcolo
Infine trovo
P ( A ∩ B) 0,24
P(A B) =
=
≅ 0,945
P ( B)
0,254
0,945 > 0,9, perciò il filtro tratterà il messaggio come spam
Daniela Valen), Treccani Scuola €
9 Riflessioni sul procedimento seguito
P( A ∩ B) = P( B A) ⋅ P( A)
€ B) =
P(A
P ( A ∩ B)
P ( B)
P( B) = P( B A) ⋅ P( A) + P( B A ) ⋅ P( A )
Ecco come calcolare €
P(AIB) a partire dalle probabilità note
€
P(B A) ⋅ P ( A)
P(A B) =
P(B A) ⋅ P ( A) + P(B A ) ⋅ P ( A )
Daniela Valen), Treccani Scuola €
10 La formula di Bayes
Risponde a una domanda:
Esempio In generale Come modifico la probabilità che Come modifico la probabilità di
una mail sia spam, quando so
un evento A, quando so che si è
che contiene la parola ‘acquista’? verificato un altro evento B?
La formula può essere scritta in varie forme:
P ( A ∩ B)
P(A B) =
P (B)
Se sono dati P(A ∩ B) e P (B)
Thomas Bayes
1701 - 1761
P(B A) ⋅ P ( A)
P(A B) =
P (B)
Se sono dati P(B A), P(A) e P (B)
P(B A) ⋅ P ( A)
P(A B) = € €
P(B A) ⋅ P ( A) + P(B A ) ⋅ P ( A )
€€
Se sono dati P ( A), P ( A ), P (B A), P (B A )
Daniela Valen), Treccani Scuola 11 Applicazioni della formula di Bayes
Numerose applicazioni della formula nei più
vari settori della realtà scientifica e sociale
Diagnosi mediche
Ricerca di relitti in mare
Daniela Valen), Treccani Scuola Intelligenza artificiale
Indagini della polizia e processi penali o civili
12 Attività 2
Il lavoro di gruppo è dedicato a risolvere problemi
che richiedono di applicare la probabilità composta,
insieme con la probabilità dell’evento
complementare o la formula di Bayes
Dividetevi in gruppi di 2 – 4 persone;
ogni gruppo avrà una scheda di
lavoro da completare.
Avete 30 minuti di tempo
Daniela Valenti, Treccani scuola
13
Che cosa abbiamo ottenuto
Daniela Valenti, Treccani scuola
14
Problema sul Totocalcio
0,4877 < 0,5
La storia del Totocalcio
La probabilità di ‘fare 14’
è poco più piccola della
probabilità che esca Testa
lanciando una moneta.
Il tifoso sbaglia 5
pronostici su 100
0,5133 > 0,5
Daniela Valenti, Treccani scuola
La probabilità di ‘fare 13’ era poco più grande della
probabilità che esca Testa lanciando una moneta.
15
Problema sugli errori di scrittura
Poco più grande
della probabilità
che non esca 6
lanciando un dado.
Ecco perché i nomi dei siti sono generalmente corti. Qualche esempio
Presidenza della repubblica italiana: www.quirinale.it
Presidenza del consiglio dei ministri: www.governo.it
Daniela Valenti, Treccani scuola
16
Problema sulle indagini nei processi
La formula di Bayes fornisce un procedimento scientifico per
prendere in considerazione tutte le informazioni disponibili,
ciascuna con la loro importanza, in modo da ottenere una
condivisibile valutazione di probabilità.
Daniela Valenti, Treccani scuola
17
I diagrammi ad albero
Sono un utile strumento per schematizzare i dati e il procedimento
risolutivo di un problema di calcolo delle probabilità.
Daniela Valenti, Treccani scuola
18
Problema sui test di gravidanza
Questo è il procedimento per valutare gli esperimenti che
studiano alcune importanti caratteristiche dei test clinici.
Daniela Valenti, Treccani scuola
19
Strumenti
essenziali
Diagrammi ad albero
Tabelle a doppia entrata
Daniela Valenti, Treccani scuola
Diagrammi di Venn
Formule
20
Problemi, giochi, paradossi, …
Guardiamo un video per incontrare un problema intrigante
Il problema di Monty Hall
https://www.youtube.com/watch?v=PJWmi7Ovaag
Steve Selvin, un professore americano di statistica,
propone il problema per la prima volta nel 1975.
Il problema compare poi nel 1990 su un settimanale
americano e da allora acquista popolarità, fino a
comparire fra le applicazioni per smartphone e tablet.
Steve Selvin (1941)
Ma come si arriva a risolvere il problema?
Daniela Valenti, Treccani scuola
21
Risolvere il problema di Monty Hall
Ecco un procedimento basato su un diagramma ad albero
Stesso ragionamento,
se il giocatore sceglie
la porta 2 o 3.
In rete si trovano video e documenti con molte altre soluzioni:
dopo tanti anni il problema continua a stimolare la creatività.
Daniela Valenti, Treccani scuola
22