Problemi e formula di Bayes Daniela Valen), Treccani Scuola 1 Problemi ‘antichi’ 1. Lancio una volta un dado A1: Esce 6 B1: NON esce 6 1 6 5 P( B1 ) = 6 P( A1 ) = € un dado 2. Lancio più volte Sapere l’esito del primo lancio non modifica la probabilità € esca 6 anche al secondo lancio. Ogni che esca o non lancio è indipendente dai precedenti. Ecco un video che illustra due classici problemi sul lancio ripetuto di dadi. Le scommesse del Cavalier De Méré https://www.youtube.com/watch?v=_buZhEQ0Upk Daniela Valen), Treccani Scuola 2 Riflessioni sul primo problema Ecco il problema dei quattro lanci di dadi successivi schematizzato con un diagramma ad albero 1 A1: Esce 6 6 5 P B = B1: NON esce 6 ( 1 ) 6 € P( A1 ) = € di un dado Riflettiamo sulla probabilità dei seguenti eventi in 4 lanci ⎛ 5 ⎞ 4 5 5 5 5 C.‘Non esce 6 per 4 volte’ C = B1 ∩ B2 ∩ B3 ∩ B4 ⇒ P(C) = ⋅ ⋅ ⋅ = ⎜ ⎟ 6 6 6 6 ⎝ 6 ⎠ ⎛ 5 ⎞ 4 D. ‘Esce 6 almeno una volta’ D = C ⇒ P( D) = 1− ⎜ ⎟ ≅ 0,5177 ⎝ 6 ⎠ Per risolvere il problema applico: la probabilità composta e la probabilità dell’evento complementare € € Daniela Valen), Treccani Scuola 3 Riflessioni sul secondo problema Estendo il procedimento a 24 lanci di 2 di dadi Una figura per visualizzare le 36 alternative nel lancio di 2 dadi A1: Esce doppio 6 P( A1 ) = 1 36 35 P B = B1: NON esce doppio 6 ( 1 ) 36 € € Riflettiamo sulla probabilità dei seguenti eventi relativi a 24 lanci di 2 dadi C.‘Non esce doppio 6 per 24 volte’ ⎛ 35 ⎞24 P(C) = ⎜ ⎟ ⎝ 36 ⎠ ⎛ 35 ⎞24 D. ‘Esce doppio 6 almeno una volta’ D = C ⇒ P( D) = 1− ⎜⎝ ⎟⎠ ≅ 0, 4914 36 € Daniela Valen), Treccani Scuola 4 Altre riflessioni sul secondo problema Che succede se lancio i due dadi più di 24 volte, ad esempio 26 volte? A1: Esce doppio 6 P( A1 ) = 1 36 B1: NON esce doppio 6 P( B1 ) = 35 36 € ⎛ 35 ⎞26 P( D) = 1− ⎜ ⎟ ≅ 0, 5193 ⎝ 36 ⎠ € Lancio i 2 dadi 26 volte e punto sull’uscita di almeno un doppio 6. È più probabile vincere che perdere Anche per risolvere il secondo problema applico: la probabilità composta e la probabilità dell’evento complementare Daniela Valen), Treccani Scuola 5 Un problema attuale Un notevole fastidio della posta elettronica (email) è l’arrivo di messaggi indesiderati (spam). Perciò molti gestori di email propongono un software (filtro antispam) che cerca parole frequenti nelle mail già ricevute e classificate come spam. Con gli esiti di questa ricerca, il filtro - valuta la probabilità P che sia una spam ogni nuovo messaggio; - mostra il messaggio solo se P è inferiore a dato un valore, ad esempio 0,9. Scopriamo, a partire da un esempio, il procedimento per calcolare la probabilità P e le sue numerose applicazioni nei più vari settori della realtà scientifica e sociale. Daniela Valen), Treccani Scuola 6 Un filtro antispam Un filtro antispam ha analizzato 5000 mail ricevute e ha trovato che: - il 30% delle mail ricevute è stata classificata spam dall’utente; - l’80% delle spam conteneva la parola ‘acquista’; - solo il 2% dei messaggi validi conteneva la parola ‘acquista’. Queste informazioni portano a valutare statisticamente la probabilità dei seguenti eventi: A. Il messaggio è spam Ā. Il messaggio NON è spam (è valido) B. Trovo la parola ‘acquista’ nel messaggio B I A. Trovo la parola ‘acquista’ nel messaggio che è spam B I Ā. Trovo la parola ‘acquista’ nel messaggio che NON è spam Debbo quindi calcolare la probabilità che un messaggio sia spam, sapendo che contiene la parola ‘acquista’, cioè P(A I B). Quali probabilità conosco e come organizzo il calcolo? Daniela Valen), Treccani Scuola 7 Filtro antispam: probabilità note Eventi da esaminare A. Il messaggio è spam Ā. Il messaggio non è spam (è valido) B. Il messaggio contiene la parola ‘acquista’ 30 P(A) = Prima valutazione statistica di probabilità: il 30% dei messaggi è classificata spam 100 = 0, 3 P(A ) = 1− P(A) = 0, 7 Altre due informazioni da considerare: € - nell’80% delle spam ho trovato ‘acquista’ P(B A) = € - nel 2% delle NON spam ho trovato ‘acquista’ P(B A ) = € 80 = 0,8 100 2 = 0, 02 100 Da tutte queste informazioni debbo ricavare la probabilità che sia spam un messaggio che contiene la parola ‘acquista’, cioè debbo calcolare P( A ∩€B) P(A B) = Daniela Valen), Treccani Scuola P( B) 8 Filtro antispam: calcolare P(A I B) Un diagramma ad albero per organizzare il calcolo Infine trovo P ( A ∩ B) 0,24 P(A B) = = ≅ 0,945 P ( B) 0,254 0,945 > 0,9, perciò il filtro tratterà il messaggio come spam Daniela Valen), Treccani Scuola € 9 Riflessioni sul procedimento seguito P( A ∩ B) = P( B A) ⋅ P( A) € B) = P(A P ( A ∩ B) P ( B) P( B) = P( B A) ⋅ P( A) + P( B A ) ⋅ P( A ) Ecco come calcolare € P(AIB) a partire dalle probabilità note € P(B A) ⋅ P ( A) P(A B) = P(B A) ⋅ P ( A) + P(B A ) ⋅ P ( A ) Daniela Valen), Treccani Scuola € 10 La formula di Bayes Risponde a una domanda: Esempio In generale Come modifico la probabilità che Come modifico la probabilità di una mail sia spam, quando so un evento A, quando so che si è che contiene la parola ‘acquista’? verificato un altro evento B? La formula può essere scritta in varie forme: P ( A ∩ B) P(A B) = P (B) Se sono dati P(A ∩ B) e P (B) Thomas Bayes 1701 - 1761 P(B A) ⋅ P ( A) P(A B) = P (B) Se sono dati P(B A), P(A) e P (B) P(B A) ⋅ P ( A) P(A B) = € € P(B A) ⋅ P ( A) + P(B A ) ⋅ P ( A ) €€ Se sono dati P ( A), P ( A ), P (B A), P (B A ) Daniela Valen), Treccani Scuola 11 Applicazioni della formula di Bayes Numerose applicazioni della formula nei più vari settori della realtà scientifica e sociale Diagnosi mediche Ricerca di relitti in mare Daniela Valen), Treccani Scuola Intelligenza artificiale Indagini della polizia e processi penali o civili 12 Attività 2 Il lavoro di gruppo è dedicato a risolvere problemi che richiedono di applicare la probabilità composta, insieme con la probabilità dell’evento complementare o la formula di Bayes Dividetevi in gruppi di 2 – 4 persone; ogni gruppo avrà una scheda di lavoro da completare. Avete 30 minuti di tempo Daniela Valenti, Treccani scuola 13 Che cosa abbiamo ottenuto Daniela Valenti, Treccani scuola 14 Problema sul Totocalcio 0,4877 < 0,5 La storia del Totocalcio La probabilità di ‘fare 14’ è poco più piccola della probabilità che esca Testa lanciando una moneta. Il tifoso sbaglia 5 pronostici su 100 0,5133 > 0,5 Daniela Valenti, Treccani scuola La probabilità di ‘fare 13’ era poco più grande della probabilità che esca Testa lanciando una moneta. 15 Problema sugli errori di scrittura Poco più grande della probabilità che non esca 6 lanciando un dado. Ecco perché i nomi dei siti sono generalmente corti. Qualche esempio Presidenza della repubblica italiana: www.quirinale.it Presidenza del consiglio dei ministri: www.governo.it Daniela Valenti, Treccani scuola 16 Problema sulle indagini nei processi La formula di Bayes fornisce un procedimento scientifico per prendere in considerazione tutte le informazioni disponibili, ciascuna con la loro importanza, in modo da ottenere una condivisibile valutazione di probabilità. Daniela Valenti, Treccani scuola 17 I diagrammi ad albero Sono un utile strumento per schematizzare i dati e il procedimento risolutivo di un problema di calcolo delle probabilità. Daniela Valenti, Treccani scuola 18 Problema sui test di gravidanza Questo è il procedimento per valutare gli esperimenti che studiano alcune importanti caratteristiche dei test clinici. Daniela Valenti, Treccani scuola 19 Strumenti essenziali Diagrammi ad albero Tabelle a doppia entrata Daniela Valenti, Treccani scuola Diagrammi di Venn Formule 20 Problemi, giochi, paradossi, … Guardiamo un video per incontrare un problema intrigante Il problema di Monty Hall https://www.youtube.com/watch?v=PJWmi7Ovaag Steve Selvin, un professore americano di statistica, propone il problema per la prima volta nel 1975. Il problema compare poi nel 1990 su un settimanale americano e da allora acquista popolarità, fino a comparire fra le applicazioni per smartphone e tablet. Steve Selvin (1941) Ma come si arriva a risolvere il problema? Daniela Valenti, Treccani scuola 21 Risolvere il problema di Monty Hall Ecco un procedimento basato su un diagramma ad albero Stesso ragionamento, se il giocatore sceglie la porta 2 o 3. In rete si trovano video e documenti con molte altre soluzioni: dopo tanti anni il problema continua a stimolare la creatività. Daniela Valenti, Treccani scuola 22