MATEMATICA a.a. 2014/15 5. Introduzione alla probabilità: Probabilità condizionata. Eventi indipendenti. Teorema di Bayes Probabilità condizionata Ogni probabilità è subordinata all’informazione corrente Urna 1 1 2 3 3 4 Probabilità che esca un numero <3 = Supponiamo di sapere che è uscito un numero pari Urna 1 1 2 3 3 4 Probabilità che esca un numero <3 sapendo che è uscito un numero pari = Probabilità condizionata Spazio campionario ridotto A= esce un numero <3 1 1 3 3 2 B= esce un numero pari 4 1 1 2 3 3 4 3 Probabilità condizionata Se A e B sono due eventi dello spazio degli eventi Ω e P(B)>0, allora la probabilità condizionata di A dato B è: Evento condizionante Con spazi finiti, la definizione è intuitivamente ovvia: se B si è verificato, il nuovo spazio di riferimento si “restringe” proprio ad B e la probabilità che si verifichi A sarà data dal rapporto tra la massa di probabilità contenuta nell’intersezione A ∩ B e quella contenuta in B. La probabilità condizionata è la probabilità di un evento condizionata al verificarsi di un altro evento 4 Regola del prodotto (Teorema della Probabilità Composte) Quindi la probabilità che si verifichino contemporaneamente due eventi A e B è P(A ∩ B) = P(A) ⋅ P(B A) = P(B) ⋅ P(A B) ossia la probabilità che si verifichi il primo per la probabilità che si verifichi il secondo dato il primo La regola del prodotto generalizzata permette di trovare la probabilità che si verifichino due eventi anche quando sono dipendenti. 5 6 7 EVENTI INDIPENDENTI Due eventi A e B si dicono indipendenti se il verificarsi di B non influenza la probabilità del verificarsi di A e il verificarsi di A non influenza la probabilità di B. P( A / B ) = P( A) P( B / A) = P( B ) da cui: P( A ∩ B) P( A / B )= = P ( A) ⇒ P( A ∩ B ) = P( A) ⋅ P( B) P( B) Se due eventi sono indipendenti la probabilità che si verifichino entrambi (probabilità dell’intersezione dei due eventi) è data dal prodotto delle due probabilità 8 EVENTI INDIPENDENTI Nel lancio di dadi: se si lancia due volte consecutivamente lo stesso dado a 6 facce non truccato, la probabilità che il primo lancio dia 3 è 1/6. Qual è la probabilità che si abbia 3 anche dal risultato del secondo lancio consecutivo? La probabilità è sempre 1/6, indipendentemente dal fatto che il risultato del primo lancio sia stato 3 o no. Poiché il risultato del primo lancio non influenza la probabilità di ottenere 3 nel secondo lancio, possiamo dire che i due eventi sono indipendenti. Due eventi sono indipendenti se il verificarsi di uno dei due non influenza la probabilità che si verifichi l’altro La regola del prodotto Quando due eventi sono indipendenti, la probabilità che si verifichino entrambi (probabilità dell’intersezione di due eventi) è data dal prodotto della probabilità del primo evento per la probabilità del secondo. Questa proprietà consente di stabilire se due (o più) variabili sono associate. 9 Esempi con una tabella doppia Intenzione di acquisto e acquisto effettivo Intenzione di acquisto Acquisto effettivo Tot Tot si no si 200 50 250 no 100 650 750 300 700 1000 Gli eventi “intenzione di acquisto”, “intenzione di non acquisto”, “acquisto effettivo”, “non acquisto effettivo” sono eventi elementari L’evento “intenzione di non acquisto” è l’evento complementare di “intenzione di acquisto” L’evento “intenzione di acquisto” e “acquisto effettivo” è un evento congiunto 10 Probabilità marginali Intenzione di acquisto Acquisto effettivo A B B 200 50 Tot P(A) = 250 = 0,25 1000 Probabilità di pianificare l’acquisto 250 P(A) = 750 = 0,75 = 1 − P(A) 1000 Probabilità di non pianificare l’acquisto A 100 650 750 P(B) = 300 = 0,30 1000 Probabilità di acquistare Tot 300 700 1000 P(B ) = Le prob marginali sono le freq rel dell’ultima riga e dell’ultima colonna 700 = 0,70 = 1 − P(B) 1000 Probabilità di non acquistare 11 Probabilità congiunte Intenzione di acquisto Acquisto effettivo Tot A A Tot B B 200 50 250 100 650 750 300 700 P(A e B) = 200 = 0,20 1000 P(A ∩ B) Probabilità di 1000 pianificare l’acquisto e di effettuare l’acquisto P(A e B ) = P(A ∩ B ) Le prob congiunte sono le freq rel delle caselle interne 50 = 0,05 1000 Probabilità di pianificare l’acquisto e di non effettuare l’acquisto 12 Probabilità condizionate Intenzione di acquisto Acquisto effettivo Tot A A Tot B B 200 50 250 100 650 750 300 700 1000 L’acquisto effettivo dipende dall’intenzione di acquisto P(B | A) = P(A ∩ B) 0,20 = = 0,8 P(A) 0,25 Probabilità di acquistare dato che si è pianificato l’acquisto La probabilità di effettuare l’acquisto cresce se si conosce che l’acquisto è stato pianificato P(B | A) = 0,80 > P(B) = 0,30 13 Probabilità condizionate Intenzione di acquisto Acquisto effettivo Tot A A Tot B B 200 50 250 100 650 750 300 700 1000 Per calcolare probabilità condizionate ad A, si suppone che A si sia verificato. Questo restringe il numero delle osservazioni da 1000 a 250 P(B | A) = 200 = 0,8 250 P(B | A) = 50 = 0,2 250 14 Probabilità condizionate come freq rel di riga Acquisto effettivo Tot Intenzione di acquisto B Tot B P(B | A) P(B | A) A = 0,80 = 0,20 P(B | A) P(B | A) A = 0,13 = 0,87 1 1 Allo stesso modo, condizionandoci all’evento complementare di A 100 P(B | A) = = 0,13 750 650 P(B | A) = = 0,87 750 Le probabilità condizionate ad A coincidono con le frequenze relative della prima riga. Le probabilità condizionate ad A complementare coincidono con le frequenze relative della seconda riga 15 Esempio Uno studio (dati pubblicati su un comunicato stampa della American Society for Microbiology pubblicato il 15 settembre 2003) ha stimato che la probabilità che un uomo si lavi le mani dopo aver usato il bagno è pari a 0.74, mentre questa probabilità è pari a 0.83 per una donna. Una grande stanza contiene 40 uomini e 60 donne. Supponete che uomini e donne abbiano un’uguale probabilità di usare il bagno. Qual è la probabilità che il prossimo individuo – uomo o donna – che utilizza il bagno si lavi le mani. P (lavarsi le mani) = P ( Lm U ) ⋅ P (U ) + P ( Lm D ) = = 0.74 × 0.40 + 0.83 × 0.60 = 0.794 Legge della probabilità totale: P (X ) = ∑ P (Y ) P ( X Y ) i i i 16 Legge della probabilità totale: P (X ) = ∑ P (Y ) P ( X Y ) i i i La legge della probabilità totale permette di calcolare la probabilità di un evento X in base a tutte le probabilità condizionate di quell’evento. Nella legge si somma, per tutte le possibili condizioni Yi, la probabilità di quella condizione P(Yi) moltipilicata per la probabilità condizionata dell’evento X data quella condizione Pr(X/Yi) 17 Un’importante relazione matematica sulla probabilità condizionata è data dal Teorema di Bayes 18 Il Teorema di Bayes Nota: P(A/B) è diversa da P(B/A) P(febbre/influenza) P(influenza/febbre) Il teorema di Bayes consente di calcolare l’una dall’altra 19 Il Teorema di Bayes Supponiamo che l’incidenza totale dell’influenza sia pari all’1% un soggetto con l’influenza ha una probabilità del 90% di probabilità di avere la febbre un soggetto senza influenza ha il 5% di probabilità di avere la febbre Il teorema di Bayes permette di sapere qual è la probabilità di avere l’influenza se si ha la febbre Traduzione I= avere l’influenza F= avere la febbre P(I)=0,01 P(F/I)=0,90 P(F/non I)=0,05 Attenzione: P(F/non I) è diversa da 1-P(F/I) Il Teorema di Bayes Qual è la probabilità di avere la febbre? P(F) = P(F I)P(I) + P(F I)P(I) I e non I (avere l’influenza e non avere l’influenza) sono due eventi incompatibili ed esaustivi P ( F ) = 0,90 ⋅ 0,01 + 0,05 ⋅ 0,99 = 0,0585 Il teorema di Bayes permette di conoscere qual è la probabilità di avere l’influenza dato che si ha la febbre P(I ∩ F) P(F I)P(I) 0, 009 P(I F) = = = = 0,154 P(F) P(F) 0, 0585 Il Teorema di Bayes Approccio logico-intuitivo Supponiamo che un dato evento B appartenente a Ω sia necessariamente prodotto da una delle “cause” A , A ,....., A ,incompatibili 1 2 k (non si possono presentare insieme) ed esaustive (una di esse deve presentarsi). Tali eventi costituiscono una Partizione dello spazio campionario. La probabilità che la “causa” Ai si presenti è data da P(Ai ) = 1 ) e la probabilità che, essendosi P(Ai ) (con presentata, produca l’evento B è data da P(B Ai ) . ∑ A posteriori, si sa che l’evento B si è verificato: qual è la probabilità che sia stato prodotto dalla “causa” Ai? 22 Schema per la formula di Bayes A1 Ω B B ∩ A1 B ∩ A3 B ∩ A2 A2 Ω = A1 ∪ A2 ∪ A3 A3 Ai ∩ A j = ∅ ∀i,j B = B ∩ Ω = (B ∩ A1 ) ∪ (B ∩ A2 ) ∪ (B ∩ A3 ) P(B) = P(B ∩ A1 ) + P(B ∩ A2 ) + P(B ∩ A3 ) = = P(A1 ) ⋅ P(B A1 ) + P(A2 ) ⋅ P(B A2 ) + P(A3 ) ⋅ P(B A3 ) 23 Poiché: P(Ai ∩ B) P(Ai B) = P(B) si ottiene la formula di Bayes: P(A i | B) = P(A i ) ⋅ P(B | A i ) k i = 1,2,..., k ∑ P(A ) ⋅ P(B | A ) i i i=1 P(A i ) prob. a priori P(B | Ai ) prob. condizionate o verosimiglianze P(A i | B) prob. a posteriori (o aggiornate) 24 Teorema di Bayes: un’applicazione Il responsabile l’opportunità di vino passito. Da quello che è solo il 40% dei avuto successo P(S) = 0,40 di un’azienda vinicola valuta lancio sul mercato di un nuovo accaduto in passato, è noto che prodotti lanciati sul mercato ha P(S) = 0,60 S è l’evento “il prodotto ha successo sul mercato” S è l’evento complementare “il prodotto non ha successo sul mercato” S e S costituiscono una partizione di Ω Sono eventi incompatibili ed esaustivi 25 Teorema di Bayes: un’applicazione Prima del lancio, un esperto enologo analizza le caratteristiche del prodotto e emette un giudizio (favorevole/non favorevole all’introduzione sul mercato) Sempre da ciò che si è verificato in passato, è noto che l’80% dei prodotti di successo avevano ricevuto un giudizio positivo, mentre solo il 30% dei prodotti che non hanno avuto successo erano stati giudicati positivamente P(F | S) = 0,80 F è l’evento “giudizio favorevole” P(F | S) = 0,30 F|S è l’evento “giudizio favorevole” sapendo che il prodotto ha avuto successo 26 Teorema di Bayes: un’applicazione Per il nuovo vino passito, gli esperti di marketing hanno espresso un giudizio favorevole. Qual è la probabilità che il prodotto abbia successo? P(S | F) = ? P(F | S) ⋅ P(S) P(S | F) = P(F | S) ⋅ P(S) + P(F | S) ⋅ P(S) 0,80 ⋅ 0,40 = = 0,64 0,80 ⋅ 0,40 + 0,30 ⋅ 0,60 27 Applicazione ad un problema medico (esempio tratto dal testo di Borra-Di Ciaccio, pag. 207) Si è a conoscenza che in una certa popolazione il 10% degli individui è affetto da una determinata patologia. Un test diagnostico deve essere effettuato per verificare o meno la presenza della patologia. Però è anche noto che il test risulta negativo per il 10% dei malati e risulta positivo per il 20% dei sani. Allora ci si chiede ma se il test risulta positivo qual è la probabilità che l’individuo sia effettivamente malato? 28 Applicazione ad un problema medico (esempio tratto dal testo di Borra-Di Ciaccio, pag. 207) Probabilità a priori di essere affetto da una patologia: P(malato)=0,1 Probabilità condizionate: P(test positivo| non malato) =0, 2 P(test negativo|malato) =0, 1 devo trovare la probabilità a posteriori ovvero P(malato|test positivo): P(malato)*P(test positivo|malato)=0,1*0,9 P(malato)* P(test positivo|malato)+P(non malato)*P(positivo|non malato)=0,1*0,9+0,9*0,2 P(malato|test positivo)=0,33 29