Probabilità. Un percorso didattico ancora sulla legge della moltiplicazione probabilità che dipendono da altre L. Cappello, C. Bonmassar a cura di L. Cappello 12 Giugno 2014 Didattica probabilità e statistica PAS 2014 1 Probabilità di eventi non elementari – Contesti significativi letture per la classe oppure approfondimento per alcuni che poi espongono Il daltonismo Noto il patrimonio genetico dei genitori, sono indipendenti gli eventi “avere un figlio daltonico” e “avere un figlio maschio”? Alcune abilità coinvolte: - interpretare un testo scientifico-matematico - modellizzare in vari modi schemi con frecce, diagramma di Punnet, grafo ad albero, … - effettuare collegamenti con le altre discipline raccomandato nelle Indicazioni nazionali - giustificare e argomentare Didattica probabilità e statistica PAS 2014 2 Probabilità di eventi non elementari – Contesti significativi Un caso giudiziario diventato un classico • 18 giugno 1964. Los Angeles. Juanita Brooks viene derubata. • I testimoni individuano sei caratteristiche dei due responsabili: - uomo di colore con la barba - uomo con i baffi - donna bianca con capelli biondi - donna con la coda di cavallo - coppia mista in un’automobile - automobile gialla 1/10 1/4 1/3 1/10 1/1000 1/10 • E’ arrestata la coppia Malcom e Janet Collins. Presenta tali caratteristiche. • L’accusa stima la probabilità che una coppia possieda una di tali caratteristiche. • Qual è la probabilità che una coppia qualunque possieda le 6 caratteristiche? p= 1 10 1 1 1 1 ∙ 4 3 10 1000 ∙ ∙ ∙ ∙ 1 10 = 𝟏 𝟏𝟐.𝟎𝟎𝟎.𝟎𝟎𝟎 Didattica probabilità e statistica PAS 2014 … per il consulente 3 Probabilità di eventi non elementari – Contesti significativi Un caso giudiziario diventato un classico • 1964. La giuria dichiara colpevole la coppia arrestata. • 1968. La corte suprema dello Stato della California annulla la sentenza. Quali errori sono stati commessi nel primo processo? Esaminiamone uno. La legge della moltiplicazione ha la forma p(A e B) = p(A) ∙ p(B) solo se A, B sono indipendenti. Ma le 6 caratteristiche (A = “uomo di colore con la barba” … ) non sono indipendenti! Didattica probabilità e statistica PAS 2014 4 Probabilità di eventi non elementari – Contesti significativi Un caso giudiziario diventato un classico esaminiamo l’errore mediante un esempio In un Istituto 1 studente su 30 pratica lo scialpinismo, 1 su 10 l’arrampicata. La probabilità che un suo studente scelto a caso pratichi entrambi gli sport è 1 30 ∙ 1 10 ? - Per applicare la legge della moltiplicazione serve sapere la percentuale di scialpinisti dell’Istituto che arrampica. - Tra gli scialpinisti, gli arrampicatori saranno (ragionevolmente) più di 1/10, che è il rapporto relativo all’intera scuola. Praticare lo scialpinismo ed arrampicare non sono eventi indipendenti! - Se, tra gli scialpinisti, gli arrampicatori sono 1/4, allora la probabilità richiesta è 1 30 𝟏 𝟏 𝟒 𝟏𝟐𝟎 ∙ = ≠ 1 300 Quindi attenzione nell’applicare la legge della moltiplicazione! Didattica probabilità e statistica PAS 2014 5 Probabilità di eventi non elementari – Un pb istruttivo Ti trovi ad una festa a cui partecipano 23 persone. Qual è la probabilità che almeno due tra esse compiano gli anni in uno stesso giorno (anche se sono nate in anni diversi)? Attività - Esaminare i compleanni di alcune classi - Ogni studente scrive un naturale “a caso” tra 1 e 365; poi si confrontano i numeri scritti - Esaminare i compleanni dei titolari e dell’arbitro (22+1) di alcune partite di calcio della squadra del cuore Mondiale di calcio 2014. Ogni squadra deve convocare 23 giocatori. Per 15 squadre su 32: almeno due giocatori compiono gli anni nello stesso giorno. (dati da wikipedia, 1/06) gli studenti formulano delle congetture sul risultato del problema iniziale Didattica probabilità e statistica PAS 2014 6 Probabilità di eventi non elementari – Un pb istruttivo Risolviamo il problema - un caso più semplice: alla festa ci sono 3 persone un suggerimento: consideriamo l’evento complementare risoluzione e osservazioni - le ipotesi: non condizioni astratte … le nascite secondo l’Istat la formalizzazione: esigenza di precisione e coincisione Didattica probabilità e statistica PAS 2014 7 Probabilità di eventi non elementari – Un pb istruttivo Diamo i numeri … Ad una festa scommetti che almeno due partecipanti compiano gli anni in uno stesso giorno. Affinché la tua probabilità di vittoria sia maggiore del 50%, i partecipanti devono essere più di 182? n. persone p ( ≥ 2 compleanni = giorno) 10 20 23 30 40 50 56 0,12 0,41 0,51 0,71 0,90 0,97 0,99 p n Qual è il più piccolo naturale per cui tale probabilità è maggiore di un dato valore? Didattica probabilità e statistica PAS 2014 8 Probabilità di eventi non elementari – Un pb istruttivo Vogliamo comprendere Perché la probabilità del problema iniziale è “grande”? Ti trovi ad una festa a cui partecipano 23 persone. Qual è la probabilità che almeno una tra esse compia gli anni nel tuo stesso giorno (oltre a te)? p=1− 364 22 365 ≈ 0,0586 L’idea: - nel pb iniziale (“in uno stesso giorno”) i casi favorevoli non sono 23 intervengono le coppie di persone … 23 ∙ 22 /2 - in questo pb (“nel tuo stesso giorno”) le coppie sono 22 un approfondimento: compleanni e coincidenze Didattica probabilità e statistica PAS 2014 9 Probabilità che dipendono da altre – Le informazioni già incontrate nelle attività precedenti, ora approfondiamo (secondo biennio) Tavole di mortalità - ISTAT 2010 età num. viventi maschi num. viventi femmine 0 100.000 100.000 40 97.921 98.918 70 81.482 89.879 popolazione stazionaria scelta a caso Qual è la probabilità che una quarantenne viva almeno fino a 70 anni? 𝑝("70 da 40") = 𝟖𝟗. 𝟖𝟕𝟗 ≈ 0,909 𝟗𝟖. 𝟗𝟏𝟖 Didattica probabilità e statistica PAS 2014 Probabilità che dipendono da altre – Le informazioni Vale 𝑝 "70 da 40" > 𝑝 "70" ≈ 0,899 età n. viventi maschi n. viventi femmine 0 100.000 100.000 40 97.921 98.918 70 81.482 89.879 Perché le due probabilità sono diverse? In “70 da 40” usiamo informazioni in più Più precisamente - casi favorevoli: {70-enni} - casi possibili di “70 da 40”: {40-enni} di “70”: insieme I - si ha {40-enni} ⊂ I probabilità condizionata I {40-enni} {70-enni} Un’altra giustificazione 𝑝 70 𝑑𝑎 40 = 𝑝 70 𝑝(40) e 0 < 𝑝 40 < 1 Didattica probabilità e statistica PAS 2014 11 Probabilità che dipendono da altre – Le informazioni Fumatori Su una popolazione di 1.000.000 individui, 32.700 hanno una certa malattia; di questi ultimi, 22.300 sono fumatori. I fumatori costituiscono il 20% della popolazione. Qual è la probabilità di avere tale malattia per un fumatore? U = {individui pop.} F = {fumatori} M = {ammalati} Insieme dei nuovi “casi possibili”? F Insieme dei “casi favorevoli”? M ∩ F 𝑝𝐹 (𝑀) = 𝟐𝟐. 𝟑𝟎𝟎 ≈ 𝟎, 𝟏𝟏 𝟐𝟎𝟎. 𝟎𝟎𝟎 invece 𝑝 𝑀 = Didattica probabilità e statistica PAS 2014 32.700 = 0,0327 1.000.000 12 Probabilità che dipendono da altre – Le informazioni Due dadi Calcola la probabilità che in un lancio di due dadi, uno bianco e l’altro giallo, escano due “6” a) senza informazioni aggiuntive b) sapendo che è uscito almeno un “6” c) sapendo che l’esito del dado giallo è “6” una rappresentazione grafica della questione le risposte: a) 1/36 b) 1/11 c) 1/6 Le nuove informazioni modificano l’insieme dei “casi possibili”. proporre però anche contesti ricchi Didattica probabilità e statistica PAS 2014 13 Probabilità che dipendono da altre – Le attenzioni alcune precisazioni … per le classi che possono apprezzarle Ok ricorrere all’intuizione, ma attenzione: - dipendenza non è sempre “influenza” tra eventi statistica sulle case inglesi dopo la seconda guerra mondiale - indipendenza non è sempre intuitiva esempio del lancio di un dado Se vi sono dubbi si può ricorrere alla condizione formale di indipendenza degli eventi A, B: 𝑝 𝐴 ∩ 𝐵 = 𝑝(𝐴) ∙ 𝑝(𝐵) Didattica probabilità e statistica PAS 2014 14 Probabilità che dipendono da altre – Il punto Dati due eventi A e B tali che p(B)≠0, diciamo probabilità condizionata di A dato B, la probabilità che si verifichi l’evento A qualora si sappia che si è verificato B. E la indichiamo con 𝑝𝐵 𝐴 . U B A Insieme dei nuovi “casi possibili” = B Insieme dei “casi favorevoli” = A ∩ B Si ha pB A = U A∩B p(A ∩ B) p(B) dove le probabilità p sono valutate rispetto all’insieme U in cui si considerano contenuti A, B. Didattica probabilità e statistica PAS 2014 15 Probabilità che dipendono da altre – Il punto Una giustificazione della formula pB A = p(A∩B) p(B) (*) • Si è verificato B; qual è la nuova probabilità di A? Con lo schema classico misura (𝐀 ∩ 𝐁) 𝐩𝐁 𝐀 = misura (𝐁) A BU U entrambe le misure sono effettuate rispetto allo stesso insieme U • Ma nella interpretazione geometrica della probabilità, la probabilità di un insieme è una sua misura. Pertanto misura 𝐀 ∩ 𝐁 = 𝐩(𝐀 ∩ 𝐁) misura 𝐁 = 𝐩(𝐁) Riferimento per la formula (*) e attività che la preparano o consolidano Didattica probabilità e statistica PAS 2014 16 Probabilità che dipendono da altre – Il docente Quanto appena proposto sulla probabilità condizionata è rivolto agli studenti di scuola secondaria. ll docente dovrebbe tenere presente che - la formula (*) è la definizione di probabilità condizionata nell’ambito della teoria assiomatica A | B non è un evento - a partire dalla definizione (*) si dimostra che nell’approccio classico la probabilità condizionata è la probabilità dell’evento sapendo che …(slide 15) - questo ultimo risultato è il significato di probabilità condizionata nell’approccio classico Didattica probabilità e statistica PAS 2014 17 Probabilità che dipendono da altre – Uno dei pb iniziali Ancora test clinici Il test “Elisa”, relativo all’HIV, può fornire esiti errati. Precisamente vi è una probabilità del 99,9% che il test dia esiti positivi nei soggetti che effettivamente hanno contratto l’HIV (sensibilità del test) ed una probabilità del 99,9% che il test risulti negativo nei soggetti che non hanno l’HIV (specificità del test). Consideriamo ora una certa popolazione. Assumiamo che lo 0,3% della quantità di individui di tale popolazione abbia l’HIV (prevalenza della malattia). Il test, applicato ad un individuo scelto a caso in tale popolazione, ha dato esito positivo. Qual è la probabilità che tale individuo sia in realtà sano, cioè non abbia l’HIV? è opportuno aver prima affrontato i problemi test clinici “diretti” (slide 36 e 37 dell’incontro 3) Didattica probabilità e statistica PAS 2014 18 Probabilità che dipendono da altre – Uno dei pb iniziali • Modellizziamo il problema T- T+ 0,003 Mc prob. condizionata MC 99,9% di M c M 0,999 0,999 99,9% di M M T- T+ 0,3% dei casi iniziali T+ T- cella: evento intersezione cammino: evento intersezione • E’ richiesta la probabilità dell’evento “l’individuo non è malato, sapendo che il test ha avuto esito positivo”, ossia 𝒑𝑻+ (𝑴𝑪 ) Attenzione all’evento “sapendo che l’individuo non è malato, il test ha avuto esito positivo” - l’insieme dei casi possibili è rappresentato sulla tabella dalla prima riga - la sua probabilità si denota con 𝑝𝑀𝑐 (𝑇 +) - si ha 𝒑𝑻+ 𝑴𝑪 ≠ 𝑝𝑀𝑐 (𝑇 +) Didattica probabilità e statistica PAS 2014 19 Probabilità che dipendono da altre – Uno dei pb iniziali • Risolviamo il problema risoluzione completa e osservazioni • Interpretiamo il risultato - 𝑝𝑇 + 𝑀𝐶 ≈ 25%: si controlla l’esito con il test Western Blot 𝑝𝑇 − 𝑀 è trascurabile (da calcolo analogo); questo è importante? Didattica probabilità e statistica PAS 2014 20 Probabilità che dipendono da altre – Uno dei pb iniziali • Esploriamo la situazione - Come varia la probabilità richiesta al variare dei valori in ipotesi? proviamo - Il test ha sensibilità e specificità “alte”. Perchè allora non è “bassa” la probabilità che il test positivo sia errato (è circa il 25%)? La malattia ha bassa prevalenza, pertanto ci sono “molti” sani ; la probabilità di falso è “bassa” ma è applicata a “molti”: quindi ci possono essere “non pochi” falsi. Un esempio numerico. Popolazione di 1.000.000 di individui: a) 997.000 sani; tra essi i test positivi “sono” lo 0,1%, ossia 997 falsi b) 3.000 malati; tra essi i test positivi “sono” il 99,9%, ossia 2997 veri Così, tra i test positivi, i falsi non sono pochi rispetto ai veri. L’attività sviluppa le abilità di previsione e controllo dei risultati del problema. Didattica probabilità e statistica PAS 2014 Probabilità che dipendono da altre – Uno dei pb iniziali • E se applicassimo direttamente la formula di Bayes? 𝑐 𝑝 𝑀 |𝑇 + = 𝒑 𝑴𝒄 𝒑(𝑴𝒄 ) ∙ 𝒑(𝑻+ |𝑴𝒄 ) ∙ 𝒑 𝑻 + 𝑴𝒄 + 𝒑 𝑴 ∙ 𝒑 𝑻 + 𝑴 = 0,997 ∙ 0,001 0,997 ∙ 0,001 + 0,003 ∙ 0,999 - l’espressione è uguale a quella ottenuta con il procedimento grafico - anzi, per ricavare la formula basta ripercorrerlo: - dà la probabilità (a posteriori) delle “cause” … note quelle degli “effetti” - la formula compare nelle Indicazioni nazionali Perché preferire l’approccio mediante modelli grafici? - per comprendere il significato del procedimento risolutivo - per controllarlo - per poter ricostruire il procedimento a lungo termine Didattica probabilità e statistica PAS 2014 22 Probabilità che dipendono da altre – Letture e attività letture dal primo incontro • Test antidoping (primo incontro slide 9 – Medici_tedeschi.pdf) Qual è la probabilità che l’atleta positivo al test sia effettivamente dopato? Assumi che la probabilità di risultare positivo per il non dopato sia dell’1%, quella di essere positivo per il dopato sia del 50%, e che i dopati siano il 10% degli atleti. Pb analogo all’ultimo sui test clinici. Ora M = “l’individuo è dopato”. Un modello che mostra le informazioni fornite: 0,10 MC M 0,50 0.01 T- Il procedimento è analogo: 𝑝𝑇 + T+ T- T+ 𝑝 𝑀 ∩ 𝑇+ 0,1 ∙ 0,5 𝑀 = = ≈ 𝟎, 𝟖𝟒𝟕 𝑝 𝑇+ 0,9 ∙ 0,01 + 0,1 ∙ 0,5 Eventualmente prima risolvere il problema su 1.000 atleti, usando le frequenze … Didattica probabilità e statistica PAS 2014 23 Probabilità che dipendono da altre – Letture e attività • Processo ad O.J. Simpson ( primo incontro slide 12 – Uomini_picchiano_donne.pdf) a) Difesa: tra le donne percosse dal compagno, solo lo 0,04% è uccisa da lui b) Studi: tra le donne percosse dal compagno e uccise, il 90% è uccisa da lui - Rappresenta con diagrammi di Venn le due situazioni ora descritte. - Esprimi ciascuna situazione mediante la probabilità condizionata. - Quale tra le 2 valutazioni di probabilità ti sembra adeguata? Perché? a) b) B B D C 𝑝𝑩 (𝑪)= 0,04% C B ={picchiate compagno} C ={uccise da compagno} D ={picchiate compagno e uccise} • Filtri anti-spam (primo incontro slide 13 – Antispam.pdf) Didattica probabilità e statistica PAS 2014 𝒑𝑫 𝑪 = 𝟗𝟎%