Probabilità. Un percorso didattico
ancora sulla legge della moltiplicazione
probabilità che dipendono da altre
L. Cappello, C. Bonmassar
a cura di L. Cappello
12 Giugno 2014
Didattica probabilità e statistica PAS 2014
1
Probabilità di eventi non elementari – Contesti
significativi
letture per la classe oppure approfondimento per alcuni che poi espongono
Il daltonismo
Noto il patrimonio genetico dei genitori, sono indipendenti gli eventi
“avere un figlio daltonico” e “avere un figlio maschio”?
Alcune abilità coinvolte:
- interpretare un testo scientifico-matematico
- modellizzare in vari modi
schemi con frecce, diagramma di Punnet, grafo ad albero, …
- effettuare collegamenti con le altre discipline
raccomandato nelle Indicazioni nazionali
- giustificare e argomentare
Didattica probabilità e statistica PAS 2014
2
Probabilità di eventi non elementari – Contesti
significativi
Un caso giudiziario diventato un classico
• 18 giugno 1964. Los Angeles. Juanita Brooks viene derubata.
• I testimoni individuano sei caratteristiche dei due responsabili:
- uomo di colore con la barba
- uomo con i baffi
- donna bianca con capelli biondi
- donna con la coda di cavallo
- coppia mista in un’automobile
- automobile gialla
1/10
1/4
1/3
1/10
1/1000
1/10
• E’ arrestata la coppia Malcom e Janet Collins. Presenta tali caratteristiche.
• L’accusa stima la probabilità che una coppia possieda una di tali caratteristiche.
• Qual è la probabilità che una coppia qualunque possieda le 6 caratteristiche?
p=
1
10
1 1 1
1
∙
4 3 10 1000
∙ ∙ ∙
∙
1
10
=
𝟏
𝟏𝟐.𝟎𝟎𝟎.𝟎𝟎𝟎
Didattica probabilità e statistica PAS 2014
… per il consulente
3
Probabilità di eventi non elementari – Contesti
significativi
Un caso giudiziario diventato un classico
• 1964. La giuria dichiara colpevole la coppia arrestata.
• 1968. La corte suprema dello Stato della California annulla la sentenza.
Quali errori sono stati commessi nel primo processo? Esaminiamone uno.
La legge della moltiplicazione ha la forma
p(A e B) = p(A) ∙ p(B)
solo se A, B sono indipendenti.
Ma le 6 caratteristiche (A = “uomo di colore con la barba” … )
non sono indipendenti!
Didattica probabilità e statistica PAS 2014
4
Probabilità di eventi non elementari – Contesti
significativi
Un caso giudiziario diventato un classico
esaminiamo l’errore mediante un esempio
In un Istituto 1 studente su 30 pratica lo scialpinismo, 1 su 10 l’arrampicata.
La probabilità che un suo studente scelto a caso pratichi entrambi gli sport è
1
30
∙
1
10
?
- Per applicare la legge della moltiplicazione serve sapere la percentuale di
scialpinisti dell’Istituto che arrampica.
- Tra gli scialpinisti, gli arrampicatori saranno (ragionevolmente) più di 1/10,
che è il rapporto relativo all’intera scuola.
Praticare lo scialpinismo ed arrampicare non sono eventi indipendenti!
- Se, tra gli scialpinisti, gli arrampicatori sono 1/4, allora la probabilità richiesta è
1
30
𝟏
𝟏
𝟒
𝟏𝟐𝟎
∙ =
≠
1
300
Quindi attenzione nell’applicare la legge della moltiplicazione!
Didattica probabilità e statistica PAS 2014
5
Probabilità di eventi non elementari – Un pb istruttivo
Ti trovi ad una festa a cui partecipano 23 persone.
Qual è la probabilità che almeno due tra esse compiano gli anni
in uno stesso giorno (anche se sono nate in anni diversi)?
Attività - Esaminare i compleanni di alcune classi
- Ogni studente scrive un naturale “a caso” tra 1 e 365;
poi si confrontano i numeri scritti
- Esaminare i compleanni dei titolari e dell’arbitro (22+1)
di alcune partite di calcio della squadra del cuore
Mondiale di calcio 2014. Ogni squadra deve convocare 23 giocatori.
Per 15 squadre su 32: almeno due giocatori compiono gli anni nello stesso giorno.
(dati da wikipedia, 1/06)
gli studenti formulano delle congetture sul risultato del problema iniziale
Didattica probabilità e statistica PAS 2014
6
Probabilità di eventi non elementari – Un pb istruttivo
Risolviamo il problema
- un caso più semplice: alla festa ci sono 3 persone
un suggerimento: consideriamo l’evento complementare
risoluzione e osservazioni
- le ipotesi: non condizioni astratte … le nascite secondo l’Istat
la formalizzazione: esigenza di precisione e coincisione
Didattica probabilità e statistica PAS 2014
7
Probabilità di eventi non elementari – Un pb istruttivo
Diamo i numeri …
Ad una festa scommetti che almeno due partecipanti compiano gli anni in uno
stesso giorno. Affinché la tua probabilità di vittoria sia maggiore del 50%, i
partecipanti devono essere più di 182?
n. persone
p ( ≥ 2 compleanni = giorno)
10
20
23
30
40
50
56
0,12
0,41
0,51
0,71
0,90
0,97
0,99
p
n
Qual è il più piccolo naturale per cui tale probabilità è maggiore di un dato valore?
Didattica probabilità e statistica PAS 2014
8
Probabilità di eventi non elementari – Un pb istruttivo
Vogliamo comprendere
Perché la probabilità del problema iniziale è “grande”?
Ti trovi ad una festa a cui partecipano 23 persone.
Qual è la probabilità che almeno una tra esse compia gli anni
nel tuo stesso giorno (oltre a te)?
p=1−
364 22
365
≈ 0,0586
L’idea:
- nel pb iniziale (“in uno stesso giorno”)
i casi favorevoli non sono 23
intervengono le coppie di persone … 23 ∙ 22 /2
- in questo pb (“nel tuo stesso giorno”) le coppie sono 22
un approfondimento: compleanni e coincidenze
Didattica probabilità e statistica PAS 2014
9
Probabilità che dipendono da altre – Le informazioni
già incontrate nelle attività precedenti, ora approfondiamo (secondo biennio)
Tavole di mortalità - ISTAT 2010
età
num. viventi maschi
num. viventi femmine
0
100.000
100.000
40
97.921
98.918
70
81.482
89.879
popolazione stazionaria
scelta a caso
Qual è la probabilità che una quarantenne viva almeno fino a 70 anni?
𝑝("70 da 40") =
𝟖𝟗. 𝟖𝟕𝟗
≈ 0,909
𝟗𝟖. 𝟗𝟏𝟖
Didattica probabilità e statistica PAS 2014
Probabilità che dipendono da altre – Le informazioni
Vale 𝑝 "70 da 40" > 𝑝 "70" ≈ 0,899
età
n. viventi maschi
n. viventi femmine
0
100.000
100.000
40
97.921
98.918
70
81.482
89.879
Perché le due probabilità sono diverse?
In “70 da 40” usiamo informazioni in più
Più precisamente
- casi favorevoli: {70-enni}
- casi possibili di “70 da 40”: {40-enni}
di “70”: insieme I
- si ha {40-enni} ⊂ I
probabilità condizionata
I
{40-enni}
{70-enni}
Un’altra giustificazione
𝑝 70 𝑑𝑎 40 =
𝑝 70
𝑝(40)
e
0 < 𝑝 40 < 1
Didattica probabilità e statistica PAS 2014
11
Probabilità che dipendono da altre – Le informazioni
Fumatori
Su una popolazione di 1.000.000 individui, 32.700 hanno una
certa malattia; di questi ultimi, 22.300 sono fumatori.
I fumatori costituiscono il 20% della popolazione.
Qual è la probabilità di avere tale malattia per un fumatore?
U = {individui pop.}
F = {fumatori}
M = {ammalati}
Insieme dei nuovi “casi possibili”? F
Insieme dei “casi favorevoli”? M ∩ F
𝑝𝐹 (𝑀) =
𝟐𝟐. 𝟑𝟎𝟎
≈ 𝟎, 𝟏𝟏
𝟐𝟎𝟎. 𝟎𝟎𝟎
invece
𝑝 𝑀 =
Didattica probabilità e statistica PAS 2014
32.700
= 0,0327
1.000.000
12
Probabilità che dipendono da altre – Le informazioni
Due dadi
Calcola la probabilità che in un lancio di due dadi, uno bianco e
l’altro giallo, escano due “6”
a) senza informazioni aggiuntive
b) sapendo che è uscito almeno un “6”
c) sapendo che l’esito del dado giallo è “6”
una rappresentazione grafica della questione
le risposte: a) 1/36 b) 1/11 c) 1/6
Le nuove informazioni modificano l’insieme dei “casi possibili”.
proporre però anche contesti ricchi
Didattica probabilità e statistica PAS 2014
13
Probabilità che dipendono da altre – Le attenzioni
alcune precisazioni … per le classi che possono apprezzarle
Ok ricorrere all’intuizione, ma attenzione:
- dipendenza
non è sempre “influenza” tra eventi
statistica sulle case inglesi dopo la seconda guerra mondiale
- indipendenza
non è sempre intuitiva
esempio del lancio di un dado
Se vi sono dubbi si può ricorrere alla condizione formale di
indipendenza degli eventi A, B:
𝑝 𝐴 ∩ 𝐵 = 𝑝(𝐴) ∙ 𝑝(𝐵)
Didattica probabilità e statistica PAS 2014
14
Probabilità che dipendono da altre – Il punto
Dati due eventi A e B tali che p(B)≠0,
diciamo probabilità condizionata di A dato B, la probabilità che
si verifichi l’evento A qualora si sappia che si è verificato B.
E la indichiamo con 𝑝𝐵 𝐴 .
U
B
A
Insieme dei nuovi “casi possibili” = B
Insieme dei “casi favorevoli” = A ∩ B
Si ha
pB A =
U
A∩B
p(A ∩ B)
p(B)
dove le probabilità p sono valutate rispetto all’insieme U in cui si considerano
contenuti A, B.
Didattica probabilità e statistica PAS 2014
15
Probabilità che dipendono da altre – Il punto
Una giustificazione della formula
pB A =
p(A∩B)
p(B)
(*)
• Si è verificato B; qual è la nuova probabilità di A? Con lo schema classico
misura (𝐀 ∩ 𝐁)
𝐩𝐁 𝐀 =
misura (𝐁)
A
BU
U
entrambe le misure sono effettuate rispetto allo stesso insieme U
• Ma nella interpretazione geometrica della probabilità, la probabilità
di un insieme è una sua misura. Pertanto
misura 𝐀 ∩ 𝐁 = 𝐩(𝐀 ∩ 𝐁)
misura 𝐁 = 𝐩(𝐁)
Riferimento per la formula (*) e attività che la preparano o consolidano
Didattica probabilità e statistica PAS 2014
16
Probabilità che dipendono da altre – Il docente
Quanto appena proposto sulla probabilità condizionata è rivolto agli
studenti di scuola secondaria.
ll docente dovrebbe tenere presente che
- la formula (*) è la definizione di probabilità condizionata nell’ambito
della teoria assiomatica
A | B non è un evento
- a partire dalla definizione (*) si dimostra che nell’approccio classico la
probabilità condizionata è la probabilità dell’evento sapendo che …(slide 15)
- questo ultimo risultato è il significato di probabilità condizionata
nell’approccio classico
Didattica probabilità e statistica PAS 2014
17
Probabilità che dipendono da altre – Uno dei pb iniziali
Ancora test clinici
Il test “Elisa”, relativo all’HIV, può fornire esiti errati.
Precisamente vi è una probabilità del 99,9% che il test dia esiti positivi nei
soggetti che effettivamente hanno contratto l’HIV (sensibilità del test) ed
una probabilità del 99,9% che il test risulti negativo nei soggetti che non
hanno l’HIV (specificità del test).
Consideriamo ora una certa popolazione. Assumiamo che lo 0,3% della
quantità di individui di tale popolazione abbia l’HIV (prevalenza della
malattia).
Il test, applicato ad un individuo scelto a caso in tale popolazione, ha dato
esito positivo. Qual è la probabilità che tale individuo sia in realtà sano,
cioè non abbia l’HIV?
è opportuno aver prima affrontato i problemi test clinici “diretti”
(slide 36 e 37 dell’incontro 3)
Didattica probabilità e statistica PAS 2014
18
Probabilità che dipendono da altre – Uno dei pb iniziali
• Modellizziamo il problema
T-
T+
0,003
Mc
prob. condizionata
MC
99,9%
di M c
M
0,999
0,999
99,9%
di M
M
T-
T+
0,3%
dei casi iniziali
T+
T-
cella: evento intersezione
cammino: evento intersezione
• E’ richiesta la probabilità dell’evento
“l’individuo non è malato, sapendo che il test ha avuto esito positivo”, ossia
𝒑𝑻+ (𝑴𝑪 )
Attenzione all’evento
“sapendo che l’individuo non è malato, il test ha avuto esito positivo”
- l’insieme dei casi possibili è rappresentato sulla tabella dalla prima riga
- la sua probabilità si denota con 𝑝𝑀𝑐 (𝑇 +)
- si ha 𝒑𝑻+ 𝑴𝑪 ≠ 𝑝𝑀𝑐 (𝑇 +)
Didattica probabilità e statistica PAS 2014
19
Probabilità che dipendono da altre – Uno dei pb iniziali
• Risolviamo il problema
risoluzione completa e osservazioni
• Interpretiamo il risultato
-
𝑝𝑇 + 𝑀𝐶 ≈ 25%: si controlla l’esito con il test Western Blot
𝑝𝑇 − 𝑀 è trascurabile (da calcolo analogo); questo è importante?
Didattica probabilità e statistica PAS 2014
20
Probabilità che dipendono da altre – Uno dei pb iniziali
• Esploriamo la situazione
- Come varia la probabilità richiesta al variare dei valori in ipotesi?
proviamo
- Il test ha sensibilità e specificità “alte”. Perchè allora non è “bassa” la
probabilità che il test positivo sia errato (è circa il 25%)?
La malattia ha bassa prevalenza, pertanto ci sono “molti” sani ;
la probabilità di falso è “bassa” ma è applicata a “molti”:
quindi ci possono essere “non pochi” falsi.
Un esempio numerico. Popolazione di 1.000.000 di individui:
a) 997.000 sani; tra essi i test positivi “sono” lo 0,1%, ossia 997 falsi
b) 3.000 malati; tra essi i test positivi “sono” il 99,9%, ossia 2997 veri
Così, tra i test positivi, i falsi non sono pochi rispetto ai veri.
L’attività sviluppa le abilità di previsione e controllo dei risultati del problema.
Didattica probabilità e statistica PAS 2014
Probabilità che dipendono da altre – Uno dei pb iniziali
• E se applicassimo direttamente la formula di Bayes?
𝑐
𝑝 𝑀 |𝑇
+
=
𝒑 𝑴𝒄
𝒑(𝑴𝒄 ) ∙ 𝒑(𝑻+ |𝑴𝒄 )
∙ 𝒑 𝑻 + 𝑴𝒄 + 𝒑 𝑴 ∙ 𝒑 𝑻 + 𝑴
=
0,997 ∙ 0,001
0,997 ∙ 0,001 + 0,003 ∙ 0,999
- l’espressione è uguale a quella ottenuta con il procedimento grafico
- anzi, per ricavare la formula basta ripercorrerlo:
- dà la probabilità (a posteriori) delle “cause” … note quelle degli “effetti”
- la formula compare nelle Indicazioni nazionali
Perché preferire l’approccio mediante modelli grafici?
- per comprendere il significato del procedimento risolutivo
- per controllarlo
- per poter ricostruire il procedimento a lungo termine
Didattica probabilità e statistica PAS 2014
22
Probabilità che dipendono da altre – Letture e attività
letture dal primo incontro
• Test antidoping (primo incontro slide 9 – Medici_tedeschi.pdf)
Qual è la probabilità che l’atleta positivo al test sia effettivamente dopato?
Assumi che la probabilità di risultare positivo per il non dopato sia dell’1%, quella
di essere positivo per il dopato sia del 50%, e che i dopati siano il 10% degli atleti.
Pb analogo all’ultimo sui test clinici. Ora M = “l’individuo è dopato”.
Un modello che mostra le informazioni fornite:
0,10
MC
M
0,50
0.01
T-
Il procedimento è analogo: 𝑝𝑇 +
T+
T-
T+
𝑝 𝑀 ∩ 𝑇+
0,1 ∙ 0,5
𝑀 =
=
≈ 𝟎, 𝟖𝟒𝟕
𝑝 𝑇+
0,9 ∙ 0,01 + 0,1 ∙ 0,5
Eventualmente prima risolvere il problema su 1.000 atleti, usando le frequenze …
Didattica probabilità e statistica PAS 2014
23
Probabilità che dipendono da altre – Letture e attività
• Processo ad O.J. Simpson ( primo incontro slide 12 – Uomini_picchiano_donne.pdf)
a) Difesa: tra le donne percosse dal compagno, solo lo 0,04% è uccisa da lui
b) Studi: tra le donne percosse dal compagno e uccise, il 90% è uccisa da lui
- Rappresenta con diagrammi di Venn le due situazioni ora descritte.
- Esprimi ciascuna situazione mediante la probabilità condizionata.
- Quale tra le 2 valutazioni di probabilità ti sembra adeguata? Perché?
a)
b)
B
B
D
C
𝑝𝑩 (𝑪)= 0,04%
C
B ={picchiate compagno}
C ={uccise da compagno}
D ={picchiate compagno e uccise}
• Filtri anti-spam (primo incontro slide 13 – Antispam.pdf)
Didattica probabilità e statistica PAS 2014
𝒑𝑫 𝑪 = 𝟗𝟎%