statistica 1 esercitazione 8

STATISTICA 1 ESERCITAZIONE 8
Dott. Giuseppe Pandolfo
24 Novembre 2014
CALCOLO DELLE PROBABILITA’
PROBABILITA’ CONDIZIONATA E INDIPENDENZA STOCASTICA
La probabilità condizionata di B dato A, Pr(B|A), si definisce:
𝑃𝑟 𝐵 𝐴 =
𝑃𝑟(𝐴 ∩ 𝐵)
, 𝑝𝑒𝑟 𝑃𝑟 𝐴 > 0
𝑃𝑟(𝐴)
Ciò implica l’intersezione:
𝑃𝑟(𝐴 ∩ 𝐵) = 𝑃𝑟 𝐴 𝑃𝑟(𝐵|𝐴)
Inoltre
𝑃𝑟 𝐸 𝛺 =
𝑃𝑟(𝐸 ∩ 𝛺) 𝑃𝑟(𝐸)
=
= 𝑃𝑟(𝐸)
𝑃𝑟(𝛺)
𝑃𝑟(𝛺)
Due eventi si dicono indipendenti se
𝑃𝑟(𝐵 ∩ 𝐴) = 𝑃𝑟(𝐴)𝑃𝑟(𝐵)
Probabilità dell’ unione di due eventi compatibili:
𝑃𝑟(𝐴 ∪ 𝐵) = 𝑃𝑟(𝐴) + 𝑃𝑟(𝐵) − 𝑃𝑟(𝐴 ∩ 𝐵)
Esercizio 1
Si consideri un’urna contenente tre palline, una Rossa, una Bianca e una Verde. Si estraggono due palline
in successione senza ripetizione. Si determini la probabilità che, per la coppia estratta
a) la prima pallina estratta sia rossa (evento A)
b) la seconda pallina estratta non sia bianca (evento B)
c) la prima pallina sia rossa o la seconda non sia bianca (evento C)
Soluzione
a) Lo spazio degli eventi è dato da
{RB, RV, BR, BV, VR, VB}
Il numero degli eventi possibili è quindi 6. Ciascuno di tali eventi ha probabilità 1/6 in quanto la
probabilità di una qualunque pallina è 1/3 alla prima estrazione e 1/2 (estrazione senza ripetizione) alla
seconda estrazione (1/3 ∗ 1/2 = 1/6). Il numero degli eventi favorevoli è due, quindi la probabilità cercata
è 2/6.
Ovvero:
𝑃𝑟 𝐴 = 𝑃𝑟 (𝑅1 ∩ 𝐵2 ∪ (𝑅1 ∩ 𝑉2 )] = 𝑃𝑟(𝑅1 ∩ 𝐵2 ) + 𝑃𝑟(𝑅1 ∩ 𝑉2 ) =
1 1 1 1 1 1 2
× + × = + =
3 2 3 2 6 6 6
b) Il numero degli eventi favorevoli è 4, la probabilità è 4/6.
Ovvero:
𝑃𝑟 𝐵 = 𝑃𝑟[(𝑅1 ∩ 𝑉2 ) ∪ (𝐵1 ∩ 𝑅2 ) ∪ (𝐵1 ∩ 𝑉2 ) ∪ (𝑉1 ∩ 𝑅2 )]
= 𝑃𝑟(𝑅1 ∩ 𝑉2 ) + 𝑃𝑟(𝐵1 ∩ 𝑅2 ) + 𝑃𝑟(𝐵1 ∩ 𝑉2 ) + 𝑃𝑟(𝑉1 ∩ 𝑅2 ) =
=
1 1 1 1 1 1 1 1
× + × + × + ×
3 2 3 2 3 2 3 2
1 1 1 1 4
+ + + =
6 6 6 6 6
c) Possiamo procedere usando la formula
Pr(A ∪ B) = Pr(A) + Pr(B) − Pr(A ∩ B)
dove A e B sono gli eventi di cui ai punti 1 e 2. A ∩ B è quindi l’evento {RV} e Pr(A ∩ B) = 1/6. Quindi la
probabilità cercata è 2/6 + 4/6 – 1/6 = 5/6.
Ovvero:
𝑃𝑟 𝐴 ∪ 𝐵 = 𝑃𝑟 𝐴 + 𝑃𝑟 𝐵 − 𝑃𝑟 𝐴 ∩ 𝐵 =
2 4
1 1
2 4 1 5
+ − ×
= + − =
6 6
3 2
6 6 6 6
Esercizio 2
Supponiamo che dati i due eventi A e B, con Pr(A) = 1/2 e Pr(A|B) = Pr(B|A) = 1/4, calcolare la
probabilità dell’event0 condizionat0 𝐴|𝐵.
Soluzione
Sappiamo che
𝑃𝑟 𝐴 ∩ 𝐵 = 𝑃𝑟 𝐴 𝑃𝑟 𝐵 𝐴 = 𝑃𝑟 𝐵 𝑃𝑟 𝐴|𝐵
Da questa abbiamo
𝑃𝑟 𝐵 = 𝑃𝑟(𝐴) = 1/2
Dalla definizione di probabilità di evento complementare
𝑃𝑟 𝐴 𝐵 = 1 − 𝑃 𝑟 𝐴 𝐵 = 1 −
=
𝑃𝑟(𝐴 ∩ 𝐵)
𝑃𝑟 𝐴 𝑃𝑟(𝐵|𝐴)
𝑃𝑟 𝐴 (1 − 𝑃𝑟 𝐵 𝐴 )
=1−
=1−
𝑃𝑟(𝐵)
𝑃𝑟(𝐵)
𝑃𝑟(𝐵)
1
= 𝑃𝑟 𝐵 𝐴
4
Con calcoli analoghi si ottiene 𝑃𝑟(𝐴|𝐵) = 3/4
Esercizio 3
Il 15% degli studenti non supera l’esame di matematica, il 20% non supera l’esame di statistica e il 10%
non supera né l’esame di matematica né quello di statistica. Se scegliamo uno studente a caso.
a) Se non ha superato l’esame di statistica, qual è la probabilità che non abbia superato matematica?
b) Se non ha superato l’esame di matematica, qual è la probabilità che non abbia superato statistica?
c) Qual è la probabilità che non abbia superato matematica o statistica?
Soluzione
Indichiamo con M ={studenti che non hanno superato matematica} e con S ={studenti che non hanno
superato statistica}, abbiamo
𝑃𝑟 𝑀 = 0,15
𝑃𝑟 𝑆 = 0,20
𝑃𝑟 𝑀 ∩ 𝑆 = 0,10
a) La probabilità che uno studente non abbia superato matematica se non ha superato statistica è
𝑃𝑟 𝑀 𝑆 =
𝑃𝑟(𝑀 ∩ 𝑆) 0,10
=
= 0,5
𝑃𝑟(𝑆)
0,20
b) La probabilità che uno studente non abbia superato statistica se non ha superato matematica è
𝑃𝑟 𝑆 𝑀 =
𝑃𝑟(𝑆 ∩ 𝑀) 0,10
=
= 0,66
𝑃𝑟(𝑀)
0,15
c) La probabilità che non abbia superato matematica o statistica è
𝑃𝑟 𝑀 ∪ 𝑆 = 𝑃𝑟 𝑀 + 𝑃𝑟 𝑆 − 𝑃𝑟 𝑀 ∩ 𝑆 = 0,15 + 0,20 − 0,10 = 0,25
Esercizio 4
La tabella seguente riporta i dati relativi a 100 studenti classificati secondo il voto ottenuto all’esame di
statistica a seconda se l’esame di matematica è stato superato o meno.
Superamento esame di matematica
Voto
SI
NO
≤ 18
15
15
> 18
50
20
a) Calcolare le probabilità marginali
b) Calcolare le probabilità condizionate della variabile Superamento esame di matematica per Voto ≤
18 e Voto > 18.
c) Calcolare la distribuzione delle probabilità congiunte che avremmo in caso di indipendenza.
Le due variabili sono indipendenti ?
Soluzione
a) Calcoliamo le probabilità congiunte:
Superamento esame di matematica
Voto
SI
NO
≤ 18
15/100 = 0,15
15/100 = 0,15
0,30
> 18
50/100 = 0,50
20/100 = 0,20
0,70
0,65
0,35
1,00
ovvero
𝑃 𝑉𝑜𝑡𝑜 = 𝑥 =
e
0,30 𝑠𝑒 𝑉𝑜𝑡𝑜 ≤ 18
0,30 𝑠𝑒 𝑉𝑜𝑡𝑜 > 18
𝑃 𝑆𝑢𝑝𝑒𝑟𝑎𝑚𝑒𝑛𝑡𝑜 = 𝑦 =
0,65 𝑠𝑒 𝑆𝑢𝑝𝑒𝑟𝑎𝑚𝑒𝑛𝑡𝑜 = 𝑆𝐼
0,35 𝑠𝑒 𝑆𝑢𝑝𝑒𝑟𝑎𝑚𝑒𝑛𝑡𝑜 = 𝑁𝑂
b) La probabilità condizionata è definita come:
𝑃𝑟 𝐵 𝐴 =
𝑃𝑟 𝑌 ∩ 𝑋
𝑃𝑟 𝑋
Dunque
0,15
= 0,50 𝑠𝑒 𝑆𝑢𝑝𝑒𝑟𝑎𝑚𝑒𝑛𝑡𝑜 = 𝑆𝐼
𝑃 𝑆𝑢𝑝𝑒𝑟𝑎𝑚𝑒𝑛𝑡𝑜|𝑉𝑜𝑡𝑜 ≤ 18 = 0,30
0,15
= 0,50 𝑠𝑒 𝑆𝑢𝑝𝑒𝑟𝑎𝑚𝑒𝑛𝑡𝑜 = 𝑁𝑂
0,30
e
0,50
= 0,71 𝑠𝑒 𝑆𝑢𝑝𝑒𝑟𝑎𝑚𝑒𝑛𝑡𝑜 = 𝑆𝐼
0,70
𝑃 𝑆𝑢𝑝𝑒𝑟𝑎𝑚𝑒𝑛𝑡𝑜|𝑉𝑜𝑡𝑜 > 18 =
0,20
= 0,29 𝑠𝑒 𝑆𝑢𝑝𝑒𝑟𝑎𝑚𝑒𝑛𝑡𝑜 = 𝑁𝑂
0,70
c) In caso di indipendenza una distribuzione congiunta può essere espressa come prodotto delle
distribuzioni marginali, ovvero:
𝑃𝑟 𝑌 𝑋 = 𝑃𝑟 𝑋 ∙ Pr⁡
(𝑌).
La distribuzione teorica sotto ipotesi di indipendenza è:
Superamento esame di matematica
Voto
SI
NO
≤ 18
0,30∙0,65 = 0,195
0,30∙0,35 = 0,105
0,30
> 18
0,70∙0,65 = 0,455
0,70∙0,35 = 0,245
0,70
0,65
0,35
1,00
Visto che le due distribuzioni congiunte, osservata e teorica, sono diverse tra loro si può concludere che le
due variabili non sono indipendenti.
Teorema di Bayes
Se 𝐻1 , 𝐻2 , … , 𝐻𝑀 sono eventi che costituiscono partizioni di Ω, allora per qualsiasi evento 𝐸 ⊂ 𝛺 la
probabilità di 𝐻𝑖 dato E è:
Pr 𝐻𝑖 𝐸 =
𝑃𝑟 𝐻𝑖 𝑃𝑟(𝐸|𝐻𝑖 )
𝑀
𝑗 =1 𝑃𝑟(𝐻𝑗 ) 𝑃𝑟(𝐸|𝐻𝑗 )
Esercizio 5
Esempio 8.16, Domenico Piccolo
Un’azienda effettua controlli sui prodotti. I due eventi A e B sono:
A={Il prodotto presenta un difetto}
B={Il prodotto supera il controllo}
Si nota che il 12% presenta un difetto. Se il prodotto non presenta difetti supera il controllo con probabilità
0,85, se, invece, il prodotto è difettoso supera il controllo con probabilità 0,4. Qual è la probabilità che il
mattone non sia difettoso sapendo che ha superato il controllo?
Soluzione
Pr 𝐴 = 0,12
Pr 𝐵 𝐴 = 0,85
Pr 𝐵 𝐴 = 0,4
Dobbiamo calcolare:
𝑃𝑟(𝐴|𝐵)
Applichiamo il teorema di Bayes e otteniamo:
𝑃𝑟 𝐴 𝐵 =
=
𝑃𝑟 𝐵 𝐴 𝑃𝑟(𝐴)
𝑃𝑟 𝐵 𝐴 (1 − 𝑃𝑟 𝐴 )
=
𝑃𝑟 𝐵 𝐴 𝑃𝑟 𝐴 + 𝑃𝑟 𝐵 𝐴 𝑃𝑟(𝐴) 𝑃𝑟 𝐵 𝐴 1 − 𝑃𝑟 𝐴 + 𝑃𝑟 𝐵|𝐴 )𝑃𝑟(𝐴)
0,85 × (1 − 0,12)
0,748
=
= 0,93
0,85 × 1 − 0,12 + 0,4 × 0,12 0,796
Esercizio 6
Leggi di De Morgan
Siano A e B due eventi tali che P A  0.3 , PB   0.4 .




Calcolare P A  B e P A  B nell’ipotesi che:
a) A e B siano indipendenti
b) A e B siano incompatibili
Soluzione
Per la legge di de Morgan
A  B  A  B  PA  B   P A  B   1  P A  B
A  B  A  B  PA  B   P A  B   1  P A  B 
con P A  B   P A  PB   P A  B 
a) Nell’ipotesi di indipendenza statistica P A  B   P APB  , quindi
PA  B   P A  B   1  P A  B = 1  P A  PB  P APB  0,42
PA  B   P A  B   1  P APB   0.88
b) Nell’ipotesi che A e B siano incompatibili P A  B   0 , quindi
PA  B   P A  B   1  P A  B   1  P A  PB   0.3
PA  B   P A  B  1  P APB  1
Esercizio 7
Una società telefonica ha commissionato un’indagine sul numero di chiamate da telefoni cellulari per
diverse classi di età. La risultante distribuzione doppia è la seguente:
Numero di
Età (Y)
chiamate
effettuate
20 |-| 30
30 -| 45
45 -| 60
Totale
Alto
4
6
9
19
Medio
12
4
7
23
Basso
13
7
0
20
Totale
29
17
16
72
(X)
La variabile Età è di tipo quantitativo continuo mentre la variabile reddito è qualitativa ordinale.
Misurare l’eventuale dipendenza in media di Y da X.
Soluzione
Costruiamo la tabella a doppia entrata con i punti medi degli intervalli della variabile Età.
Numero di
Età
chiamate
25
37,5
52,5
Totale
Alto
4
6
9
19
Medio
12
4
7
23
Basso
13
7
0
20
Totale
29
17
16
72
effettuate
Calcoliamo la media della variabile Età:
1
𝜇𝑌 =
𝑛
ℎ
𝑐𝑗 𝑛.𝑗 =
𝑗 =1
1
2202,5
25 ∙ 29 + 37,5 ∙ 17 + 52,5 ∙ 16 =
= 30,59
72
72
Calcoliamo la varianza della variabile Età:
𝜎𝑌2
1
=
𝑛
ℎ
𝑐𝑗2 𝑛.𝑗 − 𝜇𝑌 2 =
𝑗 =1
1
86131,25
252 ∙ 29 + 37,52 ∙ 17 + 52,52 ∙ 16 − 30,592 =
− 935,74
72
72
= 1196.26 − 935,74 = 260,52
La variabile X si manifesta con tre modalità, per cui dobbiamo calcolare tre medie condizionate.
𝜇𝑌|𝑋=𝐴𝑙𝑡𝑜
𝜇𝑌|𝑋=𝑀𝑒𝑑𝑖𝑜
𝜇𝑌|𝑋=𝐵𝑎𝑠𝑠𝑜
1
=
𝑛1.
1
=
𝑛2.
1
=
𝑛3.
ℎ
𝑐𝑗 𝑛1𝑗 =
1
797,5
25 ∙ 4 + 37,5 ∙ 6 + 52,5 ∙ 9 =
= 41,97
19
19
𝑐𝑗 𝑛1𝑗 =
1
817,5
25 ∙ 12 + 37,5 ∙ 4 + 52,5 ∙ 7 =
= 35,54
23
23
𝑐𝑗 𝑛1𝑗 =
1
587,5
25 ∙ 13 + 37,5 ∙ 7 + 52,5 ∙ 0 =
= 29,37
20
20
𝑗 =1
ℎ
𝑗 =1
ℎ
𝑗 =1
2
𝜎𝑒𝑠𝑡𝑒𝑟𝑛𝑎
1
=
𝑛
𝑘
2
𝜇𝑌|𝑋 𝑖 − 𝜇𝑌 𝑛𝑖.
𝑖=1
1
41,97 − 30,59
72
3053,90
=
= 42,41
72
=
𝜂𝑌2
2
∙ 19 + 35,54 − 30,59
2
∙ 23 + 29,37 − 30,59
2
∙ 20
2
𝜎𝑒𝑠𝑡𝑒𝑟𝑛𝑎
42,41
=
=
= 0,16
2
260,52
𝜎𝑌
Assume valori compresi tra 0 e 1. Y è indipendente in media da X se la varianza tra i gruppi è nulla (𝜂𝑌2 =
0), invece Y è perfettamente dipendente in media da X quando la varianza tra gruppi coincide con la
varianza marginale di Y (𝜂𝑌2 = 1).