statistica 1 esercitazione 8

annuncio pubblicitario
STATISTICA 1 ESERCITAZIONE 8
Dott. Giuseppe Pandolfo
24 Novembre 2014
CALCOLO DELLE PROBABILITA’
PROBABILITA’ CONDIZIONATA E INDIPENDENZA STOCASTICA
La probabilità condizionata di B dato A, Pr(B|A), si definisce:
π‘ƒπ‘Ÿ 𝐡 𝐴 =
π‘ƒπ‘Ÿ(𝐴 ∩ 𝐡)
, π‘π‘’π‘Ÿ π‘ƒπ‘Ÿ 𝐴 > 0
π‘ƒπ‘Ÿ(𝐴)
Ciò implica l’intersezione:
π‘ƒπ‘Ÿ(𝐴 ∩ 𝐡) = π‘ƒπ‘Ÿ 𝐴 π‘ƒπ‘Ÿ(𝐡|𝐴)
Inoltre
π‘ƒπ‘Ÿ 𝐸 𝛺 =
π‘ƒπ‘Ÿ(𝐸 ∩ 𝛺) π‘ƒπ‘Ÿ(𝐸)
=
= π‘ƒπ‘Ÿ(𝐸)
π‘ƒπ‘Ÿ(𝛺)
π‘ƒπ‘Ÿ(𝛺)
Due eventi si dicono indipendenti se
π‘ƒπ‘Ÿ(𝐡 ∩ 𝐴) = π‘ƒπ‘Ÿ(𝐴)π‘ƒπ‘Ÿ(𝐡)
Probabilità dell’ unione di due eventi compatibili:
π‘ƒπ‘Ÿ(𝐴 ∪ 𝐡) = π‘ƒπ‘Ÿ(𝐴) + π‘ƒπ‘Ÿ(𝐡) − π‘ƒπ‘Ÿ(𝐴 ∩ 𝐡)
Esercizio 1
Si consideri un’urna contenente tre palline, una Rossa, una Bianca e una Verde. Si estraggono due palline
in successione senza ripetizione. Si determini la probabilità che, per la coppia estratta
a) la prima pallina estratta sia rossa (evento A)
b) la seconda pallina estratta non sia bianca (evento B)
c) la prima pallina sia rossa o la seconda non sia bianca (evento C)
Soluzione
a) Lo spazio degli eventi è dato da
{RB, RV, BR, BV, VR, VB}
Il numero degli eventi possibili è quindi 6. Ciascuno di tali eventi ha probabilità 1/6 in quanto la
probabilità di una qualunque pallina è 1/3 alla prima estrazione e 1/2 (estrazione senza ripetizione) alla
seconda estrazione (1/3 ∗ 1/2 = 1/6). Il numero degli eventi favorevoli è due, quindi la probabilità cercata
è 2/6.
Ovvero:
π‘ƒπ‘Ÿ 𝐴 = π‘ƒπ‘Ÿ (𝑅1 ∩ 𝐡2 ∪ (𝑅1 ∩ 𝑉2 )] = π‘ƒπ‘Ÿ(𝑅1 ∩ 𝐡2 ) + π‘ƒπ‘Ÿ(𝑅1 ∩ 𝑉2 ) =
1 1 1 1 1 1 2
× + × = + =
3 2 3 2 6 6 6
b) Il numero degli eventi favorevoli è 4, la probabilità è 4/6.
Ovvero:
π‘ƒπ‘Ÿ 𝐡 = π‘ƒπ‘Ÿ[(𝑅1 ∩ 𝑉2 ) ∪ (𝐡1 ∩ 𝑅2 ) ∪ (𝐡1 ∩ 𝑉2 ) ∪ (𝑉1 ∩ 𝑅2 )]
= π‘ƒπ‘Ÿ(𝑅1 ∩ 𝑉2 ) + π‘ƒπ‘Ÿ(𝐡1 ∩ 𝑅2 ) + π‘ƒπ‘Ÿ(𝐡1 ∩ 𝑉2 ) + π‘ƒπ‘Ÿ(𝑉1 ∩ 𝑅2 ) =
=
1 1 1 1 1 1 1 1
× + × + × + ×
3 2 3 2 3 2 3 2
1 1 1 1 4
+ + + =
6 6 6 6 6
c) Possiamo procedere usando la formula
Pr(A ∪ B) = Pr(A) + Pr(B) − Pr(A ∩ B)
dove A e B sono gli eventi di cui ai punti 1 e 2. A ∩ B è quindi l’evento {RV} e Pr(A ∩ B) = 1/6. Quindi la
probabilità cercata è 2/6 + 4/6 – 1/6 = 5/6.
Ovvero:
π‘ƒπ‘Ÿ 𝐴 ∪ 𝐡 = π‘ƒπ‘Ÿ 𝐴 + π‘ƒπ‘Ÿ 𝐡 − π‘ƒπ‘Ÿ 𝐴 ∩ 𝐡 =
2 4
1 1
2 4 1 5
+ − ×
= + − =
6 6
3 2
6 6 6 6
Esercizio 2
Supponiamo che dati i due eventi A e B, con Pr(A) = 1/2 e Pr(A|B) = Pr(B|A) = 1/4, calcolare la
probabilità dell’event0 condizionat0 𝐴|𝐡.
Soluzione
Sappiamo che
π‘ƒπ‘Ÿ 𝐴 ∩ 𝐡 = π‘ƒπ‘Ÿ 𝐴 π‘ƒπ‘Ÿ 𝐡 𝐴 = π‘ƒπ‘Ÿ 𝐡 π‘ƒπ‘Ÿ 𝐴|𝐡
Da questa abbiamo
π‘ƒπ‘Ÿ 𝐡 = π‘ƒπ‘Ÿ(𝐴) = 1/2
Dalla definizione di probabilità di evento complementare
π‘ƒπ‘Ÿ 𝐴 𝐡 = 1 − 𝑃 π‘Ÿ 𝐴 𝐡 = 1 −
=
π‘ƒπ‘Ÿ(𝐴 ∩ 𝐡)
π‘ƒπ‘Ÿ 𝐴 π‘ƒπ‘Ÿ(𝐡|𝐴)
π‘ƒπ‘Ÿ 𝐴 (1 − π‘ƒπ‘Ÿ 𝐡 𝐴 )
=1−
=1−
π‘ƒπ‘Ÿ(𝐡)
π‘ƒπ‘Ÿ(𝐡)
π‘ƒπ‘Ÿ(𝐡)
1
= π‘ƒπ‘Ÿ 𝐡 𝐴
4
Con calcoli analoghi si ottiene π‘ƒπ‘Ÿ(𝐴|𝐡) = 3/4
Esercizio 3
Il 15% degli studenti non supera l’esame di matematica, il 20% non supera l’esame di statistica e il 10%
non supera né l’esame di matematica né quello di statistica. Se scegliamo uno studente a caso.
a) Se non ha superato l’esame di statistica, qual è la probabilità che non abbia superato matematica?
b) Se non ha superato l’esame di matematica, qual è la probabilità che non abbia superato statistica?
c) Qual è la probabilità che non abbia superato matematica o statistica?
Soluzione
Indichiamo con M ={studenti che non hanno superato matematica} e con S ={studenti che non hanno
superato statistica}, abbiamo
π‘ƒπ‘Ÿ 𝑀 = 0,15
π‘ƒπ‘Ÿ 𝑆 = 0,20
π‘ƒπ‘Ÿ 𝑀 ∩ 𝑆 = 0,10
a) La probabilità che uno studente non abbia superato matematica se non ha superato statistica è
π‘ƒπ‘Ÿ 𝑀 𝑆 =
π‘ƒπ‘Ÿ(𝑀 ∩ 𝑆) 0,10
=
= 0,5
π‘ƒπ‘Ÿ(𝑆)
0,20
b) La probabilità che uno studente non abbia superato statistica se non ha superato matematica è
π‘ƒπ‘Ÿ 𝑆 𝑀 =
π‘ƒπ‘Ÿ(𝑆 ∩ 𝑀) 0,10
=
= 0,66
π‘ƒπ‘Ÿ(𝑀)
0,15
c) La probabilità che non abbia superato matematica o statistica è
π‘ƒπ‘Ÿ 𝑀 ∪ 𝑆 = π‘ƒπ‘Ÿ 𝑀 + π‘ƒπ‘Ÿ 𝑆 − π‘ƒπ‘Ÿ 𝑀 ∩ 𝑆 = 0,15 + 0,20 − 0,10 = 0,25
Esercizio 4
La tabella seguente riporta i dati relativi a 100 studenti classificati secondo il voto ottenuto all’esame di
statistica a seconda se l’esame di matematica è stato superato o meno.
Superamento esame di matematica
Voto
SI
NO
≤ 18
15
15
> 18
50
20
a) Calcolare le probabilità marginali
b) Calcolare le probabilità condizionate della variabile Superamento esame di matematica per Voto ≤
18 e Voto > 18.
c) Calcolare la distribuzione delle probabilità congiunte che avremmo in caso di indipendenza.
Le due variabili sono indipendenti ?
Soluzione
a) Calcoliamo le probabilità congiunte:
Superamento esame di matematica
Voto
SI
NO
≤ 18
15/100 = 0,15
15/100 = 0,15
0,30
> 18
50/100 = 0,50
20/100 = 0,20
0,70
0,65
0,35
1,00
ovvero
𝑃 π‘‰π‘œπ‘‘π‘œ = π‘₯ =
e
0,30 𝑠𝑒 π‘‰π‘œπ‘‘π‘œ ≤ 18
0,30 𝑠𝑒 π‘‰π‘œπ‘‘π‘œ > 18
𝑃 π‘†π‘’π‘π‘’π‘Ÿπ‘Žπ‘šπ‘’π‘›π‘‘π‘œ = 𝑦 =
0,65 𝑠𝑒 π‘†π‘’π‘π‘’π‘Ÿπ‘Žπ‘šπ‘’π‘›π‘‘π‘œ = 𝑆𝐼
0,35 𝑠𝑒 π‘†π‘’π‘π‘’π‘Ÿπ‘Žπ‘šπ‘’π‘›π‘‘π‘œ = 𝑁𝑂
b) La probabilità condizionata è definita come:
π‘ƒπ‘Ÿ 𝐡 𝐴 =
π‘ƒπ‘Ÿ π‘Œ ∩ 𝑋
π‘ƒπ‘Ÿ 𝑋
Dunque
0,15
= 0,50 𝑠𝑒 π‘†π‘’π‘π‘’π‘Ÿπ‘Žπ‘šπ‘’π‘›π‘‘π‘œ = 𝑆𝐼
𝑃 π‘†π‘’π‘π‘’π‘Ÿπ‘Žπ‘šπ‘’π‘›π‘‘π‘œ|π‘‰π‘œπ‘‘π‘œ ≤ 18 = 0,30
0,15
= 0,50 𝑠𝑒 π‘†π‘’π‘π‘’π‘Ÿπ‘Žπ‘šπ‘’π‘›π‘‘π‘œ = 𝑁𝑂
0,30
e
0,50
= 0,71 𝑠𝑒 π‘†π‘’π‘π‘’π‘Ÿπ‘Žπ‘šπ‘’π‘›π‘‘π‘œ = 𝑆𝐼
0,70
𝑃 π‘†π‘’π‘π‘’π‘Ÿπ‘Žπ‘šπ‘’π‘›π‘‘π‘œ|π‘‰π‘œπ‘‘π‘œ > 18 =
0,20
= 0,29 𝑠𝑒 π‘†π‘’π‘π‘’π‘Ÿπ‘Žπ‘šπ‘’π‘›π‘‘π‘œ = 𝑁𝑂
0,70
c) In caso di indipendenza una distribuzione congiunta può essere espressa come prodotto delle
distribuzioni marginali, ovvero:
π‘ƒπ‘Ÿ π‘Œ 𝑋 = π‘ƒπ‘Ÿ 𝑋 βˆ™ Pr⁑
(π‘Œ).
La distribuzione teorica sotto ipotesi di indipendenza è:
Superamento esame di matematica
Voto
SI
NO
≤ 18
0,30βˆ™0,65 = 0,195
0,30βˆ™0,35 = 0,105
0,30
> 18
0,70βˆ™0,65 = 0,455
0,70βˆ™0,35 = 0,245
0,70
0,65
0,35
1,00
Visto che le due distribuzioni congiunte, osservata e teorica, sono diverse tra loro si può concludere che le
due variabili non sono indipendenti.
Teorema di Bayes
Se 𝐻1 , 𝐻2 , … , 𝐻𝑀 sono eventi che costituiscono partizioni di Ω, allora per qualsiasi evento 𝐸 ⊂ 𝛺 la
probabilità di 𝐻𝑖 dato E è:
Pr 𝐻𝑖 𝐸 =
π‘ƒπ‘Ÿ 𝐻𝑖 π‘ƒπ‘Ÿ(𝐸|𝐻𝑖 )
𝑀
𝑗 =1 π‘ƒπ‘Ÿ(𝐻𝑗 ) π‘ƒπ‘Ÿ(𝐸|𝐻𝑗 )
Esercizio 5
Esempio 8.16, Domenico Piccolo
Un’azienda effettua controlli sui prodotti. I due eventi A e B sono:
A={Il prodotto presenta un difetto}
B={Il prodotto supera il controllo}
Si nota che il 12% presenta un difetto. Se il prodotto non presenta difetti supera il controllo con probabilità
0,85, se, invece, il prodotto è difettoso supera il controllo con probabilità 0,4. Qual è la probabilità che il
mattone non sia difettoso sapendo che ha superato il controllo?
Soluzione
Pr 𝐴 = 0,12
Pr 𝐡 𝐴 = 0,85
Pr 𝐡 𝐴 = 0,4
Dobbiamo calcolare:
π‘ƒπ‘Ÿ(𝐴|𝐡)
Applichiamo il teorema di Bayes e otteniamo:
π‘ƒπ‘Ÿ 𝐴 𝐡 =
=
π‘ƒπ‘Ÿ 𝐡 𝐴 π‘ƒπ‘Ÿ(𝐴)
π‘ƒπ‘Ÿ 𝐡 𝐴 (1 − π‘ƒπ‘Ÿ 𝐴 )
=
π‘ƒπ‘Ÿ 𝐡 𝐴 π‘ƒπ‘Ÿ 𝐴 + π‘ƒπ‘Ÿ 𝐡 𝐴 π‘ƒπ‘Ÿ(𝐴) π‘ƒπ‘Ÿ 𝐡 𝐴 1 − π‘ƒπ‘Ÿ 𝐴 + π‘ƒπ‘Ÿ 𝐡|𝐴 )π‘ƒπ‘Ÿ(𝐴)
0,85 × (1 − 0,12)
0,748
=
= 0,93
0,85 × 1 − 0,12 + 0,4 × 0,12 0,796
Esercizio 6
Leggi di De Morgan
Siano A e B due eventi tali che P A ο€½ 0.3 , PB  ο€½ 0.4 .




Calcolare P A  B e P A οƒˆ B nell’ipotesi che:
a) A e B siano indipendenti
b) A e B siano incompatibili
Soluzione
Per la legge di de Morgan
A  B ο€½ A οƒˆ B οƒž PA  B  ο€½ P A οƒˆ B  ο€½ 1 ο€­ P A οƒˆ B
A οƒˆ B ο€½ A  B οƒž PA οƒˆ B  ο€½ P A  B  ο€½ 1 ο€­ P A  B 
con P A οƒˆ B  ο€½ P A  PB  ο€­ P A  B 
a) Nell’ipotesi di indipendenza statistica P A  B  ο€½ P APB  , quindi
PA  B  ο€½ P A οƒˆ B  ο€½ 1 ο€­ P A οƒˆ B = 1 ο€­ P A ο€­ PB  P APB ο€½ 0,42
PA οƒˆ B  ο€½ P A  B  ο€½ 1 ο€­ P APB  ο€½ 0.88
b) Nell’ipotesi che A e B siano incompatibili P A  B  ο€½ 0 , quindi
PA  B  ο€½ P A οƒˆ B  ο€½ 1 ο€­ P A οƒˆ B  ο€½ 1 ο€­ P A ο€­ PB  ο€½ 0.3
PA οƒˆ B  ο€½ P A  B ο€½ 1 ο€­ P APB ο€½ 1
Esercizio 7
Una società telefonica ha commissionato un’indagine sul numero di chiamate da telefoni cellulari per
diverse classi di età. La risultante distribuzione doppia è la seguente:
Numero di
Età (Y)
chiamate
effettuate
20 |-| 30
30 -| 45
45 -| 60
Totale
Alto
4
6
9
19
Medio
12
4
7
23
Basso
13
7
0
20
Totale
29
17
16
72
(X)
La variabile Età è di tipo quantitativo continuo mentre la variabile reddito è qualitativa ordinale.
Misurare l’eventuale dipendenza in media di Y da X.
Soluzione
Costruiamo la tabella a doppia entrata con i punti medi degli intervalli della variabile Età.
Numero di
Età
chiamate
25
37,5
52,5
Totale
Alto
4
6
9
19
Medio
12
4
7
23
Basso
13
7
0
20
Totale
29
17
16
72
effettuate
Calcoliamo la media della variabile Età:
1
πœ‡π‘Œ =
𝑛
β„Ž
𝑐𝑗 𝑛.𝑗 =
𝑗 =1
1
2202,5
25 βˆ™ 29 + 37,5 βˆ™ 17 + 52,5 βˆ™ 16 =
= 30,59
72
72
Calcoliamo la varianza della variabile Età:
πœŽπ‘Œ2
1
=
𝑛
β„Ž
𝑐𝑗2 𝑛.𝑗 − πœ‡π‘Œ 2 =
𝑗 =1
1
86131,25
252 βˆ™ 29 + 37,52 βˆ™ 17 + 52,52 βˆ™ 16 − 30,592 =
− 935,74
72
72
= 1196.26 − 935,74 = 260,52
La variabile X si manifesta con tre modalità, per cui dobbiamo calcolare tre medie condizionate.
πœ‡π‘Œ|𝑋=π΄π‘™π‘‘π‘œ
πœ‡π‘Œ|𝑋=π‘€π‘’π‘‘π‘–π‘œ
πœ‡π‘Œ|𝑋=π΅π‘Žπ‘ π‘ π‘œ
1
=
𝑛1.
1
=
𝑛2.
1
=
𝑛3.
β„Ž
𝑐𝑗 𝑛1𝑗 =
1
797,5
25 βˆ™ 4 + 37,5 βˆ™ 6 + 52,5 βˆ™ 9 =
= 41,97
19
19
𝑐𝑗 𝑛1𝑗 =
1
817,5
25 βˆ™ 12 + 37,5 βˆ™ 4 + 52,5 βˆ™ 7 =
= 35,54
23
23
𝑐𝑗 𝑛1𝑗 =
1
587,5
25 βˆ™ 13 + 37,5 βˆ™ 7 + 52,5 βˆ™ 0 =
= 29,37
20
20
𝑗 =1
β„Ž
𝑗 =1
β„Ž
𝑗 =1
2
πœŽπ‘’π‘ π‘‘π‘’π‘Ÿπ‘›π‘Ž
1
=
𝑛
π‘˜
2
πœ‡π‘Œ|𝑋 𝑖 − πœ‡π‘Œ 𝑛𝑖.
𝑖=1
1
41,97 − 30,59
72
3053,90
=
= 42,41
72
=
πœ‚π‘Œ2
2
βˆ™ 19 + 35,54 − 30,59
2
βˆ™ 23 + 29,37 − 30,59
2
βˆ™ 20
2
πœŽπ‘’π‘ π‘‘π‘’π‘Ÿπ‘›π‘Ž
42,41
=
=
= 0,16
2
260,52
πœŽπ‘Œ
Assume valori compresi tra 0 e 1. Y è indipendente in media da X se la varianza tra i gruppi è nulla (πœ‚π‘Œ2 =
0), invece Y è perfettamente dipendente in media da X quando la varianza tra gruppi coincide con la
varianza marginale di Y (πœ‚π‘Œ2 = 1).
Scarica