STATISTICA 1 ESERCITAZIONE 8 Dott. Giuseppe Pandolfo 24 Novembre 2014 CALCOLO DELLE PROBABILITA’ PROBABILITA’ CONDIZIONATA E INDIPENDENZA STOCASTICA La probabilità condizionata di B dato A, Pr(B|A), si definisce: ππ π΅ π΄ = ππ(π΄ ∩ π΅) , πππ ππ π΄ > 0 ππ(π΄) Ciò implica l’intersezione: ππ(π΄ ∩ π΅) = ππ π΄ ππ(π΅|π΄) Inoltre ππ πΈ πΊ = ππ(πΈ ∩ πΊ) ππ(πΈ) = = ππ(πΈ) ππ(πΊ) ππ(πΊ) Due eventi si dicono indipendenti se ππ(π΅ ∩ π΄) = ππ(π΄)ππ(π΅) Probabilità dell’ unione di due eventi compatibili: ππ(π΄ ∪ π΅) = ππ(π΄) + ππ(π΅) − ππ(π΄ ∩ π΅) Esercizio 1 Si consideri un’urna contenente tre palline, una Rossa, una Bianca e una Verde. Si estraggono due palline in successione senza ripetizione. Si determini la probabilità che, per la coppia estratta a) la prima pallina estratta sia rossa (evento A) b) la seconda pallina estratta non sia bianca (evento B) c) la prima pallina sia rossa o la seconda non sia bianca (evento C) Soluzione a) Lo spazio degli eventi è dato da {RB, RV, BR, BV, VR, VB} Il numero degli eventi possibili è quindi 6. Ciascuno di tali eventi ha probabilità 1/6 in quanto la probabilità di una qualunque pallina è 1/3 alla prima estrazione e 1/2 (estrazione senza ripetizione) alla seconda estrazione (1/3 ∗ 1/2 = 1/6). Il numero degli eventi favorevoli è due, quindi la probabilità cercata è 2/6. Ovvero: ππ π΄ = ππ (π 1 ∩ π΅2 ∪ (π 1 ∩ π2 )] = ππ(π 1 ∩ π΅2 ) + ππ(π 1 ∩ π2 ) = 1 1 1 1 1 1 2 × + × = + = 3 2 3 2 6 6 6 b) Il numero degli eventi favorevoli è 4, la probabilità è 4/6. Ovvero: ππ π΅ = ππ[(π 1 ∩ π2 ) ∪ (π΅1 ∩ π 2 ) ∪ (π΅1 ∩ π2 ) ∪ (π1 ∩ π 2 )] = ππ(π 1 ∩ π2 ) + ππ(π΅1 ∩ π 2 ) + ππ(π΅1 ∩ π2 ) + ππ(π1 ∩ π 2 ) = = 1 1 1 1 1 1 1 1 × + × + × + × 3 2 3 2 3 2 3 2 1 1 1 1 4 + + + = 6 6 6 6 6 c) Possiamo procedere usando la formula Pr(A ∪ B) = Pr(A) + Pr(B) − Pr(A ∩ B) dove A e B sono gli eventi di cui ai punti 1 e 2. A ∩ B è quindi l’evento {RV} e Pr(A ∩ B) = 1/6. Quindi la probabilità cercata è 2/6 + 4/6 – 1/6 = 5/6. Ovvero: ππ π΄ ∪ π΅ = ππ π΄ + ππ π΅ − ππ π΄ ∩ π΅ = 2 4 1 1 2 4 1 5 + − × = + − = 6 6 3 2 6 6 6 6 Esercizio 2 Supponiamo che dati i due eventi A e B, con Pr(A) = 1/2 e Pr(A|B) = Pr(B|A) = 1/4, calcolare la probabilità dell’event0 condizionat0 π΄|π΅. Soluzione Sappiamo che ππ π΄ ∩ π΅ = ππ π΄ ππ π΅ π΄ = ππ π΅ ππ π΄|π΅ Da questa abbiamo ππ π΅ = ππ(π΄) = 1/2 Dalla definizione di probabilità di evento complementare ππ π΄ π΅ = 1 − π π π΄ π΅ = 1 − = ππ(π΄ ∩ π΅) ππ π΄ ππ(π΅|π΄) ππ π΄ (1 − ππ π΅ π΄ ) =1− =1− ππ(π΅) ππ(π΅) ππ(π΅) 1 = ππ π΅ π΄ 4 Con calcoli analoghi si ottiene ππ(π΄|π΅) = 3/4 Esercizio 3 Il 15% degli studenti non supera l’esame di matematica, il 20% non supera l’esame di statistica e il 10% non supera né l’esame di matematica né quello di statistica. Se scegliamo uno studente a caso. a) Se non ha superato l’esame di statistica, qual è la probabilità che non abbia superato matematica? b) Se non ha superato l’esame di matematica, qual è la probabilità che non abbia superato statistica? c) Qual è la probabilità che non abbia superato matematica o statistica? Soluzione Indichiamo con M ={studenti che non hanno superato matematica} e con S ={studenti che non hanno superato statistica}, abbiamo ππ π = 0,15 ππ π = 0,20 ππ π ∩ π = 0,10 a) La probabilità che uno studente non abbia superato matematica se non ha superato statistica è ππ π π = ππ(π ∩ π) 0,10 = = 0,5 ππ(π) 0,20 b) La probabilità che uno studente non abbia superato statistica se non ha superato matematica è ππ π π = ππ(π ∩ π) 0,10 = = 0,66 ππ(π) 0,15 c) La probabilità che non abbia superato matematica o statistica è ππ π ∪ π = ππ π + ππ π − ππ π ∩ π = 0,15 + 0,20 − 0,10 = 0,25 Esercizio 4 La tabella seguente riporta i dati relativi a 100 studenti classificati secondo il voto ottenuto all’esame di statistica a seconda se l’esame di matematica è stato superato o meno. Superamento esame di matematica Voto SI NO ≤ 18 15 15 > 18 50 20 a) Calcolare le probabilità marginali b) Calcolare le probabilità condizionate della variabile Superamento esame di matematica per Voto ≤ 18 e Voto > 18. c) Calcolare la distribuzione delle probabilità congiunte che avremmo in caso di indipendenza. Le due variabili sono indipendenti ? Soluzione a) Calcoliamo le probabilità congiunte: Superamento esame di matematica Voto SI NO ≤ 18 15/100 = 0,15 15/100 = 0,15 0,30 > 18 50/100 = 0,50 20/100 = 0,20 0,70 0,65 0,35 1,00 ovvero π πππ‘π = π₯ = e 0,30 π π πππ‘π ≤ 18 0,30 π π πππ‘π > 18 π ππ’ππππππππ‘π = π¦ = 0,65 π π ππ’ππππππππ‘π = ππΌ 0,35 π π ππ’ππππππππ‘π = ππ b) La probabilità condizionata è definita come: ππ π΅ π΄ = ππ π ∩ π ππ π Dunque 0,15 = 0,50 π π ππ’ππππππππ‘π = ππΌ π ππ’ππππππππ‘π|πππ‘π ≤ 18 = 0,30 0,15 = 0,50 π π ππ’ππππππππ‘π = ππ 0,30 e 0,50 = 0,71 π π ππ’ππππππππ‘π = ππΌ 0,70 π ππ’ππππππππ‘π|πππ‘π > 18 = 0,20 = 0,29 π π ππ’ππππππππ‘π = ππ 0,70 c) In caso di indipendenza una distribuzione congiunta può essere espressa come prodotto delle distribuzioni marginali, ovvero: ππ π π = ππ π β Prβ‘ (π). La distribuzione teorica sotto ipotesi di indipendenza è: Superamento esame di matematica Voto SI NO ≤ 18 0,30β0,65 = 0,195 0,30β0,35 = 0,105 0,30 > 18 0,70β0,65 = 0,455 0,70β0,35 = 0,245 0,70 0,65 0,35 1,00 Visto che le due distribuzioni congiunte, osservata e teorica, sono diverse tra loro si può concludere che le due variabili non sono indipendenti. Teorema di Bayes Se π»1 , π»2 , … , π»π sono eventi che costituiscono partizioni di Ω, allora per qualsiasi evento πΈ ⊂ πΊ la probabilità di π»π dato E è: Pr π»π πΈ = ππ π»π ππ(πΈ|π»π ) π π =1 ππ(π»π ) ππ(πΈ|π»π ) Esercizio 5 Esempio 8.16, Domenico Piccolo Un’azienda effettua controlli sui prodotti. I due eventi A e B sono: A={Il prodotto presenta un difetto} B={Il prodotto supera il controllo} Si nota che il 12% presenta un difetto. Se il prodotto non presenta difetti supera il controllo con probabilità 0,85, se, invece, il prodotto è difettoso supera il controllo con probabilità 0,4. Qual è la probabilità che il mattone non sia difettoso sapendo che ha superato il controllo? Soluzione Pr π΄ = 0,12 Pr π΅ π΄ = 0,85 Pr π΅ π΄ = 0,4 Dobbiamo calcolare: ππ(π΄|π΅) Applichiamo il teorema di Bayes e otteniamo: ππ π΄ π΅ = = ππ π΅ π΄ ππ(π΄) ππ π΅ π΄ (1 − ππ π΄ ) = ππ π΅ π΄ ππ π΄ + ππ π΅ π΄ ππ(π΄) ππ π΅ π΄ 1 − ππ π΄ + ππ π΅|π΄ )ππ(π΄) 0,85 × (1 − 0,12) 0,748 = = 0,93 0,85 × 1 − 0,12 + 0,4 × 0,12 0,796 Esercizio 6 Leggi di De Morgan Siano A e B due eventi tali che Pο¨ Aο© ο½ 0.3 , Pο¨B ο© ο½ 0.4 . ο¨ ο© ο¨ ο© Calcolare P A ο B e P A ο B nell’ipotesi che: a) A e B siano indipendenti b) A e B siano incompatibili Soluzione Per la legge di de Morgan A ο B ο½ A ο B ο Pο¨A ο B ο© ο½ Pο¨ A ο B ο© ο½ 1 ο Pο¨ A ο Bο© A ο B ο½ A ο B ο Pο¨A ο B ο© ο½ Pο¨ A ο B ο© ο½ 1 ο Pο¨ A ο B ο© con Pο¨ A ο B ο© ο½ Pο¨ Aο© ο« Pο¨B ο© ο Pο¨ A ο B ο© a) Nell’ipotesi di indipendenza statistica Pο¨ A ο B ο© ο½ Pο¨ Aο©Pο¨B ο© , quindi Pο¨A ο B ο© ο½ Pο¨ A ο B ο© ο½ 1 ο Pο¨ A ο Bο© = 1 ο Pο¨ Aο© ο Pο¨Bο© ο« Pο¨ Aο©Pο¨Bο© ο½ 0,42 Pο¨A ο B ο© ο½ Pο¨ A ο B ο© ο½ 1 ο Pο¨ Aο©Pο¨B ο© ο½ 0.88 b) Nell’ipotesi che A e B siano incompatibili Pο¨ A ο B ο© ο½ 0 , quindi Pο¨A ο B ο© ο½ Pο¨ A ο B ο© ο½ 1 ο Pο¨ A ο B ο© ο½ 1 ο Pο¨ Aο© ο Pο¨B ο© ο½ 0.3 Pο¨A ο B ο© ο½ Pο¨ A ο Bο© ο½ 1 ο Pο¨ Aο©Pο¨Bο© ο½ 1 Esercizio 7 Una società telefonica ha commissionato un’indagine sul numero di chiamate da telefoni cellulari per diverse classi di età. La risultante distribuzione doppia è la seguente: Numero di Età (Y) chiamate effettuate 20 |-| 30 30 -| 45 45 -| 60 Totale Alto 4 6 9 19 Medio 12 4 7 23 Basso 13 7 0 20 Totale 29 17 16 72 (X) La variabile Età è di tipo quantitativo continuo mentre la variabile reddito è qualitativa ordinale. Misurare l’eventuale dipendenza in media di Y da X. Soluzione Costruiamo la tabella a doppia entrata con i punti medi degli intervalli della variabile Età. Numero di Età chiamate 25 37,5 52,5 Totale Alto 4 6 9 19 Medio 12 4 7 23 Basso 13 7 0 20 Totale 29 17 16 72 effettuate Calcoliamo la media della variabile Età: 1 ππ = π β ππ π.π = π =1 1 2202,5 25 β 29 + 37,5 β 17 + 52,5 β 16 = = 30,59 72 72 Calcoliamo la varianza della variabile Età: ππ2 1 = π β ππ2 π.π − ππ 2 = π =1 1 86131,25 252 β 29 + 37,52 β 17 + 52,52 β 16 − 30,592 = − 935,74 72 72 = 1196.26 − 935,74 = 260,52 La variabile X si manifesta con tre modalità, per cui dobbiamo calcolare tre medie condizionate. ππ|π=π΄ππ‘π ππ|π=πππππ ππ|π=π΅ππ π π 1 = π1. 1 = π2. 1 = π3. β ππ π1π = 1 797,5 25 β 4 + 37,5 β 6 + 52,5 β 9 = = 41,97 19 19 ππ π1π = 1 817,5 25 β 12 + 37,5 β 4 + 52,5 β 7 = = 35,54 23 23 ππ π1π = 1 587,5 25 β 13 + 37,5 β 7 + 52,5 β 0 = = 29,37 20 20 π =1 β π =1 β π =1 2 πππ π‘ππππ 1 = π π 2 ππ|π π − ππ ππ. π=1 1 41,97 − 30,59 72 3053,90 = = 42,41 72 = ππ2 2 β 19 + 35,54 − 30,59 2 β 23 + 29,37 − 30,59 2 β 20 2 πππ π‘ππππ 42,41 = = = 0,16 2 260,52 ππ Assume valori compresi tra 0 e 1. Y è indipendente in media da X se la varianza tra i gruppi è nulla (ππ2 = 0), invece Y è perfettamente dipendente in media da X quando la varianza tra gruppi coincide con la varianza marginale di Y (ππ2 = 1).