ESERCITAZIONE DEL 2 MAGGIO 2013 Sia data la seguente tabella di probabilità: x\y 1 2 3 totale 2 3 4 totale 1/12 1/6 0 1/4 1/6 0 1/3 1/2 1/12 1\6 0 1/4 1/3 1/3 1/3 1 Calcolare: 1) E X / Y 3 : 2) il coefficiente di correlazione del Bravais; 3) costruire la distribuzione somma , calcolare la media e la varianza e dimostrare le proprietà studiate. Soluzione 1) Si tratta di calcolare la media condizionata della x in corrispondenza del valore di y =3: x\y=3 p(xi,yj) xi p(xi,yj) 1 1/6 1/6 2 0 0 3 1/6 3\6 totale 1/3 4/6 4 4 E X / Y 3 6 3 2 1 6 3 2) Per calcolare il coefficiente di correlazione del Bravais dobbiamo conoscere le medie e le deviazioni standard delle due distribuzioni, che di seguito verranno prese in esame. Distribuzione della variabile X 1 Tabella per il calcolo della media e della devianza xi 1 2 3 totale p(xi.) xi p(xi.) xi2 xi2 p(xi.) 1/4 1/4 1 1/4 2/4 4/4 4 8/4 1/4 3/4 9 9/4 1 8/4 18/4 x xi p xi i 8 2 4 x2 xi2 pxi x2 i 18 4 4,5 4 0,5 4 x 0,5 0,71 Distribuzione della variabile Y Tabella per il calcolo della media e della devianza yi 2 3 4 totale p(yj.) yji p(yji) yj2 yj2 p(yj) 1/3 2/3 4 4/3 1/3 3/3 9 9/3 1/3 4/3 16 16/3 1 9/3 29/3 y y j py j j 9 3 3 y2 y 2j p y j y2 j 29 2 3 9,67 9 0,67 3 y 0,67 0,82 2 Per il calcolo della covarianza occorre costruire la tabella dei prodotti delle due variabili per le corrispondenti probabilità, valori che compaiono all’interno della tabella che seguer: Tabella dei prodotti: xi y j p xi y j x\y 2 3 4 totale 2/12 3/6 0 1/4 4/6 0 8/3 1/2 6/12 9\6 0 1/4 1/3 1/3 1/3 1 1 2 3 totale Riducendo allo stesso denominatore: x\y 2 3 4 2/12 6/12 0 8/12 0 32/12 6/12 18\12 0 16/12 24/12 32/12 1 2 3 totale totale 8/12 40/12 24/12 72/12 x y px y i i xy xi y j pxi , y j x y i j j i j j 72 6 66 0 12 Non esiste relazione di tipo lineare, dal momento che la covarianza è uguale a zero, quindi si utilizzeranno altri indici per il calcolo della,relazione. Dimostriamo le relazioni: 3) Distribuzione somma si 3 4 4 6 5 6 Totale p/si) 1/12 1/6 1/6 1/3 1/12 1/6 1 Riordiniamo la distribuzione,calcoliamo il minimo comune multiplo, la media e la varianza. 3 Prospetto di calcolo si 3 4 5 6 totale p(si) 1/12 4/12 1/12 6/12 1 si p(si) 3/12 16/12 5/12 36/12 60/12 s xi psi i si2 si2 p(si) 9 9/12 16 64/12 25 25/12 36 216/12 314/12 60 5 12 s2 xi2 psi s2 i 314 25 26,17 25 1,17 12 Dimostriamo le relazioni: x y x y 5 23 2 x y x2 y2 1,17 0,5 0,67 4 Esercizio Il voto conseguito dagli studenti che sostengono l’esame di Statistica si distribuisce secondo una N( 24, 4 ). Calcolare : 1) la probabilità che uno studente consegua un voto tra 22 e 25 ; 2) la probabilità che uno studente riceva un voto maggiore di 27 ; 3) la probabilità che riceva un voto minore di 20. Se vogliamo separare gli studenti in tre gruppi in modo che nel primo gruppo ricada il 20% degli studenti con i voti più alti, nel secondo gli studenti che presentano un voto intermedio e nel terzo il 30% degli studenti che hanno conseguito il voto più basso quali sono i voti che distinguono questa ripartizione ? Risoluzione Siamo in presenta di una normale di cui conosciamo le costanti caratteristiche e quindi siamo in grado di ricercare le probabilità richieste operando di volta in volta la standardizzazione dei voti relativi ai diversi casi osservati : 26 24 22 24 z P 1 z 1 0.6826 2 2 1) P22 x 26 P Area richiesta 2) P x 27 P z 0 +1 27 24 P z 1.5 P0.5 0.4332 0.0668 2 Area richiesta z 5 3) P x 20 P z 20 24 Pz 2 P0.5 0.4772 0.0228 2 area richiesta z 0 Seconda parte 30% 50% 20% zz=0,84 Per trovare i valori che distinguono le diverse ripartizioni occorre fare un ragionamento sulle aree, dalle aree risalire al valore di zeta e da questo al valore di x. Troviamo il limite inferiore del 20% dei voti più alti: se da metà curva ( parte positiva) tolgo il 20% mi rimane un valore di area da 0 a z incognito pari a 0.30. Andando sulle tavole leggo che in corrispondenza al valore di area 0.30 un valore di z pari a 0.84. Potrò allora scrivere : 0.84 x 24 0.84 2 24 x x= 25.68 che è il limite inferiore del 20% dei voti più alti. 2 Ora troviamo il limite superiore del 30% dei voti più bassi e naturalmente ci troviamo nella parte negativa della curva. Se sottraggo un’area di 30 dalla semicurva di area 50 0ttengo un’area da 0 a –z uguale a 20 e leggendo sulle tavole in corrispondenza di quest’area leggo un valore di z pari a 0.52, scriverò pertanto : 0.52 x 24 0.52 2 24 x 2 x = 22.96 La restante parte degli studenti ( 50% ) ha come limite inferiore circa 23 e come limite superiore circa 26. 6 Esercizio ( Questo è il classico esercizio che si propone agli studenti per chiarire i concetti di probabilità a priori, probabilità intersezione, probabilità condizionata, e probabilità a posteriori. Tutte queste probabilità costituiscono l’ossatura del teorema di Bayes) Si abbia la seguente distribuzione riferita a 840 unità classificate secondo il livello di istruzione e il salario annuale : Livello di istruzione\ salario annuale A B C totale E1 E2 E3 totale 200 60 5 265 350 120 35 505 20 40 10 70 570 220 50 840 Si chiede di calcolare la probabilità a posteriori con riferimento al livello A. soluzione Trasformiamo la tabella dei dati osservati in tabella di probabilità: Tabella di probabilità Livello di istruzione\ salario annuale A B C totale E1 0,24 0,42 0,02 0,68 E2 0,07 0,14 0,05 0,26 E3 totale 0,01 0,32 0,04 0,60 0,01 0.08 0,6 1 Tabella di probabilità intersezione L.llo di is.ne\ sal. a.le E1 A 0,24= P A E1 B 0,42= PB E1 E2 0,07= P A E2 0,14= PB E2 C 0,02= PC E1 totale 0,05= PC E2 0,68 E3 0,01= P A E3 0,04= PB E3 totale 0,32 0,60 0,01= PC E3 0,08 0,6 1 0,26 Tabella di probabilità condizionate L.llo di is.ne\ sal. a.le E1 A 0,24= P A / E1 PE1 B 0,42= PB / E1 PE1 C 0,02= PC / E1 P E totale 0,68 E2 0,07= P A / E2 PE2 0,14= PB / E2 PE2 0,05= PC / E1 P E 0,26 E3 0,01= P A / E3 PE3 0,04= PB / E3 PE3 0,01= PC / E1 P E 0,6 totale 0,32 0,60 0,08 3 7 Prendiamo in esame il livello di istruzione A Le probabilità conosciute sono: P A 0,32 probabilità dell’evento che si sovrappone a E1, E2, E3. Le probabilità intersezione: P A E1 0,24 P A E2 0,07 P A E3 0,01 Le probabilità a priori PE1 0,68 PE2 0,26 PE3 0,6 Le probabilità probative o verosimiglianze P A / E1 0,24 0,3529 0,68 P A / E 2 0,07 0,27 0,26 P A / E3 0,01 0,0167 0,6 Con queste probabilità possiamo calcolare le probabilità a posteriori, di seguito elencate: PE1 / A P A / E1 PE1 P A E1 0,24 0,75 P A / Ei PE1 P A / Ei PEi 0,32 PE2 / A P A / E2 PE2 P A E 2 0,07 0,22 P A / Ei PE1 P A / Ei PEi 0,32 PE3 / A P A / E3 PE3 P A E3 0,01 0,03 P A / Ei PE1 P A / Ei PEi 0,32 8 Riassumendo i risultati si potrà costruire il seguente prospetto Probabilità E1 E2 E3 Prob. a priori 0,68 0,26 0,6 1 Prob. a posteriori 0,75 0,22 0,03 1 Allo stesso modo possiamo ,ad esempio, calcolare la probabilità a posteriori: 9