1 - Università degli Studi di Cagliari

ESERCITAZIONE DEL 2 MAGGIO 2013
Sia data la seguente tabella di probabilità:
x\y
1
2
3
totale
2
3
4 totale
1/12 1/6
0
1/4
1/6
0 1/3
1/2
1/12 1\6
0
1/4
1/3 1/3 1/3
1
Calcolare:
1) E X / Y  3 :
2) il coefficiente di correlazione del Bravais;
3) costruire la distribuzione somma , calcolare la media e la varianza e dimostrare le proprietà studiate.
Soluzione
1) Si tratta di calcolare la media condizionata della x in corrispondenza del valore di y =3:
x\y=3 p(xi,yj) xi p(xi,yj)
1
1/6
1/6
2
0
0
3
1/6
3\6
totale
1/3
4/6
4
4
E  X / Y  3  6   3  2
1 6
3
2) Per calcolare il coefficiente di correlazione del Bravais dobbiamo conoscere le medie e le deviazioni
standard delle due distribuzioni, che di seguito verranno prese in esame.
Distribuzione della variabile X
1
Tabella per il calcolo della media e della devianza
xi
1
2
3
totale
p(xi.) xi p(xi.) xi2 xi2 p(xi.)
1/4
1/4 1
1/4
2/4
4/4 4
8/4
1/4
3/4 9
9/4
1
8/4
18/4
 x   xi p  xi  
i
8
2
4
 x2   xi2 pxi    x2 
i
18
 4  4,5  4  0,5
4
 x  0,5  0,71
Distribuzione della variabile Y
Tabella per il calcolo della media e della devianza
yi
2
3
4
totale
p(yj.) yji p(yji) yj2 yj2 p(yj)
1/3
2/3 4
4/3
1/3
3/3 9
9/3
1/3
4/3 16
16/3
1
9/3
29/3
 y   y j py j  
j
9
3
3
 y2   y 2j p y j    y2 
j
29 2
 3  9,67  9  0,67
3
 y  0,67  0,82
2
Per il calcolo della covarianza occorre costruire la tabella dei prodotti delle due variabili per le
corrispondenti probabilità, valori che compaiono all’interno della tabella che seguer:

Tabella dei prodotti: xi y j p xi y j
x\y

2
3
4 totale
2/12 3/6
0
1/4
4/6
0 8/3
1/2
6/12 9\6
0
1/4
1/3 1/3 1/3
1
1
2
3
totale
Riducendo allo stesso denominatore:
x\y
2
3
4
2/12 6/12
0
8/12
0 32/12
6/12 18\12
0
16/12 24/12 32/12
1
2
3
totale
totale
8/12
40/12
24/12
72/12
  x y px y 
i
i
 xy    xi y j pxi , y j    x   y 
i
j
j
i
j
j
72
6  66  0
12
Non esiste relazione di tipo lineare, dal momento che la covarianza è uguale a zero, quindi si utilizzeranno
altri indici per il calcolo della,relazione. Dimostriamo le relazioni:
3) Distribuzione somma
si
3
4
4
6
5
6
Totale
p/si)
1/12
1/6
1/6
1/3
1/12
1/6
1
Riordiniamo la distribuzione,calcoliamo il minimo comune multiplo, la media e la varianza.
3
Prospetto di calcolo
si
3
4
5
6
totale
p(si)
1/12
4/12
1/12
6/12
1
si p(si)
3/12
16/12
5/12
36/12
60/12
 s   xi psi  
i
si2 si2 p(si)
9
9/12
16 64/12
25 25/12
36 216/12
314/12
60
5
12
 s2   xi2 psi    s2 
i
314
 25  26,17  25  1,17
12
Dimostriamo le relazioni:
 x  y    x   y
5  23
 2 x  y    x2   y2
1,17  0,5  0,67
4
Esercizio
Il voto conseguito dagli studenti che sostengono l’esame di Statistica si distribuisce secondo una
N( 24, 4 ). Calcolare :
1) la probabilità che uno studente consegua un voto tra 22 e 25 ;
2) la probabilità che uno studente riceva un voto maggiore di 27 ;
3) la probabilità che riceva un voto minore di 20.
Se vogliamo separare gli studenti in tre gruppi in modo che nel primo gruppo ricada il 20% degli studenti
con i voti più alti, nel secondo gli studenti che presentano un voto intermedio e nel terzo il 30% degli
studenti che hanno conseguito il voto più basso quali sono i voti che distinguono questa ripartizione ?
Risoluzione
Siamo in presenta di una normale di cui conosciamo le costanti caratteristiche e quindi siamo in grado di
ricercare le probabilità richieste operando di volta in volta la standardizzazione dei voti relativi ai diversi
casi osservati :
26  24 
 22  24
 z
  P 1 z 1  0.6826
2 
 2
1) P22 x 26   P
Area richiesta




2) P x 27   P z 

0
+1
27  24 
  P z 1.5  P0.5  0.4332   0.0668
2 
Area richiesta

z
5


3) P x 20   P z 
20  24 
  Pz 2  P0.5  0.4772   0.0228
2 
area richiesta

z 0
Seconda parte
30%
50%
20%

 zz=0,84 
Per trovare i valori che distinguono le diverse ripartizioni occorre fare un ragionamento sulle aree, dalle
aree risalire al valore di zeta e da questo al valore di x.
Troviamo il limite inferiore del 20% dei voti più alti:
se da metà curva ( parte positiva) tolgo il 20% mi rimane un valore di area da 0 a z incognito pari a
0.30. Andando sulle tavole leggo che in corrispondenza al valore di area 0.30 un valore di z pari a
0.84. Potrò allora scrivere :
0.84 
x  24
 0.84  2  24  x x= 25.68 che è il limite inferiore del 20% dei voti più alti.
2
Ora troviamo il limite superiore del 30% dei voti più bassi e naturalmente ci troviamo nella parte negativa
della curva. Se sottraggo un’area di 30 dalla semicurva di area 50 0ttengo un’area da 0 a –z uguale a 20 e
leggendo sulle tavole in corrispondenza di quest’area leggo un valore di z pari a 0.52, scriverò pertanto :
 0.52 
x  24
 0.52  2  24  x
2
x = 22.96
La restante parte degli studenti ( 50% ) ha come limite inferiore circa 23 e come limite superiore circa 26.
6
Esercizio
( Questo è il classico esercizio che si propone agli studenti per chiarire i concetti di probabilità a priori,
probabilità intersezione, probabilità condizionata, e probabilità a posteriori. Tutte queste probabilità
costituiscono l’ossatura del teorema di Bayes)
Si abbia la seguente distribuzione riferita a 840 unità classificate secondo il livello di istruzione e il salario
annuale :
Livello di istruzione\ salario annuale
A
B
C
totale
E1
E2
E3 totale
200 60 5
265
350 120 35
505
20 40 10
70
570 220 50
840
Si chiede di calcolare la probabilità a posteriori con riferimento al livello A.
soluzione
Trasformiamo la tabella dei dati osservati in tabella di probabilità:
Tabella di probabilità
Livello di istruzione\ salario annuale
A
B
C
totale
E1
0,24
0,42
0,02
0,68
E2
0,07
0,14
0,05
0,26
E3
totale
0,01
0,32
0,04
0,60
0,01
0.08
0,6
1
Tabella di probabilità intersezione
L.llo di is.ne\ sal. a.le
E1
A 0,24= P A  E1 
B 0,42= PB  E1 
E2
0,07= P A  E2 
0,14= PB  E2 
C 0,02= PC  E1 
totale
0,05= PC  E2 
0,68
E3
0,01= P A  E3 
0,04= PB  E3 
totale
0,32
0,60
0,01= PC  E3 
0,08
0,6
1
0,26
Tabella di probabilità condizionate
L.llo di is.ne\ sal. a.le
E1
A 0,24= P A / E1 PE1 
B 0,42= PB / E1 PE1 
 
C 0,02= PC / E1 P E
totale
0,68
E2
0,07= P A / E2 PE2 
0,14= PB / E2 PE2 
 
0,05= PC / E1 P E
0,26
E3
0,01= P A / E3 PE3 
0,04= PB / E3 PE3 
 
0,01= PC / E1 P E
0,6
totale
0,32
0,60
0,08
3
7
Prendiamo in esame il livello di istruzione A
Le probabilità conosciute sono:
P A  0,32 probabilità dell’evento che si sovrappone a E1, E2, E3.
Le probabilità intersezione:
P A  E1   0,24
P A  E2   0,07
P A  E3   0,01
Le probabilità a priori
PE1   0,68
PE2   0,26
PE3   0,6
Le probabilità probative o verosimiglianze
P A / E1  
0,24
 0,3529
0,68
P A / E 2  
0,07
 0,27
0,26
P A / E3  
0,01
 0,0167
0,6
Con queste probabilità possiamo calcolare le probabilità a posteriori, di seguito elencate:
PE1 / A 
P A / E1 PE1 
P A  E1 
0,24


 0,75
P A / Ei PE1  P A / Ei PEi  0,32
PE2 / A 
P A / E2 PE2 
P A  E 2 
0,07


 0,22
P A / Ei PE1  P A / Ei PEi  0,32
PE3 / A 
P A / E3 PE3 
P A  E3 
0,01


 0,03
P A / Ei PE1  P A / Ei PEi  0,32
8
Riassumendo i risultati si potrà costruire il seguente prospetto
Probabilità
E1
E2
E3
Prob. a priori 0,68 0,26 0,6 1
Prob. a posteriori 0,75 0,22 0,03 1
Allo stesso modo possiamo ,ad esempio, calcolare la probabilità a posteriori:
9