Esercizi di econometria: serie 3

annuncio pubblicitario
Esercizi di econometria: serie 3
Esercizio 1
Costruire un esempio di variabili casuali X ed Y tali che Cov( x,y) = 0, ma X ed Y siano
dipendenti.
Soluzione
Dobbiamo verificare le seguenti condizioni:
σ XY = E[XY ] − E[X]E[Y] = 0
⇒ covarianza nulla
f XY ( x , y ) ≠ f X ( x ) f Y ( y)
⇒ dipendenza non lineare
Prima cosa da fare è costruire una tabella i cui valori attesi siano pari a zero. In questo modo
avremo verificato la prima condizione.
Y
-1
0
1
fX(x)
-1
0
0.175
0
0
0.300
0.175
0
0.350
0.300
1
fY(y)
0.175
0
0.175
0.350
0.350
0.300
0.350
1
X
Tabella 1: funzioni di densità congiunta e marginale
E[X]= E[Y]=0 quando le modalità sono dispari, equidistanti, con valore centrale nullo e le
funzioni marginali sono simmetriche.
E[XY]= 1 (0.175) - 1 (0.175) - 1 (0.175) + 1 (0.175) = 0
quindi è verificata la prima condizione di covarianza nulla.
Al fine di verificare che i due caratteri sono dipendenti, è necessario che:
f XY ( x , y ) ≠ f X ( x ) f Y ( y ) , da cui sostituendo:
f XY (1,−1) = 0.175 ≠ f X (1) f Y (− 1) = (0.35)(0.3 5) = 0.123
Quindi anche la seconda condizione è verificata.
Esercizio 2
Si consideri il lancio di due tetraedri regolari (dado a quattro facce). Sia X il valore più basso
ed Y il valore più alto.
a. Si trovi la densità congiunta di X ed Y
b. Si trovi P(X≥2 Y≥2)
1
Esercizi di econometria
serie 3
c. Si calcoli la media e la varianza di X ed Y
d. Si calcoli la distribuzione di Y condizionata ad X per tutti i valori di X.
e. Si trovi la correlazione tra X ed Y.
Soluzione
Per definire la funzione di densità congiunta della variabile doppia (X, Y), è necessario
descrivere lo spazio campionario e calcolare i valori della funzione di densità f X, f Y(x, y) per
ogni coppia di valori di x e y.
Lo spazio campionario sarà formato da 16 eventi, ossia 42 .
Inoltre, i punti campionari sono tutti equiprobabili, con probabilità pari a 1/4⋅1/4 =1/16, dato
che per ogni lancio la probabilità di un numero è 1/4 e ogni lancio è indipendente dall’altro.
I risultati dell’esperimento (spazio campionario Ω) e le coppie dei valori assunti da X,
numero più basso dei due usciti e Y, numero più alto, sono:
Ω = {1-1, 1-2, 1-3, 1-4, 2-1, 2-2, 2-3, 2-4, 3-1, 3-2, 3-3, 3-4, 4-1, 4-2, 4-3, 4-4}
X={ 1
1
1
1
1
2
2
2
1
2
3
3
1
2
3
4 }
Y={ 1
2
3
4
2
2
3
4
3
3
3
4
4
4
4
4 }
a. la funzione di densità congiunta di X ed Y è la seguente:
Y
X
1
2
3
4
fY(y)
1
2
3
4
fX(x)
1/16
0
0
0
1/16
2/16
1/16
0
0
3/16
2/16
1/16
0
0
3/16
2/16
2/16
2/16
1/16
7/16
7/16
5/16
3/16
1/16
1
Tabella 2: funzione di densità congiunta
b. la probabilità che sia X che Y siano maggiori di 2 è la seguente:
1 − P[X < 2 , Y < 2 ] = 1 − ∑∑ f X , f Y (x , y) = 1 − [ f X , f Y (1,1)] = 1 −
X <2 Y < 2
1 15
=
16 16
c. la media e la varianza di X ed Y sono le seguenti:
30
E[X] = ∑∑ x f XY ( xy ) =
= 1.875
16
x
y
50
E[Y] = ∑∑ y f XY (xy ) =
= 3.125
16
x
y
Mentre i momenti secondi
7
5
3
1
70
E(X2 ) = 1  + 4  + 9  + 16  =
= 4.375
 16   16   16 
 16  16
1
3
5
7
170
E(Y2 ) = 1  + 4  + 9  + 16  =
= 10.625
 16   16   16 
 16  16
2
Esercizi di econometria
serie 3
Pertanto le varianze sono:
VAR(X) = E(X2 ) - [E(X)]2 = 0.859
VAR(Y) = E(Y2 ) - [E(Y)]2 = 0.859
d. la distribuzione di Y condizionata ad X per tutti i valori di X è la seguente, ricordando che
f X Y (x y ) =
X
1
2
3
4
f X , Y (x ,y)
f Y (y )
f X Y (x y = 1)
f X Y (x y = 2 )
1
0
0
0
1
2/3
1/3
0
0
1
f X Y (x y = 3) f X Y (x y = 4 )
2/5
2/5
1/5
0
1
2/7
2/7
2/7
1/7
1
Tabella 3: funzioni di densità condizionata.
e. la correlazione tra X ed Y è data da:
ρ XY =
Cov(xy )
Var ( x )Var (y )
Calcoliamo dapprima la covarianza, data da dalla seguente formula:
Cov(XY) = E[XY] − E(X)E(Y) = 0.391
da cui si ottiene:
ρ XY =
Cov( xy )
0.391
=
= 0.45
Var ( x )Var (y ) 0.859
Esercizio 3
Sia data la seguente funzione di densità congiunta delle variabili casuali continue X ed Y:
e −( x + y )
f XY ( x , y ) = 
 0
x ∈ (0, ∞ ); y ∈ (0, ∞ )
altrimenti
Si calcolino:
a. P(X>1)
b. P(1<X+Y<2)
c. P(0<X<1|Y=2)
3
Esercizi di econometria
serie 3
Soluzione
a. la probabilità che X sia maggiore dell’unità è la seguente:
P(X>1) =
∞
∞
0
1
∫ dy ∫ e
−x −y
∞
[
dx = ∫ e −y dy − e −x
]
∞
1
[
= e−1 − e− y
]
∞
0
= e −1
0
b. ricordando che per una variabile casuale Z assolutamente continua
P[a < Z < b] = P[Z < b] - P[Z < a]
pertanto la probabilità richiesta si può scrivere anche:
P[1< X+Y < 2] = P[X+Y < 2] - P[X+Y < 1]
la probabilità che la somma delle due variabili X ed Y sia compresa tra 1 e 2 è data
graficamente dal dominio dell’integrazione, cioè: 1) y> 1-x 2) y< 2-x
per cui la probabilità P(X+Y<1) ha un dominio pari a D1 : 0< X <2 e 0<Y<2-X, mentre la
probabilità P(X+Y<2) ha un dominio pari a D2 : 0< X <1 e 0<Y<1-X.
x2 y2
Per definizione si ha che: P(x1 <X<x2 ; y1 <Y<y2 ) =
∫ ∫ f (xy ) dxdy per cui:
XY
x1 y1
2
P(X+Y< 2) =
P(X+Y< 1) =
2 −x
−x −y
−2
∫ dx ∫ e dy =1 − 3e
0
0
1
1 −x
0
0
∫ dx ∫ e
−x −y
dy =1 − 2e −1
Pertanto
P[1< X+Y < 2] = P[X+Y < 2] - P[X+Y < 1]= 1-3e-2-1+2 e-1 = 2 e-1 - 3e-2.
c. Per definizione la probabilità condizionata è:
P (X | Y = y) =
f XY (x , y )
= f X |Y ( x | y ) .
f Y (y)
Se le due variabili casuali X ed Y sono indipendenti, la probabilità condizionata è pari alla
probabilità marginale. E’ facilmente dimostrabile che le due variabili sono indipendenti.
Le funzioni marginali sono le seguenti:
4
Esercizi di econometria
serie 3
+∞
[
]
∞
0
= e -x
[
]
∞
0
= e- y
+∞
f X (x) = ∫ f XY (x, y)dy = e-x ∫ e -y dy = e-x − e -y
−∞
+∞
0
+∞
−∞
0
f Y (y) = ∫ f XY (x, y)dx = e- y ∫ e- x dx = e- y − e-x
Se X ed Y sono indipendenti deve verificarsi la seguente relazione:
f XY ( x , y ) = f X (x ) ⋅ f Y (y ) ⇒ e −( x + y ) = e − x ⋅ e − y ⇒ e − ( x + y ) = e −( x + y ) c.v.d.
Di conseguenza vale la seguente relazione:
P (X | Y = y) =
f XY (x , y )
= f X |Y ( x | y ) = f X (x )
f Y (y)
ossia
[
f X (0 < x < 1) = ∫ f X (x ) dx = ∫ e -x dx = − e - x
1
1
0
0
]
1
0
= −e -1 + 1 = 0.632
Esercizio 4
Sia data la seguente funzione di densità congiunta delle variabili casuali continue X ed Y:
(
(
e − y 1 − e − x
f XY ( x , y )=  − x
−y
e 1 − e
a.
b.
c.
d.
e.
f.
)
)
x ∈ (0, y) e y ∈ [0, ∞ )
x ∈ (0, ∞ ) e y ∈ [0, x)
Determinare se f XY(x,y) e’ effettivamente una funzione di densità.
Calcolare f X(x) e f Y(y)
Calcolare il valore atteso condizionato E(Y|X=x) per x>0
Calcolare la probabilità P(X≥2 Y≥2)
Calcolare la Correlazione tra X ed Y
Trovare un’altra funzione di densità con le medesime funzioni di densità marginali.
Soluzione
a. dimostriamo che essa sia una funzione di densità, ossia verifichiamo le due condizioni:
1)
f XY ( x , y ) ≥ 0
+∞ +∞
2)
∫ ∫ f ( x , y ) dxdy = 1
XY
−∞ −∞
La prima proprietà è subito dimostrata: basterà analizzare la condizione per la prima
espressione per cui per simmetria essa è verificata anche per l’altra.
(
)
e -y 1 - e -x ≥ 0 quando, essendo e -y > 0 sempre, 1 - e -x ≥ 0, ossia quando x ≥ 0 .
La seconda proprietà si verifica separatamente per 0≤ x< y e 0≤ y< ∞
5
Esercizi di econometria
+∞ y
serie 3
+∞
∫ ∫ e (1 − e ) dxdy = ∫ e
−y
−x
0 0
y
−y
0
(
dy ∫ 1 − e
−x
0
+∞
) dx = ∫ e
−y
[
dy x + e
−x
]
y
0
+∞
=
0
∫ (ye
)
−y
+ e −2 y − e − 2 y dy
0
da cui integrando per parti il prodotto (ye-y)e sviluppando si ottiene:

 − ye − y


]
+∞
0
+∞
∫e
+
−y
0
( ] ) = 1 + 12 − 1 = 12
  1 −y  +∞ 
dy  +  − 2e   + e − y

 0 
  2
+∞
0
Per simmetria per 0≤ y< x e 0≤ x< ∞ si ha che
+∞ x
1
∫ ∫ e (1 − e ) dydx = 2
−x
−y
0 0
Pertanto:
+∞ +∞
1 1
∫ ∫ f (x , y ) dxdy = 2 + 2 = 1
c.d.v.
XY
−∞ −∞
b. ricordando la definizione di funzione di densità marginale per una variabile casuale
continua
f X (x ) =
+∞
∫
f XY ( x , y ) dy e f Y (y ) =
−∞
+∞
∫ f ( x , y ) dx
XY
−∞
e poiché nel primo intervallo x<y per 0≤ y <
f X (x ) =
+∞
∫
−∞
+∞
(
)
la distribuzione marginale di X per 0≤ x<
(
x
è:
)
f XY ( x , y ) dy = ∫ e − y 1 − e − x dy + ∫ e − x 1 − e − y dx = xe − x
x
0
per simmetria segue che:
f Y (y ) =
+∞
∫ f (x , y ) dx = ye
−y
XY
per 0 ≤ y < +∞ .
−∞
c. Per definizione,
+∞
+∞
−∞
−∞
E[Y|X = x] = ∫ y f Y |X ( y | x ) dy = ∫ y
f XY ( x , y )
dy
f X (x )
e pertanto tenendo conto che 0< x < y per 0≤y<
+∞
E[Y|X=x] =
∫y
x
(
)
(
e 0< y < x per 0≤ x <
)
(
x
e− y 1 − e−x
e −x 1− e− y
1 − e−x
dy
+
y
dy
=
∫0
xe −x
xe − x
xe −x
)
+∞
−y
∫ ye dy +
x
si ha:
(
)
1x
y − ye − y dy
∫
x0
da cui integrando per parti e sostituendo si ottiene:
E[Y|X=x]=
2+ x
.
2
d. al fine di calcolare la probabilità richiesta, ossia che risulti x≤ 2 e y≤ 2 visto che 0 < x < y
6
Esercizi di econometria
serie 3
per 0 ≤ y <
e 0 < y < x per 0 ≤ x < è necessario che nel primo intervallo 0 ≤ y < 2
mentre nel secondo 2 ≤ x < , pertanto la probabilità richiesta è data da:
P (X ≥ 2, Y ≥ 2 ) =
+∞ y
(
)
−y
−x
∫ ∫ e 1 − e dxdy+
2 0
+∞ x
∫ ∫ e (1 − e ) dydx
−x
−y
2 0
Data l’evidente simmetria tra i due integrali è possibile scrivere:
+∞
(
y
+∞
)
+∞
(
)
y
y
P (X ≥ 2, Y ≥ 2 ) = 2 ∫ e − y dy ∫ 1 − e −x dx = 2 ∫ e − y  x 0 + e −x 0  dy = 2 ∫ ye − y + e −2 y − e − y dy


2
0
2
2
da cui integrando per parti si ottiene:
∞

∞

1
P (X ≥ 2, Y ≥ 2 ) = 2 − ye − y + ∫ e − y dy  + 2 − e − 2 y
2

2
  2
∞
2
 + 2 e −y
 
 
∞
2
 =  − 2e − 2 − e − y
 
∞
2


e. per trovare il coefficiente di correlazione tra X ed Y è necessario definire alcune grandezze
quali E(X), E(Y), E(XY), Var(X) e Var(Y). Si ha:
+∞
+∞
−∞
0
E(X)= ∫ x f X (x ) dx =
(
)
−x
2 −x
∫ x xe dx = − x e
+∞
0
+∞
+ ∫ 2xe − x dx = − 2e − x
+∞
=2
0
0
Quindi E(X)=2 e per ovvie ragioni di simmetria segue che E(Y)=2. Per calcolare Var(X) e
Var(Y) e necessario calcolare E(X2 ) e E(Y2 ):
+∞
E(X2 )= ∫ x f X (x ) dx =
+∞
(
)
+∞
−x
2 −x
∫ x xe dx = − x e
−∞
0
0
+∞
+ ∫ 2 xe − x dx = − 2e − x
+∞
0
=2
0
Quindi E(X2 ) = 6;sempre per simmetria si ha che E(Y2 ) = 6. Pertanto:
Var (X) = E(X 2 ) − [E(X )]2 = 6 − 22 = 2 e per simmetria Var (Y ) = 2 .
Segue che σX = 2 e σY = 2
E( XY ) =
=
+∞ +∞
+∞ y
−∞ −∞
0 0
∫ xy f xy (x , y ) dxdy =
∫
+∞
y
0
0
(
)
(
)
−y
−x
∫ ∫ xye 1 − e dxdy+
+∞
x
0
0
(
+∞ x
∫ ∫ xye (1 − e )dxdy =
−x
−y
0 0
)
−y
−x
−x
−y
∫ ye dy ∫ x − xe dx + ∫ xe dx ∫ y − ye dy
Infine, dalla simmetria dei due integrali doppi segue che:
+∞
E (XY ) = 2 ∫ ye
0
y
−y
(
dy ∫ x − xe
0
+∞
 y2 
= 2 ∫ ye − y dy  −  − xe −x
0
 2 
+∞
= 2 ∫ ye
0
−y
y
0
−x
+∞
) dx = 2 ∫ ye
−y
0
x2
dy 
 2
y
0

− ∫ xe − x dx  =

0
y
y
+∞

y
 y2

+ ∫ e − x dx   = 2 ∫ ye − y dy  −  − ye − y −  e − x 0   =

 
 2 
0
0
 
 y2

dy  + ye − y + e − y − 1 =
 2

+∞
∫y e
3
0
−y
+∞
dy + 2 ∫ y e
2
0
−2 y
+∞
dy + 2 ∫ ye
0
−2 y
+∞
dy − 2 ∫ ye − y dy
0
7
Esercizi di econometria
serie 3
Sostituendo 2y = t, per cui y =
E (XY ) =
+∞
+
e dy = dt/2, si ottiene:
+∞ 2
3 −y
∫ y e dy + 2 ∫
0
t
2
0
+∞
+∞
t − t dt
t
dt
e
+ 2 ∫ e − t − 2 ∫ ye − y dy =
4
2
2
2
0
0
+∞
3 −y
∫ y e dy +
0
1 +∞ 2 − t
t e dt +
4 ∫0
+∞
1 + ∞ −t
te
dt
−
2
ye − y dy = 5
∫
∫
2 0
0
Pertanto:
ñ=
cov(X , Y) E(XY ) − E (X)E(Y) 5 − (2 ⋅ 2) 1
=
=
= .
σXσY
σX σ Y
2
2 2
f. La più semplice funzione di densità di probabilità congiunta avente le stesse marginali è
quella che si ottiene considerando X ed Y indipendenti e precisamente:
f XY ( x , y ) = f X (x ) ⋅ f Y (y ) = xe − x ⋅ ye − y = xy e − (x + y )
per 0≤ x <
e 0≤y< .
Esercizio 5
Il reddito annuale in milioni di Lire di dieci coppie è risultato il seguente
Nome della
Coppia
Rossi
Bianchi
Verdi
Neri
Gialli
Arancioni
Azzurri
Viola
Marroni
Amaranto
Reddito del Reddito della
marito
moglie
20
15
30
35
30
25
20
25
20
25
30
15
40
25
30
25
40
35
40
25
Una coppia è estratta a caso per rappresentare l’intero collettivo. Siano X ed Y le due
variabili aleatorie relative rispettivamente al reddito del marito e della moglie estratti.
a. Trovare la distribuzione di probabilità bivariata di X ed Y.
b. Trovare le distribuzioni marginali della X e della Y , il loro valor medio e la loro varianza.
c. Trovare la covarianza e la correlazione tra X ed Y.
d. Trovare la media e la varianza del reddito familiare totale.
e. Supponiamo che l’aliquota contributiva del marito sia del 40 % e quella della moglie del
20%. Calcolare la media e la varianza del reddito famigliare dopo la tassazione.
f. Per misurare il livello di discriminazione contro le donne un sociologo calcola l’indice D =
X - Y. Qual è la media e la varianza di tale indice?
8
Esercizi di econometria
serie 3
Soluzione
a. Le determinazioni assunte dalla variabile aleatoria X = “reddito del marito” sono le
seguenti:
X = {20 , 30 , 40}
mentre per la variabile Y = “reddito della moglie” si ha
Y = {15, 25, 35}
Lo spazio campionario Ω è dato dall’insieme delle coppie e, secondo le ipotesi dell’esercizio,
ciascuna coppia ha la stessa probabilità di essere estratta P = 1 10 . La distribuzione di
probabilità congiunta f XY (x ,y ) = P(X = x , Y = y ) è data dalla tabella a doppia entrata qui di
seguito riportata:
X
20
30
40
fY(y)
15
1/10
1/10
0
2/10
25
2/10
2/10
2/10
6/10
35
0
1/10
1/10
2/10
fX(x)
3/10
4/10
3/10
1
Y
Tabella 4: funzione di probabilità congiunta e marginale
b. dove le funzioni marginali sono date dall’ultima riga e colonna, precisamente:
f X (x ) = ∑ f XY (x , y j )
f Y (y ) = ∑ f XY (x i , y ) .
e
j
i
I valori attesi di X ed Y sono:
3
4
3
E (X) = ∑ x i ⋅ f X ( x i ) = 20 ⋅ + 30 ⋅ + 40 ⋅
= 30
10
10
10
i
2
6
2
E (Y) = ∑ y j ⋅ f Y (y j ) = 15 ⋅ + 25 ⋅ + 35 ⋅
= 25
10
10
10
j
mentre le varianze:
[ ]
Var (X) = E X 2 − (E[X])2
[ ]
E X 2 = ∑ x 2i ⋅ f X (x i ) = 20 2 ⋅
i
Var (X) = 960 − 900 = 60
3
4
3
+ 30 2 ⋅ + 40 2 ⋅
= 960
10
10
10
[ ]
Var (Y) = E Y 2 − (E[Y])2
[ ]
E Y 2 = ∑ y 2j ⋅ f Y (y j ) = 152 ⋅
j
2
6
2
+ 25 2 ⋅ + 352 ⋅ = 665
10
10
10
Var (Y) = 665 − 625 = 40
c. la covarianza tra X ed Y è definita nel seguente modo
Cov[X ,Y ] = E[X , Y] − E[X]E[Y] dove :
Il coefficiente di correlazione tra X ed Y è invece definito quale:
9
Esercizi di econometria
ρ XY =
serie 3
Cov[X, Y]
Var [X]Var [X]
20
=
60 ⋅ 40
= 0.408
d. Il reddito familiare globale è definito come Z=X+Y dove la distribuzione di probabilità, il
valore atteso e la varianza della nuova variabile aleatoria Z sono i seguenti:
Z
P(Z)
35
1/10
45
3/10
55
2/10
65
3/10
75
1/10
1
Tabella 6: distribuzione di probabilità di Z
E[Z] = ∑ z k ⋅ f Z (z k ) = 55
[ ]
k
E Z = ∑ z 2k ⋅ f Z (z k ) = 3165
2
k
[ ]
Var [Z] = E Z 2 − (E[Z]) 2 = 140
e. La distribuzione di probabilità congiunta delle X ed Y e quella di Z, dopo la tassazione,
sono date da:
X
12
18
24
fY(y)
12
1/10
1/10
0
2/10
20
2/10
2/10
2/10
6/10
28
0
1/10
1/10
2/10
fX(x)
3/10
4/10
3/10
1
Y
Tabella 7: distribuzione di probabilità congiunta
Z
P(Z)
24
30
32
38
44
46
72
1/10
1/10
2/10
2/10
2/10
1/10
1/10
1
Tabella 8: distribuzione di Z dopo la tassazione
10
Esercizi di econometria
serie 3
E[Z] = ∑ z k ⋅ f Z (z k ) = 40
k
[ ] = ∑ z ⋅ f (z ) = 1758.4
Var [Z] = E[Z ] − (E[Z]) = 158.4
EZ
2
2
Z
k
k
k
2
2
f. La distribuzione di probabilità dell’indice di discriminazione delle mogli rispetto ai mariti
definito come D = X – Y è la seguente:
D
P(D)
5
7/10
15
3/10
10/10=1
Tabella 9: distribuzione di probabilità dell’indice D
E[D] = 5 ⋅
7
3
+ 15 ⋅ = 8
10
10
7
3
E D 2 = 5 2 ⋅ + 15 2 ⋅
= 85
10
10
Var [D] = 85 − 8 2 = 21
[ ]
11
Scarica