Esercizi di econometria: serie 3 Esercizio 1 Costruire un esempio di variabili casuali X ed Y tali che Cov( x,y) = 0, ma X ed Y siano dipendenti. Soluzione Dobbiamo verificare le seguenti condizioni: σ XY = E[XY ] − E[X]E[Y] = 0 ⇒ covarianza nulla f XY ( x , y ) ≠ f X ( x ) f Y ( y) ⇒ dipendenza non lineare Prima cosa da fare è costruire una tabella i cui valori attesi siano pari a zero. In questo modo avremo verificato la prima condizione. Y -1 0 1 fX(x) -1 0 0.175 0 0 0.300 0.175 0 0.350 0.300 1 fY(y) 0.175 0 0.175 0.350 0.350 0.300 0.350 1 X Tabella 1: funzioni di densità congiunta e marginale E[X]= E[Y]=0 quando le modalità sono dispari, equidistanti, con valore centrale nullo e le funzioni marginali sono simmetriche. E[XY]= 1 (0.175) - 1 (0.175) - 1 (0.175) + 1 (0.175) = 0 quindi è verificata la prima condizione di covarianza nulla. Al fine di verificare che i due caratteri sono dipendenti, è necessario che: f XY ( x , y ) ≠ f X ( x ) f Y ( y ) , da cui sostituendo: f XY (1,−1) = 0.175 ≠ f X (1) f Y (− 1) = (0.35)(0.3 5) = 0.123 Quindi anche la seconda condizione è verificata. Esercizio 2 Si consideri il lancio di due tetraedri regolari (dado a quattro facce). Sia X il valore più basso ed Y il valore più alto. a. Si trovi la densità congiunta di X ed Y b. Si trovi P(X≥2 Y≥2) 1 Esercizi di econometria serie 3 c. Si calcoli la media e la varianza di X ed Y d. Si calcoli la distribuzione di Y condizionata ad X per tutti i valori di X. e. Si trovi la correlazione tra X ed Y. Soluzione Per definire la funzione di densità congiunta della variabile doppia (X, Y), è necessario descrivere lo spazio campionario e calcolare i valori della funzione di densità f X, f Y(x, y) per ogni coppia di valori di x e y. Lo spazio campionario sarà formato da 16 eventi, ossia 42 . Inoltre, i punti campionari sono tutti equiprobabili, con probabilità pari a 1/4⋅1/4 =1/16, dato che per ogni lancio la probabilità di un numero è 1/4 e ogni lancio è indipendente dall’altro. I risultati dell’esperimento (spazio campionario Ω) e le coppie dei valori assunti da X, numero più basso dei due usciti e Y, numero più alto, sono: Ω = {1-1, 1-2, 1-3, 1-4, 2-1, 2-2, 2-3, 2-4, 3-1, 3-2, 3-3, 3-4, 4-1, 4-2, 4-3, 4-4} X={ 1 1 1 1 1 2 2 2 1 2 3 3 1 2 3 4 } Y={ 1 2 3 4 2 2 3 4 3 3 3 4 4 4 4 4 } a. la funzione di densità congiunta di X ed Y è la seguente: Y X 1 2 3 4 fY(y) 1 2 3 4 fX(x) 1/16 0 0 0 1/16 2/16 1/16 0 0 3/16 2/16 1/16 0 0 3/16 2/16 2/16 2/16 1/16 7/16 7/16 5/16 3/16 1/16 1 Tabella 2: funzione di densità congiunta b. la probabilità che sia X che Y siano maggiori di 2 è la seguente: 1 − P[X < 2 , Y < 2 ] = 1 − ∑∑ f X , f Y (x , y) = 1 − [ f X , f Y (1,1)] = 1 − X <2 Y < 2 1 15 = 16 16 c. la media e la varianza di X ed Y sono le seguenti: 30 E[X] = ∑∑ x f XY ( xy ) = = 1.875 16 x y 50 E[Y] = ∑∑ y f XY (xy ) = = 3.125 16 x y Mentre i momenti secondi 7 5 3 1 70 E(X2 ) = 1 + 4 + 9 + 16 = = 4.375 16 16 16 16 16 1 3 5 7 170 E(Y2 ) = 1 + 4 + 9 + 16 = = 10.625 16 16 16 16 16 2 Esercizi di econometria serie 3 Pertanto le varianze sono: VAR(X) = E(X2 ) - [E(X)]2 = 0.859 VAR(Y) = E(Y2 ) - [E(Y)]2 = 0.859 d. la distribuzione di Y condizionata ad X per tutti i valori di X è la seguente, ricordando che f X Y (x y ) = X 1 2 3 4 f X , Y (x ,y) f Y (y ) f X Y (x y = 1) f X Y (x y = 2 ) 1 0 0 0 1 2/3 1/3 0 0 1 f X Y (x y = 3) f X Y (x y = 4 ) 2/5 2/5 1/5 0 1 2/7 2/7 2/7 1/7 1 Tabella 3: funzioni di densità condizionata. e. la correlazione tra X ed Y è data da: ρ XY = Cov(xy ) Var ( x )Var (y ) Calcoliamo dapprima la covarianza, data da dalla seguente formula: Cov(XY) = E[XY] − E(X)E(Y) = 0.391 da cui si ottiene: ρ XY = Cov( xy ) 0.391 = = 0.45 Var ( x )Var (y ) 0.859 Esercizio 3 Sia data la seguente funzione di densità congiunta delle variabili casuali continue X ed Y: e −( x + y ) f XY ( x , y ) = 0 x ∈ (0, ∞ ); y ∈ (0, ∞ ) altrimenti Si calcolino: a. P(X>1) b. P(1<X+Y<2) c. P(0<X<1|Y=2) 3 Esercizi di econometria serie 3 Soluzione a. la probabilità che X sia maggiore dell’unità è la seguente: P(X>1) = ∞ ∞ 0 1 ∫ dy ∫ e −x −y ∞ [ dx = ∫ e −y dy − e −x ] ∞ 1 [ = e−1 − e− y ] ∞ 0 = e −1 0 b. ricordando che per una variabile casuale Z assolutamente continua P[a < Z < b] = P[Z < b] - P[Z < a] pertanto la probabilità richiesta si può scrivere anche: P[1< X+Y < 2] = P[X+Y < 2] - P[X+Y < 1] la probabilità che la somma delle due variabili X ed Y sia compresa tra 1 e 2 è data graficamente dal dominio dell’integrazione, cioè: 1) y> 1-x 2) y< 2-x per cui la probabilità P(X+Y<1) ha un dominio pari a D1 : 0< X <2 e 0<Y<2-X, mentre la probabilità P(X+Y<2) ha un dominio pari a D2 : 0< X <1 e 0<Y<1-X. x2 y2 Per definizione si ha che: P(x1 <X<x2 ; y1 <Y<y2 ) = ∫ ∫ f (xy ) dxdy per cui: XY x1 y1 2 P(X+Y< 2) = P(X+Y< 1) = 2 −x −x −y −2 ∫ dx ∫ e dy =1 − 3e 0 0 1 1 −x 0 0 ∫ dx ∫ e −x −y dy =1 − 2e −1 Pertanto P[1< X+Y < 2] = P[X+Y < 2] - P[X+Y < 1]= 1-3e-2-1+2 e-1 = 2 e-1 - 3e-2. c. Per definizione la probabilità condizionata è: P (X | Y = y) = f XY (x , y ) = f X |Y ( x | y ) . f Y (y) Se le due variabili casuali X ed Y sono indipendenti, la probabilità condizionata è pari alla probabilità marginale. E’ facilmente dimostrabile che le due variabili sono indipendenti. Le funzioni marginali sono le seguenti: 4 Esercizi di econometria serie 3 +∞ [ ] ∞ 0 = e -x [ ] ∞ 0 = e- y +∞ f X (x) = ∫ f XY (x, y)dy = e-x ∫ e -y dy = e-x − e -y −∞ +∞ 0 +∞ −∞ 0 f Y (y) = ∫ f XY (x, y)dx = e- y ∫ e- x dx = e- y − e-x Se X ed Y sono indipendenti deve verificarsi la seguente relazione: f XY ( x , y ) = f X (x ) ⋅ f Y (y ) ⇒ e −( x + y ) = e − x ⋅ e − y ⇒ e − ( x + y ) = e −( x + y ) c.v.d. Di conseguenza vale la seguente relazione: P (X | Y = y) = f XY (x , y ) = f X |Y ( x | y ) = f X (x ) f Y (y) ossia [ f X (0 < x < 1) = ∫ f X (x ) dx = ∫ e -x dx = − e - x 1 1 0 0 ] 1 0 = −e -1 + 1 = 0.632 Esercizio 4 Sia data la seguente funzione di densità congiunta delle variabili casuali continue X ed Y: ( ( e − y 1 − e − x f XY ( x , y )= − x −y e 1 − e a. b. c. d. e. f. ) ) x ∈ (0, y) e y ∈ [0, ∞ ) x ∈ (0, ∞ ) e y ∈ [0, x) Determinare se f XY(x,y) e’ effettivamente una funzione di densità. Calcolare f X(x) e f Y(y) Calcolare il valore atteso condizionato E(Y|X=x) per x>0 Calcolare la probabilità P(X≥2 Y≥2) Calcolare la Correlazione tra X ed Y Trovare un’altra funzione di densità con le medesime funzioni di densità marginali. Soluzione a. dimostriamo che essa sia una funzione di densità, ossia verifichiamo le due condizioni: 1) f XY ( x , y ) ≥ 0 +∞ +∞ 2) ∫ ∫ f ( x , y ) dxdy = 1 XY −∞ −∞ La prima proprietà è subito dimostrata: basterà analizzare la condizione per la prima espressione per cui per simmetria essa è verificata anche per l’altra. ( ) e -y 1 - e -x ≥ 0 quando, essendo e -y > 0 sempre, 1 - e -x ≥ 0, ossia quando x ≥ 0 . La seconda proprietà si verifica separatamente per 0≤ x< y e 0≤ y< ∞ 5 Esercizi di econometria +∞ y serie 3 +∞ ∫ ∫ e (1 − e ) dxdy = ∫ e −y −x 0 0 y −y 0 ( dy ∫ 1 − e −x 0 +∞ ) dx = ∫ e −y [ dy x + e −x ] y 0 +∞ = 0 ∫ (ye ) −y + e −2 y − e − 2 y dy 0 da cui integrando per parti il prodotto (ye-y)e sviluppando si ottiene: − ye − y ] +∞ 0 +∞ ∫e + −y 0 ( ] ) = 1 + 12 − 1 = 12 1 −y +∞ dy + − 2e + e − y 0 2 +∞ 0 Per simmetria per 0≤ y< x e 0≤ x< ∞ si ha che +∞ x 1 ∫ ∫ e (1 − e ) dydx = 2 −x −y 0 0 Pertanto: +∞ +∞ 1 1 ∫ ∫ f (x , y ) dxdy = 2 + 2 = 1 c.d.v. XY −∞ −∞ b. ricordando la definizione di funzione di densità marginale per una variabile casuale continua f X (x ) = +∞ ∫ f XY ( x , y ) dy e f Y (y ) = −∞ +∞ ∫ f ( x , y ) dx XY −∞ e poiché nel primo intervallo x<y per 0≤ y < f X (x ) = +∞ ∫ −∞ +∞ ( ) la distribuzione marginale di X per 0≤ x< ( x è: ) f XY ( x , y ) dy = ∫ e − y 1 − e − x dy + ∫ e − x 1 − e − y dx = xe − x x 0 per simmetria segue che: f Y (y ) = +∞ ∫ f (x , y ) dx = ye −y XY per 0 ≤ y < +∞ . −∞ c. Per definizione, +∞ +∞ −∞ −∞ E[Y|X = x] = ∫ y f Y |X ( y | x ) dy = ∫ y f XY ( x , y ) dy f X (x ) e pertanto tenendo conto che 0< x < y per 0≤y< +∞ E[Y|X=x] = ∫y x ( ) ( e 0< y < x per 0≤ x < ) ( x e− y 1 − e−x e −x 1− e− y 1 − e−x dy + y dy = ∫0 xe −x xe − x xe −x ) +∞ −y ∫ ye dy + x si ha: ( ) 1x y − ye − y dy ∫ x0 da cui integrando per parti e sostituendo si ottiene: E[Y|X=x]= 2+ x . 2 d. al fine di calcolare la probabilità richiesta, ossia che risulti x≤ 2 e y≤ 2 visto che 0 < x < y 6 Esercizi di econometria serie 3 per 0 ≤ y < e 0 < y < x per 0 ≤ x < è necessario che nel primo intervallo 0 ≤ y < 2 mentre nel secondo 2 ≤ x < , pertanto la probabilità richiesta è data da: P (X ≥ 2, Y ≥ 2 ) = +∞ y ( ) −y −x ∫ ∫ e 1 − e dxdy+ 2 0 +∞ x ∫ ∫ e (1 − e ) dydx −x −y 2 0 Data l’evidente simmetria tra i due integrali è possibile scrivere: +∞ ( y +∞ ) +∞ ( ) y y P (X ≥ 2, Y ≥ 2 ) = 2 ∫ e − y dy ∫ 1 − e −x dx = 2 ∫ e − y x 0 + e −x 0 dy = 2 ∫ ye − y + e −2 y − e − y dy 2 0 2 2 da cui integrando per parti si ottiene: ∞ ∞ 1 P (X ≥ 2, Y ≥ 2 ) = 2 − ye − y + ∫ e − y dy + 2 − e − 2 y 2 2 2 ∞ 2 + 2 e −y ∞ 2 = − 2e − 2 − e − y ∞ 2 e. per trovare il coefficiente di correlazione tra X ed Y è necessario definire alcune grandezze quali E(X), E(Y), E(XY), Var(X) e Var(Y). Si ha: +∞ +∞ −∞ 0 E(X)= ∫ x f X (x ) dx = ( ) −x 2 −x ∫ x xe dx = − x e +∞ 0 +∞ + ∫ 2xe − x dx = − 2e − x +∞ =2 0 0 Quindi E(X)=2 e per ovvie ragioni di simmetria segue che E(Y)=2. Per calcolare Var(X) e Var(Y) e necessario calcolare E(X2 ) e E(Y2 ): +∞ E(X2 )= ∫ x f X (x ) dx = +∞ ( ) +∞ −x 2 −x ∫ x xe dx = − x e −∞ 0 0 +∞ + ∫ 2 xe − x dx = − 2e − x +∞ 0 =2 0 Quindi E(X2 ) = 6;sempre per simmetria si ha che E(Y2 ) = 6. Pertanto: Var (X) = E(X 2 ) − [E(X )]2 = 6 − 22 = 2 e per simmetria Var (Y ) = 2 . Segue che σX = 2 e σY = 2 E( XY ) = = +∞ +∞ +∞ y −∞ −∞ 0 0 ∫ xy f xy (x , y ) dxdy = ∫ +∞ y 0 0 ( ) ( ) −y −x ∫ ∫ xye 1 − e dxdy+ +∞ x 0 0 ( +∞ x ∫ ∫ xye (1 − e )dxdy = −x −y 0 0 ) −y −x −x −y ∫ ye dy ∫ x − xe dx + ∫ xe dx ∫ y − ye dy Infine, dalla simmetria dei due integrali doppi segue che: +∞ E (XY ) = 2 ∫ ye 0 y −y ( dy ∫ x − xe 0 +∞ y2 = 2 ∫ ye − y dy − − xe −x 0 2 +∞ = 2 ∫ ye 0 −y y 0 −x +∞ ) dx = 2 ∫ ye −y 0 x2 dy 2 y 0 − ∫ xe − x dx = 0 y y +∞ y y2 + ∫ e − x dx = 2 ∫ ye − y dy − − ye − y − e − x 0 = 2 0 0 y2 dy + ye − y + e − y − 1 = 2 +∞ ∫y e 3 0 −y +∞ dy + 2 ∫ y e 2 0 −2 y +∞ dy + 2 ∫ ye 0 −2 y +∞ dy − 2 ∫ ye − y dy 0 7 Esercizi di econometria serie 3 Sostituendo 2y = t, per cui y = E (XY ) = +∞ + e dy = dt/2, si ottiene: +∞ 2 3 −y ∫ y e dy + 2 ∫ 0 t 2 0 +∞ +∞ t − t dt t dt e + 2 ∫ e − t − 2 ∫ ye − y dy = 4 2 2 2 0 0 +∞ 3 −y ∫ y e dy + 0 1 +∞ 2 − t t e dt + 4 ∫0 +∞ 1 + ∞ −t te dt − 2 ye − y dy = 5 ∫ ∫ 2 0 0 Pertanto: ñ= cov(X , Y) E(XY ) − E (X)E(Y) 5 − (2 ⋅ 2) 1 = = = . σXσY σX σ Y 2 2 2 f. La più semplice funzione di densità di probabilità congiunta avente le stesse marginali è quella che si ottiene considerando X ed Y indipendenti e precisamente: f XY ( x , y ) = f X (x ) ⋅ f Y (y ) = xe − x ⋅ ye − y = xy e − (x + y ) per 0≤ x < e 0≤y< . Esercizio 5 Il reddito annuale in milioni di Lire di dieci coppie è risultato il seguente Nome della Coppia Rossi Bianchi Verdi Neri Gialli Arancioni Azzurri Viola Marroni Amaranto Reddito del Reddito della marito moglie 20 15 30 35 30 25 20 25 20 25 30 15 40 25 30 25 40 35 40 25 Una coppia è estratta a caso per rappresentare l’intero collettivo. Siano X ed Y le due variabili aleatorie relative rispettivamente al reddito del marito e della moglie estratti. a. Trovare la distribuzione di probabilità bivariata di X ed Y. b. Trovare le distribuzioni marginali della X e della Y , il loro valor medio e la loro varianza. c. Trovare la covarianza e la correlazione tra X ed Y. d. Trovare la media e la varianza del reddito familiare totale. e. Supponiamo che l’aliquota contributiva del marito sia del 40 % e quella della moglie del 20%. Calcolare la media e la varianza del reddito famigliare dopo la tassazione. f. Per misurare il livello di discriminazione contro le donne un sociologo calcola l’indice D = X - Y. Qual è la media e la varianza di tale indice? 8 Esercizi di econometria serie 3 Soluzione a. Le determinazioni assunte dalla variabile aleatoria X = “reddito del marito” sono le seguenti: X = {20 , 30 , 40} mentre per la variabile Y = “reddito della moglie” si ha Y = {15, 25, 35} Lo spazio campionario Ω è dato dall’insieme delle coppie e, secondo le ipotesi dell’esercizio, ciascuna coppia ha la stessa probabilità di essere estratta P = 1 10 . La distribuzione di probabilità congiunta f XY (x ,y ) = P(X = x , Y = y ) è data dalla tabella a doppia entrata qui di seguito riportata: X 20 30 40 fY(y) 15 1/10 1/10 0 2/10 25 2/10 2/10 2/10 6/10 35 0 1/10 1/10 2/10 fX(x) 3/10 4/10 3/10 1 Y Tabella 4: funzione di probabilità congiunta e marginale b. dove le funzioni marginali sono date dall’ultima riga e colonna, precisamente: f X (x ) = ∑ f XY (x , y j ) f Y (y ) = ∑ f XY (x i , y ) . e j i I valori attesi di X ed Y sono: 3 4 3 E (X) = ∑ x i ⋅ f X ( x i ) = 20 ⋅ + 30 ⋅ + 40 ⋅ = 30 10 10 10 i 2 6 2 E (Y) = ∑ y j ⋅ f Y (y j ) = 15 ⋅ + 25 ⋅ + 35 ⋅ = 25 10 10 10 j mentre le varianze: [ ] Var (X) = E X 2 − (E[X])2 [ ] E X 2 = ∑ x 2i ⋅ f X (x i ) = 20 2 ⋅ i Var (X) = 960 − 900 = 60 3 4 3 + 30 2 ⋅ + 40 2 ⋅ = 960 10 10 10 [ ] Var (Y) = E Y 2 − (E[Y])2 [ ] E Y 2 = ∑ y 2j ⋅ f Y (y j ) = 152 ⋅ j 2 6 2 + 25 2 ⋅ + 352 ⋅ = 665 10 10 10 Var (Y) = 665 − 625 = 40 c. la covarianza tra X ed Y è definita nel seguente modo Cov[X ,Y ] = E[X , Y] − E[X]E[Y] dove : Il coefficiente di correlazione tra X ed Y è invece definito quale: 9 Esercizi di econometria ρ XY = serie 3 Cov[X, Y] Var [X]Var [X] 20 = 60 ⋅ 40 = 0.408 d. Il reddito familiare globale è definito come Z=X+Y dove la distribuzione di probabilità, il valore atteso e la varianza della nuova variabile aleatoria Z sono i seguenti: Z P(Z) 35 1/10 45 3/10 55 2/10 65 3/10 75 1/10 1 Tabella 6: distribuzione di probabilità di Z E[Z] = ∑ z k ⋅ f Z (z k ) = 55 [ ] k E Z = ∑ z 2k ⋅ f Z (z k ) = 3165 2 k [ ] Var [Z] = E Z 2 − (E[Z]) 2 = 140 e. La distribuzione di probabilità congiunta delle X ed Y e quella di Z, dopo la tassazione, sono date da: X 12 18 24 fY(y) 12 1/10 1/10 0 2/10 20 2/10 2/10 2/10 6/10 28 0 1/10 1/10 2/10 fX(x) 3/10 4/10 3/10 1 Y Tabella 7: distribuzione di probabilità congiunta Z P(Z) 24 30 32 38 44 46 72 1/10 1/10 2/10 2/10 2/10 1/10 1/10 1 Tabella 8: distribuzione di Z dopo la tassazione 10 Esercizi di econometria serie 3 E[Z] = ∑ z k ⋅ f Z (z k ) = 40 k [ ] = ∑ z ⋅ f (z ) = 1758.4 Var [Z] = E[Z ] − (E[Z]) = 158.4 EZ 2 2 Z k k k 2 2 f. La distribuzione di probabilità dell’indice di discriminazione delle mogli rispetto ai mariti definito come D = X – Y è la seguente: D P(D) 5 7/10 15 3/10 10/10=1 Tabella 9: distribuzione di probabilità dell’indice D E[D] = 5 ⋅ 7 3 + 15 ⋅ = 8 10 10 7 3 E D 2 = 5 2 ⋅ + 15 2 ⋅ = 85 10 10 Var [D] = 85 − 8 2 = 21 [ ] 11