ROSS06-233-296.Ita 9-07-2004 10:33 Pagina 233 CAPITOLO 6 Leggi congiunte di variabili aleatorie 6.1 FUNZIONI DI DISTRIBUZIONE CONGIUNTE Fino a ora abbiamo considerato unicamente le leggi di singole variabili aleatorie. Tuttavia, siamo spesso interessati a studiare problemi di probabilità legati al valore congiunto di due o più variabili aleatorie. Per trattare queste probabilità, definiamo, per due variabili aleatorie X e Y, la funzione di distribuzione congiunta di X e Y come F1a, b2 = P5X … a, Y … b6 - q 6 a, b 6 q La funzione di distribuzione di X può essere ottenuta da quella congiunta di X e Y come segue: FX1a2 = P5X … a6 = P5X … a, Y 6 q 6 = P Q lim 5X … a, Y … b6 R b: q = lim P5X … a, Y … b6 b: q = lim F1a, b2 b: q K F1a, q 2 Il lettore può notare che nelle precedenti uguaglianze abbiamo fatto uso una volta di più del fatto che la probabilità è un funzione d’insieme continua. In maniera analoga, la funzione di distribuzione della variabile Y è data da FY1b2 = P5Y … b6 = lim F1a, b2 a: q K F1 q , b2 Le funzioni di distribuzioni FX e FY sono definite le funzioni di distribuzione marginali di X e Y. Tutte le proprietà riguardanti le probabilità relative alle variabili X e Y possono, in teoria, essere espresse in termini della loro funzione di distribuzione congiunta. Per esempio, supponiamo di voler calcolare la probabilità che X sia maggiore di a e Y sia maggiore di b. ROSS06-233-296.Ita 234 9-07-2004 Capitolo 6 10:33 Pagina 234 Leggi congiunte di variabili aleatorie Questo può essere fatto nel seguente modo: P5X 7 a, Y 7 b6 = 1 - P15X 7 a, Y 7 b6c2 = 1 - P15X 7 a6c ´ 5Y 7 b6c2 = 1 - P15X … a6 ´ 5Y … b62 (1.1) = 1 - 3P5X … a6 + P5Y … b6 - P5X … a, Y … b64 = 1 - FX1a2 - FY1b2 + F1a, b2 La Formula (1.1) è un caso speciale della Formula (1.2), la cui dimostrazione è lasciata come esercizio. P5a1 6 X … a2 , b1 6 Y … b26 = F1a2 , b22 + F1a1 , b12 - F1a1 , b22 - F1a2 , b12 (1.2) quando a1 6 a2 , b1 6 b2 . Nel caso in cui sia X che Y siano variabili aleatorie discrete, è conveniente definire la (funzione di) densità discreta congiunta di X e Y come segue p1x, y2 = P5X = x, Y = y6 La densità discreta di X può essere ottenuta da p1x, y2 tramite pX1x2 = P5X = x6 = a p1x, y2 y:p1x, y2 7 0 In maniera analoga, pY1y2 = a p1x, y2 x:p1x, y2 7 0 Esempio 1a. Supponiamo che vengano scelte a caso 3 palline da un’urna contenente 3 palline rosse, 4 bianche e 5 blu. Se denotiamo con X e Y, rispettivamente, il numero di palline rosse e bianche scelte, allora la densità discreta congiunta di X e Y, p1i, j2 = P5X = i, Y = j6, è data da 5 12 10 p10, 02 = a b n a b = 3 3 220 4 5 12 40 p10, 12 = a b a b n a b = 1 2 3 220 4 5 12 30 p10, 22 = a b a b n a b = 2 1 3 220 4 12 4 p10, 32 = a b n a b = 3 3 220 3 5 12 30 p11, 02 = a b a b n a b = 1 2 3 220 3 4 5 12 60 p11, 12 = a b a b a b n a b = 1 1 1 3 220 ROSS06-233-296.Ita 9-07-2004 10:33 Pagina 235 6.1 TABELLA 6.1 Funzioni di distribuzione congiunte 235 P5X = i, Y = j6 i j 0 1 2 3 Somme sulla riga = P5X = i6 0 10 220 40 220 30 220 4 220 84 220 1 30 220 60 220 18 220 0 108 220 2 15 220 12 220 0 0 27 220 3 1 220 0 0 0 1 220 56 220 112 220 48 220 4 220 Somme sulla colonna = P5Y = j6 3 4 12 18 p11, 22 = a b a b n a b = 1 2 3 220 3 5 12 15 p12, 02 = a b a b n a b = 2 1 3 220 3 4 12 12 p12, 12 = a b a b n a b = 2 1 3 220 3 12 1 p13, 02 = a b n a b = 3 3 220 Queste probabilità possono facilmente essere tabulate come nella Tabella 6.1. Il lettore noti che la densità discreta della variabile X si ottiene calcolando le somme sulle righe, mentre quella di Y si ottiene sommando i valori sulle colonne. Siccome le densità discrete di X e Y appaiono ai margini di questa tabella, per questo motivo hanno ricevuto il nome di densità marginali. ■ Esempio 1b. Supponiamo che il 15 per cento delle famiglie in una certa comunità non abbia bambini, che il 20 per cento ne abbia 1, il 35 per cento ne abbia 2 e il 30 per cento ne abbia 3; e supponiamo, inoltre, che in ogni famiglia, ogni figlio sia con uguale probabilità maschio o femmina in maniera indipendente. Se scegliamo a caso una famiglia di questa comunità, allora M, il numero di maschi e F, il numero delle femmine, in questa famiglia hanno la densità discreta congiunta mostrata nella Tabella 6.2. TABELLA 6.2 P5B = i, G = j6 j 1 2 3 Somme sulla riga = P5B = i6 0.15 0.10 0.0875 0.0375 0.3750 0.10 0.175 0.1125 0 0.3875 2 0.0875 0.1125 0 0 0.2000 3 0.0375 0 0 0 0.0375 i 0 0 1 Somme sulla colonna=P5G = j6 0.3750 0.3875 0.2000 0.0375 ROSS06-233-296.Ita 236 9-07-2004 Capitolo 6 10:33 Pagina 236 Leggi congiunte di variabili aleatorie Queste probabilità si ottengono come segue: P5B = 0, G = 06 = P5senza figli6 = 0.15 P5B = 0, G = 16 = P51 femmina e in totale 1 figlio6 = P51 figlio6P51 femmina1 figlio6 = 10.202 A 12 B P5B = 0, G = 26 = P52 femmine e in totale 2 figli6 = P52 figli6P52 femmine 2 figli6 = 10.352 A 12 B 2 Lasciamo al lettore di verificare l’esattezza degli altri valori della Tabella 6.2. ■ Diciamo che le variabili aleatorie X e Y sono congiuntamente (assolutamente) continue se esiste una funzione f1x, y2 integrabile, che abbia la proprietà che per ogni sottoinsieme C dello spazio delle coppie di numeri reali P51X, Y2 H C6 = O f1x, y2 dx dy (1.3) 1x, y2HC La funzione f1x, y2 è chiamata (funzione di) densità congiunta di X e Y. Se A e B sono una qualsiasi coppia di sottoinsiemi della retta reale, allora definendo C = 51x, y2: x H A, y H B6, dalla Formula (1.3) otteniamo che P5X H A, Y H B6 = LB LA f1x, y2 dx dy (1.4) Poiché F1a, b2 = P5X H 1- q , a4, Y H 1- q , b46 b = a L- q L- q f1x, y2 dx dy segue, differenziando, che f1a, b2 = 02 F1a, b2 0a 0b sempre che le derivate parziali di F abbiano senso. Un’ulteriore interpretazione della densità congiunta si ottiene dalla Formula (1.4) nel modo seguente: d + db P5a 6 X 6 a + da, b 6 Y 6 b + db6 = Lb a + da La f1x, y2 dx dy L f1a, b2 da db quando da e db sono “piccoli” e f1x, y2 è continua in (a, b). Perciò f1a, b2 risulta una misura di quanto sia probabile che il vettore (aleatorio) 1X, Y2 sia vicino a 1a, b2. Se X e Y sono congiuntamente continue, esse lo saranno anche individualmente, e le loro densità si posso ottenere come segue: P5X H A6 = P5X H A, Y H 1- q , q 26 ROSS06-233-296.Ita 9-07-2004 10:33 Pagina 237 6.1 Funzioni di distribuzione congiunte q = LA L- q = LA f1x, y2 dy dx fX1x2 dx dove fX1x2 = q L- q f1x, y2 dy è perciò la densità (marginale) della variabile aleatoria X. In maniera analoga, la densità (marginale) di Y è data da fY1y2 = Esempio 1c. q L- q f1x, y2 dx La densità congiunta di X e Y è data da f1x, y2 = b 2e-xe-2y 0 0 6 x 6 q, 0 6 y 6 q altrimenti Si calcolino (a) P5X 7 1, Y 6 16, (b) P5X 6 Y6, e (c) P5X 6 a6. Soluzione 1 (a) P5X 7 1, Y 6 16 = 2e -xe -2y dx dy L0 L1 1 = q L0 2e -2y ¢ -e -x ` ≤ dy q 1 1 = e -1 L0 2e -2y dy = e -111 - e -22 (b) P5X 6 Y6 = O 2e -xe -2y dx dy 1x, y2: x 6 y y q = L0 L0 q = L0 2e -xe -2y dx dy 2e -2y11 - e -y2 dy q = L0 = 1 = 1 3 q 2e -2y dy 2 3 L0 2e -3y dy 237 ROSS06-233-296.Ita 238 9-07-2004 10:33 Capitolo 6 Pagina 238 Leggi congiunte di variabili aleatorie a (c) P5X 6 a6 = q L0 L0 2e -2ye -x dy dx a e -x dx L0 = 1 - e -a = ■ Esempio 1d. Si consideri un cerchio di raggio R e supponiamo di scegliere a caso un punto dentro il cerchio in modo tale che tutte le regioni di uguale area interne al cerchio abbiano uguale probabilità di contenere il punto. (In altre parole, il punto è uniformemente distribuito dentro il cerchio.) Se fissiamo il centro del cerchio come l’origine di un sistema di assi cartesiani e X e Y rappresentano le coordinate del punto scelto (Figura 6.1), segue che, essendo 1X, Y2 un punto scelto a caso e in modo uniforme, la densità congiunta di X e Y è data da f1x, y2 = b se x2 + y2 … R2 se x2 + y2 7 R2 c 0 per un qualche c. (a) Si determini la costante c. (b) Si determinino le densità marginali di X e Y. (c) Si calcoli la probabilità che D, la distanza dall’origine del punto selezionato, sia minore o uguale a a. (d) Si trovi E3D4. Soluzione (a) Poiché q q L- q L- q f1x, y2 dy dx = 1 segue che c 2 O 2 dy dx = 1 2 x +y …R y R (X, Y) (0, 0) x Figura 6.1 Distribuzione congiunta. ROSS06-233-296.Ita 9-07-2004 10:33 Pagina 239 6.1 Funzioni di distribuzione congiunte 239 Possiamo calcolare 4x2 + y2 … R2 dy dx utilizzando la trasformazione a coordinate polari, o più semplicemente notando che essa rappresenta l’area del cerchio ed è quindi uguale a pR2. Quindi 1 pR2 c = (b) fX1x2 = q f1x, y2 dy L- q 1 = dy pR2 Lx2 + y2 … R2 c 1 = dy c = 2R2 - x2 pR2 L-c = 2 2R2 - x2 pR2 x2 … R2 ed è uguale a 0 quando x2 7 R2. Per simmetria la densità marginale di Y è data da fY1y2 = 2 2R2 - y2 pR2 y2 … R2 y2 7 R2 = 0 (c) Per la funzione di distribuzione di D = 2X2 + Y2 , la distanza dall’origine, si ottiene quanto segue: per 0 … a … R, FD1a2 = P E 2X2 + Y2 … a F = P5X2 + Y2 … a26 = 2 O 2 f1x, y2 dy dx 2 x +y …a = 1 pR2 2 O 2 dy dx x +y …a 2 = pa pR2 = a2 R2 dove abbiamo utilizzato il fatto che 4x2 + y2 … a2 dy dx è l’area del cerchio di raggio a e quindi è pari a pa2. (d) Per il punto (c) otteniamo che la densità di D è fD1a2 = 2a R2 0 … a … R ROSS06-233-296.Ita 240 9-07-2004 Capitolo 6 10:33 Pagina 240 Leggi congiunte di variabili aleatorie Quindi R E3D4 = Esempio 1e. 2R 2 a2 da = 2 3 R L0 ■ La densità congiunta di X e Y è data da f1x, y2 = b e-1x + y2 0 0 6 x 6 q, 0 6 y 6 q altrimenti Si determini la densità della variabile X>Y. Soluzione Iniziamo calcolando la funzione di distribuzione di X>Y. Per a 7 0, FX>Y1a2 = P e = X … af Y O e -1x + y2 dx dy x>y … a q = L0 L0 q = ay L0 e -1x + y2 dx dy 11 - e -ay2e -y dy e -1a + 12y r` a + 1 0 q = b -e -y + = 1 - 1 a + 1 Differenziando otteniamo che la densità di X>Y è data da fX>Y1a2 = 1>1a + 122, 0 6 a 6 q. ■ Possiamo definire in maniera analoga al caso di due variabile, la distribuzione di probabilità congiunta di n variabili aleatorie. Per esempio, la funzione di distribuzione congiunta F1a1 , a2, p , an2 di n variabili aleatorie X1 , X2, p , Xn si definisce F1a1 , a2, p , an2 = P5X1 … a1 , X2 … a2, p , Xn … an6 Inoltre, le n variabili aleatorie sono dette congiuntamente continue se esiste una funzione f1x1 , x2, p , xn2, detta densità congiunta, tale che per ogni sottoinsieme C dello spazio delle n-uple di numeri reali P51X1 , X2, p , Xn2 H C6 = O p L 1x1, p , xn2HC f1x1, p , xn2 dx1 dx2 p dxn In particolare, per ogni famiglia di sottoinsiemi A1 , A2, p , An della retta reale P5X1 H A 1 , X2 H A 2, p , Xn H A n6 ROSS06-233-296.Ita 9-07-2004 10:33 Pagina 241 6.2 = LAn LAn - 1 p Variabili aleatorie indipendenti LA1 241 f1x1, p , xn2 dx1 dx2 p dxn Esempio 1f. La distribuzione multinomiale. Una delle più importanti distribuzioni congiunte è certamente la multinomiale, che si ottiene quando si ripeta n volte un esperimento in forma indipendente. Supponiamo che ogni esperimento possa avere come risultato uno qualsiasi tra r possibili esiti, con probabir lità pari a p1 , p2, p , pr , a pi = 1, rispettivamente. Se denotiamo con Xi il numei=1 ro degli n esperimenti che hanno dato come risultato l’esito numero i, allora P5X1 = n1 , X2 = n2, p , Xr = nr6 = n! pn1pn2 p pnr r n1! n2! p nr! 1 2 (1.5) r ogni volta che a ni = n. i=1 La Formula (1.5) è verificata notando che ogni successione degli esiti degli n esperimenti che portano al fatto che l’esito i si verifichi esattamente ni volte, per i=1, 2, p , r, avrà probabilità pari a pn1 1pn2 2 p pnr r, grazie all’ipotesi di indipendenza. Essendoci n!>1n1! n2! p nr!2 di tali sequenze (vi sono n!>n1! p nr! permutazioni di n oggetti dei quali n1 sono uguali tra loro, n2 sono uguali tra loro, p , nr sono uguali tra loro) la Formula (1.5) risulta verificata. La distribuzione congiunta determinata dalla densità discreta congiunta data dalla Formula (1.5) è detta distribuzione multinomiale. Il lettore noterà che per r = 2, la distribuzione multinomiale si riduce all’usuale binomiale. Come applicazione della distribuzione multinomiale, supponiamo di lanciare 9 volte un dado equilibrato. La probabilità che 1 appaia tre volte, 2 e 3 due volte ciascuno, 4 e 5 una sola volta ciascuno e il 6 mai, è pari a 9! 1 3 1 2 1 2 1 1 1 1 1 0 9! 1 9 a b a b a b a b a b a b = a b 3! 2! 2! 1! 1! 0! 6 6 6 6 6 6 3! 2! 2! 6 6.2 ■ VARIABILI ALEATORIE INDIPENDENTI Le variabili aleatorie X e Y si dicono indipendenti se, per ogni coppia di sottoinsiemi della retta reale A e B, P5X H A, Y H B6 = P5X H A6P5Y H B6 (2.1) In altre parole, X e Y sono indipendenti se, per ogni A e B, gli eventi EA = 5X H A6 e FB = 5Y H B6 sono indipendenti. Grazie agli assiomi della probabilità si può provare che l’Equazione (2.1) è verificata se e solo se per ogni coppia di numeri reali a, b, P5X … a, Y … b6 = P5X … a6P5Y … b6 ROSS06-233-296.Ita 242 9-07-2004 Capitolo 6 10:33 Pagina 242 Leggi congiunte di variabili aleatorie Quindi, in termini della distribuzione congiunta F di X e Y, abbiamo che X e Y sono indipendenti se e solo se F1a, b2 = FX1a2FY1b2 per ogni a, b Quando X e Y sono variabili aleatorie discrete, la definizione d’indipendenza (2.1) risulta equivalente a p1x, y2 = pX1x2pY1y2 per ogni x, y (2.2) L’equivalenza segue poiché, se (2.1) è soddisfatta, allora otteniamo la (2.2) ponendo A e B uguali, rispettivamente, ai sottoinsiemi formati da un solo punto A = 5x6, B = 5y6. Inoltre, se (2.2) è soddisfatta, allora per ogni coppia di sottoinsiemi A e B, P5X H A, Y H B6 = a a p1x, y2 yHB xHA = a a pX1x2pY1y2 yHB xHA = a pY1y2 a pX1x2 yHB xHA = P5Y H B6P5X H A6 e quindi la (2.1) risulta verificata. Nel caso di variabili congiuntamente continue la condizione d’indipendenza è equivalente a f1x, y2 = fX1x2fY1y2 per ogni x, y Perciò, semplificando, X e Y sono indipendenti se la conoscenza del valore di una non cambia la distribuzione dell’altra. Le variabili che non sono indipendenti vengono definite dipendenti. Esempio 2a. Supponiamo che vengano eseguite n + m prove indipendenti, ognuna delle quali abbia probabilità pari a p di risultare in un successo. Se X è il numero di successi nelle prime n prove e Y il numero di successi nelle m prove successive, allora X e Y sono indipendenti, già che conoscere il numero dei successi nelle prime n prove non modifica la distribuzione del numero di successi nelle ulteriori m prove (per l’ipotesi di indipendenza delle prove). Infatti, per valori interi positivi x e y, n m P5X = x, Y = y6 = a b px11 - p2n - x a b py11 - p2m - y x y 0 … x … n, 0 … y … m = P5X = x6P5Y = y6 D’altra parte anche X e Z saranno indipendenti, dove Z è il numero totale di suc■ cessi nelle n + m prove (perché?). Esempio 2b. Supponiamo che il numero di persone che entrano in un ufficio postale in un dato giorno sia descrivibile con una variabile di Poisson di parametro l. Si provi che, se ogni persona che entra nell’ufficio postale è un uomo con probabilità pari a p e donna con probabilità pari a 1 – p, allora il numero di uomini e ROSS06-233-296.Ita 9-07-2004 10:33 Pagina 243 6.2 Variabili aleatorie indipendenti 243 donne che entrano nell’ufficio postale sono variabili aleatorie di Poisson indipendenti di parametri rispettivamente pari a lp e l11 - p2. Soluzione Denotiamo con X e Y, rispettivamente, il numero di uomini e donne che entrano nell’ufficio postale. Proveremo che sono indipendenti dimostrando che la Formula (2.2) è verificata. Per ottenere questa espressione per P5X = i, Y = j6, condizioniamo rispetto a X + Y come segue: P5X = i, Y = j6 = P5X = i, Y = jX + Y = i + j6P5X + Y = i + j6 + P5X = i, Y = jX + Y Z i + j6P5X + Y Z i + j6 [Il lettore noti come questa formula non sia altro che un caso particolare della formula P1E2 = P1E F2P1F2 + P1EFc2P1Fc2.] Essendo P5X = i, Y = jX + Y Z i + j6 chiaramente pari a 0, otteniamo P5X = i, Y = j6 = P5X = i, Y = jX + Y = i + j6P5X + Y = i + j6 (2.3) Ora, siccome X + Y rappresenta il numero totale di persone che entrano nell’ufficio postale, segue, per ipotesi, che li + j P5X + Y = i + j6 = e-l (2.4) 1i + j2! Inoltre, dato che i + j persone entrano nell’ufficio postale e con probabilità pari a p ognuna di esse è un uomo, segue che la probabilità che esattamente i di essi sia un uomo (e quindi j siano donne) è semplicemente la densità discreta di una variabii + j i le binomiale di parametri i + j e p valutata in i, ovvero a b p 11 - p2j. Quindi i P5X = i, Y = jX + Y = i + j6 = a i + j i b p 11 - p2j i (2.5) Sostituendo la (2.4) e la (2.5) nella (2.3) abbiamo P5X = i, Y = j6 = a i + j i li + j b p 11 - p2je -l i 1i + j2! = e -l = Perciò P5X = i6 = e -lp 1lp2i 3l11 - p24j i! j! e -lp1lp2i -l11 - p2 3l11 - p24j e i! j! (2.6) 1lp2i 3l11 - p24j 1lp2i -l11 - p2 -lp e = e i! a j! i! j (2.7) e in maniera simile P5Y = j6 = e -l11 - p2 3l11 - p24j j! Le Formule (2.6), (2.7) e (2.8) verificano quanto desiderato. (2.8) ■