II Appello di Calcolo delle Probabilità Laurea Triennale in Matematica 2016/17 Martedì 14 febbraio 2017 Cognome: Nome: Email: Se non è espressamente indicato il contrario, per la soluzione degli esercizi è possibile usare tutti i risultati visti a lezione (compresi quelli di cui non è stata fornita la dimostrazione). Prima parte (Esercizi 1, 2, 3) Esercizio 1. Valentino lancia un dado regolare a sei facce, il cui risultato indichiamo con X. Quindi estrae casualmente X lettere dall’alfabeto inglese (26 lettere totali), una dopo l’altra con reimmissione, componendo una parola. Successivamente Valentino lancia un’altra volta il dado, il cui risultato indichiamo con Y , e compone casualmente una seconda parola di Y lettere. (a) Qual è la probabilità che la due parole composte abbiano lo stesso numero di lettere? (b) Qual è la probabilità che la prima parola composta sia CUORE? (c) Se la prima parola è CUORE, qual è la probabilità che la seconda parola sia un anagramma di CUORE? Soluzione 1. P(X = Y ) = (a) Dobbiamo calcolare 6 X i=1 P(X = Y, X = i) = 6 X i=1 P(X = i, Y = i) = 6 X i=1 6 X 11 1 P(X = i)P(Y = i) = = . 66 6 i=1 (b) Indichiamo con Z la prima parola. Osserviamo che la sua lunghezza è data da X, quindi è una variabile aleatoria. Affinché Z = CU ORE, deve innanzitutto accadere che X = 5; quindi, condizionalmente all’evento {X = 5}, possiamo osservare che Z = (Z1 , Z2 , Z3 , Z4 , Z5 ) dove le variabili aleatorie Zi sono indipendenti con distribuzione uniforme discreta a valori nell’alfabeto. In definitiva, la probabilità richiesta è P(Z = CU ORE) = P(X = 5, Z = CU ORE) = P(X = 5) P(Z = CU ORE|X = 5) = P(X = 5) P(Z1 = C, Z2 = U, Z3 = O, Z4 = R, Z5 = E) = P(X = 5) P(Z1 = C) P(Z2 = U ) P(Z3 = O) P(Z4 = R) P(Z5 = E) 1 1 = . 6 265 (c) Indichiamo con W la seconda parola, mentre Z indica la prima parola. Per l’indipendenza delle due parole, dobbiamo calcolare Dobbiamo calcolare P(W è un anagramma di CUORE | Z = CU ORE) = P(W è un anagramma di CUORE) . Ci sono 5! = 120 anagrammi di CUORE, e ciascuno ha la stessa probabilità calcolata al punto precedente: infatti, scelte arbitrariamente le lettere w1 , w2 , w3 , w4 , w5 , si ha 1 1 P(W = (w1 , w2 , w3 , w4 , w5 )) = P(Y = 5) P(W = (w1 , w2 , w3 , w4 , w5 ) | Y = 5) = . 6 265 In definitiva 1 1 20 P(W è un anagramma di CUORE) = 120 · = 5. 5 6 26 26 2 Esercizio 2. Siano X e Y due variabili aleatorie a valori interi, con X ≥ 1 e Y ≥ 2, con densità discreta congiunta data dalla formula seguente, per (k, n) ∈ N2 : p(X,Y ) (k, n) = P((X, Y ) = (k, n)) = q 2 (1 − q)n−2 1{k≥1} 1{n≥2} 1{n≥k+1} , dove q ∈ (0, 1) è un parametro fissato. Definiamo quindi la variabile aleatoria Z := Y − X . (a) Si mostri che X ha distribuzione geometrica. (b) Le variabili aleatorie X e Y sono indipendenti? (c) Si mostri che Z è indipendente da X e ha distribuzione geometrica. (d) Si calcolino E[Y ] e Cov[X, Y ]. (a) La densità discreta di X è data per k ∈ N da ∞ ∞ X X X 2 n−2 2 k−1 pX (k) = p(X,Y ) (k, n) = q (1 − q) = q (1 − q) (1 − q)n−(k+1) . Soluzione 2. n∈N n=k+1 n=k+1 Col cambio di variabili ` = n − (k + 1), l’ultima somma diventa la serie geometrica 1 q)` = 1−(1−q) = 1q , pertanto P∞ `=0 (1 − pX (k) = q (1 − q)k−1 . Ciò mostra che X è geometrica di parametro q. (b) X e Y non sono indipendenti. Basta notare che P(X = 2, Y = 2) = 0, perché la densità discreta si annulla per n = k (grazie a 1{n≥k+1} ), mentre P(X = 2) > 0 e P(Y = 2) > 0. Per giustificare queste disuguaglianze, si può notare che P(X = 2) = q(1 − q) > 0, come mostrato nel primo, mentre P(Y = 2) ≥ P(X = 1, Y = 2) = p(X,Y ) (1, 2) = q 2 > 0. (c) Calcoliamo la distribuzione congiunta di (X, Z). p(X,Z) (k, m) = P(X = k, Z = m) = P(X = k, Y − X = m) = P(X = k, Y = k + m) = p(X,Y ) (k, k + m) = q 2 (1 − q)k+m−2 1{k≥1} 1{k+m≥2} 1{k+m≥k+1} = q 2 (1 − q)k+m−2 1{k≥1} 1{m≥1} = q (1 − q)k−1 1{k≥1} q (1 − q)m−1 1{m≥1} . Dato che la densità discreta congiunta di X e Z si fattorizza nel prodotto di due densità geometriche di parametro q, segue che X e Z sono indipendenti, entrambe con distribuzione geometrica di parametro q. (d) Possiamo scrivere Y = X + Z. Sappiamo che X e Z sono geometriche di parametro q, quindi hanno media 1/q e varianza (1 − q)/q 2 . Per la linearità del valore medio 2 E[Y ] = E[X] + E[Z] = q mentre per la bilinearità della covarianza, e per il fatto che v.a. indipendenti sono scorrelate, 1−q Cov[X, Y ] = Cov[X, X + Z] = Cov[X, X] + Cov[X, Z] = Cov[X, X] = Var[X] = . q2 3 Esercizio 3. Sia X una variabile aleatoria reale con densità c fX (x) = 1 (x) , (1 + x)3 (0,∞) dove c ∈ R è un’opportuna costante. Definiamo la variabile aleatoria Y := log X . (a) Si determini il valore di c e si dica per quali p ∈ (0, ∞) si ha X ∈ Lp . (b) Si mostri che Y è assolutamente continua. (c) Si determini la distribuzione di M := max{X, Y }. Soluzione 3. (a) Imponendo che l’integrale della densità valga uno, si ottiene ∞ Z ∞ c c c 1= dx = − = , 3 2 (1 + x) 2(1 + x) 0 2 0 da cui c = 2. Dato che X > 0 q.c. (la densità si annulla per argomenti negativi), si ha Z ∞ 2 p p dx . xp E[|X| ] = E[X ] = (1 + x)3 0 La funzione integranda è continua in [0, ∞), dunque è integrabile (in quanto misurabile e limitata) in ogni intervallo compatto [0, M ]. Per x → ∞ essa è asintotica a 2/x3−p , pertanto è integrabile se e solo se 3 − p > 1, ossia p < 2. In definitiva, X ∈ Lp se e solo se p < 2. (b) Calcoliamo la funzione di ripartizione di Y : per ogni y ∈ R FY (y) = P(Y ≤ y) = P(log X ≤ y) = P(X ≤ ey ) = FX (ey ) . Calcoliamo la funzione di ripartizione di X: per x > 0 x Z x 2 1 1 FX (x) = =1− dt = − . 3 2 (1 + t) (1 + t) (1 + x)2 0 0 In definitiva 1 . (1 + ey )2 Questa funzione è C ∞ , quindi Y è assolutamente continua con densità 2ey . fY (y) = FY0 (y) = (1 + ey )3 FY (y) = FX (ey ) = 1 − (c) Dato che log x ≤ x per ogni x > 0, si ha M = max{X, log X} = X, dunque M ha la stessa distribuzione di X. In alternativa, per ogni t > 0, FM (t) = P(M ≤ t) = P(X ≤ t, Y ≤ t) = P(X ≤ t, X ≤ et ) = P(X ≤ min{t, et }) = P(X ≤ t)) = FX (t) , dal momento che t ≤ et per ogni t ∈ R. 4 Seconda parte (Esercizi 4, 5, 6) Esercizio 4. Romeo si trova con i suoi amici, ciascuno dei quali ha una moneta. • L’amico numero uno dà la sua moneta a Romeo; quindi si unisce a lui, formando un gruppo di due persone. • L’amico numero due dà la sua moneta a una persona del gruppo (Romeo o il primo amico) scelta casualmente; quindi si unisce al gruppo, che diventa di tre persone. • Procedendo, per ogni n ∈ N, l’amico numero n dà la sua moneta a una persona scelta a caso tra le n del gruppo; quindi si unisce al gruppo, che diventa di n + 1 persone. Definiamo gli eventi Ai := “l’amico numero i dà la sua moneta a Romeo” e indichiamo con Sn il numero di monete che Romeo ha in tasca dopo che l’amico numero n ha consegnato la sua moneta. Si noti che Sn è una variabile aleatoria che assume valori tra 1 e n. (a) Si mostri che 1 1 , P(Sn = n) = . n n! (b) Si esprima Sn in termini degli eventi Ai . Si deduca che P(Sn = 1) = E[Sn ] → ∞ per n → ∞ , Var[Sn ] ≤ E[Sn ] ∀n ∈ N . (c) Si definisca la variabile aleatoria Yn := Sn E[Sn ] e si calcoli il limite seguente: lim Var[Yn ] = . . . n→∞ (d) Si mostri che Yn converge in probabilità e si identifichi il limite. Soluzione 4. (a) L’evento {Sn = 1} significa che tutti gli amici dal numero 2 al numero n danno la loro moneta a una persona diversa da Romeo, quindi 123 n−1 1 P(Sn = 1) = P(Ac2 ∩ Ac3 ∩ . . . ∩ Acn ) = ··· = . 234 n n L’evento {Sn = n} significa che tutti gli amici dal numero 2 al numero n danno la loro moneta a Romeo, quindi 1 1 111 ··· = . P(Sn = n) = P(A2 ∩ A3 ∩ . . . ∩ An ) = 234 n n! (b) Possiamo scrivere Sn = X1 + X2 + . . . + Xn dove Xi = 1Ai è una variabile aleatoria Be( 1i ), quindi E[Xi ] = 1 , i Per linearità del valore medio E[Sn ] = E[X1 ] + . . . + E[Xn ] = 1 + 1 1 + ... + → ∞. 2 n Dato che Xi ∼ Be( 1i ), si ha inoltre 1 1 1 Var[Xi ] = 1− ≤ . i i i 5 Dato che gli eventi Ai sono indipendenti, lo sono anche le v.a. Xi , quindi per additività della varianza 1 1 Var[Sn ] = Var[X1 ] + . . . + Var[Xn ] ≤ 1 + + . . . + = E[Sn ] . 2 n (c) Si ha 1 1 1 Var[Sn ] ≤ E[Sn ] = −−−→ 0 , Var[Yn ] = 2 2 E[Sn ] E[Sn ] E[Sn ] n→∞ perché E[Sn ] → ∞. (d) Si noti che E[Yn ] = 1. Per la disuguaglianza di Chebychev, per ogni ε > 0 P(|Yn − 1| > ε) = P(|Yn − E[Yn ]| > ε) ≤ dunque Yn → 1 in probabilità. Var[Yn ] −−−→ 0 , n→∞ ε2 6 Esercizio 5. Achille lancia freccette che colpiscono il bersaglio triangolare B definito da B = {(x, y) ∈ R2 : 0 ≤ x ≤ 2, 0 ≤ y ≤ 1 − 21 x} . La freccetta i-esima atterra nel punto (Xi , Yi ) distribuito uniformemente in B, e gli esiti di lanci distinti sono indipendenti. Il punteggio ottenuto col lancio i-esimo è dato dall’ascissa Xi . (a) Si determini la distribuzione di Xi e se ne calcolino media m e varianza σ 2 . (b) Quante freccette deve mettere in conto di lanciare Achille, se vuole superare il punteggio di 40 con il 90% di probabilità? Soluzione 5. data da (a) Si noti che B ha area unitaria, pertanto la densità congiunta di (Xi , Yi ) è f(Xi ,Yi ) (x, y) = 1B (x, y) . Chiaramente 0 ≤ Xi ≤ 2, dunque fXi (x) = 0 se x 6∈ [0, 2], mentre per x ∈ [0, 2] Z Z 1− 1 x 2 fXi (x) = f(Xi ,Yi ) (x, y) dy = 1 dy = 1 − 12 x . 0 R Si ha dunque Z 0 R E[Xi2 ] = Z 2 Z x fXi (x) dx = m = E[Xi ] = x2 fXi (x) dx = Z 0 R 2 x (1 − 21 x) dx = [ x2 − 2 3 x2 (1 − 12 x) dx = [ x3 − x3 2 6 ]0 x4 2 8 ]0 =2− = 8 3 8 6 = −2= 2 , 3 2 , 3 2 4 2 − = . 3 9 9 (b) Indichiamo con Sn := X1 + . .√ . + Xn il punteggio ottenuto in n lanci. Per il teorema limite centrale, Zn := (Sn − mn)/(σ n) → Z ∼ N (0, 1) in legge, pertanto 40 − 23 n Sn − mn 120 − 2n 120 − 2n 2n − 120 √ √ √ P(Sn > 40) = P 'P Z> √ = 1−Φ =Φ . > √ √ 2 σ n 2n 2n 2n n 3 2 σ = E[Xi2 ] − m2 = Dalla tavola della distribuzione normale si ricava che Φ(z) = 0.90 per z ' 1.29, pertanto √ √ 2n − 120 √ ' 1.29 ⇐⇒ ( 2n)2 − 1.29 2n − 120 = 0 2n √ √ 1.29 + 1.292 + 480 1.29 + 21.95 2n ≥ ' = 11.62 , 2 2 da cui (11.62)2 n≥ ' 68 . 2 7 Esercizio 6. Sia X = (Xn )n≥0 una catena di Markov sull’insieme E = {1, 2, 3} con il seguente grafo di transizione, dove q ∈ [0, 31 ] indica un parametro fissato: 2 3 2 3 2 3 1 3 2 3 1 3 q 1 Indichiamo come al solito Pi ( · ) := P( · |X0 = i). (a) Si scriva la matrice di transizione, si classifichino gli stati e se ne determini il periodo. (b) Si calcoli P3 (X2 = 1). (c) Si mostri che esiste un unico valore del parametro q per cui la catena di Markov ammette una probabilità reversibile π = (πi )i=1,2,3 e la si calcoli. (d) Per il valore di q determinato al punto precedente, si calcolino i limiti seguenti: lim P1 (Xn−1 = 1 | Xn = 3) = . . . lim P1 (Xn = 3) = . . . n→∞ Soluzione 6. n→∞ (a) Si ha 0 2 3 p = 13 0 1 3 2 3 . q 23 31 − q Dato che 3 → 2 → 1 → 3, c’è un’unica classe di comunicazione, che è ovviamente chiusa e finita, dunque ricorrente positiva. Ciò significa che la catena di Markov è irriducibile e ricorrente positiva. Tutti gli stati hanno lo stesso periodo T = 1, ossia la catena è aperiodica: infatti p233 ≥ p23 p32 > 0 e p333 ≥ p32 p21 p13 > 0, da cui T = M.C.D.{2, 3, . . .} = 1. (b) Disintegrando rispetto al valore di X1 si ottiene P3 (X2 = 1) = P3 (X1 = 1, X2 = 1) + P3 (X1 = 2, X2 = 1) + P3 (X1 = 3, X2 = 1) 21 1 2 q = p31 p11 + p32 p21 + p33 p31 = + − q q = + − q2 . 33 3 9 3 In alternativa, ricordiamo che Pi (Xn = j) = (pn )ij . La potenza seconda della matrice di transizione è 2 q q 2 5 9 + 3 9 9 − 3 2q 2q 5 1 p2 = p · p = 3 9 3 − 3 2 9 quindi P3 (X2 = 1) = (p2 )31 = 2 9 + q 3 q 2 3 −q q2. + − 2 9 5 9 − q 3 + q2 (c) Una probabilità è reversibile se e solo se πi pij = πj pji per ogni i, j ∈ {1, 2, 3}. Questa relazione per i = j è sempre soddisfatta, quindi basta verificare solo i casi in cui i 6= j. 1 2 π1 p12 = π2 p21 ⇐⇒ π1 = π2 ⇐⇒ π2 = 2 π1 . 3 3 2 2 π2 p23 = π3 p32 ⇐⇒ π2 = π3 ⇐⇒ π3 = π2 = 2 π1 . 3 3 8 ⇐⇒ π3 p31 = π1 p13 π3 q = π1 Da ciò segue che π è reversibile se e solo se 1 =2 ⇐⇒ 3q Imponendo π1 + π2 + π3 = 1 si ottiene infine 1 π1 + 2 π1 + π1 = π1 + 2 π1 + 2 π1 = 5 π1 = 1 3q (d) Per il teorema di convergenza all’equilibrio 1 3 ⇐⇒ q= lim P1 (Xn = 3) = π3 = 1 π1 . 3q 1 . 6 1 π1 = , 5 ⇐⇒ n→∞ π3 = π2 = π3 = 2 . 5 2 . 5 Per la formula di Bayes P1 (Xn = 3 | Xn−1 = 1) P(Xn−1 = 1) p13 P(Xn−1 = 1) = , P(Xn = 3) P(Xn = 3) per la proprietà di Markov. Dato che 1 lim P1 (Xn−1 = 1) = π1 = n→∞ 5 e p13 = 31 , otteniamo P1 (Xn−1 = 1 | Xn = 3) = lim P1 (Xn−1 = 1 | Xn = 3) = n→∞ 1 1 3 5 2 5 = 1 . 6 9 Tavola della distribuzione normale Rz − 1 x2 La tabella seguente riporta i valori di Φ(z) := −∞ e√22π dx, la funzione di ripartizione della distribuzione normale standard N (0, 1), per 0 ≤ z ≤ 3.5. Ricordiamo che i valori di Φ(z) per z < 0 possono essere ricavati grazie alla formula Φ(z) = 1 − Φ(−z) . z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.0 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 3.0 3.1 3.2 3.3 3.4 0.5000 0.5398 0.5793 0.6179 0.6554 0.6915 0.7257 0.7580 0.7881 0.8159 0.8413 0.8643 0.8849 0.9032 0.9192 0.9332 0.9452 0.9554 0.9641 0.9713 0.9772 0.9821 0.9861 0.9893 0.9918 0.9938 0.9953 0.9965 0.9974 0.9981 0.9987 0.9990 0.9993 0.9995 0.9997 0.5040 0.5438 0.5832 0.6217 0.6591 0.6950 0.7291 0.7611 0.7910 0.8186 0.8438 0.8665 0.8869 0.9049 0.9207 0.9345 0.9463 0.9564 0.9649 0.9719 0.9778 0.9826 0.9864 0.9896 0.9920 0.9940 0.9955 0.9966 0.9975 0.9982 0.9987 0.9991 0.9993 0.9995 0.9997 0.5080 0.5478 0.5871 0.6255 0.6628 0.6985 0.7324 0.7642 0.7939 0.8212 0.8461 0.8686 0.8888 0.9066 0.9222 0.9357 0.9474 0.9573 0.9656 0.9726 0.9783 0.9830 0.9868 0.9898 0.9922 0.9941 0.9956 0.9967 0.9976 0.9982 0.9987 0.9991 0.9994 0.9995 0.9997 0.5120 0.5517 0.5910 0.6293 0.6664 0.7019 0.7357 0.7673 0.7967 0.8238 0.8485 0.8708 0.8907 0.9082 0.9236 0.9370 0.9484 0.9582 0.9664 0.9732 0.9788 0.9834 0.9871 0.9901 0.9925 0.9943 0.9957 0.9968 0.9977 0.9983 0.9988 0.9991 0.9994 0.9996 0.9997 0.5160 0.5557 0.5948 0.6331 0.6700 0.7054 0.7389 0.7704 0.7995 0.8264 0.8508 0.8729 0.8925 0.9099 0.9251 0.9382 0.9495 0.9591 0.9671 0.9738 0.9793 0.9838 0.9875 0.9904 0.9927 0.9945 0.9959 0.9969 0.9977 0.9984 0.9988 0.9992 0.9994 0.9996 0.9997 0.5199 0.5596 0.5987 0.6368 0.6736 0.7088 0.7422 0.7734 0.8023 0.8289 0.8531 0.8749 0.8944 0.9115 0.9265 0.9394 0.9505 0.9599 0.9678 0.9744 0.9798 0.9842 0.9878 0.9906 0.9929 0.9946 0.9960 0.9970 0.9978 0.9984 0.9989 0.9992 0.9994 0.9996 0.9997 0.5239 0.5636 0.6026 0.6406 0.6772 0.7123 0.7454 0.7764 0.8051 0.8315 0.8554 0.8770 0.8962 0.9131 0.9279 0.9406 0.9515 0.9608 0.9686 0.9750 0.9803 0.9846 0.9881 0.9909 0.9931 0.9948 0.9961 0.9971 0.9979 0.9985 0.9989 0.9992 0.9994 0.9996 0.9997 0.5279 0.5675 0.6064 0.6443 0.6808 0.7157 0.7486 0.7794 0.8078 0.8340 0.8577 0.8790 0.8980 0.9147 0.9292 0.9418 0.9525 0.9616 0.9693 0.9756 0.9808 0.9850 0.9884 0.9911 0.9932 0.9949 0.9962 0.9972 0.9979 0.9985 0.9989 0.9992 0.9995 0.9996 0.9997 0.5319 0.5714 0.6103 0.6480 0.6844 0.7190 0.7517 0.7823 0.8106 0.8365 0.8599 0.8810 0.8997 0.9162 0.9306 0.9429 0.9535 0.9625 0.9699 0.9761 0.9812 0.9854 0.9887 0.9913 0.9934 0.9951 0.9963 0.9973 0.9980 0.9986 0.9990 0.9993 0.9995 0.9996 0.9997 0.5359 0.5753 0.6141 0.6517 0.6879 0.7224 0.7549 0.7852 0.8133 0.8389 0.8621 0.8830 0.9015 0.9177 0.9319 0.9441 0.9545 0.9633 0.9706 0.9767 0.9817 0.9857 0.9890 0.9916 0.9936 0.9952 0.9964 0.9974 0.9981 0.9986 0.9990 0.9993 0.9995 0.9997 0.9998