Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma ‘La Sapienza’ CALCOLO DELLE PROBABILITÀ E STATISTICA ESAME DEL 17/06/2015 NOME: COGNOME: MATRICOLA: Esercizio 1 Un sistema di servizio é composto da tre “sportelli” che, per comoditá, indichiamo con S1 , S2 ed S3 . Ipotizziamo che ogni utente, rivolgendosi al sistema, venga dirottato verso uno dei tre sportelli in maniera casuale per essere servito. Ipotizziamo, inoltre, che ciascuno dei tre sportelli abbia tempi di risposta diversi e cioé che il tempo necessario per servire un generico utente presso uno dei tre sportelli sia descritto da una variabile casuale esponenziale di parametri λ1 , λ2 e λ3 diversi tra loro. a) Scrivere in funzione di λ1 , λ2 e λ3 la probabilitá che un utente impieghi piú di 60 sec per essere servito. b) Scrivere in funzione di λ1 , λ2 e λ3 la probabilitá che l’utente sia stato servito dal primo sportello sapendo che lo stesso é stato servito in un tempo maggiore di 60 sec. N.B. tutti i passaggi devono essere opportunamente giustificati Soluzione: a) Indichiamo con T la variabile casuale tempo di servizio e con Si l’evento “l’utente é servito dallo sportello i-esimo”. Per ipotesi di lavoro abbiamo P (Si ) = 1/3, per ogni i = 1, 2, 3. Applicando la formula di disintegrazione avremo: P (T > 60) = P (T > 60|S1 )P (S1 ) + P (T > 60|S2 )P (S2 ) + P (T > 60|S3 )P (S3 ) ∫ ∫ ∫ λ1 +∞ −λ1 t λ2 +∞ −λ2 t λ3 +∞ −λ3 t = e dt + e dt + e dt 3 60 3 60 3 60 1 −λ1 60 = (e + e−λ2 60 + e−λ3 60 ) 3 b) Applicando il teorema di Bayes avremo P (S1 |T > 60) = P (S1 )P (T > 60|S1 ) e−λ1 60 = ... = −λ1 60 P (T > 60) e + e−λ2 60 + e−λ3 60 1 2 CALCOLO DELLE PROBABILITÀ E STATISTICA ESAME DEL 17/06/2015 Esercizio 2 Sia X una v.c. di Bernoulli con parametro 0.5 e sia Y una v.c. tale che P (Y = 1|X = 0) = 0.1, P (Y = 2|X = 0) = 0.4, P (Y = 3|X = 0) = 0.5 e P (Y = 1|X = 1) = 0.5, P (Y = 2|X = 1) = 0.4, P (Y = 3|X = 1) = 0.1. a) Si determinino le funzioni massa di probabilitá di (X,Y) e di Y. b) Si calcolino la media e la varianza di Y. c) Si stabilisca se X e Y sono indipendenti e/o identicamente distribuite, motivando le risposte. d) Si calcoli la covarianza e) Si dica come é distribuita la v.a. Z = X/Y N.B. tutti i passaggi devono essere opportunamente giustificati Soluzione: a) applicando la formula sulle probabilitá composte P (X = i, Y = j) = P (X = i)P (Y = j|X = i), possiamo riempire la tabella che rappresenta la funzione massa di probabilitá della v.a. doppia richiesta P (x, y) Y = 1 Y = 2 Y = 3 X=0 0.0500 0.2000 0.2500 0.5 X=1 0.2500 0.2000 0.0500 0.5 0.3 0.4 0.3 Nel margine inferiore rimane la funzione massa di probabilitá della v.a. Y . b) E(Y ) = ∑ yP (Y = y) = 0.3 + 2 0.4 + 3 0.3 = 2 V ar(Y ) = E(Y 2 ) − E(Y )2 = 4.6 − 4 = 0.6 y c) Le due variabili non sono indipendenti per costruzione, né sono identicamente distribuite. d) Valutiamo prima il valor medio del prodotto E(XY ) = 0.8, pertanto avremo Cov(X, Y ) = E(XY ) − E(X)E(Y ) = 0.8 − 2/2 = −0.2 e) La distribuzione della nuova variabile casuale, funzione della coppia (X, Y ), é la seguente P (Z = 0) = 0.5, P (Z = 1) = 0.25, P (Z = 1/2) = 0.2, P (Z = 1/3) = 0.05 CALCOLO DELLE PROBABILITÀ E STATISTICA ESAME DEL 17/06/2015 3 Esercizio 3 Durante l’ultimo anno un’azienda ha introdotto l’orario “flessibile” (ogni impiegato puó, entro certi limiti, scegliere l’orario di lavoro piú adatto alle sue esigenze). Il numero medio di giorni di assenza per impiegato, nei tre anni precedenti, é stato di 6.3 giorni all’anno. Per verificare se l’introduzione dell’orario flessibile ha ridotto l’assenteismo, come alcuni dirigenti hanno sostenuto, viene estratto un campione casuale di 100 impiegati, e viene registrato il numero medio di giorni di assenza per ciascun impiegato nel corso dell’ultimo anno. Indicato con X il numero dei giorni di assenza per ciscun impiegato si é osservato 100 ∑ i=1 xi = 550 100 ∑ x2i = 3866 i=1 a) Stimare, giustificando la scelta dello stimatore, la varianza dei giorni di assenza b) Si puó affermare, ad un livello di significativitá pari a 0.5% che l’orario flessibile riduce l’assenteismo? (si tenga conto che t0.05,99=1.66 ) N.B. tutti i passaggi devono essere opportunamente giustificati Soluzione: a) Utilizziamo la varianza campionaria poiché esso é uno stimatore non distorto della varianza della popolazione ∑100 2 100 X − 100X̄ 2 1 ∑ S2 = (Xi − X̄)2 = i=1 i = 8.49 n − 1 i=1 99 b) H0 : µ = 6.3 H1 : µ < 6.3 eseguiamo il test ad una coda per µ con σ incognito, per il quale (essendo il campione casuale molto numeroso) la statistica da usare é X̄ − µ0 √ ∼ T99 S/ n Dai dati si ricava toss = 5.5−6.3 2.91/10 = −2.74, per cui il valore osservato cade nella regione di rifiuto {t : t < −t0.05,99 }, perció l’ipotesi nulla é da rifiutare e possiamo concludere che c’é un’ evidenza sperimentale a favore dell’alternativa. 4 CALCOLO DELLE PROBABILITÀ E STATISTICA ESAME DEL 17/06/2015 Domanda 1 Si enunci e si dimostri la legge debole dei grandi numeri CALCOLO DELLE PROBABILITÀ E STATISTICA ESAME DEL 17/06/2015 Domanda 2 Si descriva una variabile casuale gaussiana o normale. 5 6 CALCOLO DELLE PROBABILITÀ E STATISTICA ESAME DEL 17/06/2015 Domanda 3 Si dia la definizine di intervallo di confidenza per la stima di un parametro incognito di una popolazione.