Esame di Statistica I – 12 Giugno 2003 docente: Prof.ssa J. Mortera Cognome __________________ Nome __________________ Matricola __________________ I quesiti in corsivo hanno carattere teorico. La prova si ritiene superata se si raggiunge la sufficienza sia sugli esercizi sia sulla parte teorica. 1. [5] Un’indagine su un campione di 20 comuni governati dall’alleanza A mostra che essi spendono in media una somma di 175 Euro annui per ciascun contribuente in spese di amministrazione, con una deviazione standard campionaria di 25 Euro mentre una simile indagine su un campione di 15 comuni governati dall’alleanza B trova una media di 158 Euro con deviazione standard campionaria di 30 Euro. a) Costruire un intervallo di confidenza per la differenza tra le spese medie delle due amministrazioni comunali al livello di confidenza 99%. b) Verificare l’ipotesi che l’alleanza B spende in media significativamente meno dell’alleanza A? N.B. si supponga che le deviazioni standard campionarie fornite siano quelle non distorte. 2. Nel 1976 venne condotto un esperimento negli Stati Uniti per valutare se aiutare gli ex carcerati durante i primi mesi dopo la scarcerazione poteva evitare la recidività. a) 592 ex carcerati (gruppo di trattamento) vennero aiutati con diversi contributi economici e il 48,3% di questi venne nuovamente arrestato dopo un anno dal rilascio. 154 ex carcerati (gruppo di controllo) non vennero supportati in alcun modo e il 49,4% di questi venne nuovamente arrestato dopo un anno dal rilascio. Il supporto economico ai detenuti rilasciati riduce la recidività? Trovare il livello di significatività osservato. b) Nel primo anno dopo la scarcerazione i soggetti assegnati al gruppo di trattamento lavorano in media per 16,8 settimane (con una standard deviation di 15,9 settimane), contro le 24,3 settimane del gruppo di controllo (con una standard deviation di 17,3 settimane). Un ex carcerato che viene sostenuto economicamente tenderà a lavorare di meno? Usare un livello di significatività del 1%. 2. [7] Il numero di clienti che si presentano ad uno sportello bancario in un giorno è descritto da una variabile casuale X con distribuzione di Poisson di parametro , cioè x , x0 e 0 f ( x; ) e x! Al fine di stimare , è stato rilevato per cinque giorni il numero di clienti che si sono presentati a questo sportello e si è osservato: 12, 10, 4, 10, 18. a) Determinate lo stimatore di massima verosimiglianza di . b) Calcolarne la stima in corrispondenza del campione osservato. c) Definire la proprietà di consistenza di uno stimatore. Lo stimatore trovato è anche consistente? 3. [4] Illustrare le principali proprietà della distribuzione normale e motivare la rilevanza della distribuzione normale nell’inferenza statistica. 4. [3] Presa una variabile casuale X di media e varianza 2, dimostrare che la variabile standardizzata Z ha media pari a zero e varianza pari uno. 1 5. [8] Una bibita viene venduta in due tipi di confezioni: una bottiglia grande e una piccola. La quantità di bevenda, in ml, contenuta in ciascuna bottiglia è distribuita normalmente come segue Media Varianza 2 Piccola 252 4 Grande 1012 25 a) Quattro bottiglie piccole sono scelte a caso. Trovare la probabilità che almeno una di esse abbia contenuto superiore alla media. b) Trovare la probabilità che il contenuto totale delle quattro bottiglie piccole sia maggiore di 1012 ml. c) Un bottiglia grande e quattro bottiglie piccole sono scelte a caso. Trovare la probabilità che il contenuto della bottiglia grande superi quello totale delle quattro bottiglie piccole. d) Un bottiglia grande e una bottiglia piccola sono scelte a caso. Trovare la probabilità che il contenuto della bottiglia grande sia maggiore di quattro volte quello della bottiglia piccola. 6. [4] Un’azienda rileva su un campione 15 famiglie il numero di volte che è stato acquistato il prodotto “saponetta” nell’arco di 3 anni 18 14 21 27 3 8 14 17 28 33 40 36 39 20 12 a) Ricavare il valore mediano, i quantili e disegnare il box-plot. b) Sulle stesse famiglie è stato rilevato anche il numero di biglietti dell’autobus acquistati nello stesso intervallo di tempo: 118 27 3 0 87 121 8 48 152 67 80 0 0 234 99 Si confronti la variabilità osservata nei due insiemi di dati mediante il calcolo del coefficiente di variazione. Commentare il risultato. 2