Prova scritta di Statistica – A – 27 Febbraio 2015 1. Sia X una v.a. binomiale di parametri n=6 e p=0.5. (a) Si completi la seguente tabella di valori della funzione massa di probabilità: X 0 1 2 3 4 5 6 P(X=x) 0.0156 0.0938 0.2344 0.3125 ? ? ? (b) Calcolare media, moda e mediana. (c) E’ possibile determinare gli indici di cui al punto (b) senza effettuare calcoli? (d) Si calcoli P(X>1). 2. La Tabella mostra il reddito annuale (in migliaia di euro) iniziale di 42 ingegneri neolaureati. (a) (b) (c) (d) Reddito 27 28 29 30 31 32 34 36 37 40 Frequenza 4 1 3 ? 8 ? ? 2 3 1 Completare la tabella, sapendo che le modalità 30 e 34 hanno la stessa frequenza assoluta, e che la frequenza della modalità 32 è il doppio della frequenza della modalità 30. Determinare il reddito mediano. Determinare la percentuale di ingegneri che percepiscono un reddito al di sotto di 36.000 euro. Al di sotto di quale reddito si trova il 75% degli ingegneri? 3. L’ente che gestisce un tratto di autostrada conserva sale a sufficienza per eliminare un totale di 80 pollici di neve. Si assuma che la quantità di neve che cade al giorno sia una variabile aleatoria di media 1.5 pollici e deviazione standard 0.3 pollici. (a) Determinare la probabilità (approssimativa) che il sale a disposizione basti per 50 giorni. (b) Quali sono le ipotesi assunte per rispondere al quesito (a)? (c) (solo per 10CFU) Quanto deve valere la quantità di neve media che cade in un giorno se si vuole che la probabilità al punto (a) sia superiore al 90%? 4. Uno scanner ottico, munito di programma in grado di convertire in formato testo le pagine di un libro, ha una probabilità p (costante) che venga commesso un errore (di lettura o di conversione) in corrispondenza di ciascun carattere tipografico. Errori su caratteri distinti si verificano indipendentemente l’uno dall’altro. (a) Per stimare p viene usato il primo canto della Divina Commedia. Tale canto è formato da 5114 caratteri. Confrontando il testo originale con quello fornito dal convertitore, si trovano 7 errori. Quanto vale una stima di p? (b) Determinare un intervallo di confidenza al 92% per p. (c) (solo per 10CFU) Sempre sullo stesso canto della Divina Commedia, ma usando lo scanner ottico di un’altra azienda, vengono trovati 12 errori. E’ possibile asserire che la probabilità p è la medesima per i due scanner al livello di significatività del 5% (solo per 10 CFU)? 5. Due eventi A e B sono indipendenti. Per ciascuna affermazione stabilire se è vera sempre oppure può essere vera sotto opportune ipotesi (nel qual caso dire quali). Motivare la risposta. A. Se si verifica uno dei due eventi, l’altro non può verificarsi. B. La probabilità che si verifichino entrambi è 0.5. C. La probabilità che si verifichino entrambi è 0. D. La probabilità che si verifichi un evento non modifica la probabilità che si verifichi l’altro. E. La loro intersezione è l’insieme vuoto. Prova scritta di Statistica – B – 27 Febbraio 2015 1. Si osserva una distribuzione di frequenza. Per ciascuna affermazione stabilire se è falsa, se è vera, oppure può essere vera sotto opportune ipotesi (nel qual caso dire quali). Motivare la risposta. A. Le classi sono mutuamente esclusive. B. Le classi hanno la stessa ampiezza. C. Almeno 5 osservazioni, devono appartenere ad ogni classe. D. Le classi sono di tipo nominale. E. Non si usano distribuzioni di frequenza aventi una sola classe. 2. Una popolazione formata da operai maschi, presenta dei pesi corporei (in libbre) di media 167. (a) Se si seleziona un campione di 20 elementi, quanto vale la probabilità che la media campionaria dei loro pesi sia compresa tra 163 e 171, se la deviazione standard campionaria è risultata pari a 13.47? (b) Quali ipotesi sono necessarie sulla popolazione per rispondere al quesito a)? (c) Cosa cambia nella risposta al quesito a) se la deviazione standard pari a 13.47 è teorica? 3. La seguente tabella delle frequenze mostra la classificazione di 58 discariche di uno Stato secondo la concentrazione di tre elementi chimici pericolosi: arsenico, bario e mercurio in esse rilevata. Bario Alta Bassa Mercurio Mercurio Alta Bassa Alta Bassa Alta 1 3 5 9 Arsenico Bassa 4 8 10 18 Se si sceglie una discarica a caso, trovare la probabilità che abbia a) un’alta concentrazione di mercurio; b) un’alta concentrazione di mercurio e alta concentrazione di Bario dato che ha un’alta concentrazione di arsenico; c) un’alta concentrazione di bario dato che vi è una bassa concentrazione di arsenico e mercurio; d) un’alta concentrazione di due elementi qualsiasi e bassa concentrazione del terzo. 4. Se la densità di probabilità di una variabile casuale è data da ∈ 0,1 = 0 a) determinare il valore del parametro k; b) calcolare la funzione di ripartizione; c) calcolare la media. 5. Da un controllo effettuato dall’ufficio personale di una certa azienda, è risultato che un campione di 60 lavoratori ha impiegato in media 33.8 minuti per raggiungere l’azienda, con una deviazione standard di 6.1 minuti. Determinare l’intervallo di confidenza al livello 1% per il tempo medio di percorrenza del tragitto casa-lavoro. a) Cosa accade all’intervallo di confidenza se il campione ha taglia inferiore a 60? b) In una pregressa indagine, lo stesso ufficio aveva trovato che i lavoratori impiegavano in media 32.6 minuti per andare al lavoro. In base al campione di cui al punto a), è possibile rifiutare l’ipotesi nulla = 32.6 contro l’ipotesi alternativa > 32.6 al livello 1%? (solo per 10 CFU)