Prove d’esame di Statistica - corso base a.a. 2016-17 Esame del 10/1/2017 Esercizio 1 (punti 4) – Relativamente ai voti riportati da 10 studenti nell’esame X, si dispone delle seguenti informazioni: voto medio aritmetico 23.4; voto mediano 22; somma dei quadrati degli scarti dalla mediana 190. Calcolare il coefficiente di variazione e misurare l’asimmetria della distribuzione. 190= (somma scarti media)^2 + 10*1,4^2 170,4 somma scarti media 17,04 var 4,1280 sqm 0,1764 CV 1,4 asimmetria positiva Esercizio 2 (punti 3) - Tra le tipologie di soggiorno scelte dagli italiani per trascorrere le proprie vacanze estive nel 2016 in Italia, al primo posto ci sono gli alberghi, scelti dal 26,7%, seguiti, nell’ordine, dalla casa di parenti o amici (22,4%), dalla casa di proprietà (13,5%), dai villaggi turistici (12,1%), dagli appartamenti in affitto (11,3%), dai residence (8,7%) e dai campeggi (5,3%). Misurare l’eterogeneità della distribuzione delle scelte. eterogeneità ass eterogeneità rel 0,8225 0,9596 Esercizio 3 (punti 6) - Da un lotto di 20 macchine, ne vengono scelte 2 in modo casuale. Sapendo che 5 delle 20 macchine sono difettose, calcolare: • la probabilità che la prima macchina scelta sia difettosa; • la probabilità che la seconda macchina scelta sia difettosa sapendo che la prima non lo è; • calcolare il numero medio di macchine difettose. prima dffettosa seconda dffettosa n. medio prob prob 0,25 0,25 0,2632 se senza reimmissione 0,5 Esercizio 4 (punti 6) - Di una variabile casuale X con distribuzione Normale si sa che il primo quartile è pari a 1.976 e il settimo decile è pari a 5.573. Calcolare la media e la varianza di X e calcolare le seguenti probabilità: a) P(X>3); b) P(X<2); c) P(1<X<4). sistema media σ a) prob b) prb c) prob -0,675 = (1,976 - µ) / σ 0,524 = (5,573 - µ) / σ 4 3 varianza 0,6293 0,2514 0,3413 9 Esercizio 5 (punti 6) - In una recente ispezione in una azienda, è stato misurato il rumore (in decibel) in 74 sale. La media delle misure ottenute è stata 61.3 e lo scarto quadratico medio campionario 7.8. Calcolare un intervallo di confidenza al 90% per la media dei decibel a cui sono esposti i lavoratori dell'azienda. Materiale ad esclusivo uso interno del corso. E’ autorizzata la riproduzione da supporto informatico, ad uso personale. E’ vietato qualsiasi utilizzo commerciale del presente materiale. Fissato un errore del primo tipo pari a 0.05, verificare se il livello di rumore medio è significativamente superiore a 82. estremi intervallo H0: µ ≤ 82 test H1: µ > 82 59,81 62,79 (appross.normale) -22,83 non è superiore a 82 Esercizio 6 (punti 8) – Per n = 10 famiglie, si dispone dei seguenti dati sul reddito medio mensile nel 2015 (X, in migliaia di euro) e sulla spesa media mensile per uno specifico bene (Y, in euro): X 3.2 1.9 2.4 5.7 3.8 1.6 2.5 2.9 3.6 3.4 Y 43 40 42 68 50 30 34 40 38 35 Determinare i parametri della retta di regressione di Y su X e misurare la correlazione lineare. Stimare il livello di spesa per il bene Y previsto per una famiglia con reddito medio mensile di 4000 euro. Sapendo che il coefficiente ISTAT per tradurre valori monetati del 2005 in valori del 2015 è pari a 1.174 e ipotizzando che il potere d’acquisto della famiglia a reddito più elevato sia rimasto invariato nel decennio, determinare quale avrebbe dovuto essere il reddito mensile in euro 2005 di quella famiglia. Mx 3,1 MY 42 Var X 1,218 Var Y 102,2 Cov (X;Y) 9,48 stima Y per X = 4 valore equivalente 2005 B0 B1 r 17,8719 7,7833 0,8497 49,00 4,855 Esame del 2/2/2017 Esercizio 1 (punti 5) – Data la seguente distribuzione di frequenze cumulate relative costruita su 1000 individui secondo il numero di giorni di vacanza trascorsi al mare lo scorso anno 2016: N. giorni 0 fino a 3 fino a 7 fino a 15 fino a 30 Freq. cum. rel. 0,13 0,42 0,82 0,94 0,992 e sapendo che il numero massimo di giorni di vacanza al mare trascorsi da una persona è stato 40, ricostruire la distribuzione delle frequenze assolute e calcolare media aritmetica, mediana e varianza della distribuzione. X n X*n 0 130 0 M1 5,64 1-3 290 580 Me 4 4-7 400 2200 Var 34,91 8 - 15 120 1380 16 - 30 52 1196 31 - 40 8 284 Tot 1000 5640 Esercizio 2 (punti 6) - I risultati di una indagine campionaria sono stati organizzati in una tabella a doppia entrata, sulla quale si è calcolato un valore del χ2 con 14 gradi di libertà pari a 162,82. a) Valutare la significatività del risultato b) Individuare le dimensioni (n. righe e n. colonne) della tabella c) Individuare il numero di casi classificati nella tabella. Materiale ad esclusivo uso interno del corso. E’ autorizzata la riproduzione da supporto informatico, ad uso personale. E’ vietato qualsiasi utilizzo commerciale del presente materiale. N.B. – Non necessariamente le informazioni fornite consentono di rispondere alle domande poste; laddove si ritenga che le informazioni non permettano di dare risposta, motivare il perché. significativo (per α = 0,0005 si ha 38,1085) a b 3x8 c (o viceversa) non si può rispondere (il valore di chi-quadro non è legato a n) Esercizio 3 (punti 6) - Su un campione di 61 lavoratori di età 36-40 anni si è calcolato un numero medio di anni di esperienza lavorativa pari a 12,21, con una deviazione standard corretta pari a 5,63. Costruire, al livello α = 0,05, gli intervalli di confidenza per la media e per la varianza. Sapendo che la distribuzione del numero di anni di esperienza lavorativa presenta una debole asimmetria positiva, individuare quale di questi può rappresentare il valore della mediana della distribuzione, motivando la risposta fornita: 8 12 16. estremi int.conf. media con la t60 10,7681 13,6519 con la N 10,7971 13,6229 estremi int.conf. varianza 22,8315 possibile mediana 12 (se 8, forte asimmetria positiva, se 16 asimmetria negativa) 46,9796 Esercizio 4 (punti 8) - Il prezzo del bene X ha avuto il seguente andamento negli ultimi 7 anni: Anno Prezzo (€) 2010 2,01 2011 2,05 2012 2,13 2013 2,19 2014 2,15 2015 2,20 2016 2,25 Interpolare l’andamento del prezzo in funzione del tempo e misurare la bontà di adattamento del modello. Costruire quindi le serie dei numeri indici del prezzo, a base mobile e a base fissa 2014 = 100. t p N.I mob NI fix -3 2,01 === 93,49 -2 2,05 101,99 95,35 -1 2,13 103,90 99,07 0 2,19 102,82 101,86 1 2,15 98,17 100,00 2 2,20 102,33 102,33 3 2,25 102,27 104,65 0 4 2,14 media 0,0062 var 0,1486 cov 2,14 b0 N.B. assumendo una diversa origine dei tempi sarebbe stato diverso 0,0371 b1 0,94343 r 0,8901 R2 Esercizio 5 (punti 2) - Per due stimatori T1 e T2 del parametro θ, entrambi corretti, si conoscono le varianze delle rispettive distribuzioni campionarie: Var (T1) = 3,24 Var(T2) = 2,87. Quale dei due stimatori è preferibile utilizzare e perché? Meglio T2, perché è più efficiente (varianza minore) Materiale ad esclusivo uso interno del corso. E’ autorizzata la riproduzione da supporto informatico, ad uso personale. E’ vietato qualsiasi utilizzo commerciale del presente materiale. Esercizio 6 (punti 6) - Ad un tizio viene proposto di scommettere sul numero di successi ottenuti in 10 prove, consistenti nel lancio di una moneta truccata. Definito come successo l’uscita della faccia “testa” (T), al tizio conviene giocare con una moneta per quale p(T) = 0,42 scommettendo che si otterranno esattamente 3 successi, oppure con una moneta per la quale p(T) = 0,55 scommettendo che si otterranno almeno 8 successi? p(T) = 0,42 3 successi 0,1963 P(T) = 0,55 8 successi 0,0763 9 successi 0,0207 10 successi 0,0025 conviene 0,0996 Materiale ad esclusivo uso interno del corso. E’ autorizzata la riproduzione da supporto informatico, ad uso personale. E’ vietato qualsiasi utilizzo commerciale del presente materiale.