Prove d’esame di Statistica - corso base a.a. 2015-16 Esame del 12/1/2016 Esercizio 1 (punti 14) - Su un campione di 543 case, si rilevano il prezzo (in euro) e la dimensione (in m2). Prezzo / Dimensione (16-30] (30-50] (50-170] (25000-66000] 59 187 63 309 (66000-100000] 6 49 115 170 (100000-150000] 0 6 52 58 (150000-200000] 0 0 6 6 65 242 236 543 a) Calcolare la media aritmetica, la mediana, la varianza e il coefficiente di variazione della variabile Dimensione; b) Disegnare l'istogramma della variabile Dimensione; c) Calcolare un opportuno indice di associazione tra la dimensione e il prezzo delle case e commentare il risultato; d) Supponendo che il prezzo delle case si distribuisca normalmente, verificare se il prezzo medio delle case è significativamente inferiore al prezzo medio pre-crisi pari a 75000 euro (si usi un livello di significatività pari a 0.05). R: a) Media aritmetica 68,389 Classe mediana 30-50 mediana 47,025 Varianza 1358,3309 sqm 36,8555 CV 0,5369 b) Ordinate istogramma (ni/di) 4,642 12,1 1,96227 c) Chi-quadro 166,0519 forte grado di associazione d) Statistica test = - 6,3278 si rifiuta H0 Esercizio 2 (punti 6) - Alice e Irene confrontano cosa hanno trovato nelle rispettive calze della Befana. Alice ha trovato 10 caramelle, 5 cioccolatini e 3 pezzi di carbone zuccherato mentre Irene ha trovato 13 caramelle, 6 cioccolatini e 5 pezzi di carbone zuccherato. Qual è la probabilità che Alice estragga una caramella? Alice fa 10 estrazioni indipendenti dalla sua calza. Quale è la probabilità che Alice estragga 7 caramelle? • Alice estrae una caramella e la mangia. Quale è la probabilità che nell’estrazione successiva esca un cioccolatino? Prima che le due bambine tocchino le calze, il fratellino di Alice ruba le due calze. • Qual è la probabilità che il bambino estragga un pezzettino di carbone? • Avendo estratto un pezzettino di carbone, quale è la probabilità che lo abbia estratto dalla calza della sorellina? • • R: a) 10/18 = 0,55 b) v.c. binomiale, 7 successi in 10 prove 0,168 c) 5/17 = 0,294 d) 0,1905 e) teorema di Bayes 0,4445 Materiale ad esclusivo uso interno del corso. E’ autorizzata la riproduzione da supporto informatico, ad uso personale. E’ vietato qualsiasi utilizzo commerciale del presente materiale. Esercizio 3 (punti 6) - Di una variabile casuale X con distribuzione Normale si sa che il terzo quartile è pari a 5 e il primo decile è pari a -0.84. Calcolare la media e la varianza di X e calcolare le seguenti probabilità: a) P(X>3); b) P(X<-3); c) P(1<X<2). R: µ = 2,9876 σ2 = 8,9143 a) P(z>0,004) ≈ 0,5 b) P(z<-2,01) 0,0222 c) P(-0,67<z<-0,33) 0,1193 Esercizio 4 (punti 6) - Si rilevano il numero medio di incidenti stradali e il numero medio di multe nello stesso anno nelle 20 regioni italiane. Incidenti 3.6 Multe 4.2 22.7 21.5 12.9 10.6 7.1 4.2 8.8 9.35 14.2 10.4 10.6 5.5 15.7 11.3 1.5 9.2 8.8 7.7 7.7 9.7 10.5 8.1 19.0 14.5 14.6 10.5 9.0 7.6 10.8 5.5 13.7 14.7 8.4 7.1 7.2 19.0 15.9 15.7 Studiare mediante un opportuno modello statistico se il numero di incidenti è influenzato dal numero di multe. R: Y = - 0,5 X + 14,99 debole influenza Esame del 2/2/2016 Esercizio 1 (punti 10) – Da alcuni anni l’Opera San Francesco organizza a Milano “Il Natale in mensa” per i poveri. Questi i pasti serviti il giorno di Natale negli anni dal 2010 al 2014: Anno 2010 2011 2012 2013 2014 Pasti serviti a pranzo 935 1185 1276 1341 1430 Pasti serviti a cena 538 682 592 647 846 Interpolare linearmente in funzione del tempo il numero complessivo di pasti serviti, misurare la bontà di adattamento del modello e commentare il significato ‘sociale’ del coefficiente angolare della retta. Ipotizzando che il modello mantenga la sua validità nel tempo, stimare il numero di pasti che verranno serviti a Natale 2016. Misurare la correlazione tra il numero di pasti serviti a pranzo e quelli serviti a cena. R: Assumendo come origine dei tempi (t=0) il 2012: t Y 0 1894,4 media 2 66681,04 varianza correlazione p/c 345,4 covarianza 0,762966 1894,4 B0 172,7 B1 0,9458149 r 0,89456583 R2 commento "sociale": aumento delle situazioni di povertà 2016 t = 4 2585 Esercizio 2 (punti 3) – Un dado viene lanciato 5 volte, e tutte e 5 le volte esce la faccia “1”. Quale è la probabilità che il dado sia perfetto? E quale è la probabilità che in 5 lanci di un dado perfetto esca sempre la stessa faccia? Materiale ad esclusivo uso interno del corso. E’ autorizzata la riproduzione da supporto informatico, ad uso personale. E’ vietato qualsiasi utilizzo commerciale del presente materiale. R: cinque volte 1 cinque volte stessa faccia 0,000129 0,000772 Esercizio 3 (punti 16) – In un palazzo abitano 10 famiglie, i cui redditi annui (in migliaia di €) nel 2014 sono stati: 32 24 60 45 18 24 30 22 38 47 Calcolare media aritmetica, mediana, coefficiente di variazione. Disegnare la curva di concentrazione dei redditi e calcolare il rapporto di concentrazione. La famiglia che nel 2014 ha avuto un reddito di 47000 euro, nel 2005 aveva avuto un reddito di 40500 euro. Sapendo che il coefficiente di rivalutazione ISTAT per esprimere valori monetari del 2005 in euro 2014 è pari a 1,175, di quanto è variato il potere di acquisto reale di quella famiglia, in termini assoluti e in termini percentuali? Ipotizzando che quelle 10 famiglie rappresentino un campione casuale delle famiglie di un Comune italiano e che la distribuzione dei redditi sia normale, costruire gli intervalli di confidenza per la media e per la varianza (livello di significatività α = 0,05). Si vuole ripetere l’indagine, mirando ad ottenere un intervallo di confidenza per la media di ampiezza complessiva non superiore a 6000 euro (sempre al livello di significatività α = 0,05); quale dovrà essere la numerosità del nuovo campione? X 18 22 24 24 30 32 38 45 47 60 Fi 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 Pi 0,0529 0,1176 0,1882 0,2588 0,3471 0,4412 0,5529 0,6853 0,8235 1 media 34 mediana 30 e 32 CV 0,37226511 rivalutaz I=6 R conc. 47587,5 variaz ass variaz rel var corr 178 s 13,3416641 int conf media int conf varianza nuovo n diff 0,0471 0,0824 0,1118 0,1412 0,1529 0,1588 0,1471 0,1147 0,0765 0,229412 -587,5 -0,01235 24,45577 43,54423 84,21473 593,2454 76 Esercizio 4 (punti 3) – Un’area di 100 m2 è stata suddivisa in 10000 quadratini di 10 cm di lato ciascuno, e su di essa viene sparso un sacchetto che contiene 2000 semi. Quale è la probabilità che in un quadratino cadano almeno due semi? Materiale ad esclusivo uso interno del corso. E’ autorizzata la riproduzione da supporto informatico, ad uso personale. E’ vietato qualsiasi utilizzo commerciale del presente materiale. R: v.c. di Poisson P(0) = 0,818731 P(1) = 0,163746 prob(x>=2) 0,017523 Appello straordinario del 12/4/2016 Esercizio 1 (punti 5) – Su un collettivo di n = 20 osservazioni, si sono calcolate la media aritmetica, pari a 10, e la mediana, pari a 8. Sapendo che la somma dei quadrati degli scarti dalla mediana vale 800, calcolare la varianza della distribuzione. R: var = 36 Esercizio 2 (punti 2) - Dati due caratteri X e Y, se vale la relazione b y;x = bx;y, spiegare perché il valore assoluto di tali coefficienti non può essere superiore a 1. R: Il prodotto dei due coefficienti angolari è r 2, valore compreso tra 0 e 1; se sono uguali, sono anche uguali a r e quindi compresi tra -1 e +1. Esercizio 3 (punti 2) – Dato un campione casuale di n = 100 osservazioni, si è sottoposta a verifica l’ipotesi H0: µ = 30, contro l’alternativa H1: µ ≠ 30 e si è calcolato un p-value pari a 0,3147. A quale conclusione giungereste? R: Il p-value fornito è elevato, superiore a qualsiasi usuale soglia; quindi, si accetta H0. Esercizio 4 (punti 4) – E’ data una tabella a doppia entrata di dimensione 3x3. Spiegare perché su una siffatta tabella il valore massimo del χ 2 non può essere pari a 81. Ipotizzando che su quella tabella sia stato calcolato un valore effettivo del χ 2 pari a 6,72, sottoporre a verifica l’ipotesi di indipendenza tra i due caratteri, al livello α = 0,05. R: max χ2 = [min(k;c) – 1] n.. , quindi 2 n.. , che è necessariamente pari. 6,72 < χ42 = 9,4877 Si accetta l’ipotesi di indipendenza. Esercizio 5 (punti 4) – Un’azienda di elettrodomestici intende testare, su un campione casuale semplice di frequentatori di un punto vendita di una grande catena che si occupa di vendita di elettrodomestici, la frazione di quanti visitano il reparto “frigoriferi”. Per ottenere un intervallo di fiducia di tale frazione di ampiezza complessiva pari a 0,04 (al livello α = 0,05), quale dovrà essere il numero di frequentatori da intervistare, sotto l’ipotesi di massima prudenza? E ipotizzando invece che l’80% dei visitatori si rechi in quel reparto? R: a) 2401 b) 1537 Esercizio 6 (punti 7) – E’ data la seguente distribuzione di un campione di 200 cartoni che contengono ciascuno 1000 pezzi di un prodotto secondo il numero pezzi difettosi presenti in ciascun cartone: N. pezzi difettosi 0 1-3 4-7 8 - 14 15 o più N. cartoni 51 43 52 49 5 Si sa inoltre che il numero medio di pezzi difettosi per i 5 cartoni con il maggior numero di pezzi difettosi è pari a 18. Determinare la media aritmetica, la mediana, il coefficiente di variazione e misurare l’asimmetria della distribuzione. Determinare gli estremi dell’intervallo di confidenza per la media, al livello α = 0,05. Materiale ad esclusivo uso interno del corso. E’ autorizzata la riproduzione da supporto informatico, ad uso personale. E’ vietato qualsiasi utilizzo commerciale del presente materiale. R: x 0 2 5,5 11 18 tot media mediana varianza CV asimmetria sqm corr estremi int. n 51 43 52 49 5 200 M1-Me xn x^2 n 0 0 86 172 286 1573 539 5929 90 1620 1001 9294 5,005 4 21,41998 0,92471 1,005 positiva 4,639786 4,3620 5,6480 Esercizio 7 (punti 8) – Negli ultimi giorni, un titolo azionario ha fatto registrare le seguenti quotazioni di chiusura: Data 21/3 24/3 30/3 1/4 6/4 Quotazione 3,51 3,43 3,52 3,59 3,65 Ricordando che marzo ha 31 giorni, interpolare linearmente l’andamento delle quotazioni, misurare la bontà di adattamento del modello e, sulla base del modello stimato, prevedere la quotazione di chiusura di quel titolo al 12 aprile, argomentando brevemente sui limiti di tale previsione. R: Assumendo come origine (t=0) il 20 marzo t Y 1 3,51 b0 3,4427 4 3,43 b1 0,0111 10 3,52 r 0,8431 12 3,59 r2 0,7108 17 3,65 prev t=23 3,6970 I corsi azionari sono troppo volatili per essere ragionevolmente prevedibili per estrapolazione. Esame del 07/06/2016 Esercizio 1 (punti 10) - Su un collettivo di n=100 soggetti è stato rilevato il numero di volte in cui si recano al cinema nell’arco della settimana (X) e il numero di volte in cui si recano a cena al ristorante (Y). Nella tabella seguente si riportano le frequenze relative della distribuzione congiunta (X,Y): X\Y 0 1 2 0 0 0.1 0.5 1 0.2 0.2 0 a) Calcolare la media aritmetica, la varianza e il coefficiente di variazione del numero di volte in cui i soggetti si recano a cena al ristorante; b) Valutare l’associazione tra i due caratteri; c) A ciascun soggetto, viene chiesto quanto spende in media per andare a cena al ristorante. La spesa media complessiva è risultata pari a 45 euro con una deviazione standard pari a 12. Si verifichi se la spesa media è significativamente diversa da 30 euro (α = 0,05). X \ Y 0 1 2 Materiale ad esclusivo uso interno del corso. E’ autorizzata la riproduzione da supporto informatico, ad uso personale. E’ vietato qualsiasi utilizzo commerciale del presente materiale. 0 1 media Y varianza Y CV 0 20 10 20 50 0 12 8 18 12 30 20 -12 12 72,222 -8 8 20 -20 12,5 rifiuto H0 1,3 0,61 60,08 Frequenze teoriche contingenze chi quadro test Esercizio 2 (punti 6) - Il numero medio di chiamate all’ora ad un centralino ha distribuzione di Poisson con media pari a 180. a) Calcolare la probabilità che in un determinato minuto non arrivi nessuna chiamata; b) Supponendo che il centralino sia in grado di soddisfare non più di 3 chiamate al minuto, calcolare la probabilità di trovarlo occupato. P(X=0) P(X>3) 0,049787 0,352768 0,149361 0,224042 0,224042 P(X=1) P(X=2) P(X=3) Esercizio 3 (punti 6) - Il 46% degli elettori di un Comune si ritiene politicamente di centro, il 30% di sinistra e il 24% di destra. In un’elezione recente sono andati a votare il 35% degli elettori di centro, il 62% degli elettori di sinistra e il 58% di quelli di destra. Un elettore è scelto a caso. a) Sapendo che l’elettore ha votato alle scorse elezioni, quale è la probabilità che si tratti di un elettore di centro? b) Quale è la percentuale di elettori che ha partecipato alla scorsa elezione? Centro votanti 0,3311 0,4862 Esercizio 4 (punti 5) - Dati due caratteri X e Y si vuole valutare, mediante modello di regressione lineare, l’effetto di X su Y. Sapendo che la covarianza è pari a 5, la varianza di y è pari a 5 e il coefficiente di correlazione lineare è pari 0.7, calcolare il coefficiente angolare della retta e l’indice di determinazione. Interpretare i parametri della retta e il significato dell’indice di determinazione. B1 0,49 2 r 0,49 La retta è inclinata positivamente, quindi vi è una relazione diretta tra le due variabili; il modello spiega circa il 50% della variabilità. Esercizio 5 (punti 6) - Si consideri una variabile aleatoria X con distribuzione Normale con media pari a 4 e coefficiente di variazione pari a 0.5. Si calcoli a) P (X>3) b) P (X<0) c) il quantile di X a livello 0.05. Sia Y=2*X - 6. Che distribuzione di probabilità ha la variabile Y? Si calcolino E[Y] e Var[Y]. Materiale ad esclusivo uso interno del corso. E’ autorizzata la riproduzione da supporto informatico, ad uso personale. E’ vietato qualsiasi utilizzo commerciale del presente materiale. N (4;4) P(z>-0,5) P(z<-2) quantile Y normale (2;16) 0,69146 0,02275 0,71 Esame del 4/7/2016 Esercizio 1 (punti 10) - Sia data la seguente distribuzione di frequenze cumulate relativa a un campione di 80 redditieri: Reddito annuo (.000 euro) Ni fino 10 5 fino 20 25 fino 50 67 fino 100 80 - Calcolare la media aritmetica, la mediana e il coefficiente di variazione. - Disegnare la curva di concentrazione - Costruire gli intervalli di confidenza (al livello α = 0,05) per la media e per la varianza. x centr 5 15 35 75 n xn Fi Pi 5 25 0,0625 0,009025 20 300 0,3125 0,117329 42 1470 0,8375 0,648014 13 975 1 1 80 2770 media 34,625 mediana 30,71429 varianza 416,1094 corretta 421,3766 sqm 20,5275 cv 0,589134 int conf media 30,12672 39,12328 (usando l'approssimazione con la normale) int conf var 312,1937 582,4477 Esercizio 2 (punti 2) - Trasmissione televisiva “Il malloppo” del 19/8/2005: il malloppo è contenuto in una tra sei casseforti e i concorrenti possono, pagando un certo prezzo, eliminare una cassaforte vuota e così – secondo il conduttore – “ridurre a un quinto” la probabilità di individuare la cassaforte con il malloppo. Quale errore è contenuto nell’affermazione del conduttore? R: Non "si riduce" ma "aumenta" Esercizio 3 (punti 6) - Relativamente a 10 imprese commerciali si dispone dei seguenti dati, relativi al risultato (utile o perdita) dell’esercizio 2014 e al fatturato, sempre nel 2014 (milioni di euro): Utile 0,1 0,16 0,28 -0,5 -0,12 0,22 0,13 0,11 0,3 0,2 Fatt. 2,8 3,0 5,3 7,6 2,7 4,4 2,9 2,1 4,4 8,8 Misurare la correlazione lineare tra i due caratteri e determinare i parametri della retta di regressione dell’utile in funzione del fatturato. 0,194314 B0 -0,02416 B1 -0,22824 r Materiale ad esclusivo uso interno del corso. E’ autorizzata la riproduzione da supporto informatico, ad uso personale. E’ vietato qualsiasi utilizzo commerciale del presente materiale. Esercizio 4 (punti 5) - Su un campione di 12 imprese è risultato che il fatturato annuo medio è pari a 2,5 milioni di euro. Supponendo che la variabile considerata si distribuisca come una normale con varianza pari a 1,21, determinare l’intervallo di confidenza per la media, al livello di significatività del 10%. Nel caso si volesse ripetere l’indagine, quale dovrà essere la numerosità del campione, ad un livello di attendibilità del 95%, con ampiezza pari a 500 mila euro? int conf nuovo n 1,977642 3,022358 75 Esercizio 5 (punti 6) - Tre signore vanno a fare la spesa al supermercato: al momento di passare alla cassa, nel carrello della prima vi sono 24 articoli, tra i quali 6 confezioni di biscotti, in quello della seconda 6 articoli, tra i quali 3 confezioni di biscotti e in quello della terza 20 articoli, tra i quali 6 confezioni di biscotti. Si estrae a caso un carrello, con probabilità di estrazione proporzionale al numero di articoli contenuti in ciascuno di essi e, tra gli articoli presenti in quel carrello, se ne sorteggia uno. Sapendo che l’articolo sorteggiato è una confezioni di biscotti, determinare la probabilità che il carrello sorteggiato sia quello della prima signora. Pa 0,48 biscotti 0,25 prod 0,12 probabilità carrello A Pb 0,12 0,50 0,06 Pc tot 0,40 0,30 0,30 0,12 0,40 Esercizio 6 (punti 1 per ciascuna risposta esatta, -0,5 per ciascuna risposta errata) - Per ciascuno dei seguenti quesiti individuare la risposta esatta (di seguito evidenziata in grassetto): 1) La variabile “tempo effettivamente trascorso tra l’inizio e la fine del primo tempo di una partita di calcio” è una variabile: A) continua B) discreta C) dicotomica 2) La media geometrica di 10 osservazioni, non tutte uguali fra loro, vale 5; considerata una ulteriore osservazione x11 > 5, si confrontino la media aritmetica calcolata sulle prime 10 osservazioni (Ma) e quella calcolata sulle 11 osservazioni (Mb). Risulterà: A) Ma > Mb B) Ma < Mb C) dipende dai valori di Ma e di x11 3) In un decennio il prezzo di un bene è aumentato del 50%. Il potere d’acquisto della moneta, in termini di quel bene, risulta: A) dimezzato B) ridotto di un terzo C) ridotto a un terzo 4) Se per tre eventi E1, E2, E3 (per ciascuno dei quali P(Ei) > 0) vale la relazione: P(E1 U E2 U E3) = P(E1)+P(E2)+P(E3), allora gli eventi: A) sono dipendenti B) sono indipendenti C) sono necessariamente esaustivi Esame del 6/9/2016 Esercizio 1 (punti 4) – Secondo un recente studio coordinato a livello mondiale dall’Imperial College, in Italia la statura media dei giovani diciottenni in un secolo è passata dai 164,7 cm del 1914 ai 177,8 cm del 2014. Calcolare l’incremento medio annuo composto della statura. Ipotizzando che la statura media continui a crescere allo stesso ritmo nei prossimi anni, quanto saranno mediamente alti a 18 anni i bambini italiani che sono nati o nasceranno durante il 2016? incremento complessivo 13,1 cm Materiale ad esclusivo uso interno del corso. E’ autorizzata la riproduzione da supporto informatico, ad uso personale. E’ vietato qualsiasi utilizzo commerciale del presente materiale. incremento medio annuo (media geometrica) previsione al 2034 0,000766 180,54 Esercizio 2 (punti 8) – Il Corriere della Sera del 26 luglio scorso ha lanciato un sondaggio on line per raccogliere l’opinione dei lettori circa questa affermazione di V. Sgarbi: “Gli uomini che portano il marsupio sono un oltraggio al decoro urbano”. Su 1255 rispondenti, il 54,2% si è dichiarato d’accordo, il restante 45,8% contrario. a) Misurare l’eterogeneità della distribuzione delle risposte. b) Ipotizzando che i rispondenti rappresentino un campione casuale di lettori, si vuole verificare l’ipotesi che, nell’universo, favorevoli e contrari si equivalgano, contro quella che invece vi sia una maggioranza che condivide l’affermazione di Sgarbi. Si calcoli il p-value e si giunga ad una conclusione, sulla base del risultato ottenuto. c) Il Corriere della Sera, in una nota, correttamente precisa però che sondaggi on line di questo tipo “non hanno valore statistico”. Spiegare perché. a) eterogeneità ass rel 0,4965 0,9929 b) H0: π = 0,5 H1: π > 0,5 test 2,98 p-value 0,00144 ai livelli α usuali, si respinge H0 c) Non ha valore statistico perché non si tratta di un campione (probabilistico o ragionato), ma di un insieme di persone autoselezionate che, per i motivi più vari, hanno deciso di votare. Potrebbe essere profondamente distorto. Esercizio 3 (punti 3) – In una distribuzione statistica, il 50° percentile vale 0 e il 75° percentile vale 1. Si consideri un valore pari a 3; relativamente a tale valore si può affermare che: • potrebbe non appartenere alla distribuzione • potrebbe corrispondere al 90° percentile • le affermazioni a) e b) sono entrambe plausibili • almeno una tra le affermazioni a) e b) è certamente falsa. Motivare la risposta fornita. [R: risposta esatta c. Le informazioni fornite ci dicono che il 90° percentile non può essere inferiore a 1, quindi potrebbe essere 3. Non conosciamo il valore più grande osservato, che potrebbe anche essere inferiore a 3, quindi in questo caso 3 non apparterrebbe alla distribuzione]. Esercizio 4 (punti 3) - Sia X una variabile aleatoria con distribuzione Normale di media pari a 4 e coefficiente di variazione pari a 0,4. Calcolare: a) P(X>1) b) P(X< -1) c) Il quantile a livello 0,25. var (X) 2,56 p(X>1) = P(z>-1,875) = 0,9695 p(X<-1)=P(z<-3,125) = 0,00089 X0,25 = 2,92 Esercizio 5 (punti 8) - Sia X una variabile che indica se un soggetto di nazionalità britannica è favorevole o meno all'uscita del proprio paese dall'Unione Europea. La variabile X è definita come segue: P(X=”no”) = k P(X=”si”) = 0.3 a) Per quale valore di k la precedente distribuzione definisce una distribuzione di probabilità? b) Fissato tale valore di k, determinare il valore atteso della variabile aleatoria X e la sua varianza; c) Sia Y una variabile aleatoria definita come somma di 10000 variabili aleatorie X. Quale è la distribuzione di probabilità di Y? Si determinino il valore atteso di Y e la sua varianza. Materiale ad esclusivo uso interno del corso. E’ autorizzata la riproduzione da supporto informatico, ad uso personale. E’ vietato qualsiasi utilizzo commerciale del presente materiale. a) k = 0,7 b) posto "no"=0 e "sì"=1 media 0,3 varianza 0,21 c) binomiale, approssimabile con la normale media 3000 varianza 2100 Esercizio 6 (punti 7) - Il peso (in grammi) di un lotto di confezioni di pasta, del peso nominale di 250 grammi, è la seguente: Peso 245 245 247 238 245 250 249 245 246 242 247 246 242 244 246 a) Si calcoli il peso medio del lotto e la deviazione standard; b) Si disegni il diagramma a scatola e baffi; c) Si supponga di valutare il peso medio di 100 confezioni di pasta estratte a caso, sulle quali si sono rilevati un peso medio pari a 247 e una varianza pari a 7. E' possibile denunciare il produttore per frode? a) media 245,133 SD 2,8253 b) per box plot 238 244 245 247 250 min q1 mediana q3 max c) H0: π = 250 H1: π < 250 test -11,34 A qualunque usuale livello di sgnificatività, SI, è possibile denunciare il produttore. Appello straordinario del 4/11/2016 Esercizio 1 (punti 10 – N.B. Qualora l’esercizio venga impostato su una base dati errata NON verrà valutato) – Nello scorso mese di agosto in Sapienza è uscito un bando per 48 posti da ricercatore a tempo determinato, così ripartiti per area CUN: Area CUN* 01 02 03 04 05 06 07 08 09 10 11 12 13 14 N. posti 5 3 2 1 3 13 0 1 5 4 5 1 2 3 * le aree CUN sono designate da un codice (numerico), che rappresenta però solo una semplice etichetta. Calcolare media aritmetica, mediana, varianza e un indice di asimmetria della distribuzione dei posti assegnati per area. Disegnare la curva di concentrazione e calcolare il rapporto di concentrazione. X 0 1 1 1 2 2 3 3 3 4 Fi 0,0714 0,1429 0,2143 0,2857 0,3571 0,4286 0,5000 0,5714 0,6429 0,7143 Qi 0 0,0208 0,0417 0,0625 0,1042 0,1458 0,2083 0,2708 0,3333 0,4167 Fi-Qi 0,0714 0,1220 0,1726 0,2232 0,2530 0,2827 0,2917 0,3006 0,3095 0,2976 Materiale ad esclusivo uso interno del corso. E’ autorizzata la riproduzione da supporto informatico, ad uso personale. E’ vietato qualsiasi utilizzo commerciale del presente materiale. 5 5 5 13 0,7857 0,8571 0,9286 1 6,5000 0,5208 0,6250 0,7292 1 0,2649 0,2321 0,1994 3,0208 media 3,4286 mediana 3 varianza 9,5306 asimmetria positiva M1- Me = 0,4286 R 0,4647 Esercizio 2 (punti 6) – Secondo i dati della Conferenza Episcopale Italiana, nell’ultimo quinquennio la percentuale di alunni delle scuole medie superiori statali italiane che hanno deciso di non avvalersi dell’insegnamento della religione cattolica è così variata: Anno scolastico % 2014/15 18,4 2013/14 18,0 2012/13 17,9 2011/12 17,0 2010/11 16,2 Interpolare linearmente tale andamento in funzione del tempo e, utilizzando i risultati ottenuti, stimare la percentuale di studenti che non si avvalgono dell’insegnamento della religione cattolica nell’a.s. in corso (2016-17). Nell’a.s. 2000-01 la percentuale di studenti non avvalentisi era dell’11,9%. Valutare se il trend del fenomeno negli ultimi anni (quelli dei dati riportati in tabella) ha subito una accelerazione rispetto al decennio precedente. t Y -2 16,2 -1 17 0 17,9 1 18 2 18,4 increm decennio prec. increm ultimi anni sostanzialmente stabile B0 B1 17,50 0,54 t=4 19,66 3,13 geom 3,23 geom 3,61 aritm 3,40 aritm Esercizio 3 (punti 6) – Un quiz consta di 5 domande con tre possibili risposte. Una persona risponde a caso a tutte e 5. Determinare la probabilità che azzecchi: 1) 2 risposte esatte; 2) 3 risposte esatte; 3) il numero medio di risposte esatte. p=0,333 Pr(X=2) Pr(X=3) n.medio 0,3292 0,1646 1,6667 Esercizio 4 (punti 6) – Sia X una variabile aleatoria con distribuzione normale di media pari a 4 e deviazione standard pari a 2. Si determini: 1) Pr(X>5) 2) Pr(4.5<X<5.5) 3) il quantile a livello 0,25. Pr(X>5) = Pr(z>0,5) = Pr(4,5<X<5,5) = Pr(0,25<z<0,75) = z0,25 = -0,675 da cui x0,25 = 0,3085 0,1747 2,65 Esercizio 5 (punti 6) - Una compagnia di assicurazioni vuole valutare l’entita media delle richieste di risarcimento danni per incidenti automobilistici. Un’indagine svolta su di un campione di 25 Materiale ad esclusivo uso interno del corso. E’ autorizzata la riproduzione da supporto informatico, ad uso personale. E’ vietato qualsiasi utilizzo commerciale del presente materiale. richieste ha dato i seguenti risultati (con X si indica la variabile “richiesta di risarcimento in migliaia di euro”): Σxi = 112,12 e Σxi2 = 629,89. 1) Stimare l’entita media delle richieste e la varianza delle richieste di risarcimento; 2) Ipotizzando che X abbia distribuzione gaussiana, calcolare l’intervallo di confidenza al 95% per la richiesta media di risarcimento e saggiare, ad un livello di significatività α = 0,05, l’ipotesi H0: µ = 3 contro l’alternativa H1: µ > 3. media 4,485 var 5,0822 var corr 5,2939 estremi int conf media (t24) test (unilaterale) € 3,2266 Si respinge H0 3,535 5,435 t24 = 1,7109 Materiale ad esclusivo uso interno del corso. E’ autorizzata la riproduzione da supporto informatico, ad uso personale. E’ vietato qualsiasi utilizzo commerciale del presente materiale.