STATISTICA DESCRITTIVA (parte A) - Prova scritta del 18 gennaio 2010 ESERCIZIO 1. Un istituto per ricerche statistiche e sondaggi ha chiesto a 50 studenti universitari (22 F e 28 M) quante volte la settimana accedessero a Internet usando i computer dei laboratori dell’Università. Le risposte ottenute sono: Maschi : 1 7 3 4 1 0 7 0 1 8 3 3 4 2 4 3 0 3 3 5 3 3 7 4 1 7 5 3 Femmine : 4 3 3 3 7 6 8 0 7 2 4 0 3 9 3 4 4 4 4 3 5 6 1. Creare una tabella di frequenza per i dati 2. A quanto ammonta la percentuale di studenti che si collega a Internet esattamente 5 volte la settimana ? E più di cinque volte ? 3. Determinare la distribuzione percentuale del numero di accessi rispetto al genere e confrontare i risultati ottenuti. ESERCIZIO 2. Un professore di matematica decide di condurre uno studio per verificare se dare compiti a casa ha effetto sul rendimento dello studente. Divide quindi gli studenti in due gruppi: studenti a cui non sono stati dati compiti a casa e studenti a cui invece sono stati assegnati. Dopo il primo compito in classe il professore registra i voti (in decimi) dei due gruppi: Voto – nessun compito a casa 4 6 6 7 5 5 5 7 6 6 5 5 9 Voto – compiti a casa 6566778975667 1. Calcolare le distribuzioni di frequenze assolute e relative per il voto dei due gruppi. 2. Si traccino i box-plot nei due casi e si confrontino le distribuzioni. 3. Si calcolino media e varianza delle due distribuzioni e se ne commenti il risultato. 4. Si calcoli, utilizzando la formula della varianza nei sottogruppi, la varianza totale della classe. 5. Si supponga che il professore faccia correggere i compiti da un suo collega. Sapendo che il collega aumenterà i voti di un 10% più 1 punto perché meno severo, ricalcolare, utilizzandone le proprietà, media e varianza. STATISTICA DESCRITTIVA (parte A) - Prova scritta del 18 gennaio 2010 ESERCIZIO 1. Alcuni analisti economici si chiedono in che misura un incremento di popolarità delle compagnie di assicurazione abbia influenzato lo stato di salute di queste organizzazioni. Hanno raccolto quindi dati sui profitti e sul numero di clienti per dieci di queste organizzazioni. Clienti (milioni di unità) Profitti (miliardi di euro) 4,24 3,19 1,83 1,62 2,07 2,30 1,83 2,15 0,97 0,89 5,49 4,63 3,86 3,60 3,43 2,91 2,74 2,40 1,71 1,20 1. Calcolare il coefficiente di correlazione tra i profitti e il numero di clienti. 2. Calcolare i parametri della retta di regressione che spiega i profitti in funzione del numero di clienti. 3. Disegnare, sullo scatterplot allegato, il grafico della retta di regressione. 4. Prevedere il profitto di una nuova organizzazione che abbia 1.2 milioni di unità di clienti. 5. Disegnare il grafico dei residui rispetto ai valori fittati e commentare il risultato ottenuto. 6. Qual’é l’organizzazione per cui il profitto è predetto dal modello lineare con più precisione ? E quello predetto con peggior precisione ? Giustificare la risposta. ESERCIZIO 2. Siano X e Y due variabili quantitative positive. Disegnare su tre sistemi di assi cartesiani tre “nuvole di almeno 10 punti” con correlazione approssimativamente pari a 0,7 ; 0,1 e -0,9 . ESERCIZIO 3. Le variabili Tmin e Tmax rappresentano rispettivamente le temperature minime e massime in gradi centigradi registrate a Genova nelle date riportate. Il valore della covarianza tra tali variabili è circa 3,9. 1. Quale è l’unità di misura della covarianza? 2. Determinare due punti fra quelli riportati sotto (indicare il valore della data) che danno rispettivamente un contributo positivo e uno negativo alla covarianza. Tmax 20 20 19 17 14 17 17 20 22 22 Tmin 14 12 12 12 11 11 10 15 15 15 15 14 13 Tmin data 23/04 24/04 25/04 26/04 27/04 28/04 29/04 09/05 10/05 11/05 12 11 10 13 14 15 16 17 18 Tmax 19 20 21 22 ESERCIZIO 4. Nella tabella seguente sono riportati i prezzi (euro/kg) di due prodotti (A e B) distribuiti per uso agricolo in una regione in differenti anni. Nei primi due anni il prodotto A ha ottenuto il 40% e il prodotto B il 60% delle vendite complessive dei due prodotti. Negli ultimi due anni le proporzioni sono diventate 25% per A e 75% per B. Anno 1998 1999 2001 2002 A 120 124 125 128 B 110 126 135 146 1. Calcolare gli indici a base fissa 1998 e a base mobile per uno dei due prodotti a scelta. 2. Calcolare l’indice di Laspeyres con base 1998. 3. Calcolare l’indice di Paasche con base 1998. 6 5 Profitti 4 3 2 1 1,0 1,5 2,0 2,5 Clienti 3,0 3,5 4,0 4,5 Fitted Line Plot y = 0,7845 + 1,144 x 6 S R-Sq R-Sq(adj) 0,652977 77,4% 74,6% 5 y 4 3 2 1 1,0 1,5 2,0 2,5 x 3,0 3,5 4,0 4,5 Versus Fits (response is y) 1,0 Residual 0,5 0,0 -0,5 -1,0 2 3 4 Fitted Value 5 6