STATISTICA DESCRITTIVA (parte A) - Prova scritta del 18 gennaio

STATISTICA DESCRITTIVA (parte A) - Prova scritta del 18 gennaio 2010
ESERCIZIO 1.
Un istituto per ricerche statistiche e sondaggi ha chiesto a 50 studenti
universitari (22 F e 28 M) quante volte la settimana accedessero a Internet usando i
computer dei laboratori dell’Università.
Le risposte ottenute sono:
Maschi : 1 7 3 4 1 0 7 0 1 8 3 3 4 2 4 3 0 3 3 5 3 3 7 4 1 7 5 3
Femmine : 4 3 3 3 7 6 8 0 7 2 4 0 3 9 3 4 4 4 4 3 5 6
1. Creare una tabella di frequenza per i dati
2. A quanto ammonta la percentuale di studenti che si collega a Internet
esattamente 5 volte la settimana ? E più di cinque volte ?
3. Determinare la distribuzione percentuale del numero di accessi rispetto al
genere e confrontare i risultati ottenuti.
ESERCIZIO 2.
Un professore di matematica decide di condurre uno studio per verificare se
dare compiti a casa ha effetto sul rendimento dello studente.
Divide quindi gli studenti in due gruppi: studenti a cui non sono stati dati compiti a casa
e studenti a cui invece sono stati assegnati.
Dopo il primo compito in classe il professore registra i voti (in decimi) dei due gruppi:


Voto – nessun compito a casa 4 6 6 7 5 5 5 7 6 6 5 5 9
Voto – compiti a casa
6566778975667
1. Calcolare le distribuzioni di frequenze assolute e relative per il voto dei due
gruppi.
2. Si traccino i box-plot nei due casi e si confrontino le distribuzioni.
3. Si calcolino media e varianza delle due distribuzioni e se ne commenti il risultato.
4. Si calcoli, utilizzando la formula della varianza nei sottogruppi, la varianza totale
della classe.
5. Si supponga che il professore faccia correggere i compiti da un suo collega.
Sapendo che il collega aumenterà i voti di un 10% più 1 punto perché meno
severo, ricalcolare, utilizzandone le proprietà, media e varianza.
STATISTICA DESCRITTIVA (parte A) - Prova scritta del 18 gennaio 2010
ESERCIZIO 1.
Alcuni analisti economici si chiedono in che misura un incremento di popolarità
delle compagnie di assicurazione abbia influenzato lo stato di salute di queste
organizzazioni. Hanno raccolto quindi dati sui profitti e sul numero di clienti per dieci di
queste organizzazioni.
Clienti (milioni di
unità)
Profitti (miliardi di
euro)
4,24 3,19 1,83 1,62 2,07 2,30 1,83 2,15 0,97 0,89
5,49 4,63 3,86 3,60 3,43 2,91 2,74 2,40 1,71 1,20
1. Calcolare il coefficiente di correlazione tra i profitti e il numero di clienti.
2. Calcolare i parametri della retta di regressione che spiega i profitti in funzione
del numero di clienti.
3. Disegnare, sullo scatterplot allegato, il grafico della retta di regressione.
4. Prevedere il profitto di una nuova organizzazione che abbia 1.2 milioni di unità di
clienti.
5. Disegnare il grafico dei residui rispetto ai valori fittati e commentare il risultato
ottenuto.
6. Qual’é l’organizzazione per cui il profitto è predetto dal modello lineare con più
precisione ? E quello predetto con peggior precisione ? Giustificare la risposta.
ESERCIZIO 2.
Siano X e Y due variabili quantitative positive. Disegnare su tre sistemi di assi
cartesiani tre “nuvole di almeno 10 punti” con correlazione approssimativamente pari
a 0,7 ; 0,1 e -0,9 .
ESERCIZIO 3.
Le variabili Tmin e Tmax rappresentano rispettivamente le temperature minime
e massime in gradi centigradi registrate a Genova nelle date riportate.
Il valore della covarianza tra tali variabili è circa 3,9.
1. Quale è l’unità di misura della covarianza?
2. Determinare due punti fra quelli riportati sotto (indicare il valore della data) che
danno rispettivamente un contributo positivo e uno negativo alla covarianza.
Tmax
20
20
19
17
14
17
17
20
22
22
Tmin
14
12
12
12
11
11
10
15
15
15
15
14
13
Tmin
data
23/04
24/04
25/04
26/04
27/04
28/04
29/04
09/05
10/05
11/05
12
11
10
13
14
15
16
17
18
Tmax
19
20
21
22
ESERCIZIO 4.
Nella tabella seguente sono riportati i prezzi (euro/kg) di due prodotti (A e B)
distribuiti per uso agricolo in una regione in differenti anni. Nei primi due anni il
prodotto A ha ottenuto il 40% e il prodotto B il 60% delle vendite complessive dei due
prodotti. Negli ultimi due anni le proporzioni sono diventate 25% per A e 75% per B.
Anno
1998
1999
2001
2002
A
120
124
125
128
B
110
126
135
146
1. Calcolare gli indici a base fissa 1998 e a base mobile per uno dei due prodotti a
scelta.
2. Calcolare l’indice di Laspeyres con base 1998.
3. Calcolare l’indice di Paasche con base 1998.
6
5
Profitti
4
3
2
1
1,0
1,5
2,0
2,5
Clienti
3,0
3,5
4,0
4,5
Fitted Line Plot
y = 0,7845 + 1,144 x
6
S
R-Sq
R-Sq(adj)
0,652977
77,4%
74,6%
5
y
4
3
2
1
1,0
1,5
2,0
2,5
x
3,0
3,5
4,0
4,5
Versus Fits
(response is y)
1,0
Residual
0,5
0,0
-0,5
-1,0
2
3
4
Fitted Value
5
6