statistica i - corso di laurea in statistica - UniFI

STATISTICA I - CORSO DI LAUREA IN STATISTICA
a.a. 2004/2005
Prova intermedia del 01 aprile 2005
Esercizio 1
La Tabella 1 contiene alcuni dati relativi a 14 aziende.
Tabella 1 – Dati (fittizi) su alcune aziende
Azienda
Settore
Numero di
sedi
1
2
3
4
5
6
7
8
9
10
11
12
13
14
Primario
Primario
Primario
Primario
Secondario
Secondario
Secondario
Secondario
Secondario
Secondario
Secondario
Terziario
Terziario
Terziario
4
1
2
1
3
2
3
3
2
4
1
3
3
2
Fatturato
Livello
Numero
(migliaia innovazione
dipendenti
di euro) tecnologica
2235
545
854
976
336
402
1071
1197
555
1526
534
1008
2438
550
Medio
[missing]
Medio
Basso
Medio
Basso
Medio
[missing]
Alto
Medio
Basso
Basso
Medio
Alto
141
35
49
64
41
45
68
70
32
40
39
62
137
39
Con riferimento ai dati della Tabella 1:
a) scrivere la distribuzione delle frequenze assolute, relative e cumulate relative (ove
ammissibile) dei caratteri Settore, Numero di sedi, Fatturato e Livello di innovazione
tecnologica. NOTA: per il Fatturato usare classi di ampiezza pari a 500 mila euro;
b) calcolare un indice di posizione (il più informativo possibile) per i caratteri Settore, Numero
di sedi e Livello di innovazione tecnologica;
c) rappresentare la distribuzione di frequenze e la funzione di ripartizione empirica del
carattere Numero di sedi;
d) disegnare l’istogramma e la funzione di ripartizione dedotta dall’istogramma del carattere
Fatturato;
e) calcolare la proporzione di aziende con fatturato compreso tra 600 mila e 1800 mila euro.
Relativamente al carattere Numero di dipendenti calcolare:
f) campo di variazione;
g) scarto interquartile;
h) varianza e scarto quadratico medio;
i) coefficiente di variazione.
Relativamente al carattere Fatturato calcolare:
j) primo e terzo quartile, utilizzando la funzione di ripartizione dedotta dall’istogramma
definita al punto d).
05/04/05
Esercizio 2
Rispondere ai seguenti quesiti, spiegando brevemente le ragioni della risposta:
(a)
Quale media lascia invariato il prodotto dei valori della successione?
(b)
Che cos’è una media aritmetica ponderata?
(c)
Se si aggiunge una costante a ognuno dei dati di una successione, come si modifica la
media aritmetica?
(d)
Se si aggiunge una costante a ognuno dei dati di una successione, come si modifica la
deviazione standard?
(e)
Se raddoppia ognuno dei dati di una successione, come si modifica la media aritmetica?
(f)
Se raddoppia ognuno dei dati di una successione, come si modifica la deviazione
standard?
(g)
Se si cambia il segno a ognuno dei dati di una successione, come si modifica la media
aritmetica?
(h)
Se si cambia il segno a ognuno dei dati di una successione, come si modifica la
deviazione standard?
(i)
Se la deviazione standard di un insieme di valori è zero, cosa significa?
(j)
Se la media quadratica di un insieme di valori è zero, cosa significa? In questo caso,
media aritmetica e media geometrica saranno anch’esse pari a zero?
(k)
Se la media aritmetica di un insieme di valori è zero, quanto vale la varianza?
(l)
Che cosa rappresenta la derivata prima della funzione di ripartizione dedotta
dall’istogramma?
(m)
Quali sono le principali differenze tra un esperimento controllato e uno studio sul
campo?
(n)
Quali sono i vantaggi e gli svantaggi della formulazione aperta e chiusa delle domande
in un questionario postale?
Esercizio 3
Enunciare e dimostrare la proprietà di baricentro e la proprietà dei minimi quadrati della media
aritmetica. Perché queste due proprietà sono importanti?
Esercizio 4
Un gruppo di persone ha una temperatura corporea media di 98.6 gradi Fahreneheit, con una
deviazione standard di 0.3 °F. Sapendo che °C=(5/9)(°F-32°) calcolare media aritmetica, deviazione
standard e varianza in gradi centigradi.
05/04/05
SOLUZIONE
Esercizio 1 (soluzione parziale)
n
4
7
3
14
f
0.29
0.50
0.21
1.00
n
3
4
5
2
14
f
0.21
0.29
0.36
0.14
1.00
F
0.21
0.50
0.86
1.00
Livello innovazione tecnologica
Basso
Medio
Alto
n
4
6
2
12
f
0.33
0.50
0.17
1.00
F
0.33
0.83
1.00
[missing]
Totale complessivo
2
14
Settore
Primario
Secondario
Terziario
Indice: moda='Secondario'
Numero di sedi
1
2
3
4
Indice: media aritmetica=2.4
Indice: mediana='Medio'
Fatturato
inf
0
500
1000
1500
2000
sup
500
1000
1500
2000
2500
n
2
6
3
1
2
f
0.143
0.429
0.214
0.071
0.143
N
2
8
11
12
14
F
0.143
0.571
0.786
0.857
1.000
prop(X<600) = 0.143 + (600-500)*0.857143/1000 =
prop(X<1800) = 0.786 + (1800-1500)*0.142857/1000 =
prop(X<1800)-prop(X<600) =
Q1 = 500 + (0.25-0.143)*1000/0.857143 =
Q3 = 1000 + (0.75-0.571)*1000/0.428571 =
amp
500
500
500
500
500
dens*1000
0.285714
0.857143
0.428571
0.142857
0.285714
0.229
0.829
0.600
625.000
1416.667
05/04/05
Numero dipendenti
campo variazione
Q1
Q3
Q3-Q1
media
var
sd
CV
109
39
68
29
61.571
1145.531
33.846
0.550
Esercizio 2
Rispondere ai seguenti quesiti, spiegando brevemente le ragioni della risposta:
a) Quale media lascia invariato il prodotto dei valori della successione? Media geometrica.
b) Che cos’è una media aritmetica ponderata? E’ una media in cui ad ogni valore viene
associato un peso:
n
n
i =1
i =1
∑ xi pi / ∑ pi
c) Se si aggiunge una costante a ognuno dei dati di una successione, come si modifica la
media aritmetica? M(X+a)=a+M(X).
d) Se si aggiunge una costante a ognuno dei dati di una successione, come si modifica la
deviazione standard? σ(X+a)=σ(X).
e) Se raddoppia ognuno dei dati di una successione, come si modifica la media aritmetica?
M(2X)=2M(X).
f) Se raddoppia ognuno dei dati di una successione, come si modifica la deviazione
standard? σ(2X)=2σ(X)
g) Se si cambia il segno a ognuno dei dati di una successione, come si modifica la media
aritmetica? M(-1*X)= -1*M(X).
h) Se si cambia il segno a ognuno dei dati di una successione, come si modifica la deviazione
standard? σ(-1*X)=σ(X)
i) Se la deviazione standard di un insieme di valori è zero, cosa significa? La variabile
statistica è degenere (tutte le u.s. presentano la stessa modalità del carattere).
j) Se la media quadratica di un insieme di valori è zero, cosa significa? La variabile è
degenere in 0 (tutte le u.s. presentano la modalità 0). In questo caso, media aritmetica e
media geometrica saranno anch’esse pari a zero? Sì.
k) Se la media aritmetica di un insieme di valori è zero, quanto vale la varianza?
V(X)=M(X2).
l) Che cosa rappresenta la derivata prima della funzione di ripartizione dedotta
dall’istogramma? La derivata prima rappresenta la pendenza dei segmenti di retta che
uniscono due estremi di classe successivi.
m) Quali sono le principali differenze tra un esperimento controllato e uno studio sul campo?
In un esperimento le unità statistiche sono assegnate casualmente al trattamento, quindi
eventuali differenze nella risposta tra gruppo trattato e gruppo di controllo sono da attribuirsi
al trattamento. In uno studio sul campo, in generale, le unità statistiche non sono assegnate a
caso al trattamento e altri fattori (detti di disturbo), oltre al trattamento possono influire sulla
risposta.
n) Quali sono i vantaggi e gli svantaggi della formulazione aperta e chiusa delle domande in
un questionario postale? Le domande aperte sono utili nel caso in cui le modalità di risposta
non siano note a priori, ma sono più ‘faticose’ per gli intervistati e più difficili da trattare in
fase di analisi dei risultati.
05/04/05
Esercizio 3
Vedi libro di testo.
Esercizio 4
Indichiamo con Y la temperatura espressa in °C e con X la temperatura in °F.
Sappiamo che M(X)= 98.6 °F e σ(X)= 0.3 °F, V(X)=0.32=0.09.
Applicando la trasformazione °C=(5/9)(°F-32°) da gradi Fahreneheit a gradi centigradi otteniamo:
M(Y)= (5/9)(98.6 -32)=37, V(Y)= (5/9)2(0.09)=0.03, σ(Y)= (5/9)(0.3)=0.17.
05/04/05