Corso di Statistica - Esercitazione 1
Dott. Davide Buttarazzi
B [email protected]
Esercizio 1
La seguente tabella riporta dati riguardanti la produzione di tastiere per computer risultate difettose.
Causa
Punto nero
Danno
Jitting
Deformazione
Graffi
Muffa
Segno argentato
Foro
Alone
Posizione tasti
Tot.
ni
413
1039
258
834
442
275
413
371
292
1987
6324
1. Definire la tipologia della variabile Causa
2. Calcolare moda, media, quartili ed indice di eterogeneità di Gini della variabile Causa
Soluzioni esercizio 1
1. Causa è un carattere qualitativo nominale
2. Moda: xi : ni = max = P osizione tasti
Media: non calcolabile
Quartili: non calcolabili
Indice di eterogeneità di Gini: E = 1 −
10
P
i=1
fi2 = 0.8343 ,
0 ≤ E ≤ ( K−1
K = 0.9)
Esercizio 2
La seguente tabella riporta dati relativi al giudizio espresso da alcuni clienti sulla qualità dell’ultimo modello di smartphone prodotto
da una nota azienda.
Valutazione
Inaccettabile
Scarsa
Accettabile
Buona
Ottima
Tot.
ni
250
500
1500
2100
350
4700
1. Definire la tipologia della variabile Valutazione
2. Calcolare moda, media e quartili della variabile Valutazione
3. Calcolare l’indice di dispersione normalizzato della variabile Valutazione
4. Rappresentare graficamente la variabile Valutazione
Soluzioni esercizio 2
1. Valutazione è una variabile di tipo qualitativo ordinale
Per ottenere le soluzioni ai quesiti 2, 3 e 4 opportuno far riferimento alla seguente tabella:
Valutazione
Inaccettabile
Scarsa
Accettabile
Buona
Ottima
Tot.
ni
250
500
1500
2100
350
4700
fi
0.05
0.11
0.32
0.45
0.07
1
Fi
0.05
0.16
0.48
0.92
1
RFi
1
0.95
0.84
0.52
0.07
2. Moda: xi : ni = max = Buona
Media: non calcolabile
Quartili:
Q1 = x( n4 ) = xi : Fi ≥ 0.25 = Accettabile
Q2 = M e = x( n+1 ) = xi : Fi ≥ 0.5 = Buona
2
= xi : Fi ≥ 0.75 = Buona
Q3 = x( 3n
4 )
3. Indice di dispersione normalizzato:
5
4
P
P
D=
[Fi (1 − Fi ) + RFi (1 − RFi )] = 2
Fi (1 − Fi ) = 1 ,
i=1
D∗ =
0≤D≤2
i=1
2
K−1 D
= 0.5 ,
0 ≤ D∗ ≤ 1
4. La variabile Valutazione può essere rappresentata graficamente tramite grafico a barre
2000
Frequenza
1500
1000
500
0
Inaccettabile
Scarsa
Accettabile
Buona
Ottima
Valutazione
Esercizio 3
La seguente tabella riporta il prezzo di mercato di un campione di smartphone considerati da una nota azienda come principali
competitor.
Prezzo
200
99
180
450
20
130
100
100
100
360
150
130
200
50
100
195
140
140
1. Definire la tipologia della variabile Prezzo
2. Calcolare moda, media e quartili della variabile Prezzo
3. Calcolare le seguenti misure di variabilità della variabile Prezzo:
• differenza semplice media (senza ripetizione)
• scostamento semplice medio
• scostamento quadratico medio
• varianza
• devianza
• coefficiente di variazione
• campo di variazione interquartile
• campo di variazione assoluto
Soluzioni esercizio 3
1. Prezzo è una variabile di tipo quntitativo discreta.
2. Moda: xi : ni = max = 100
N
18
P
P
xi
P rezzoi
Media: µ =
= 158
N =
18
i=1
i=1
Quartili:
Per calcolare i quartili occorre riorganizzare la serie grezza in ordine non-decrescente:
20
50
99
100
100
100
100
130
130
140
140
150
180
195
200
200
360
450
Q1 = x( n4 ) = xi : Fi ≥ 0.25 = 100
Q2 = M e = x( n+1 ) = xi : Fi ≥ 0.5 = 140
2
= xi : Fi ≥ 0.75 = 195
Q3 = x( 3n
4 )
3.
• Differenza semplice media:
n P
n
P
Per calcolare l’indice ∆SR =
20
50
99
100
100
100
100
130
130
140
140
150
180
195
200
200
360
450
20
0
50
30
0
99
79
49
0
|xi −xj |
i=1 j=1
100
80
50
1
0
è opportuno costruire la seguente matrice di distanze in valore assoluto:
n(n−1)
100
80
50
1
0
0
100
80
50
1
0
0
0
100
80
50
1
0
0
0
0
130
110
80
31
30
30
30
30
0
130
110
80
31
30
30
30
30
0
0
140
120
90
41
40
40
40
40
10
10
0
140
120
90
41
40
40
40
40
10
10
0
0
150
130
100
51
50
50
50
50
20
20
10
10
0
180
160
130
81
80
80
80
80
50
50
40
40
30
0
195
175
145
96
95
95
95
95
65
65
55
55
45
15
0
200
180
150
101
100
100
100
100
70
70
60
60
50
20
5
0
200
180
150
101
100
100
100
100
70
70
60
60
50
20
5
0
0
360
340
310
261
260
260
260
260
230
230
220
220
210
180
165
160
160
0
450
430
400
351
350
350
350
350
320
320
310
310
300
270
255
250
250
90
0
Il numeratore di ∆SR corrisponde alla somma di tutti gli elementi della matrice (SR=senza ripetizione, quindi vengono
esclusi gli elementi presenti sulla diagonale principale). Poiché la matrice è simmetrica, ciò corrisponde a 2 volte la somma
degli elementi della parte superiore (o inferiore) della matrice.
Quindi
∆SR =
2(30+79+80+...+160+250+90)
18(18−1)
=
32156
306
= 105.08
L’indice puó essere normalizzato (ovvero 0 ≤ ∆SR ≤ 1) dividendo per 2µ
• scostamento semplice medio
Per calcolare gli indici di variabilità rispetto alla media (µ = 158), é opportuno costruire la seguente tabella:
xi
200
99
180
450
20
130
100
100
100
360
150
130
200
50
100
195
140
140
Totale
|xi − µ|
42
59
22
292
138
28
58
58
58
202
8
28
42
108
58
37
18
18
1274
(xi − µ)2
1764
3481
484
85264
19044
784
3364
3364
3364
40804
64
784
1764
11664
3364
1369
324
324
181374
Quindi si avrà che lo scostamento semplice medio sarà:
n
P
Sµ1 =
|xi −µ|
i=1
=
n
1274
18
= 70.7
• scostamento quadratico medio:
s n
P
2
(xi −µ)
Sµ2 = σ =
i=1
=
n
181374
18
=
√
10076 = 100.3
• varianza:
n
P
(xi −µ)2
2
σ =
i=1
• devianza:
dev(x) =
n
n
P
=
181374
18
= 10076
2
(xi − µ) = 181374
i=1
• coefficiente di variazione:
100.3
σ
µ = 158 = 0.63
• campo di variazione interquartile:
q3 − q1 = 195 − 100 = 95
• campo di variazione assoluto:
max − min = 450 − 20 = 430
Esercizio 4
Dopo aver organizzato in 5 classi di uguale ampiezza i dati in serie grezza dell’esercizio 3:
1. calcolare la mediana della variabile Prezzo tramite il metodo dell’interpolazione lineare utilizzando le frequenze relative (e
relative cumulate)
2. calcolare la media
3. rappresentare graficamente i dati
Soluzioni esercizio 4
1. L’ampiezza delle classi (uguale per tutte le classi) può essere cosı̀ calcolata:
max−min
K
∆=
=
430
5
= 86
Quindi la serie grezza può essere riorganizzata nella seguenta tabella per classi:
Prezzo
20 |− 106
106 |− 192
192 |− 278
278 |− 364
364 | − | 450
qx = xi−1 +
xi −xi−1
Fi −Fi−1 [F (qx )
− Fi−1 ] = 106 +
86
0.33 (0.5
ni
7
6
3
1
1
fi
0.39
0.33
0.16
0.06
0.06
Fi
0.39
0.72
0.88
0.94
1
− 0.39) = 135
2. Per calcolare la media occorre individuare i centri delle classi utilizzando la formula x̂ci =
xi−1 +xi
2
Si avrà quindi:
Prezzo
20 |− 106
106 |− 192
192 |− 278
278 |− 364
364 | − | 450
La media sarà quindi:
K
P
x̂ci ni
7×63+6×149+3×235+1×321+1×397
µ=
=
N =
18
i=1
2734
18
ni
7
6
3
1
1
x̂ci
63
149
235
321
397
= 151.8
4
3
0
1
2
Frequenza
5
6
7
3. La variabile Prezzo può essere rappresentata graficamente tramite istogramma
20
106
192
278
364
450
Prezzo
In questo caso, poiché le classi hanno uguale ampiezza, ponendo sull’asse delle ordinate la densità si ottiene lo stesso risultato
grafico.