Corso di Statistica - Esercitazione 1 Dott. Davide Buttarazzi B [email protected] Esercizio 1 La seguente tabella riporta dati riguardanti la produzione di tastiere per computer risultate difettose. Causa Punto nero Danno Jitting Deformazione Graffi Muffa Segno argentato Foro Alone Posizione tasti Tot. ni 413 1039 258 834 442 275 413 371 292 1987 6324 1. Definire la tipologia della variabile Causa 2. Calcolare moda, media, quartili ed indice di eterogeneità di Gini della variabile Causa Soluzioni esercizio 1 1. Causa è un carattere qualitativo nominale 2. Moda: xi : ni = max = P osizione tasti Media: non calcolabile Quartili: non calcolabili Indice di eterogeneità di Gini: E = 1 − 10 P i=1 fi2 = 0.8343 , 0 ≤ E ≤ ( K−1 K = 0.9) Esercizio 2 La seguente tabella riporta dati relativi al giudizio espresso da alcuni clienti sulla qualità dell’ultimo modello di smartphone prodotto da una nota azienda. Valutazione Inaccettabile Scarsa Accettabile Buona Ottima Tot. ni 250 500 1500 2100 350 4700 1. Definire la tipologia della variabile Valutazione 2. Calcolare moda, media e quartili della variabile Valutazione 3. Calcolare l’indice di dispersione normalizzato della variabile Valutazione 4. Rappresentare graficamente la variabile Valutazione Soluzioni esercizio 2 1. Valutazione è una variabile di tipo qualitativo ordinale Per ottenere le soluzioni ai quesiti 2, 3 e 4 opportuno far riferimento alla seguente tabella: Valutazione Inaccettabile Scarsa Accettabile Buona Ottima Tot. ni 250 500 1500 2100 350 4700 fi 0.05 0.11 0.32 0.45 0.07 1 Fi 0.05 0.16 0.48 0.92 1 RFi 1 0.95 0.84 0.52 0.07 2. Moda: xi : ni = max = Buona Media: non calcolabile Quartili: Q1 = x( n4 ) = xi : Fi ≥ 0.25 = Accettabile Q2 = M e = x( n+1 ) = xi : Fi ≥ 0.5 = Buona 2 = xi : Fi ≥ 0.75 = Buona Q3 = x( 3n 4 ) 3. Indice di dispersione normalizzato: 5 4 P P D= [Fi (1 − Fi ) + RFi (1 − RFi )] = 2 Fi (1 − Fi ) = 1 , i=1 D∗ = 0≤D≤2 i=1 2 K−1 D = 0.5 , 0 ≤ D∗ ≤ 1 4. La variabile Valutazione può essere rappresentata graficamente tramite grafico a barre 2000 Frequenza 1500 1000 500 0 Inaccettabile Scarsa Accettabile Buona Ottima Valutazione Esercizio 3 La seguente tabella riporta il prezzo di mercato di un campione di smartphone considerati da una nota azienda come principali competitor. Prezzo 200 99 180 450 20 130 100 100 100 360 150 130 200 50 100 195 140 140 1. Definire la tipologia della variabile Prezzo 2. Calcolare moda, media e quartili della variabile Prezzo 3. Calcolare le seguenti misure di variabilità della variabile Prezzo: • differenza semplice media (senza ripetizione) • scostamento semplice medio • scostamento quadratico medio • varianza • devianza • coefficiente di variazione • campo di variazione interquartile • campo di variazione assoluto Soluzioni esercizio 3 1. Prezzo è una variabile di tipo quntitativo discreta. 2. Moda: xi : ni = max = 100 N 18 P P xi P rezzoi Media: µ = = 158 N = 18 i=1 i=1 Quartili: Per calcolare i quartili occorre riorganizzare la serie grezza in ordine non-decrescente: 20 50 99 100 100 100 100 130 130 140 140 150 180 195 200 200 360 450 Q1 = x( n4 ) = xi : Fi ≥ 0.25 = 100 Q2 = M e = x( n+1 ) = xi : Fi ≥ 0.5 = 140 2 = xi : Fi ≥ 0.75 = 195 Q3 = x( 3n 4 ) 3. • Differenza semplice media: n P n P Per calcolare l’indice ∆SR = 20 50 99 100 100 100 100 130 130 140 140 150 180 195 200 200 360 450 20 0 50 30 0 99 79 49 0 |xi −xj | i=1 j=1 100 80 50 1 0 è opportuno costruire la seguente matrice di distanze in valore assoluto: n(n−1) 100 80 50 1 0 0 100 80 50 1 0 0 0 100 80 50 1 0 0 0 0 130 110 80 31 30 30 30 30 0 130 110 80 31 30 30 30 30 0 0 140 120 90 41 40 40 40 40 10 10 0 140 120 90 41 40 40 40 40 10 10 0 0 150 130 100 51 50 50 50 50 20 20 10 10 0 180 160 130 81 80 80 80 80 50 50 40 40 30 0 195 175 145 96 95 95 95 95 65 65 55 55 45 15 0 200 180 150 101 100 100 100 100 70 70 60 60 50 20 5 0 200 180 150 101 100 100 100 100 70 70 60 60 50 20 5 0 0 360 340 310 261 260 260 260 260 230 230 220 220 210 180 165 160 160 0 450 430 400 351 350 350 350 350 320 320 310 310 300 270 255 250 250 90 0 Il numeratore di ∆SR corrisponde alla somma di tutti gli elementi della matrice (SR=senza ripetizione, quindi vengono esclusi gli elementi presenti sulla diagonale principale). Poiché la matrice è simmetrica, ciò corrisponde a 2 volte la somma degli elementi della parte superiore (o inferiore) della matrice. Quindi ∆SR = 2(30+79+80+...+160+250+90) 18(18−1) = 32156 306 = 105.08 L’indice puó essere normalizzato (ovvero 0 ≤ ∆SR ≤ 1) dividendo per 2µ • scostamento semplice medio Per calcolare gli indici di variabilità rispetto alla media (µ = 158), é opportuno costruire la seguente tabella: xi 200 99 180 450 20 130 100 100 100 360 150 130 200 50 100 195 140 140 Totale |xi − µ| 42 59 22 292 138 28 58 58 58 202 8 28 42 108 58 37 18 18 1274 (xi − µ)2 1764 3481 484 85264 19044 784 3364 3364 3364 40804 64 784 1764 11664 3364 1369 324 324 181374 Quindi si avrà che lo scostamento semplice medio sarà: n P Sµ1 = |xi −µ| i=1 = n 1274 18 = 70.7 • scostamento quadratico medio: s n P 2 (xi −µ) Sµ2 = σ = i=1 = n 181374 18 = √ 10076 = 100.3 • varianza: n P (xi −µ)2 2 σ = i=1 • devianza: dev(x) = n n P = 181374 18 = 10076 2 (xi − µ) = 181374 i=1 • coefficiente di variazione: 100.3 σ µ = 158 = 0.63 • campo di variazione interquartile: q3 − q1 = 195 − 100 = 95 • campo di variazione assoluto: max − min = 450 − 20 = 430 Esercizio 4 Dopo aver organizzato in 5 classi di uguale ampiezza i dati in serie grezza dell’esercizio 3: 1. calcolare la mediana della variabile Prezzo tramite il metodo dell’interpolazione lineare utilizzando le frequenze relative (e relative cumulate) 2. calcolare la media 3. rappresentare graficamente i dati Soluzioni esercizio 4 1. L’ampiezza delle classi (uguale per tutte le classi) può essere cosı̀ calcolata: max−min K ∆= = 430 5 = 86 Quindi la serie grezza può essere riorganizzata nella seguenta tabella per classi: Prezzo 20 |− 106 106 |− 192 192 |− 278 278 |− 364 364 | − | 450 qx = xi−1 + xi −xi−1 Fi −Fi−1 [F (qx ) − Fi−1 ] = 106 + 86 0.33 (0.5 ni 7 6 3 1 1 fi 0.39 0.33 0.16 0.06 0.06 Fi 0.39 0.72 0.88 0.94 1 − 0.39) = 135 2. Per calcolare la media occorre individuare i centri delle classi utilizzando la formula x̂ci = xi−1 +xi 2 Si avrà quindi: Prezzo 20 |− 106 106 |− 192 192 |− 278 278 |− 364 364 | − | 450 La media sarà quindi: K P x̂ci ni 7×63+6×149+3×235+1×321+1×397 µ= = N = 18 i=1 2734 18 ni 7 6 3 1 1 x̂ci 63 149 235 321 397 = 151.8 4 3 0 1 2 Frequenza 5 6 7 3. La variabile Prezzo può essere rappresentata graficamente tramite istogramma 20 106 192 278 364 450 Prezzo In questo caso, poiché le classi hanno uguale ampiezza, ponendo sull’asse delle ordinate la densità si ottiene lo stesso risultato grafico.