Lezione 5 A. Iodice La media troncata Lezione 5 La variabilità Statistica La varianza Altri indici di variabilità Coefficiente di variazione Scostamento medio semplice Alfonso Iodice D’Enza [email protected] Università degli studi di Cassino A. Iodice () Lezione 5 Statistica 1 / 26 Outline Lezione 5 A. Iodice La media troncata 1 La media troncata 2 La variabilità 3 La varianza 4 Altri indici di variabilità Coefficiente di variazione Scostamento medio semplice La variabilità La varianza Altri indici di variabilità Coefficiente di variazione Scostamento medio semplice A. Iodice () Lezione 5 Statistica 2 / 26 Trimmed mean - La media troncata Lezione 5 A. Iodice La media troncata La variabilità La varianza Altri indici di variabilità Coefficiente di variazione Scostamento medio semplice La media aritmetica risente della presenza di valori estremi. Per limitare questo problema si calcola la media sui valori centrali della distribuzione, eliminando il possibile effetto di valori anomali. Media troncata (α%) Per calcolare la media troncata sugli 1 − α valori centrali di una distribuzione si procede come segue: 1 ordinare i valori osservati in senso crescente; 2 individuare i valori corrispondenti ai percentili qa = α/2 e qb = 1 − α/2; 3 4 A. Iodice () selezionare gli n∗ valori xi∗ tali che xi > qa e xi ≤ qb ; P ∗ calcolare la media troncata µα = n1∗ ni=1 xi . Lezione 5 Statistica 3 / 26 Trimmed mean - La media troncata Lezione 5 A. Iodice La media troncata Esempio media troncata α = 50% La variabilità {1, 5, 7, 13, 14, 15, 18, 18, 22, 23, 24, 25, 27, 28, 29} La varianza Altri indici di variabilità {1, 5, 7, 13, 14, 15, 18, 18, 22, 23, 24, 25, 27, 28, 29} Coefficiente di variazione Scostamento medio semplice ∗ n 1 X 14 + 15 + 18 + 18 + 22 + 23 + 24 + 25 µα = ∗ xi = = 19.875 n i=1 8 A. Iodice () Lezione 5 Statistica 4 / 26 Trimmed mean - La media troncata Lezione 5 A. Iodice La media troncata La variabilità La varianza Altri indici di variabilità Coefficiente di variazione Scostamento medio semplice A. Iodice () Lezione 5 Statistica 5 / 26 Trimmed mean - La media troncata Lezione 5 A. Iodice La media troncata La variabilità La varianza Altri indici di variabilità Coefficiente di variazione Scostamento medio semplice A. Iodice () Lezione 5 Statistica 6 / 26 Trimmed mean - La media troncata Lezione 5 A. Iodice La media troncata La variabilità La varianza Altri indici di variabilità Coefficiente di variazione Scostamento medio semplice A. Iodice () Lezione 5 Statistica 7 / 26 Trimmed mean - La media troncata Lezione 5 A. Iodice La media troncata La variabilità La varianza Altri indici di variabilità Coefficiente di variazione Scostamento medio semplice A. Iodice () Lezione 5 Statistica 8 / 26 Trimmed mean - La media troncata Lezione 5 A. Iodice La media troncata La variabilità La varianza Altri indici di variabilità Coefficiente di variazione Scostamento medio semplice A. Iodice () Lezione 5 Statistica 9 / 26 Trimmed mean - La media troncata Lezione 5 A. Iodice La media troncata La variabilità La varianza Altri indici di variabilità Coefficiente di variazione Scostamento medio semplice A. Iodice () Lezione 5 Statistica 10 / 26 Indici di posizione e tipo di caratteri Lezione 5 A. Iodice La media troncata La variabilità la moda si applica a tutte le tipologie di caratteri La varianza la mediana (quartili, quantili in generale) si applica a tutte le tipologie di caratteri le cui modalità sono ordinabili (mutabili rettilinee e variabili) Altri indici di variabilità Coefficiente di variazione Scostamento medio semplice la media aritmetica si applica alle sole variabili quantitative A. Iodice () Lezione 5 Statistica 11 / 26 Il concetto di variabilità Lezione 5 A. Iodice La media troncata La variabilità La variabilità si definisce come l’attitudine di un fenomeno ad assumere modalità differenti. La variabilità può essere misurata in diversi modi: La varianza variabilità delle singole modalità x1 , x2 , . . . , xn rispetto ad un indice di posizione Altri indici di variabilità Coefficiente di variazione Scostamento medio semplice mutua variabilità variabilità delle modalità x1 , x2 , . . . , xn ordinate in modo crescente (usando la f. di ripartizione) variabilità delle frequenze relative (applicabile anche a mutabili) A. Iodice () Lezione 5 Statistica 12 / 26 Requisiti per indici di variabilità Lezione 5 A. Iodice La media troncata La variabilità Un indice per la misura della variabilità deve avere le seguenti caratteristiche La varianza un indice di variabilità deve assumere valori maggiori o uguali a 0 Altri indici di variabilità Coefficiente di variazione Scostamento medio semplice un indice di variabilità calcolato su una distribuzione di costanti ugulae a 0 aggiungendo una costante alla variabile osservata, il valore dell’indice non deve cambiare A. Iodice () Lezione 5 Statistica 13 / 26 Definizione di varianza Lezione 5 A. Iodice La varianza un’indice che misura la variabilità di una variabile X rispetto alla media aritmetica. In particolare la varianza σ 2 data dalla media dei quadrati degli scarti (delle modalità dalla media) La media troncata (x1 − µ)2 + (x2 − µ)2 + . . . + (xn − µ)2 = n n 1X = (xi − µ)2 n i=1 La variabilità σ2 = La varianza Altri indici di variabilità Coefficiente di variazione Scostamento medio semplice per dati organizzati in frequenze (seriazione) (x1 − µ)2 × n1 + (x2 − µ)2 × n2 + . . . + (xk − µ)2 × nk = n1 + n2 + . . . + nk k 1X = (xi − µ)2 × ni n i=1 σ2 = A. Iodice () Lezione 5 Statistica 14 / 26 Definizione di varianza Lezione 5 A. Iodice La media troncata In alcuni casi la varianza può essere ottenuta attraverso una formula alternativa che semplifica il calcolo formula alternativa La variabilità La varianza Altri indici di variabilità σ2 = n n 1X 1X 2 (xi − µx )2 = (x + µ2x − 2xi µx ) = n i=1 n i=1 | i {z } quadrato del binomio Coefficiente di variazione Scostamento medio semplice 1 = n = 1 n n X i=1 n X i=1 x2i + n X µ2x −2 i=1 x2i + nµ2x − 2µx n X ! xi µx i=1 n X = portare le costanti fuori sommatoria ! xi i=1 = n n 1X 1X 2 1 2 xi + nµx − 2µx xi = n i=1 n n i=1 | {z } | {z } µx2 µx = µx2 + µ2x − 2µ2x = µx2 − µ2x A. Iodice () Lezione 5 Statistica 15 / 26 Esempio di calcolo della varianza Lezione 5 A. Iodice Data la variabile X : numero di esami sostenuti prima di quello di statistica osservata su un collettivo di n = 6 studenti La media troncata La variabilità La varianza Altri indici di variabilità Coefficiente di variazione Scostamento medio semplice La varianza sarà dunque n 1X 50.8333 2 σ = (xi − µ)2 = = 8.4722 n 6 i=1 A. Iodice () Lezione 5 Statistica 16 / 26 Lo scarto quadratico medio (standard deviation) Lezione 5 A. Iodice La media troncata La variabilità La varianza Altri indici di variabilità Coefficiente di variazione Scostamento medio semplice Una difficoltà di interpretazione della varianza dipende dal fatto che tale indice espresso nell’unità di misura al quadrato della variabile cui si riferisce. Per ovviare a questo problema si utilizza lo scarto quadratico medio σ, dato da v u n u1 X (xi − µ)2 σ=t n i=1 dall’esempio precedente risulta dunque r 50.8333 σ= = 2.9107 6 A. Iodice () Lezione 5 Statistica 17 / 26 Calcolo della varianza Lezione 5 A. Iodice Si consideri un campione di n = 100 sportelli bancari e sia X : numero di operazioni effettuate presso uno sportello nell’ultima settimana. La media troncata X [60, 62] [63, 65] [66, 68] [69, 71] [72, 74] La variabilità La varianza Altri indici di variabilità Coefficiente di variazione Scostamento medio semplice Freq (ni ) 5 18 42 27 8 100 Calcolare un indice di tendenza centrale (media) Misurare la variabilità rispetto ad un centro (scarto quadratico medio) A. Iodice () Lezione 5 Statistica 18 / 26 Calcolo della varianza Lezione 5 A. Iodice La media troncata Calcolo della media aritmetica Per calcolare la media aritmetica bisogna individuare i centri di ciascuna classe e tenere conto delle frequenze. Ricordando la formula della media aritmetica La variabilità Pk µx = La varianza i=1 ci × ni n Altri indici di variabilità Coefficiente di variazione Scostamento medio semplice X [60, 62] [63, 65] [66, 68] [69, 71] [72, 74] Pk µx = A. Iodice () i=1 ci × ni n Freq=ni 5 18 42 27 8 100 = centri=ci 61 64 67 70 73 ci × ni 305 1152 2814 1890 584 6745 305 + 1152 + 2814 + 1890 + 584 Lezione 5 100 = 67.45 Statistica 19 / 26 Calcolo della varianza Lezione 5 A. Iodice Calcolo della varianza Ripetendo il calcolo utilizzando la formula alternativa per il calcolo della varianza La media troncata σ La variabilità 2 2 = µx2 − (µx ) Pk = i=1 c2 i × ni n Pk i=1 − ci × ni !2 n La varianza Altri indici di variabilità X [60, 62] [63, 65] [66, 68] [69, 71] [72, 74] Coefficiente di variazione Scostamento medio semplice σ 2 Pk = i=1 c2 i × ni N Freq=ni 5 18 42 27 8 100 Pk − i=1 ci N da cui lo scarto quadratico medio σ = A. Iodice () !2 = centri=ci 61 64 67 70 73 455803 100 − c2 i 3721 4096 4489 4900 5329 6745 100 c2 i × ni 18605 73728 188538 132300 42632 455803 2 = 4558.03 − 4549.503 = 8.5275 √ 8.5275 = 2.92 Lezione 5 Statistica 20 / 26 Massima variabilità Lezione 5 La varianza può crescere indefinitamente perchè gli scarti delle modalità dalla media possono essere A. Iodice illimitatamente grandi La situazione di massima variabilità per un collettivo con media µ, si ha quando su n modalità, 6=0 n − 1 sono nulle ed una sola modalità xi = nµ La media troncata La variabilità La varianza σ 2 Altri indici di variabilità ≤ n 1 X n i=1 2 (xi − µ) 1 2 ((n − 1)(0 − µ) + n | {z } = n−1 modalità nulle = Coefficiente di variazione Scostamento medio semplice 1 n 2 ((n − 1)µ + 2 2 2 2 (n µ + µ − 2nµ ) | {z } 2 (nµ − µ) )= | {z } unica modalità 6=0 = sviluppo del binomio (nµ−µ)2 = = 1 n 1 n 2 2 2 ((n − 1)µ + µ (n + 1 − 2n)) = 2 2 2 ((n − 1) µ + µ (n + 1 − 2n)) = | {z } µ2 in evid. = = A. Iodice () 1 n 1 n 2 2 (µ (n − 1 + n + 1 − 2n)) = 2 1 n 2 2 (µ (n − n)) = 2 (µ n(n − 1)) = µ (n − 1) Lezione 5 Statistica 21 / 26 Le proprietà della varianza Lezione 5 A. Iodice La media troncata La variabilità La varianza gode di alcune importanti proprietà di seguito riportate: La varianza 1 La varianza di X sempre un numero non negativo (≥ 0) Altri indici di variabilità 2 La varianza di X pari a 0 se e solo se X una costante Coefficiente di variazione Scostamento medio semplice 3 Se alla variabile X si aggiunge una costante, σx non cambia 4 Se si moltiplica la variabile X per una costante b, si avr σx∗ = b2 σx2 A. Iodice () Lezione 5 Statistica 22 / 26 Le proprietà della varianza Lezione 5 A. Iodice La media troncata Le proprietà 3 e 4 dipendono dalla proprietà di linearità della media aritmetica: si consideri Y = a + bX, con a e b costanti. Dalla proprietà risulta che µy = a + bµx . Calcolando la varianza di Y si avrà: La variabilità 2 σy = La varianza Altri indici di variabilità = Coefficiente di variazione Scostamento medio semplice = n 1 X n 1=1 n 1 X n 1=1 n 1 X n 1=1 2 (yi − µy ) = 2 (yi − (a + bµx )) 2 (bxi − bµx ) = = n 1 X n 1=1 n 1 X n 1=1 2 (a + bxi − a − bµx ) 2 ((b)(xi − µx )) = = n n X 1 X 2 2 2 1 2 2 2 b (xi − µx ) = b (xi − µx ) = b σx n i=1 n 1=1 A. Iodice () Lezione 5 Statistica 23 / 26 Il coefficiente di variazione (CV ) Lezione 5 A. Iodice La media troncata La variabilità La varianza è un indice assoluto, dipende quindi dall’unità di misura della variabile. Un indice relativo di variabilità è il coefficiente di variazione CV . E’ dato da La varianza CV = Altri indici di variabilità Coefficiente di variazione Scostamento medio semplice σ µ essendo un numero puro consente il confronto fra fenomeni rilevati in momenti diversi o espressi in unità di misura diverse A. Iodice () Lezione 5 Statistica 24 / 26 Il coefficiente di variazione (CV ) Lezione 5 A. Iodice La media troncata La variabilità La varianza è un indice assoluto, dipende quindi dall’unità di misura della variabile. Un indice relativo di variabilità è il coefficiente di variazione CV . E’ dato da La varianza CV = Altri indici di variabilità Coefficiente di variazione Scostamento medio semplice σ µ essendo un numero puro consente il confronto fra fenomeni rilevati in momenti diversi o espressi in unità di misura diverse Limiti di utilizzo del CV è defnito solo se µ > 0 se µ → 0 il CV tende a diventare molto grande A. Iodice () Lezione 5 Statistica 24 / 26 Scostamento medio semplice Lezione 5 A. Iodice La media troncata La variabilità La varianza Altri indici di variabilità Per ottenere lo scostamento medio semplice bisogna calcolare il valore assoluto degli scarti dei centri delle classi dalla media e tenere conto delle frequenze. Ricordando la formula dello scostamento medio semplice Coefficiente di variazione Scostamento medio semplice Pk MD = A. Iodice () i=1 | ci Lezione 5 − µ | ×ni n Statistica 25 / 26 Esempio calcolo scostamento medio semplice Lezione 5 A. Iodice La media troncata Calcolo dello scostamento medio semplice X [60, 62] [63, 65] [66, 68] [69, 71] [72, 74] La variabilità La varianza Altri indici di variabilità Coefficiente di variazione Scostamento medio semplice Pk MD = A. Iodice () i=1 Freq=ni 5 18 42 27 8 100 centri=ci 61 64 67 70 73 | ci − µ | 6.45 3.45 0.45 2.55 5.55 | ci − µ | ×ni 32.25 62.10 18.90 68.85 44.40 226.5 | ci − µ | ×ni 32.25 + 62.1 + 18.9 + 68.85 + 44.4 226.5 = = = 2.265 n 100 100 Lezione 5 Statistica 26 / 26