Esercitazione 4 A. Iodice La varianza Esercitazione 4 Altri indici di variabilità Statistica Mutua variabilità Esercizio sulla variabilità Alfonso Iodice D’Enza [email protected] Università degli studi di Cassino A. Iodice () Esercitazione 4 Statistica 1 / 21 Outline Esercitazione 4 A. Iodice La varianza 1 La varianza 2 Altri indici di variabilità 3 Mutua variabilità 4 Esercizio sulla variabilità Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità A. Iodice () Esercitazione 4 Statistica 2 / 21 Definizione di varianza Esercitazione 4 A. Iodice La varianza Altri indici di variabilità La varianza un’indice che misura la variabilità di una variabile X rispetto alla media aritmetica. In particolare la varianza σ 2 data dalla media dei quadrati degli scarti (delle modalità dalla media) Mutua variabilità Esercizio sulla variabilità A. Iodice () Esercitazione 4 Statistica 3 / 21 Definizione di varianza Esercitazione 4 A. Iodice La varianza Altri indici di variabilità La varianza un’indice che misura la variabilità di una variabile X rispetto alla media aritmetica. In particolare la varianza σ 2 data dalla media dei quadrati degli scarti (delle modalità dalla media) (x1 − µ)2 + (x2 − µ)2 + . . . + (xn − µ)2 = n n 1X = (xi − µ)2 n σ2 = Mutua variabilità Esercizio sulla variabilità i=1 A. Iodice () Esercitazione 4 Statistica 3 / 21 Definizione di varianza Esercitazione 4 A. Iodice La varianza Altri indici di variabilità La varianza un’indice che misura la variabilità di una variabile X rispetto alla media aritmetica. In particolare la varianza σ 2 data dalla media dei quadrati degli scarti (delle modalità dalla media) (x1 − µ)2 + (x2 − µ)2 + . . . + (xn − µ)2 = n n 1X = (xi − µ)2 n σ2 = Mutua variabilità Esercizio sulla variabilità i=1 per dati organizzati in frequenze (seriazione) (x1 − µ)2 × n1 + (x2 − µ)2 × n2 + . . . + (xk − µ)2 × nk = n1 + n2 + . . . + nk k 1X = (xi − µ)2 × ni n σ2 = i=1 A. Iodice () Esercitazione 4 Statistica 3 / 21 Esempio di calcolo della varianza Esercitazione 4 A. Iodice Data la variabile X : numero di esami sostenuti prima di quello di statistica osservata su un collettivo di n = 6 studenti La varianza Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità A. Iodice () Esercitazione 4 Statistica 4 / 21 Esempio di calcolo della varianza Esercitazione 4 A. Iodice Data la variabile X : numero di esami sostenuti prima di quello di statistica osservata su un collettivo di n = 6 studenti La varianza Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità A. Iodice () Esercitazione 4 Statistica 4 / 21 Esempio di calcolo della varianza Esercitazione 4 A. Iodice Data la variabile X : numero di esami sostenuti prima di quello di statistica osservata su un collettivo di n = 6 studenti La varianza Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità La varianza sar dunque n 1X 50.8333 2 σ = (xi − µ)2 = = 8.4722 n 6 i=1 A. Iodice () Esercitazione 4 Statistica 4 / 21 Massima variabilità Esercitazione 4 A. Iodice La varianza Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità A. Iodice () Esercitazione 4 Statistica 5 / 21 Massima variabilità Esercitazione 4 La varianza può crescere indefinitamente perchè gli scarti delle modalità dalla media possono essere illimitatamente grandi A. Iodice La varianza Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità A. Iodice () Esercitazione 4 Statistica 5 / 21 Massima variabilità Esercitazione 4 La varianza può crescere indefinitamente perchè gli scarti delle modalità dalla media possono essere illimitatamente grandi La situazione di massima variabilità per un collettivo con media µ, si ha quando su n modalità, n − 1 sono nulle ed 0 una sola modalità x6= i = nµ A. Iodice La varianza Altri indici di variabilità Mutua variabilità n Esercizio sulla variabilità σ2 ≤ 1X 1 (xi − µ)2 = ((n − 1)(0 − µ)2 + (nµ − µ)2 ) = n n i=1 1 = ((n − 1)µ2 + µ2 (n − 1)2 ) = n 1 = ((n − 1)µ2 + µ2 (n2 + 1 − 2n)) = n 1 = (µ2 n(n − 1)) = µ2 (n − 1) n A. Iodice () Esercitazione 4 Statistica 5 / 21 Le proprietà della varianza Esercitazione 4 A. Iodice La varianza Altri indici di variabilità La varianza gode di alcune importanti propriet di seguito riportate: Mutua variabilità Esercizio sulla variabilità A. Iodice () Esercitazione 4 Statistica 6 / 21 Le proprietà della varianza Esercitazione 4 A. Iodice La varianza Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità La varianza gode di alcune importanti propriet di seguito riportate: 1 La varianza di X sempre un numero non negativo (≥ 0) 2 La varianza di X pari a 0 se e solo se X una costante 3 Se alla variabile X si aggiunge una costante, σx non cambia 4 Se si moltiplica la variabile X per una costante b, si avr σx∗ = b2 σx2 A. Iodice () Esercitazione 4 Statistica 6 / 21 Le proprietà della varianza Esercitazione 4 A. Iodice La varianza Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità Le propriet 3 e 4 dipendono dalla propriet di linearit della media aritmetica: si consideri Y = a + bX, con a e b costanti. Dalla propriet risulta che µy = a + bµx . Calcolando la varianza di Y si avr: n σy2 1X (yi − µy )2 = = n 1=1 n n 1X 1X 2 = (yi − (a + bµx )) = (a + bxi − a − bµx )2 = n n 1=1 1=1 n n 1X 2 1X 2 (bxi − bµx ) = b (xi − µx )2 = = n n = b2 A. Iodice () 1=1 n X 1 n 1=1 (xi − µx )2 = b2 σx2 i=1 Esercitazione 4 Statistica 7 / 21 Lo scarto quadratico medio (standard deviation) Esercitazione 4 A. Iodice La varianza Altri indici di variabilità Una difficoltà di interpretazione della varianza dipende dal fatto che tale indice espresso nell’unità di misura al quadrato della variabile cui si riferisce. Per ovviare a questo problema si utilizza lo scarto quadratico medio σ, dato da Mutua variabilità Esercizio sulla variabilità A. Iodice () Esercitazione 4 Statistica 8 / 21 Lo scarto quadratico medio (standard deviation) Esercitazione 4 A. Iodice La varianza Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità Una difficoltà di interpretazione della varianza dipende dal fatto che tale indice espresso nell’unità di misura al quadrato della variabile cui si riferisce. Per ovviare a questo problema si utilizza lo scarto quadratico medio σ, dato da v u n u1 X σ=t (xi − µ)2 n i=1 A. Iodice () Esercitazione 4 Statistica 8 / 21 Lo scarto quadratico medio (standard deviation) Esercitazione 4 A. Iodice La varianza Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità Una difficoltà di interpretazione della varianza dipende dal fatto che tale indice espresso nell’unità di misura al quadrato della variabile cui si riferisce. Per ovviare a questo problema si utilizza lo scarto quadratico medio σ, dato da v u n u1 X σ=t (xi − µ)2 n i=1 dall’esempio precedente risulta dunque r 50.8333 σ= = 2.9107 6 A. Iodice () Esercitazione 4 Statistica 8 / 21 Il coefficiente di variazione (CV Esercitazione 4 A. Iodice La varianza Altri indici di variabilità La varianza è un indice assoluto, dipende quindi dall’unità di misura della variabile. Un indice relativo di variabilità è il coefficiente di variazione CV . E’ dato da CV = Mutua variabilità Esercizio sulla variabilità σ µ essendo un numero puro consente il confronto fra fenomeni rilevati in momenti diversi o espressi in unità di misura diverse A. Iodice () Esercitazione 4 Statistica 9 / 21 Il coefficiente di variazione (CV Esercitazione 4 A. Iodice La varianza Altri indici di variabilità La varianza è un indice assoluto, dipende quindi dall’unità di misura della variabile. Un indice relativo di variabilità è il coefficiente di variazione CV . E’ dato da CV = Mutua variabilità Esercizio sulla variabilità σ µ essendo un numero puro consente il confronto fra fenomeni rilevati in momenti diversi o espressi in unità di misura diverse Limiti di utilizzo del CV è defnito solo se µ > 0 se µ → 0 il CV tende a diventare molto grande A. Iodice () Esercitazione 4 Statistica 9 / 21 Variabilità e modalità ordinate Esercitazione 4 A. Iodice La varianza Altri indici di variabilità In caso di variabili con modalità ordinabili è possibile definire degli indici di variabilità derivati dalla funzione di ripartizione empirica. Data la distribuzione unitaria ordinata di modalità Mutua variabilità {1, 5, 7, 13, 14, 15, 18, 18, 22, 23, 24, 25, 27, 28, 29} Esercizio sulla variabilità A. Iodice () Esercitazione 4 Statistica 10 / 21 Variabilità e modalità ordinate Esercitazione 4 A. Iodice La varianza Altri indici di variabilità In caso di variabili con modalità ordinabili è possibile definire degli indici di variabilità derivati dalla funzione di ripartizione empirica. Data la distribuzione unitaria ordinata di modalità Mutua variabilità {1, 5, 7, 13, 14, 15, 18, 18, 22, 23, 24, 25, 27, 28, 29} Esercizio sulla variabilità il range (o campo di variazione) è dato da R(X) = max(xi ) − min(xi = 29 − 1 = 27 il range inter-quartile (o campo di variazione interquartile) è dato da IQR(X) = Q3 − Q1 = 25 − 13 = 12 A. Iodice () Esercitazione 4 Statistica 10 / 21 Variabilità e modalità ordinate Esercitazione 4 A. Iodice La varianza Altri indici di variabilità In caso di variabili con modalità ordinabili è possibile definire degli indici di variabilità derivati dalla funzione di ripartizione empirica. Data la distribuzione unitaria ordinata di modalità Mutua variabilità {1, 5, 7, 13, 14, 15, 18, 18, 22, 23, 24, 25, 27, 28, 29} Esercizio sulla variabilità il range (o campo di variazione) è dato da R(X) = max(xi ) − min(xi = 29 − 1 = 27 il range inter-quartile (o campo di variazione interquartile) è dato da IQR(X) = Q3 − Q1 = 25 − 13 = 12 A. Iodice () Esercitazione 4 Statistica 10 / 21 Mutua variabilità Esercitazione 4 A. Iodice La varianza Altri indici di variabilità In presenza di caratteri trasferibili (reddito, risorde energetiche, consumo di beni) è di maggior interesse lo studio della variabilità tra le singole unità statistiche piuttosto che la variabilità rispetto a un centro. Mutua variabilità Esercizio sulla variabilità A. Iodice () Esercitazione 4 Statistica 11 / 21 Mutua variabilità Esercitazione 4 A. Iodice La varianza Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità In presenza di caratteri trasferibili (reddito, risorde energetiche, consumo di beni) è di maggior interesse lo studio della variabilità tra le singole unità statistiche piuttosto che la variabilità rispetto a un centro. Differenza media semplice tale indice rappresenta la media dei valori assoluti delle differenze calcolate rispetto a tutte le possibili coppie di modalità. Esso corrisponde a Pn i6=j=1 |xi − xj | ∆= n(n − 1) la quantità al denominatore (n(n − 1)) rappresenta il numero di possibili coppie di n osservazioni. A. Iodice () Esercitazione 4 Statistica 11 / 21 Mutua variabilità Esercitazione 4 Dato un carattere X osservato su n = 4 osservazioni A. Iodice {7, 14, 18, 24} La varianza Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità A. Iodice () Esercitazione 4 Statistica 12 / 21 Mutua variabilità Esercitazione 4 Dato un carattere X osservato su n = 4 osservazioni A. Iodice {7, 14, 18, 24} La varianza Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità Differenza media semplice Il valore di ∆ sarà in questo caso |7 − 14| + |7 − 18| + |7 − 24| + |14 − 7|+ 12 +|14 − 18| + |14 − 24| + |18 − 7| + |18 − 14| + |18 − 24|+ 12 +|24 − 7| + |24 − 14| + |24 − 18| = 12 110 = = 9.1667 12 ∆= A. Iodice () Esercitazione 4 Statistica 12 / 21 mutua variabilità: minimo e massimo Esercitazione 4 l’indice ∆ assume il valore minimo (∆ = 0) quando tutte le modalità coincidono: in questo caso le differenze semplici sono nulle A. Iodice La varianza Altri indici di variabilità l’indice ∆ assume il valore massimo quando tutte le modalità tranne una sono nulle: in tal caso si ha che ∆ = 2µ Mutua variabilità Esercizio sulla variabilità Dunque ∆ assume valore nell’intervallo [0, 2µ]: è possibile ottenere una versione normalizzata: R= ∆ 2µ tale indice viene denominato rapporto di concentrazione di Gini A. Iodice () Esercitazione 4 Statistica 13 / 21 Esercizio Esercitazione 4 Si consideri un campione di n = 100 sportelli bancari e sia X : numero di operazioni effettuate presso uno sportello nell’ultima settimana. A. Iodice X [60, 62] [63, 65] [66, 68] [69, 71] [72, 74] La varianza Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità Freq (ni ) 5 18 42 27 8 100 Quesiti Calcolare un indice di tendenza centrale (media) Misurare la variabilità rispetto ad un centro (scostamento medio semplice e scarto quadratico medio) Misurare la mutua variabilità A. Iodice () Esercitazione 4 Statistica 14 / 21 Esercizio: svolgimento Esercitazione 4 Quesito 1 Calcolare un indice di tendenza centrale (media) A. Iodice La varianza Altri indici di variabilità Calcolo della media aritmetica Per calcolare la media aritmetica bisogna individuare i centri di ciascuna classe e tenere conto delle frequenze. Ricordando la formula della media aritmetica Mutua variabilità Pk µ= i=1 Esercizio sulla variabilità X [60, 62] [63, 65] [66, 68] [69, 71] [72, 74] Pk µ= A. Iodice () i=1 Freq=ni 5 18 42 27 8 100 ci × ni n = ci × ni n centri=ci 61 64 67 70 73 ci × ni 305 1152 2814 1890 584 6745 305 + 1152 + 2814 + 1890 + 584 Esercitazione 4 100 = 67.45 Statistica 15 / 21 Esercizio: svolgimento Esercitazione 4 Quesito 2 Misurare la variabilità rispetto ad un centro : scostamento medio semplice A. Iodice La varianza Calcolo dello scostamento medio semplice Altri indici di variabilità Per ottenere lo scostamento medio semplice bisogna calcolare il valore assoluto degli scarti dei centri delle classi dalla media e tenere conto delle frequenze. Ricordando la formula dello scostamento medio semplice Mutua variabilità Pk MD = i=1 Esercizio sulla variabilità X [60, 62] [63, 65] [66, 68] [69, 71] [72, 74] Pk MD = A. Iodice () i=1 Freq=ni 5 18 42 27 8 100 | ci − µ | ×ni n = centri=ci 61 64 67 70 73 | ci − µ | ×ni n | ci − µ | 6.45 3.45 0.45 2.55 5.55 | ci − µ | ×ni 32.25 62.10 18.90 68.85 44.40 226.5 32.25 + 62.1 + 18.9 + 68.85 + 44.4 Esercitazione 4 100 = 226.5 100 = 2.265 Statistica 16 / 21 Esercizio: svolgimento Esercitazione 4 Quesito 2 Misurare la variabilità rispetto ad un centro : scarto quadratico medio A. Iodice La varianza Calcolo della varianza Altri indici di variabilità Per ottenere lo scarto quadratico medio, si procede al calcolo della varianza che rappresenta il valore medio dei quadrati degli scarti dalla media aritmetica: bisogna calcolare i quadrati degli scarti dei centri delle classi dalla media e tenere conto delle frequenze. Ricordando la formula della varianza Pk 2 2 i=1 (ci − µ) × ni s = n Mutua variabilità Esercizio sulla variabilità X [60, 62] [63, 65] [66, 68] [69, 71] [72, 74] 2 s = Freq=ni 5 18 42 27 8 centri=ci 61 64 67 70 73 100 (ci − µ)2 41.60 11.90 0.20 6.50 30.80 (ci − µ)2 × ni 208.0125 214.245 8.505 175.5675 246.42 852.75 208.0125 + 214.245 + 8.505 + 175.5675 + 246.42 100 = 852.75 100 = 8.5275 √ da cui lo scarto quadratico medio s = 8.5275 = 2.92 A. Iodice () Esercitazione 4 Statistica 17 / 21 Esercizio: svolgimento Esercitazione 4 Quesito 2 Misurare la variabilità rispetto ad un centro : scarto quadratico medio A. Iodice La varianza Calcolo della varianza Altri indici di variabilità Ripetendo il calcolo utilizzando la formula alternativa per il calcolo della varianza Mutua variabilità s 2 Pk = i=1 c2 i × ni N Pk i=1 − ci × ni !2 N Pk i=1 = c2 i × ni N 2 − (µ) Esercizio sulla variabilità X [60, 62] [63, 65] [66, 68] [69, 71] [72, 74] s 2 Pk = i=1 c2 i × ni N Freq=ni 5 18 42 27 8 100 Pk − i=1 ci N da cui lo scarto quadratico medio s = A. Iodice () !2 = centri=ci 61 64 67 70 73 455803 100 „ − c2 i 3721 4096 4489 4900 5329 6745 100 c2 i × ni 18605 73728 188538 132300 42632 455803 «2 = 4558.03 − 4549.503 = 8.5275 √ 8.5275 = 2.92 Esercitazione 4 Statistica 18 / 21 Esercizio: svolgimento Esercitazione 4 A. Iodice Quesito 3 Misurare la mutua variabilità : differenza media semplice La varianza Altri indici di variabilità Mutua variabilità Calcolo della mutua variabilità La differenza media semplice corrisponde al valore medio delle differenze tra le possibili coppie di modalità. PN Esercizio sulla variabilità ∆= i6=j=1 |xi − xj | N (N − 1) la quantità al denominatore (N (N − 1)) rappresenta il numero di possibili coppie di n osservazioni. Nel caso di intervalli di valori e di distribuzione di frequenze si fa riferimento ai centri delle classi ci e alle frequenze. La formula da utilizzare è la seguente Pk ∆= A. Iodice () i6=j=1 |xi − xj | × ni × nj N (N − 1) Esercitazione 4 Statistica 19 / 21 Esercizio: svolgimento Esercitazione 4 Quesito 3 Misurare la mutua variabilità : differenza media semplice A. Iodice La varianza Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità X [60, 62] [63, 65] [66, 68] [69, 71] [72, 74] A. Iodice () Freq=ni 5 18 42 27 8 100 centri=ci 61 64 67 70 73 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Esercitazione 4 | ci − cj | 3 6 9 12 3 3 6 9 6 3 3 6 9 6 3 3 12 9 6 3 ni × nj 90 210 135 40 90 756 486 144 210 756 1134 336 135 486 1134 216 40 144 336 216 | ci − cj | ×ni × nj 270 1260 1215 480 270 2268 2916 1296 1260 2268 3402 2016 1215 2916 3402 648 480 1296 2016 648 31542 Statistica 20 / 21 Esercizio: svolgimento Esercitazione 4 Quesito 3 A. Iodice Misurare la mutua variabilità : differenza media semplice metodo rapido. La varianza ci − cj 3 6 9 12 3 6 9 3 6 3 Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità ci /cj 61 64 67 70 73 61 25 90 210 135 40 64 90 324 756 486 144 2× ∆= = A. Iodice () 67 210 756 1764 1134 336 70 135 486 1134 729 216 Pk−1 Pk i=1 73 40 144 336 216 64 j=(i+1) |xi − xj | × ni × nj N (N − 1) = (3 × 90) + (6 × 210) + (9 × 135) + . . . + (3 × 216) 100 × 99 Esercitazione 4 ni × nj 90 210 135 40 756 486 144 1134 336 216 = 3.186 Statistica 21 / 21