Esercitazione 3 A. Iodice La variabilità Esercitazione 3 variabilità per variabili qualitative Statistica Indici di eterogeneità La varianza Alfonso Iodice D’Enza [email protected] Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità Università degli studi di Cassino A. Iodice () Esercitazione 3 Statistica 1 / 31 Outline Esercitazione 3 A. Iodice 1 La variabilità La variabilità variabilità per variabili qualitative Indici di eterogeneità La varianza Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità A. Iodice () Esercitazione 3 Statistica 2 / 31 Outline Esercitazione 3 A. Iodice 1 La variabilità 2 variabilità per variabili qualitative La variabilità variabilità per variabili qualitative Indici di eterogeneità La varianza Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità A. Iodice () Esercitazione 3 Statistica 2 / 31 Outline Esercitazione 3 A. Iodice 1 La variabilità 2 variabilità per variabili qualitative 3 Indici di eterogeneità La variabilità variabilità per variabili qualitative Indici di eterogeneità La varianza Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità A. Iodice () Esercitazione 3 Statistica 2 / 31 Outline Esercitazione 3 A. Iodice 1 La variabilità 2 variabilità per variabili qualitative 3 Indici di eterogeneità 4 La varianza La variabilità variabilità per variabili qualitative Indici di eterogeneità La varianza Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità A. Iodice () Esercitazione 3 Statistica 2 / 31 Outline Esercitazione 3 A. Iodice 1 La variabilità 2 variabilità per variabili qualitative 3 Indici di eterogeneità 4 La varianza 5 Altri indici di variabilità La variabilità variabilità per variabili qualitative Indici di eterogeneità La varianza Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità A. Iodice () Esercitazione 3 Statistica 2 / 31 Outline Esercitazione 3 A. Iodice 1 La variabilità 2 variabilità per variabili qualitative 3 Indici di eterogeneità 4 La varianza 5 Altri indici di variabilità 6 Mutua variabilità La variabilità variabilità per variabili qualitative Indici di eterogeneità La varianza Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità A. Iodice () Esercitazione 3 Statistica 2 / 31 Outline Esercitazione 3 A. Iodice 1 La variabilità 2 variabilità per variabili qualitative 3 Indici di eterogeneità 4 La varianza 5 Altri indici di variabilità 6 Mutua variabilità 7 Esercizio sulla variabilità La variabilità variabilità per variabili qualitative Indici di eterogeneità La varianza Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità A. Iodice () Esercitazione 3 Statistica 2 / 31 Il concetto di variabilità Esercitazione 3 A. Iodice La variabilità variabilità per variabili qualitative La variabilità si definisce come l’attitudine di un fenomeno ad assumere modalità differenti. La variabilità può essere misurata in diversi modi: Indici di eterogeneità La varianza Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità A. Iodice () Esercitazione 3 Statistica 3 / 31 Il concetto di variabilità Esercitazione 3 A. Iodice La variabilità variabilità per variabili qualitative La variabilità si definisce come l’attitudine di un fenomeno ad assumere modalità differenti. La variabilità può essere misurata in diversi modi: variabilità delle singole modalità x1 , x2 , . . . , xn rispetto ad un indice di posizione Indici di eterogeneità La varianza mutua variabilità Altri indici di variabilità variabilità delle modalità x1 , x2 , . . . , xn ordinate in modo crescente (usando la f. di ripartizione) Mutua variabilità variabilità delle frequenze relative (applicabile anche a mutabili) Esercizio sulla variabilità A. Iodice () Esercitazione 3 Statistica 3 / 31 Requisiti per indici di variabilità Esercitazione 3 A. Iodice La variabilità variabilità per variabili qualitative Un indice per la misura della variabilità deve avere le seguenti caratteristiche Indici di eterogeneità La varianza Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità A. Iodice () Esercitazione 3 Statistica 4 / 31 Requisiti per indici di variabilità Esercitazione 3 A. Iodice La variabilità variabilità per variabili qualitative Un indice per la misura della variabilità deve avere le seguenti caratteristiche un indice di variabilità deve assumere valori maggiori o uguali a 0 Indici di eterogeneità La varianza Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità A. Iodice () Esercitazione 3 Statistica 4 / 31 Requisiti per indici di variabilità Esercitazione 3 A. Iodice La variabilità variabilità per variabili qualitative Un indice per la misura della variabilità deve avere le seguenti caratteristiche un indice di variabilità deve assumere valori maggiori o uguali a 0 Indici di eterogeneità La varianza un indice di variabilità calcolato su una distribuzione di costanti ugulae a 0 Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità A. Iodice () Esercitazione 3 Statistica 4 / 31 Requisiti per indici di variabilità Esercitazione 3 A. Iodice La variabilità variabilità per variabili qualitative Un indice per la misura della variabilità deve avere le seguenti caratteristiche un indice di variabilità deve assumere valori maggiori o uguali a 0 Indici di eterogeneità La varianza un indice di variabilità calcolato su una distribuzione di costanti ugulae a 0 Altri indici di variabilità aggiungendo una costante alla variabile osservata, il valore dell’indice non deve cambiare Mutua variabilità Esercizio sulla variabilità A. Iodice () Esercitazione 3 Statistica 4 / 31 Il concetto di mutabilità Esercitazione 3 A. Iodice La variabilità variabilità per variabili qualitative In caso di variabili qualitative la variabilità del carattere espressa in termini di mutabilità, definita come l’attitudine di un carattere ad assumere differenti modalità qualitative. Indici di eterogeneità La varianza Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità A. Iodice () Esercitazione 3 Statistica 5 / 31 Il concetto di mutabilità Esercitazione 3 A. Iodice La variabilità variabilità per variabili qualitative In caso di variabili qualitative la variabilità del carattere espressa in termini di mutabilità, definita come l’attitudine di un carattere ad assumere differenti modalità qualitative. perfetta omogeneità: tutte le unità statistiche assumono la stessa modalità del carattere qualitativo Indici di eterogeneità La varianza massima disomogeneità: le modalità del carattere hanno tutte la stessa frequenza assoluta (relativa) Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità A. Iodice () Esercitazione 3 Statistica 5 / 31 Il concetto di mutabilità Esercitazione 3 A. Iodice La variabilità variabilità per variabili qualitative In caso di variabili qualitative la variabilità del carattere espressa in termini di mutabilità, definita come l’attitudine di un carattere ad assumere differenti modalità qualitative. perfetta omogeneità: tutte le unità statistiche assumono la stessa modalità del carattere qualitativo Indici di eterogeneità La varianza massima disomogeneità: le modalità del carattere hanno tutte la stessa frequenza assoluta (relativa) Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità Le situazioni intermedie sono caratterizzate da un diverso grado di eterogeneità. A. Iodice () Esercitazione 3 Statistica 5 / 31 eterogeneità Esercitazione 3 A. Iodice La variabilità variabilità per variabili qualitative L’eterogeneità misura la variabilità delle frequenze relative (f1 , f2 , . . . , fk ) delle k modalità del carattere. Indici di eterogeneità La varianza Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità A. Iodice () Esercitazione 3 Statistica 6 / 31 eterogeneità Esercitazione 3 A. Iodice La variabilità variabilità per variabili qualitative L’eterogeneità misura la variabilità delle frequenze relative (f1 , f2 , . . . , fk ) delle k modalità del carattere. minima eterogeneità: si manifesta una sola modalità j la cui frequenza relativa fj = 1: un indice di eterogeneità deve avere valore 0 in questo caso Indici di eterogeneità La varianza Altri indici di variabilità massima eterogeneità: Le frequenze relative sono tutte uguali: fi = k1 , con i = 1, . . . , k e k numero di modalità del carattere Mutua variabilità Esercizio sulla variabilità A. Iodice () Esercitazione 3 Statistica 6 / 31 Indici di eterogeneità: l’indice di Gini (G) Esercitazione 3 A. Iodice La variabilità L’indice per la misura della eterogeneità proposto da Gini dato da k X G=1− fi2 variabilità per variabili qualitative i=1 Indici di eterogeneità La varianza Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità A. Iodice () Esercitazione 3 Statistica 7 / 31 Indici di eterogeneità: l’indice di Gini (G) Esercitazione 3 A. Iodice La variabilità L’indice per la misura della eterogeneità proposto da Gini dato da k X G=1− fi2 variabilità per variabili qualitative i=1 Indici di eterogeneità in caso di minima eterogeneità, G = 0 La varianza in caso di massima eterogeneità l’indice assume valore G = 1 − k1 Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità A. Iodice () Esercitazione 3 Statistica 7 / 31 Indici di eterogeneità: l’indice di Gini (G) Esercitazione 3 A. Iodice La variabilità L’indice per la misura della eterogeneità proposto da Gini dato da k X G=1− fi2 variabilità per variabili qualitative i=1 Indici di eterogeneità in caso di minima eterogeneità, G = 0 La varianza in caso di massima eterogeneità l’indice assume valore G = 1 − k1 Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità Avendo definito il valore massimo dell’indice, possibile ottenerne la versione normalizzata G∗ G∗ = A. Iodice () Esercitazione 3 k×G k−1 Statistica 7 / 31 Esempio di applicazione dell’indice di Gini (G) Esercitazione 3 A. Iodice La variabilità variabilità per variabili qualitative Una nuova azienda informatica immette sul mercato una gamma di prodotti. Dopo i primi sei mesi la vendita dei prodotti risulta ripartita tra le varie categorie secondo la seguente distribuzione di frequenze: Indici di eterogeneità La varianza Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità A. Iodice () Esercitazione 3 Statistica 8 / 31 Esempio di applicazione dell’indice di Gini (G) Esercitazione 3 A. Iodice La variabilità variabilità per variabili qualitative Una nuova azienda informatica immette sul mercato una gamma di prodotti. Dopo i primi sei mesi la vendita dei prodotti risulta ripartita tra le varie categorie secondo la seguente distribuzione di frequenze: Indici di eterogeneità La varianza Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità La colonna promo riguarda le frequenze delle vendite per categoria di prodotto dopo una politica di promozioni sui diversi prodotti A. Iodice () Esercitazione 3 Statistica 8 / 31 Esempio di applicazione dell’indice di Gini (G) Esercitazione 3 A. Iodice La variabilità variabilità per variabili qualitative Indici di eterogeneità La varianza Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità A. Iodice () Esercitazione 3 Statistica 9 / 31 Esempio di applicazione dell’indice di Gini (G) Esercitazione 3 A. Iodice G=1− La variabilità variabilità per variabili qualitative k X fi2 = 1 − [(0.2094)2 + i=1 + (0.3535)2 + (0.1337)2 + Indici di eterogeneità + (0.1071)2 + (0.1964)2 ] = La varianza = 1 − 0.2357 = 0.7633 Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità A. Iodice () Esercitazione 3 Statistica 9 / 31 Esempio di applicazione dell’indice di Gini (G) Esercitazione 3 A. Iodice G=1− La variabilità variabilità per variabili qualitative k X fi2 = 1 − [(0.2094)2 + i=1 + (0.3535)2 + (0.1337)2 + Indici di eterogeneità + (0.1071)2 + (0.1964)2 ] = La varianza = 1 − 0.2357 = 0.7633 Altri indici di variabilità Mutua variabilità l’indice in versione normalizzata G∗ dato da G∗ = Esercizio sulla variabilità A. Iodice () k×G 5 × 0.7633 = = 3.8165/4 = 0.9541 k−1 5−1 Esercitazione 3 Statistica 9 / 31 Esempio di applicazione dell’indice di Gini (G) Esercitazione 3 A. Iodice La variabilità variabilità per variabili qualitative Indici di eterogeneità La varianza Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità A. Iodice () Esercitazione 3 Statistica 10 / 31 Esempio di applicazione dell’indice di Gini (G) Esercitazione 3 A. Iodice Gpromo = 1 − La variabilità k X fi2 = 1 − [(0.3045)2 + i=1 + (0.1824)2 + (0.0074)2 + variabilità per variabili qualitative + (0.3281)2 + (0.1777)2 ] = Indici di eterogeneità = 1 − 0.2652 = 0.7348 La varianza Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità A. Iodice () Esercitazione 3 Statistica 10 / 31 Esempio di applicazione dell’indice di Gini (G) Esercitazione 3 A. Iodice Gpromo = 1 − La variabilità k X fi2 = 1 − [(0.3045)2 + i=1 + (0.1824)2 + (0.0074)2 + variabilità per variabili qualitative + (0.3281)2 + (0.1777)2 ] = Indici di eterogeneità = 1 − 0.2652 = 0.7348 La varianza Altri indici di variabilità l’indice in versione normalizzata G∗ dato da Mutua variabilità G∗promo = Esercizio sulla variabilità k×G 5 × 0.7348 = = 3.6738/4 = 0.9185 k−1 5−1 Risultando essere G > Gpromo si pu concludere che la politica di promozioni ha fatto diminuire l’eterogeneità (aumentare l’omogeneità) delle vendite nelle diverse categorie di prodotti A. Iodice () Esercitazione 3 Statistica 10 / 31 Indice di dispersione per variabili qualitative ordinate ordinate Esercitazione 3 A. Iodice La variabilità variabilità per variabili qualitative Indici di eterogeneità In caso di variabili qualitative con modalità ordinabili è possibile calcolare l’eterogeneità attraverso l’indice di Gini. In questo modo tuttavia non si tiene conto della relazione d’ordine che sussiste tra le modalità delle variabili. L’indice D L’indice D per il calcolo della dispersione in variabili qualitative ordinali si basa sulle frequenze cumulate Fj e retrocumulate RFj , con j = 1, . . . , k, dove k è il numero di modalità della variabile. Ricordando che la frequenza relativa cumulata Fj della j-esima modalità è data da: Fj = f1 + f2 + . . . + fj La varianza Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità e che la frequenza relativa retrocumulata RFj della j-esima delle K modalità del carattere è data da RFj = fj + fj+1 + . . . + fK ; L’indice D è il seguente: D= k X [Fj (1 − Fj ) + RFj (1 − RFj )] j=1 A. Iodice () Esercitazione 3 Statistica 11 / 31 Indice di dispersione per variabili qualitative ordinate ordinate Esercitazione 3 A. Iodice Esempio di calcolo dell’indice D t.studio analf abeta lic.elementare lic.media diploma laurea tot La variabilità variabilità per variabili qualitative Indici di eterogeneità absF reqs 5 5 3 3 4 20 relF reqs 0.25 0.25 0.15 0.15 0.2 1.00 Fj 0.25 0.50 0.65 0.80 1.00 RFj 1.00 0.75 0.50 0.35 0.20 La varianza Altri indici di variabilità Mutua variabilità D= k X [Fj (1 − Fj ) + RFj (1 − RFj )] = j=1 Esercizio sulla variabilità = [0.25(1 − 0.25) + 1(1 − 1)] + [0.5(1 − 0.5) + 0.75(1 − 0.75)] + + [0.65(1 − 0.65) + 0.5(1 − 0.5)] + [0.8(1 − 0.8) + 0.35(1 − 0.35)] + + [1(1 − 1) + 0.2(1 − 0.2)] = 1.65 A. Iodice () Esercitazione 3 Statistica 12 / 31 Definizione di varianza Esercitazione 3 A. Iodice La variabilità variabilità per variabili qualitative La varianza un’indice che misura la variabilità di una variabile X rispetto alla media aritmetica. In particolare la varianza σ 2 data dalla media dei quadrati degli scarti (delle modalità dalla media) Indici di eterogeneità La varianza Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità A. Iodice () Esercitazione 3 Statistica 13 / 31 Definizione di varianza Esercitazione 3 A. Iodice La variabilità variabilità per variabili qualitative La varianza un’indice che misura la variabilità di una variabile X rispetto alla media aritmetica. In particolare la varianza σ 2 data dalla media dei quadrati degli scarti (delle modalità dalla media) (x1 − µ)2 + (x2 − µ)2 + . . . + (xn − µ)2 = n n 1X = (xi − µ)2 n σ2 = Indici di eterogeneità La varianza Altri indici di variabilità i=1 Mutua variabilità Esercizio sulla variabilità A. Iodice () Esercitazione 3 Statistica 13 / 31 Definizione di varianza Esercitazione 3 A. Iodice La variabilità variabilità per variabili qualitative La varianza un’indice che misura la variabilità di una variabile X rispetto alla media aritmetica. In particolare la varianza σ 2 data dalla media dei quadrati degli scarti (delle modalità dalla media) (x1 − µ)2 + (x2 − µ)2 + . . . + (xn − µ)2 = n n 1X = (xi − µ)2 n σ2 = Indici di eterogeneità La varianza Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità i=1 per dati organizzati in frequenze (seriazione) (x1 − µ)2 × n1 + (x2 − µ)2 × n2 + . . . + (xk − µ)2 × nk = n1 + n2 + . . . + nk k 1X = (xi − µ)2 × ni n σ2 = i=1 A. Iodice () Esercitazione 3 Statistica 13 / 31 Esempio di calcolo della varianza Esercitazione 3 A. Iodice Data la variabile X : numero di esami sostenuti prima di quello di statistica osservata su un collettivo di n = 6 studenti La variabilità variabilità per variabili qualitative Indici di eterogeneità La varianza Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità A. Iodice () Esercitazione 3 Statistica 14 / 31 Esempio di calcolo della varianza Esercitazione 3 A. Iodice Data la variabile X : numero di esami sostenuti prima di quello di statistica osservata su un collettivo di n = 6 studenti La variabilità variabilità per variabili qualitative Indici di eterogeneità La varianza Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità A. Iodice () Esercitazione 3 Statistica 14 / 31 Esempio di calcolo della varianza Esercitazione 3 A. Iodice Data la variabile X : numero di esami sostenuti prima di quello di statistica osservata su un collettivo di n = 6 studenti La variabilità variabilità per variabili qualitative Indici di eterogeneità La varianza Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità La varianza sar dunque n 1X 50.8333 2 σ = (xi − µ)2 = = 8.4722 n 6 i=1 A. Iodice () Esercitazione 3 Statistica 14 / 31 Massima variabilità Esercitazione 3 A. Iodice La variabilità variabilità per variabili qualitative Indici di eterogeneità La varianza Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità A. Iodice () Esercitazione 3 Statistica 15 / 31 Massima variabilità Esercitazione 3 La varianza può crescere indefinitamente perchè gli scarti delle modalità dalla media possono essere illimitatamente grandi A. Iodice La variabilità variabilità per variabili qualitative Indici di eterogeneità La varianza Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità A. Iodice () Esercitazione 3 Statistica 15 / 31 Massima variabilità Esercitazione 3 La varianza può crescere indefinitamente perchè gli scarti delle modalità dalla media possono essere illimitatamente grandi La situazione di massima variabilità per un collettivo con media µ, si ha quando su n modalità, n − 1 sono nulle ed 0 una sola modalità x6= i = nµ A. Iodice La variabilità variabilità per variabili qualitative Indici di eterogeneità n σ2 ≤ La varianza Altri indici di variabilità 1X 1 (xi − µ)2 = ((n − 1)(0 − µ)2 + (nµ − µ)2 ) = n n i=1 1 = ((n − 1)µ2 + µ2 (n − 1)2 ) = n 1 = ((n − 1)µ2 + µ2 (n2 + 1 − 2n)) = n 1 = (µ2 n(n − 1)) = µ2 (n − 1) n Mutua variabilità Esercizio sulla variabilità A. Iodice () Esercitazione 3 Statistica 15 / 31 Le proprietà della varianza Esercitazione 3 A. Iodice La variabilità variabilità per variabili qualitative La varianza gode di alcune importanti propriet di seguito riportate: Indici di eterogeneità La varianza Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità A. Iodice () Esercitazione 3 Statistica 16 / 31 Le proprietà della varianza Esercitazione 3 A. Iodice La variabilità variabilità per variabili qualitative Indici di eterogeneità La varianza La varianza gode di alcune importanti propriet di seguito riportate: 1 La varianza di X sempre un numero non negativo (≥ 0) 2 La varianza di X pari a 0 se e solo se X una costante 3 Se alla variabile X si aggiunge una costante, σx non cambia 4 Se si moltiplica la variabile X per una costante b, si avr σx∗ = b2 σx2 Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità A. Iodice () Esercitazione 3 Statistica 16 / 31 Le proprietà della varianza Esercitazione 3 A. Iodice La variabilità variabilità per variabili qualitative Indici di eterogeneità La varianza Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità Le propriet 3 e 4 dipendono dalla propriet di linearit della media aritmetica: si consideri Y = a + bX, con a e b costanti. Dalla propriet risulta che µy = a + bµx . Calcolando la varianza di Y si avr: n σy2 1X (yi − µy )2 = = n 1=1 n n 1X 1X 2 = (yi − (a + bµx )) = (a + bxi − a − bµx )2 = n n 1=1 1=1 n n 1X 2 1X 2 (bxi − bµx ) = b (xi − µx )2 = = n n = b2 A. Iodice () 1=1 n X 1 n 1=1 (xi − µx )2 = b2 σx2 i=1 Esercitazione 3 Statistica 17 / 31 Lo scarto quadratico medio (standard deviation) Esercitazione 3 A. Iodice La variabilità variabilità per variabili qualitative Una difficoltà di interpretazione della varianza dipende dal fatto che tale indice espresso nell’unità di misura al quadrato della variabile cui si riferisce. Per ovviare a questo problema si utilizza lo scarto quadratico medio σ, dato da Indici di eterogeneità La varianza Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità A. Iodice () Esercitazione 3 Statistica 18 / 31 Lo scarto quadratico medio (standard deviation) Esercitazione 3 A. Iodice La variabilità variabilità per variabili qualitative Indici di eterogeneità La varianza Una difficoltà di interpretazione della varianza dipende dal fatto che tale indice espresso nell’unità di misura al quadrato della variabile cui si riferisce. Per ovviare a questo problema si utilizza lo scarto quadratico medio σ, dato da v u n u1 X σ=t (xi − µ)2 n i=1 Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità A. Iodice () Esercitazione 3 Statistica 18 / 31 Lo scarto quadratico medio (standard deviation) Esercitazione 3 A. Iodice La variabilità variabilità per variabili qualitative Indici di eterogeneità La varianza Una difficoltà di interpretazione della varianza dipende dal fatto che tale indice espresso nell’unità di misura al quadrato della variabile cui si riferisce. Per ovviare a questo problema si utilizza lo scarto quadratico medio σ, dato da v u n u1 X σ=t (xi − µ)2 n i=1 Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità dall’esempio precedente risulta dunque r 50.8333 σ= = 2.9107 6 A. Iodice () Esercitazione 3 Statistica 18 / 31 Il coefficiente di variazione (CV Esercitazione 3 A. Iodice La variabilità variabilità per variabili qualitative La varianza è un indice assoluto, dipende quindi dall’unità di misura della variabile. Un indice relativo di variabilità è il coefficiente di variazione CV . E’ dato da CV = Indici di eterogeneità La varianza Altri indici di variabilità σ µ essendo un numero puro consente il confronto fra fenomeni rilevati in momenti diversi o espressi in unità di misura diverse Mutua variabilità Esercizio sulla variabilità A. Iodice () Esercitazione 3 Statistica 19 / 31 Il coefficiente di variazione (CV Esercitazione 3 A. Iodice La variabilità variabilità per variabili qualitative La varianza è un indice assoluto, dipende quindi dall’unità di misura della variabile. Un indice relativo di variabilità è il coefficiente di variazione CV . E’ dato da CV = Indici di eterogeneità La varianza Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità σ µ essendo un numero puro consente il confronto fra fenomeni rilevati in momenti diversi o espressi in unità di misura diverse Limiti di utilizzo del CV è defnito solo se µ > 0 se µ → 0 il CV tende a diventare molto grande A. Iodice () Esercitazione 3 Statistica 19 / 31 Variabilità e modalità ordinate Esercitazione 3 A. Iodice La variabilità variabilità per variabili qualitative In caso di variabili con modalità ordinabili è possibile definire degli indici di variabilità derivati dalla funzione di ripartizione empirica. Data la distribuzione unitaria ordinata di modalità Indici di eterogeneità {1, 5, 7, 13, 14, 15, 18, 18, 22, 23, 24, 25, 27, 28, 29} La varianza Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità A. Iodice () Esercitazione 3 Statistica 20 / 31 Variabilità e modalità ordinate Esercitazione 3 A. Iodice La variabilità variabilità per variabili qualitative In caso di variabili con modalità ordinabili è possibile definire degli indici di variabilità derivati dalla funzione di ripartizione empirica. Data la distribuzione unitaria ordinata di modalità Indici di eterogeneità {1, 5, 7, 13, 14, 15, 18, 18, 22, 23, 24, 25, 27, 28, 29} La varianza Altri indici di variabilità il range (o campo di variazione) è dato da R(X) = max(xi ) − min(xi = 29 − 1 = 27 Mutua variabilità il range inter-quartile (o campo di variazione interquartile) è dato da IQR(X) = Q3 − Q1 = 25 − 13 = 12 Esercizio sulla variabilità A. Iodice () Esercitazione 3 Statistica 20 / 31 Variabilità e modalità ordinate Esercitazione 3 A. Iodice La variabilità variabilità per variabili qualitative In caso di variabili con modalità ordinabili è possibile definire degli indici di variabilità derivati dalla funzione di ripartizione empirica. Data la distribuzione unitaria ordinata di modalità Indici di eterogeneità {1, 5, 7, 13, 14, 15, 18, 18, 22, 23, 24, 25, 27, 28, 29} La varianza Altri indici di variabilità il range (o campo di variazione) è dato da R(X) = max(xi ) − min(xi = 29 − 1 = 27 Mutua variabilità il range inter-quartile (o campo di variazione interquartile) è dato da IQR(X) = Q3 − Q1 = 25 − 13 = 12 Esercizio sulla variabilità A. Iodice () Esercitazione 3 Statistica 20 / 31 Mutua variabilità Esercitazione 3 A. Iodice La variabilità variabilità per variabili qualitative In presenza di caratteri trasferibili (reddito, risorde energetiche, consumo di beni) è di maggior interesse lo studio della variabilità tra le singole unità statistiche piuttosto che la variabilità rispetto a un centro. Indici di eterogeneità La varianza Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità A. Iodice () Esercitazione 3 Statistica 21 / 31 Mutua variabilità Esercitazione 3 A. Iodice La variabilità variabilità per variabili qualitative Indici di eterogeneità La varianza Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità In presenza di caratteri trasferibili (reddito, risorde energetiche, consumo di beni) è di maggior interesse lo studio della variabilità tra le singole unità statistiche piuttosto che la variabilità rispetto a un centro. Differenza media semplice tale indice rappresenta la media dei valori assoluti delle differenze calcolate rispetto a tutte le possibili coppie di modalità. Esso corrisponde a Pn i6=j=1 |xi − xj | ∆= n(n − 1) la quantità al denominatore (n(n − 1)) rappresenta il numero di possibili coppie di n osservazioni. A. Iodice () Esercitazione 3 Statistica 21 / 31 Mutua variabilità Esercitazione 3 Dato un carattere X osservato su n = 4 osservazioni A. Iodice {7, 14, 18, 24} La variabilità variabilità per variabili qualitative Indici di eterogeneità La varianza Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità A. Iodice () Esercitazione 3 Statistica 22 / 31 Mutua variabilità Esercitazione 3 Dato un carattere X osservato su n = 4 osservazioni A. Iodice {7, 14, 18, 24} La variabilità variabilità per variabili qualitative Indici di eterogeneità La varianza Altri indici di variabilità Mutua variabilità Esercizio sulla variabilità Differenza media semplice Il valore di ∆ sarà in questo caso |7 − 14| + |7 − 18| + |7 − 24| + |14 − 7|+ 12 +|14 − 18| + |14 − 24| + |18 − 7| + |18 − 14| + |18 − 24|+ 12 +|24 − 7| + |24 − 14| + |24 − 18| = 12 110 = = 9.1667 12 ∆= A. Iodice () Esercitazione 3 Statistica 22 / 31 mutua variabilità: minimo e massimo Esercitazione 3 l’indice ∆ assume il valore minimo (∆ = 0) quando tutte le modalità coincidono: in questo caso le differenze semplici sono nulle A. Iodice La variabilità variabilità per variabili qualitative l’indice ∆ assume il valore massimo quando tutte le modalità tranne una sono nulle: in tal caso si ha che ∆ = 2µ Indici di eterogeneità La varianza Altri indici di variabilità Mutua variabilità Dunque ∆ assume valore nell’intervallo [0, 2µ]: è possibile ottenere una versione normalizzata: Esercizio sulla variabilità R= ∆ 2µ tale indice viene denominato rapporto di concentrazione di Gini A. Iodice () Esercitazione 3 Statistica 23 / 31 Esercizio Esercitazione 3 Si consideri un campione di n = 100 sportelli bancari e sia X : numero di operazioni effettuate presso uno sportello nell’ultima settimana. A. Iodice X [60, 62] [63, 65] [66, 68] [69, 71] [72, 74] La variabilità variabilità per variabili qualitative Indici di eterogeneità La varianza Freq (ni ) 5 18 42 27 8 100 Altri indici di variabilità Mutua variabilità Quesiti Calcolare un indice di tendenza centrale (media) Esercizio sulla variabilità Misurare la variabilità rispetto ad un centro (scostamento medio semplice e scarto quadratico medio) Misurare la mutua variabilità A. Iodice () Esercitazione 3 Statistica 24 / 31 Esercizio: svolgimento Esercitazione 3 Quesito 1 Calcolare un indice di tendenza centrale (media) A. Iodice La variabilità variabilità per variabili qualitative Calcolo della media aritmetica Per calcolare la media aritmetica bisogna individuare i centri di ciascuna classe e tenere conto delle frequenze. Ricordando la formula della media aritmetica Indici di eterogeneità Pk µ= i=1 ci × ni n La varianza Altri indici di variabilità X [60, 62] [63, 65] [66, 68] [69, 71] [72, 74] Mutua variabilità Esercizio sulla variabilità Pk µ= A. Iodice () i=1 Freq=ni 5 18 42 27 8 100 ci × ni n = centri=ci 61 64 67 70 73 ci × ni 305 1152 2814 1890 584 6745 305 + 1152 + 2814 + 1890 + 584 Esercitazione 3 100 = 67.45 Statistica 25 / 31 Esercizio: svolgimento Esercitazione 3 Quesito 2 Misurare la variabilità rispetto ad un centro : scostamento medio semplice A. Iodice La variabilità Calcolo dello scostamento medio semplice variabilità per variabili qualitative Per ottenere lo scostamento medio semplice bisogna calcolare il valore assoluto degli scarti dei centri delle classi dalla media e tenere conto delle frequenze. Ricordando la formula dello scostamento medio semplice Pk Indici di eterogeneità MD = i=1 | ci − µ | ×ni n La varianza Altri indici di variabilità X [60, 62] [63, 65] [66, 68] [69, 71] [72, 74] Mutua variabilità Esercizio sulla variabilità Pk MD = A. Iodice () i=1 Freq=ni 5 18 42 27 8 100 | ci − µ | ×ni n = centri=ci 61 64 67 70 73 | ci − µ | 6.45 3.45 0.45 2.55 5.55 | ci − µ | ×ni 32.25 62.10 18.90 68.85 44.40 226.5 32.25 + 62.1 + 18.9 + 68.85 + 44.4 Esercitazione 3 100 = 226.5 100 = 2.265 Statistica 26 / 31 Esercizio: svolgimento Esercitazione 3 Quesito 2 Misurare la variabilità rispetto ad un centro : scarto quadratico medio A. Iodice La variabilità Calcolo della varianza variabilità per variabili qualitative Per ottenere lo scarto quadratico medio, si procede al calcolo della varianza che rappresenta il valore medio dei quadrati degli scarti dalla media aritmetica: bisogna calcolare i quadrati degli scarti dei centri delle classi dalla media e tenere conto delle frequenze. Ricordando la formula della varianza Pk 2 2 i=1 (ci − µ) × ni s = n Indici di eterogeneità La varianza Altri indici di variabilità X [60, 62] [63, 65] [66, 68] [69, 71] [72, 74] Mutua variabilità Esercizio sulla variabilità 2 s = Freq=ni 5 18 42 27 8 centri=ci 61 64 67 70 73 100 (ci − µ)2 41.60 11.90 0.20 6.50 30.80 (ci − µ)2 × ni 208.0125 214.245 8.505 175.5675 246.42 852.75 208.0125 + 214.245 + 8.505 + 175.5675 + 246.42 100 = 852.75 100 = 8.5275 √ da cui lo scarto quadratico medio s = 8.5275 = 2.92 A. Iodice () Esercitazione 3 Statistica 27 / 31 Esercizio: svolgimento Esercitazione 3 Quesito 2 Misurare la variabilità rispetto ad un centro : scarto quadratico medio A. Iodice La variabilità Calcolo della varianza variabilità per variabili qualitative Ripetendo il calcolo utilizzando la formula alternativa per il calcolo della varianza s Indici di eterogeneità 2 Pk = i=1 c2 i × ni N Pk i=1 − ci × ni !2 N Pk i=1 = c2 i × ni N 2 − (µ) La varianza Altri indici di variabilità X [60, 62] [63, 65] [66, 68] [69, 71] [72, 74] Mutua variabilità Esercizio sulla variabilità s 2 Pk = i=1 c2 i × ni N Freq=ni 5 18 42 27 8 100 Pk − i=1 ci N da cui lo scarto quadratico medio s = A. Iodice () !2 = centri=ci 61 64 67 70 73 455803 100 − c2 i 3721 4096 4489 4900 5329 6745 100 c2 i × ni 18605 73728 188538 132300 42632 455803 2 = 4558.03 − 4549.503 = 8.5275 √ 8.5275 = 2.92 Esercitazione 3 Statistica 28 / 31 Esercizio: svolgimento Esercitazione 3 A. Iodice Quesito 3 Misurare la mutua variabilità : differenza media semplice La variabilità variabilità per variabili qualitative Calcolo della mutua variabilità La differenza media semplice corrisponde al valore medio delle differenze tra le possibili coppie di modalità. Indici di eterogeneità PN ∆= La varianza Altri indici di variabilità Mutua variabilità i6=j=1 |xi − xj | N (N − 1) la quantità al denominatore (N (N − 1)) rappresenta il numero di possibili coppie di n osservazioni. Nel caso di intervalli di valori e di distribuzione di frequenze si fa riferimento ai centri delle classi ci e alle frequenze. La formula da utilizzare è la seguente Pk Esercizio sulla variabilità ∆= A. Iodice () i6=j=1 |xi − xj | × ni × nj N (N − 1) Esercitazione 3 Statistica 29 / 31 Esercizio: svolgimento Esercitazione 3 Quesito 3 Misurare la mutua variabilità : differenza media semplice A. Iodice La variabilità variabilità per variabili qualitative Indici di eterogeneità La varianza Altri indici di variabilità Mutua variabilità X [60, 62] [63, 65] [66, 68] [69, 71] [72, 74] Esercizio sulla variabilità A. Iodice () Freq=ni 5 18 42 27 8 100 centri=ci 61 64 67 70 73 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Esercitazione 3 | ci − cj | 3 6 9 12 3 3 6 9 6 3 3 6 9 6 3 3 12 9 6 3 ni × nj 90 210 135 40 90 756 486 144 210 756 1134 336 135 486 1134 216 40 144 336 216 | ci − cj | ×ni × nj 270 1260 1215 480 270 2268 2916 1296 1260 2268 3402 2016 1215 2916 3402 648 480 1296 2016 648 31542 Statistica 30 / 31 Esercizio: svolgimento Esercitazione 3 Quesito 3 A. Iodice Misurare la mutua variabilità : differenza media semplice metodo rapido. La variabilità variabilità per variabili qualitative Indici di eterogeneità La varianza ci /cj 61 64 67 70 73 61 25 90 210 135 40 64 90 324 756 486 144 67 210 756 1764 1134 336 70 135 486 1134 729 216 ci − cj 3 6 9 12 3 6 9 3 6 3 73 40 144 336 216 64 Altri indici di variabilità ni × nj 90 210 135 40 756 486 144 1134 336 216 Mutua variabilità Esercizio sulla variabilità 2× ∆= = A. Iodice () Pk−1 Pk i=1 j=(i+1) |xi − xj | × ni × nj N (N − 1) = (3 × 90) + (6 × 210) + (9 × 135) + . . . + (3 × 216) 100 × 99 Esercitazione 3 = 3.186 Statistica 31 / 31