Esercitazione 3 A. Iodice Ancora sugli indici di posizione Esercitazione 3 La variabilità Statistica La varianza Alfonso Iodice D’Enza [email protected] Università degli studi di Cassino A. Iodice () Esercitazione 3 Statistica 1 / 16 Outline Esercitazione 3 A. Iodice Ancora sugli indici di posizione 1 Ancora sugli indici di posizione La variabilità La varianza A. Iodice () Esercitazione 3 Statistica 2 / 16 Outline Esercitazione 3 A. Iodice Ancora sugli indici di posizione 1 Ancora sugli indici di posizione 2 La variabilità La variabilità La varianza A. Iodice () Esercitazione 3 Statistica 2 / 16 Outline Esercitazione 3 A. Iodice Ancora sugli indici di posizione 1 Ancora sugli indici di posizione 2 La variabilità 3 La varianza La variabilità La varianza A. Iodice () Esercitazione 3 Statistica 2 / 16 La media geometrica Esercitazione 3 A. Iodice Ancora sugli indici di posizione La definizione di media geometrica deriva dal criterio di Chisini, definendo f (.) come prodotto delle modalità x1 , x2 , . . . , xn . Ricordando la relazione generale f (x1 , x2 , . . . , xn ) = f (µg , µg , . . . , µg ) La variabilità La varianza in questo caso risulta essere A. Iodice () Esercitazione 3 Statistica 3 / 16 La media geometrica Esercitazione 3 A. Iodice Ancora sugli indici di posizione La definizione di media geometrica deriva dal criterio di Chisini, definendo f (.) come prodotto delle modalità x1 , x2 , . . . , xn . Ricordando la relazione generale f (x1 , x2 , . . . , xn ) = f (µg , µg , . . . , µg ) La variabilità La varianza in questo caso risulta essere n n Y Y (xi ) = (x1 × x2 × . . . × xn ) = (µg ) = µng i=1 A. Iodice () i=1 Esercitazione 3 Statistica 3 / 16 La media geometrica Esercitazione 3 A. Iodice Ancora sugli indici di posizione La definizione di media geometrica deriva dal criterio di Chisini, definendo f (.) come prodotto delle modalità x1 , x2 , . . . , xn . Ricordando la relazione generale f (x1 , x2 , . . . , xn ) = f (µg , µg , . . . , µg ) La variabilità La varianza in questo caso risulta essere n n Y Y (xi ) = (x1 × x2 × . . . × xn ) = (µg ) = µng i=1 da cui i=1 v u n uY n µg = t (xi ) i=1 A. Iodice () Esercitazione 3 Statistica 3 / 16 Esempio di calcolo della media geometrica Esercitazione 3 A. Iodice Ancora sugli indici di posizione Un esempio di applicazione della media geometrica: si consideri il deposito in banca di un ammontare di capitale pari ad 1 per un periodo di 5 anni. i tassi di interesse i percepiti in ciascun anno sono rispettivamente i1 = 0.08, i2 = 0.03, i3 = 0.06, i4 = 0.07, i5 = 0.05 La variabilità La varianza A. Iodice () Esercitazione 3 Statistica 4 / 16 Esempio di calcolo della media geometrica Esercitazione 3 A. Iodice Ancora sugli indici di posizione Un esempio di applicazione della media geometrica: si consideri il deposito in banca di un ammontare di capitale pari ad 1 per un periodo di 5 anni. i tassi di interesse i percepiti in ciascun anno sono rispettivamente i1 = 0.08, i2 = 0.03, i3 = 0.06, i4 = 0.07, i5 = 0.05 La variabilità La varianza Rendita del capitale Capitale inizio primo anno: 1 Capitale fine primo anno: 1 + 1 × i1 = 1 + i1 A. Iodice () Esercitazione 3 Statistica 4 / 16 Esempio di calcolo della media geometrica Esercitazione 3 A. Iodice Ancora sugli indici di posizione Un esempio di applicazione della media geometrica: si consideri il deposito in banca di un ammontare di capitale pari ad 1 per un periodo di 5 anni. i tassi di interesse i percepiti in ciascun anno sono rispettivamente i1 = 0.08, i2 = 0.03, i3 = 0.06, i4 = 0.07, i5 = 0.05 La variabilità La varianza Rendita del capitale Capitale inizio primo anno: 1 Capitale fine primo anno: 1 + 1 × i1 = 1 + i1 Capitale inizio secondo anno: 1 + i1 Capitale fine secondo anno: (1 + i1 ) + (1 + i1 ) × i2 = (1 + i1 ) × (1 + i2 ) A. Iodice () Esercitazione 3 Statistica 4 / 16 Esempio di calcolo della media geometrica Esercitazione 3 A. Iodice Rendita del capitale Capitale inizio terzo anno: (1 + i1 ) × (1 + i2 ) Ancora sugli indici di posizione Capitale fine terzo anno: La variabilità (1 + i1 ) × (1 + i2 ) × (1 + i3 ) La varianza A. Iodice () Esercitazione 3 Statistica 5 / 16 Esempio di calcolo della media geometrica Esercitazione 3 A. Iodice Rendita del capitale Capitale inizio terzo anno: (1 + i1 ) × (1 + i2 ) Ancora sugli indici di posizione Capitale fine terzo anno: La variabilità (1 + i1 ) × (1 + i2 ) × (1 + i3 ) La varianza Capitale inizio quarto anno: (1 + i1 ) × (1 + i2 ) × (1 + i3 ) Capitale fine quarto anno: (1 + i1 ) × (1 + i2 ) × (1 + i3 ) × (1 + i4 ) A. Iodice () Esercitazione 3 Statistica 5 / 16 Esempio di calcolo della media geometrica Esercitazione 3 A. Iodice Ancora sugli indici di posizione Rendita del capitale Capitale inizio quinto anno: La variabilità (1 + i1 ) × (1 + i2 ) × (1 + i3 ) × (1 + i4 ) La varianza Capitale fine fine anno: (1 + i1 ) × (1 + i2 ) × (1 + i3 ) × (1 + i4 ) × (1 + i5 ) A. Iodice () Esercitazione 3 Statistica 6 / 16 Esempio di calcolo della media geometrica Esercitazione 3 A. Iodice Ancora sugli indici di posizione La variabilità La varianza Il problema trovare il tasso di interesse i costante tale da produrre la stessa rendita di capitale. Formalmente (1 + i1 ) × (1 + i2 ) × . . . × (1 + i5 ) = (1 + i) × (1 + i) × . . . × (1 + i) che equivale al criterio di Chisini con f (.) funzione moltiplicativa, con xj = (1 + ij ). A. Iodice () Esercitazione 3 Statistica 7 / 16 Esempio di calcolo della media geometrica Esercitazione 3 A. Iodice Ancora sugli indici di posizione La variabilità La varianza Il problema trovare il tasso di interesse i costante tale da produrre la stessa rendita di capitale. Formalmente (1 + i1 ) × (1 + i2 ) × . . . × (1 + i5 ) = (1 + i) × (1 + i) × . . . × (1 + i) che equivale al criterio di Chisini con f (.) funzione moltiplicativa, con xj = (1 + ij ). p 5 (1 + i1 ) × (1 + i2 ) × . . . × (1 + i5 ) p 5 = (1 + 0.08) × (1 + 0.03) × . . . × (1 + 0.05) = √ √ 5 = 5 1.08 × 1.03 × 1.06 × 1.07 × 1.05 = 1.3248 = 1.0579 1+i= essendo (1 + i) = 1.0579, il tasso fisso da noi cercato i = 0.0579. A. Iodice () Esercitazione 3 Statistica 7 / 16 Indici di posizione e tipo di caratteri Esercitazione 3 A. Iodice Ancora sugli indici di posizione la moda si applica a tutte le tipologie di caratteri La variabilità la mediana (quartili, quantili in generale) si applica a tutte le tipologie di caratteri le cui modalità sono ordinabili (mutabili rettilinee e variabili) La varianza la media aritmetica si applica alle sole variabili quantitative A. Iodice () Esercitazione 3 Statistica 8 / 16 Il concetto di variabilità Esercitazione 3 A. Iodice Ancora sugli indici di posizione La variabilità si definisce come l’attitudine di un fenomeno ad assumere modalità differenti. La variabilità può essere misurata in diversi modi: La variabilità La varianza A. Iodice () Esercitazione 3 Statistica 9 / 16 Il concetto di variabilità Esercitazione 3 A. Iodice Ancora sugli indici di posizione La variabilità si definisce come l’attitudine di un fenomeno ad assumere modalità differenti. La variabilità può essere misurata in diversi modi: La variabilità variabilità delle singole modalità x1 , x2 , . . . , xn rispetto ad un indice di posizione La varianza mutua variabilità variabilità delle modalità x1 , x2 , . . . , xn ordinate in modo crescente (usando la f. di ripartizione) variabilità delle frequenze relative (applicabile anche a mutabili) A. Iodice () Esercitazione 3 Statistica 9 / 16 Requisiti per indici di variabilità Esercitazione 3 A. Iodice Ancora sugli indici di posizione Un indice per la misura della variabilità deve avere le seguenti caratteristiche La variabilità La varianza A. Iodice () Esercitazione 3 Statistica 10 / 16 Requisiti per indici di variabilità Esercitazione 3 A. Iodice Ancora sugli indici di posizione Un indice per la misura della variabilità deve avere le seguenti caratteristiche La variabilità un indice di variabilità deve assumere valori maggiori o uguali a 0 La varianza A. Iodice () Esercitazione 3 Statistica 10 / 16 Requisiti per indici di variabilità Esercitazione 3 A. Iodice Ancora sugli indici di posizione Un indice per la misura della variabilità deve avere le seguenti caratteristiche La variabilità un indice di variabilità deve assumere valori maggiori o uguali a 0 La varianza un indice di variabilità calcolato su una distribuzione di costanti ugulae a 0 A. Iodice () Esercitazione 3 Statistica 10 / 16 Requisiti per indici di variabilità Esercitazione 3 A. Iodice Ancora sugli indici di posizione Un indice per la misura della variabilità deve avere le seguenti caratteristiche La variabilità un indice di variabilità deve assumere valori maggiori o uguali a 0 La varianza un indice di variabilità calcolato su una distribuzione di costanti ugulae a 0 aggiungendo una costante alla variabile osservata, il valore dell’indice non deve cambiare A. Iodice () Esercitazione 3 Statistica 10 / 16 Definizione di varianza Esercitazione 3 A. Iodice Ancora sugli indici di posizione La varianza un’indice che misura la variabilità di una variabile X rispetto alla media aritmetica. In particolare la varianza σ 2 data dalla media dei quadrati degli scarti (delle modalità dalla media) La variabilità La varianza A. Iodice () Esercitazione 3 Statistica 11 / 16 Definizione di varianza Esercitazione 3 A. Iodice Ancora sugli indici di posizione La varianza un’indice che misura la variabilità di una variabile X rispetto alla media aritmetica. In particolare la varianza σ 2 data dalla media dei quadrati degli scarti (delle modalità dalla media) (x1 − µ)2 + (x2 − µ)2 + . . . + (xn − µ)2 = n n 1X = (xi − µ)2 n σ2 = La variabilità La varianza i=1 A. Iodice () Esercitazione 3 Statistica 11 / 16 Definizione di varianza Esercitazione 3 A. Iodice Ancora sugli indici di posizione La varianza un’indice che misura la variabilità di una variabile X rispetto alla media aritmetica. In particolare la varianza σ 2 data dalla media dei quadrati degli scarti (delle modalità dalla media) (x1 − µ)2 + (x2 − µ)2 + . . . + (xn − µ)2 = n n 1X = (xi − µ)2 n σ2 = La variabilità La varianza i=1 per dati organizzati in frequenze (seriazione) (x1 − µ)2 × n1 + (x2 − µ)2 × n2 + . . . + (xk − µ)2 × nk = n1 + n2 + . . . + nk k 1X = (xi − µ)2 × ni n σ2 = i=1 A. Iodice () Esercitazione 3 Statistica 11 / 16 Esempio di calcolo della varianza Esercitazione 3 A. Iodice Data la variabile X : numero di esami sostenuti prima di quello di statistica osservata su un collettivo di n = 6 studenti Ancora sugli indici di posizione La variabilità La varianza A. Iodice () Esercitazione 3 Statistica 12 / 16 Esempio di calcolo della varianza Esercitazione 3 A. Iodice Data la variabile X : numero di esami sostenuti prima di quello di statistica osservata su un collettivo di n = 6 studenti Ancora sugli indici di posizione La variabilità La varianza A. Iodice () Esercitazione 3 Statistica 12 / 16 Esempio di calcolo della varianza Esercitazione 3 A. Iodice Data la variabile X : numero di esami sostenuti prima di quello di statistica osservata su un collettivo di n = 6 studenti Ancora sugli indici di posizione La variabilità La varianza La varianza sar dunque n 1X 50.8333 2 σ = (xi − µ)2 = = 8.4722 n 6 i=1 A. Iodice () Esercitazione 3 Statistica 12 / 16 Massima variabilità Esercitazione 3 A. Iodice Ancora sugli indici di posizione La variabilità La varianza A. Iodice () Esercitazione 3 Statistica 13 / 16 Massima variabilità Esercitazione 3 La varianza può crescere indefinitamente perchè gli scarti delle modalità dalla media possono essere illimitatamente grandi A. Iodice Ancora sugli indici di posizione La variabilità La varianza A. Iodice () Esercitazione 3 Statistica 13 / 16 Massima variabilità Esercitazione 3 La varianza può crescere indefinitamente perchè gli scarti delle modalità dalla media possono essere illimitatamente grandi La situazione di massima variabilità per un collettivo con media µ, si ha quando su n modalità, n − 1 sono nulle ed 0 una sola modalità x6= i = nµ A. Iodice Ancora sugli indici di posizione La variabilità La varianza n σ2 ≤ 1X 1 (xi − µ)2 = ((n − 1)(0 − µ)2 + (nµ − µ)2 ) = n n i=1 1 = ((n − 1)µ2 + µ2 (n − 1)2 ) = n 1 = ((n − 1)µ2 + µ2 (n2 + 1 − 2n)) = n 1 = (µ2 n(n − 1)) = µ2 (n − 1) n A. Iodice () Esercitazione 3 Statistica 13 / 16 Le propriet della varianza Esercitazione 3 A. Iodice Ancora sugli indici di posizione La varianza gode di alcune importanti propriet di seguito riportate: La variabilità La varianza A. Iodice () Esercitazione 3 Statistica 14 / 16 Le propriet della varianza Esercitazione 3 A. Iodice Ancora sugli indici di posizione La variabilità La varianza gode di alcune importanti propriet di seguito riportate: 1 La varianza di X sempre un numero non negativo (≥ 0) 2 La varianza di X pari a 0 se e solo se X una costante 3 Se alla variabile X si aggiunge una costante, σx non cambia 4 Se si moltiplica la variabile X per una costante b, si avr σx∗ = b2 σx2 La varianza A. Iodice () Esercitazione 3 Statistica 14 / 16 Le propriet della varianza Esercitazione 3 A. Iodice Ancora sugli indici di posizione La variabilità La varianza Le propriet 3 e 4 dipendono dalla propriet di linearit della media aritmetica: si consideri Y = a + bX, con a e b costanti. Dalla propriet risulta che µy = a + bµx . Calcolando la varianza di Y si avr: n σy2 1X (yi − µy )2 = = n 1=1 n n 1X 1X 2 = (yi − (a + bµx )) = (a + bxi − a − bµx )2 = n n 1=1 1=1 n n 1X 2 1X 2 (bxi − bµx ) = b (xi − µx )2 = = n n = b2 A. Iodice () 1=1 n X 1 n 1=1 (xi − µx )2 = b2 σx2 i=1 Esercitazione 3 Statistica 15 / 16 Lo scarto quadratico medio (standard deviation) Esercitazione 3 A. Iodice Ancora sugli indici di posizione Una difficoltà di interpretazione della varianza dipende dal fatto che tale indice espresso nell’unità di misura al quadrato della variabile cui si riferisce. Per ovviare a questo problema si utilizza lo scarto quadratico medio σ, dato da La variabilità La varianza A. Iodice () Esercitazione 3 Statistica 16 / 16 Lo scarto quadratico medio (standard deviation) Esercitazione 3 A. Iodice Ancora sugli indici di posizione La variabilità La varianza Una difficoltà di interpretazione della varianza dipende dal fatto che tale indice espresso nell’unità di misura al quadrato della variabile cui si riferisce. Per ovviare a questo problema si utilizza lo scarto quadratico medio σ, dato da v u n u1 X σ=t (xi − µ)2 n i=1 A. Iodice () Esercitazione 3 Statistica 16 / 16 Lo scarto quadratico medio (standard deviation) Esercitazione 3 A. Iodice Ancora sugli indici di posizione La variabilità La varianza Una difficoltà di interpretazione della varianza dipende dal fatto che tale indice espresso nell’unità di misura al quadrato della variabile cui si riferisce. Per ovviare a questo problema si utilizza lo scarto quadratico medio σ, dato da v u n u1 X σ=t (xi − µ)2 n i=1 dall’esempio precedente risulta dunque r 50.8333 σ= = 2.9107 6 A. Iodice () Esercitazione 3 Statistica 16 / 16 Il coefficiente di variazione (CV Esercitazione 3 A. Iodice Ancora sugli indici di posizione La varianza è un indice assoluto, dipende quindi dall’unità di misura della variabile. Un indice relativo di variabilità è il coefficiente di variazione CV . E’ dato da La variabilità CV = La varianza σ µ essendo un numero puro consente il confronto fra fenomeni rilevati in momenti diversi o espressi in unità di misura diverse A. Iodice () Esercitazione 3 Statistica 17 / 16 Il coefficiente di variazione (CV Esercitazione 3 A. Iodice Ancora sugli indici di posizione La varianza è un indice assoluto, dipende quindi dall’unità di misura della variabile. Un indice relativo di variabilità è il coefficiente di variazione CV . E’ dato da La variabilità CV = La varianza σ µ essendo un numero puro consente il confronto fra fenomeni rilevati in momenti diversi o espressi in unità di misura diverse Limiti di utilizzo del CV è defnito solo se µ > 0 se µ → 0 il CV tende a diventare molto grande A. Iodice () Esercitazione 3 Statistica 17 / 16 Variabilità e modalità ordinate Esercitazione 3 A. Iodice Ancora sugli indici di posizione In caso di variabili con modalità ordinabili è possibile definire degli indici di variabilità derivati dalla funzione di ripartizione empirica. Data la distribuzione unitaria ordinata di modalità La variabilità La varianza {1, 5, 7, 13, 14, 15, 18, 18, 22, 23, 24, 25, 27, 28, 29} A. Iodice () Esercitazione 3 Statistica 18 / 16 Variabilità e modalità ordinate Esercitazione 3 A. Iodice Ancora sugli indici di posizione In caso di variabili con modalità ordinabili è possibile definire degli indici di variabilità derivati dalla funzione di ripartizione empirica. Data la distribuzione unitaria ordinata di modalità La variabilità La varianza {1, 5, 7, 13, 14, 15, 18, 18, 22, 23, 24, 25, 27, 28, 29} il range (o campo di variazione) è dato da R(X) = max(xi ) − min(xi = 29 − 1 = 27 il range inter-quartile (o campo di variazione interquartile) è dato da IQR(X) = Q3 − Q1 = 25 − 13 = 12 A. Iodice () Esercitazione 3 Statistica 18 / 16 Variabilità e modalità ordinate Esercitazione 3 A. Iodice Ancora sugli indici di posizione In caso di variabili con modalità ordinabili è possibile definire degli indici di variabilità derivati dalla funzione di ripartizione empirica. Data la distribuzione unitaria ordinata di modalità La variabilità La varianza {1, 5, 7, 13, 14, 15, 18, 18, 22, 23, 24, 25, 27, 28, 29} il range (o campo di variazione) è dato da R(X) = max(xi ) − min(xi = 29 − 1 = 27 il range inter-quartile (o campo di variazione interquartile) è dato da IQR(X) = Q3 − Q1 = 25 − 13 = 12 A. Iodice () Esercitazione 3 Statistica 18 / 16 Mutua variabilità Esercitazione 3 A. Iodice Ancora sugli indici di posizione In presenza di caratteri trasferibili (reddito, risorde energetiche, consumo di beni) è di maggior interesse lo studio della variabilità tra le singole unità statistiche piuttosto che la variabilità rispetto a un centro. La variabilità La varianza A. Iodice () Esercitazione 3 Statistica 19 / 16 Mutua variabilità Esercitazione 3 A. Iodice Ancora sugli indici di posizione La variabilità La varianza In presenza di caratteri trasferibili (reddito, risorde energetiche, consumo di beni) è di maggior interesse lo studio della variabilità tra le singole unità statistiche piuttosto che la variabilità rispetto a un centro. Differenza media semplice tale indice rappresenta la media dei valori assoluti delle differenze calcolate rispetto a tutte le possibili coppie di modalità. Esso corrisponde a Pn i6=j=1 |xi − xj | ∆= n(n − 1) la quantità al denominatore (n(n − 1)) rappresenta il numero di possibili coppie di n osservazioni. A. Iodice () Esercitazione 3 Statistica 19 / 16 Mutua variabilità Esercitazione 3 Dato un carattere X osservato su n = 4 osservazioni A. Iodice {7, 14, 18, 24} Ancora sugli indici di posizione La variabilità La varianza A. Iodice () Esercitazione 3 Statistica 20 / 16 Mutua variabilità Esercitazione 3 Dato un carattere X osservato su n = 4 osservazioni A. Iodice {7, 14, 18, 24} Ancora sugli indici di posizione La variabilità La varianza Differenza media semplice Il valore di ∆ sarà in questo caso |7 − 14| + |7 − 18| + |7 − 24| + |14 − 7|+ 12 +|14 − 18| + |14 − 24| + |18 − 7| + |18 − 14| + |18 − 24|+ 12 +|24 − 7| + |24 − 14| + |24 − 18| = 12 110 = = 9.1667 12 ∆= A. Iodice () Esercitazione 3 Statistica 20 / 16 mutua variabilità: minimo e massimo Esercitazione 3 l’indice ∆ assume il valore minimo (∆ = 0) quando tutte le modalità coincidono: in questo caso le differenze semplici sono nulle A. Iodice Ancora sugli indici di posizione l’indice ∆ assume il valore massimo quando tutte le modalità tranne una sono nulle: in tal caso si ha che ∆ = 2µ La variabilità La varianza Dunque ∆ assume valore nell’intervallo [0, 2µ]: è possibile ottenere una versione normalizzata: R= ∆ 2µ tale indice viene denominato rapporto di concentrazione di Gini A. Iodice () Esercitazione 3 Statistica 21 / 16 La concentrazione Esercitazione 3 A. Iodice Ancora sugli indici di posizione La variabilità La varianza In caso di caratteri trasferibili è interessante considerare il grado di vicinanza all’equidistribuzione, situazione in cui tutte le unità detengono lo stesso ammontare del carattere. La concentrazione indica quanto il collettivo osservato sia ’lontano/vicino’ rispetto all’equidistribuzione. Da cui, A. Iodice () Esercitazione 3 Statistica 22 / 16 La concentrazione Esercitazione 3 A. Iodice Ancora sugli indici di posizione La variabilità La varianza In caso di caratteri trasferibili è interessante considerare il grado di vicinanza all’equidistribuzione, situazione in cui tutte le unità detengono lo stesso ammontare del carattere. La concentrazione indica quanto il collettivo osservato sia ’lontano/vicino’ rispetto all’equidistribuzione. Da cui, la concentrazione è pari a 0 se tutte le unità detengono lo stesso ammontare del carattere la concentrazione è massima se l’intero ammontare del carattere è detenuto da una sola osservazione A. Iodice () Esercitazione 3 Statistica 22 / 16 Indice di concentrazione Esercitazione 3 A. Iodice Ancora sugli indici di posizione Si consideri un carattere trasferibile (reddito, risorsa) distribuito tra n modalità, si considerino poi pi e qi , rispettivamente: La variabilità pi = La varianza Pi i n j=1 qi = Pn xj j=1 xj A. Iodice () Esercitazione 3 Statistica 23 / 16 Indice di concentrazione Esercitazione 3 A. Iodice Ancora sugli indici di posizione Si consideri un carattere trasferibile (reddito, risorsa) distribuito tra n modalità, si considerino poi pi e qi , rispettivamente: La variabilità pi = La varianza Pi i n j=1 qi = Pn xj j=1 xj pi è la frazione cumulata dei primi i redditieri qi , ammontare del reddito detenuto dai primi i redditieri A. Iodice () Esercitazione 3 Statistica 23 / 16 Indice di concentrazione Esercitazione 3 A. Iodice Ancora sugli indici di posizione La variabilità La varianza Le differenze (pi - qi ) ≥ 0, sono misure dirette della concentrazione. La media aritmetica della versione normalizzata di tali differenze rappresenta il rapporto di concentrazione di Gini. Pn−1 pi −qi Pn−1 (pi − qi ) i=1 ( pi )pi = i=1 Pn−1 Pn−1 i=1 pi i=1 pi A. Iodice () Esercitazione 3 Statistica 24 / 16 Esempio di calcolo concentrazione Esercitazione 3 A. Iodice Si considerino i fatturati in milioni di euro di un collettivo di otto aziende prodottrici di componenti per auto Ancora sugli indici di posizione La variabilità La varianza A. Iodice () Esercitazione 3 Statistica 25 / 16 Esempio di calcolo concentrazione Esercitazione 3 A. Iodice Si considerino i fatturati in milioni di euro di un collettivo di otto aziende prodottrici di componenti per auto Ancora sugli indici di posizione La variabilità La varianza A. Iodice () Esercitazione 3 Statistica 25 / 16 Esempio di calcolo concentrazione Esercitazione 3 A. Iodice Si considerino i fatturati in milioni di euro di un collettivo di otto aziende prodottrici di componenti per auto Ancora sugli indici di posizione La variabilità La varianza NOTA: le modalità (X) sono state ordinate in modo crescente A. Iodice () Esercitazione 3 Statistica 25 / 16 Esempio di calcolo concentrazione Esercitazione 3 A. Iodice Si considerino i fatturati in milioni di euro di un collettivo di otto aziende prodottrici di componenti per auto Ancora sugli indici di posizione La variabilità La varianza NOTA: le modalità (X) sono state ordinate in modo crescente Pn−1 (pi − qi ) 2.1912 = = 0.6261 Pn−1 3.5 i=1 pi i=1 A. Iodice () Esercitazione 3 Statistica 25 / 16 Rappresentazione grafica: la curva di Lorenz Esercitazione 3 A. Iodice Ancora sugli indici di posizione La variabilità La varianza Partendo dai dati nell’esempio precedente, la curva di Lorenz è la spezzata passante per i punti di coordinate (pi , qi ). A. Iodice () Esercitazione 3 Statistica 26 / 16 Rappresentazione grafica: la curva di Lorenz Esercitazione 3 A. Iodice Partendo dai dati nell’esempio precedente, la curva di Lorenz è la spezzata passante per i punti di coordinate (pi , qi ). Ancora sugli indici di posizione La variabilità La varianza A. Iodice () Esercitazione 3 Statistica 26 / 16 Rappresentazione grafica: la curva di Lorenz Esercitazione 3 A. Iodice Partendo dai dati nell’esempio precedente, la curva di Lorenz è la spezzata passante per i punti di coordinate (pi , qi ). Ancora sugli indici di posizione La variabilità La varianza A. Iodice () Esercitazione 3 Statistica 26 / 16 Rappresentazione grafica: la curva di Lorenz Esercitazione 3 A. Iodice Partendo dai dati nell’esempio precedente, la curva di Lorenz è la spezzata passante per i punti di coordinate (pi , qi ). Ancora sugli indici di posizione La variabilità La varianza A. Iodice () Esercitazione 3 Statistica 26 / 16 Rappresentazione grafica: la curva di Lorenz Esercitazione 3 A. Iodice Partendo dai dati nell’esempio precedente, la curva di Lorenz è la spezzata passante per i punti di coordinate (pi , qi ). Ancora sugli indici di posizione La variabilità La varianza A. Iodice () Esercitazione 3 Statistica 26 / 16 Il concetto di mutabilità Esercitazione 3 A. Iodice Ancora sugli indici di posizione La variabilità In caso di variabili qualitative la variabilità del carattere espressa in termini di mutabilità, definita come l’attitudine di un carattere ad assumere differenti modalità qualitative. La varianza A. Iodice () Esercitazione 3 Statistica 27 / 16 Il concetto di mutabilità Esercitazione 3 A. Iodice Ancora sugli indici di posizione La variabilità In caso di variabili qualitative la variabilità del carattere espressa in termini di mutabilità, definita come l’attitudine di un carattere ad assumere differenti modalità qualitative. perfetta omogeneità: tutte le unità statistiche assumono la stessa modalità del carattere qualitativo La varianza massima disomogeneità: le modalità del carattere hanno tutte la stessa frequenza assoluta (relativa) A. Iodice () Esercitazione 3 Statistica 27 / 16 Il concetto di mutabilità Esercitazione 3 A. Iodice Ancora sugli indici di posizione La variabilità In caso di variabili qualitative la variabilità del carattere espressa in termini di mutabilità, definita come l’attitudine di un carattere ad assumere differenti modalità qualitative. perfetta omogeneità: tutte le unità statistiche assumono la stessa modalità del carattere qualitativo La varianza massima disomogeneità: le modalità del carattere hanno tutte la stessa frequenza assoluta (relativa) Le situazioni intermedie sono caratterizzate da un diverso grado di eterogeneità. A. Iodice () Esercitazione 3 Statistica 27 / 16 eterogeneità Esercitazione 3 A. Iodice Ancora sugli indici di posizione L’eterogeneità misura la variabilità delle frequenze relative (f1 , f2 , . . . , fk ) delle k modalità del carattere. La variabilità La varianza A. Iodice () Esercitazione 3 Statistica 28 / 16 eterogeneità Esercitazione 3 A. Iodice Ancora sugli indici di posizione L’eterogeneità misura la variabilità delle frequenze relative (f1 , f2 , . . . , fk ) delle k modalità del carattere. La variabilità minima eterogeneità: si manifesta una sola modalità j la cui frequenza relativa fj = 1: un indice di eterogeneità deve avere valore 0 in questo caso La varianza massima eterogeneità: Le frequenze relative sono tutte uguali: fi = k1 , con i = 1, . . . , k e k numero di modalità del carattere A. Iodice () Esercitazione 3 Statistica 28 / 16 Indici di eterogeneità: l’indice di Gini (G) Esercitazione 3 A. Iodice Ancora sugli indici di posizione L’indice per la misura della eterogeneità proposto da Gini dato da k X G=1− fi2 i=1 La variabilità La varianza A. Iodice () Esercitazione 3 Statistica 29 / 16 Indici di eterogeneità: l’indice di Gini (G) Esercitazione 3 A. Iodice Ancora sugli indici di posizione L’indice per la misura della eterogeneità proposto da Gini dato da k X G=1− fi2 i=1 La variabilità La varianza in caso di minima eterogeneità, G = 0 in caso di massima eterogeneità l’indice assume valore G = 1 − k1 A. Iodice () Esercitazione 3 Statistica 29 / 16 Indici di eterogeneità: l’indice di Gini (G) Esercitazione 3 A. Iodice Ancora sugli indici di posizione L’indice per la misura della eterogeneità proposto da Gini dato da k X G=1− fi2 i=1 La variabilità La varianza in caso di minima eterogeneità, G = 0 in caso di massima eterogeneità l’indice assume valore G = 1 − k1 Avendo definito il valore massimo dell’indice, possibile ottenerne la versione normalizzata G∗ G∗ = A. Iodice () Esercitazione 3 k×G k−1 Statistica 29 / 16 Esempio di applicazione dell’indice di Gini (G) Esercitazione 3 A. Iodice Ancora sugli indici di posizione Una nuova azienda informatica immette sul mercato una gamma di prodotti. Dopo i primi sei mesi la vendita dei prodotti risulta ripartita tra le varie categorie secondo la seguente distribuzione di frequenze: La variabilità La varianza A. Iodice () Esercitazione 3 Statistica 30 / 16 Esempio di applicazione dell’indice di Gini (G) Esercitazione 3 A. Iodice Ancora sugli indici di posizione Una nuova azienda informatica immette sul mercato una gamma di prodotti. Dopo i primi sei mesi la vendita dei prodotti risulta ripartita tra le varie categorie secondo la seguente distribuzione di frequenze: La variabilità La varianza La colonna promo riguarda le frequenze delle vendite per categoria di prodotto dopo una politica di promozioni sui diversi prodotti A. Iodice () Esercitazione 3 Statistica 30 / 16 Esempio di applicazione dell’indice di Gini (G) Esercitazione 3 A. Iodice Ancora sugli indici di posizione La variabilità La varianza A. Iodice () Esercitazione 3 Statistica 31 / 16 Esempio di applicazione dell’indice di Gini (G) Esercitazione 3 A. Iodice G=1− Ancora sugli indici di posizione k X fi2 = 1 − [(0.2094)2 + i=1 La variabilità + (0.3535)2 + (0.1337)2 + La varianza + (0.1071)2 + (0.1964)2 ] = = 1 − 0.2357 = 0.7633 A. Iodice () Esercitazione 3 Statistica 31 / 16 Esempio di applicazione dell’indice di Gini (G) Esercitazione 3 A. Iodice G=1− Ancora sugli indici di posizione k X fi2 = 1 − [(0.2094)2 + i=1 La variabilità + (0.3535)2 + (0.1337)2 + La varianza + (0.1071)2 + (0.1964)2 ] = = 1 − 0.2357 = 0.7633 l’indice in versione normalizzata G∗ dato da G∗ = A. Iodice () k×G 5 × 0.7633 = = 3.8165/4 = 0.9541 k−1 5−1 Esercitazione 3 Statistica 31 / 16 Esempio di applicazione dell’indice di Gini (G) Esercitazione 3 A. Iodice Ancora sugli indici di posizione La variabilità La varianza A. Iodice () Esercitazione 3 Statistica 32 / 16 Esempio di applicazione dell’indice di Gini (G) Esercitazione 3 A. Iodice Gpromo = 1 − Ancora sugli indici di posizione k X fi2 = 1 − [(0.3045)2 + i=1 + (0.1824)2 + (0.0074)2 + La variabilità + (0.3281)2 + (0.1777)2 ] = La varianza = 1 − 0.2652 = 0.7348 A. Iodice () Esercitazione 3 Statistica 32 / 16 Esempio di applicazione dell’indice di Gini (G) Esercitazione 3 A. Iodice Gpromo = 1 − Ancora sugli indici di posizione k X fi2 = 1 − [(0.3045)2 + i=1 + (0.1824)2 + (0.0074)2 + La variabilità + (0.3281)2 + (0.1777)2 ] = La varianza = 1 − 0.2652 = 0.7348 l’indice in versione normalizzata G∗ dato da G∗promo = k×G 5 × 0.7348 = = 3.6738/4 = 0.9185 k−1 5−1 Risultando essere G > Gpromo si pu concludere che la politica di promozioni ha fatto diminuire l’eterogeneità (aumentare l’omogeneità) delle vendite nelle diverse categorie di prodotti A. Iodice () Esercitazione 3 Statistica 32 / 16 Indici di eterogeneità: l’indice di Shannon (H) Esercitazione 3 L’indice per la misura della eterogeneità proposto da Shannon A. Iodice H=− Ancora sugli indici di posizione k X fi log(fi ) i=1 La variabilità La varianza A. Iodice () Esercitazione 3 Statistica 33 / 16 Indici di eterogeneità: l’indice di Shannon (H) Esercitazione 3 L’indice per la misura della eterogeneità proposto da Shannon A. Iodice H=− Ancora sugli indici di posizione k X fi log(fi ) i=1 La variabilità La varianza in caso di minima eterogeneità, H = 0 in caso di massima eterogeneità l’indice assume valore H = log(k) A. Iodice () Esercitazione 3 Statistica 33 / 16 Indici di eterogeneità: l’indice di Shannon (H) Esercitazione 3 L’indice per la misura della eterogeneità proposto da Shannon A. Iodice H=− Ancora sugli indici di posizione k X fi log(fi ) i=1 La variabilità La varianza in caso di minima eterogeneità, H = 0 in caso di massima eterogeneità l’indice assume valore H = log(k) Avendo definito il valore massimo dell’indice, possibile ottenerne la versione normalizzata H ∗ H∗ = A. Iodice () Esercitazione 3 H log(k) Statistica 33 / 16 Esempio di applicazione dell’indice di Shannon (H) Esercitazione 3 A. Iodice Ancora sugli indici di posizione La variabilità La varianza A. Iodice () Esercitazione 3 Statistica 34 / 16 Esempio di applicazione dell’indice di Shannon (H) Esercitazione 3 H=− A. Iodice k X fi log(fi ) = i=1 Ancora sugli indici di posizione = 0, 2094 × log(0, 2094)+ + 0, 3535 × log(0, 3535)+ La variabilità La varianza + 0, 1337 × log(0, 1337)+ + 0, 1071 × log(0, 1071)+ + 0.1964 × log(0, 1964) = = 1.5228 A. Iodice () Esercitazione 3 Statistica 34 / 16 Esempio di applicazione dell’indice di Shannon (H) Esercitazione 3 H=− A. Iodice k X fi log(fi ) = i=1 Ancora sugli indici di posizione = 0, 2094 × log(0, 2094)+ + 0, 3535 × log(0, 3535)+ La variabilità La varianza + 0, 1337 × log(0, 1337)+ + 0, 1071 × log(0, 1071)+ + 0.1964 × log(0, 1964) = = 1.5228 l’indice in versione normalizzata H ∗ dato da H 1.5228 H∗ = = = 0.9462 log(k) 1.6094 A. Iodice () Esercitazione 3 Statistica 34 / 16 Esempio di applicazione dell’indice di Shannon (H) Esercitazione 3 A. Iodice Ancora sugli indici di posizione La variabilità La varianza A. Iodice () Esercitazione 3 Statistica 35 / 16 Esempio di applicazione dell’indice di Shannon (H) Esercitazione 3 Hpromo = − A. Iodice k X fi log(fi ) = i=1 Ancora sugli indici di posizione = 0.3045 × log(0.3045)+ + 0, 1824 × log(0.1824)+ La variabilità La varianza + 0.0074 × log(0.0074)+ + 0.3281 × log(0.3281)+ + 0.1777 × log(0.1777) = = 1.3813 A. Iodice () Esercitazione 3 Statistica 35 / 16 Esempio di applicazione dell’indice di Shannon (H) Esercitazione 3 Hpromo = − A. Iodice k X fi log(fi ) = i=1 Ancora sugli indici di posizione = 0.3045 × log(0.3045)+ + 0, 1824 × log(0.1824)+ La variabilità La varianza + 0.0074 × log(0.0074)+ + 0.3281 × log(0.3281)+ + 0.1777 × log(0.1777) = = 1.3813 ∗ l’indice in versione normalizzata Hpromo dato da ∗ Hpromo = A. Iodice () H 1.3813 = = 0.8582 log(k)) 1.6094 Esercitazione 3 Statistica 35 / 16 La forma di una distribuzione Esercitazione 3 A. Iodice Ancora sugli indici di posizione La variabilità La varianza Due distribuzioni aventi stessa posizione e variabilità possono differire per forma. In altre parole, la forma dipende dal valore delle modalità più piccole (o più grandi) del valore centrale della distribuzione. A. Iodice () Esercitazione 3 Statistica 36 / 16 La forma di una distribuzione Esercitazione 3 A. Iodice Ancora sugli indici di posizione La variabilità La varianza Due distribuzioni aventi stessa posizione e variabilità possono differire per forma. In altre parole, la forma dipende dal valore delle modalità più piccole (o più grandi) del valore centrale della distribuzione. Aspetti che caratterizzano la forma di una distribuzione sono asimmetria curtosi A. Iodice () Esercitazione 3 Statistica 36 / 16 La forma di una distribuzione Esercitazione 3 A. Iodice Ancora sugli indici di posizione La variabilità La varianza Due distribuzioni aventi stessa posizione e variabilità possono differire per forma. In altre parole, la forma dipende dal valore delle modalità più piccole (o più grandi) del valore centrale della distribuzione. Aspetti che caratterizzano la forma di una distribuzione sono asimmetria curtosi A. Iodice () Esercitazione 3 Statistica 36 / 16 Asimmetria Esercitazione 3 distribuzione simmetrica rettangolare A. Iodice Ancora sugli indici di posizione La variabilità La varianza A. Iodice () Esercitazione 3 Statistica 37 / 16 Asimmetria Esercitazione 3 distribuzione simmetrica campanulare A. Iodice Ancora sugli indici di posizione La variabilità La varianza A. Iodice () Esercitazione 3 Statistica 37 / 16 Asimmetria Esercitazione 3 distribuzione asimmetrica positiva A. Iodice Ancora sugli indici di posizione La variabilità La varianza A. Iodice () Esercitazione 3 Statistica 37 / 16 Asimmetria Esercitazione 3 distribuzione asimmetrica negativa A. Iodice Ancora sugli indici di posizione La variabilità La varianza A. Iodice () Esercitazione 3 Statistica 37 / 16 Indici di asimmetria Esercitazione 3 A. Iodice Ancora sugli indici di posizione La variabilità indice normalizzato di asimmetria A Tale indice la versione normalizzata della differenza tra media e mediana, dal momento che σ risulta essere in qualunque caso tale che σ ≥ µ − M e La varianza A= µ − Me σ Tale indice varia nell’intervallo [−1, 1]. A. Iodice () Esercitazione 3 Statistica 38 / 16 Indici di asimmetria Esercitazione 3 A. Iodice Ancora sugli indici di posizione La variabilità indice normalizzato di asimmetria A Tale indice la versione normalizzata della differenza tra media e mediana, dal momento che σ risulta essere in qualunque caso tale che σ ≥ µ − M e La varianza A= µ − Me σ Tale indice varia nell’intervallo [−1, 1]. se A > 0 allora la distribuzione asimmetrica positiva se A < 0 allora la distribuzione asimmetrica negativa se A = 0 allora la distribuzione simmetrica A. Iodice () Esercitazione 3 Statistica 38 / 16 Indice normalizzato di asimmetria Esercitazione 3 A. Iodice Si considerino tre studenti, A, B e C che nei primi 9 esami hanno riportato i seguenti voti: Ancora sugli indici di posizione A = {18, 20, 21, 23, 25, 26, 27, 27, 30} La variabilità B = {22, 23, 24, 24, 25, 27, 29, 29, 30} La varianza C = {21, 22, 23, 24, 25, 26, 27, 28, 29} A. Iodice () Esercitazione 3 Statistica 39 / 16 Indice normalizzato di asimmetria Esercitazione 3 A. Iodice Si considerino tre studenti, A, B e C che nei primi 9 esami hanno riportato i seguenti voti: Ancora sugli indici di posizione A = {18, 20, 21, 23, 25, 26, 27, 27, 30} La variabilità B = {22, 23, 24, 24, 25, 27, 29, 29, 30} La varianza C = {21, 22, 23, 24, 25, 26, 27, 28, 29} A(A) = A. Iodice () µ − Me 24.1111 − 25 = = −0.2287 σ 3.8873 Esercitazione 3 Statistica 39 / 16 Indice normalizzato di asimmetria Esercitazione 3 A. Iodice Si considerino tre studenti, A, B e C che nei primi 9 esami hanno riportato i seguenti voti: Ancora sugli indici di posizione A = {18, 20, 21, 23, 25, 26, 27, 27, 30} La variabilità B = {22, 23, 24, 24, 25, 27, 29, 29, 30} La varianza C = {21, 22, 23, 24, 25, 26, 27, 28, 29} A(A) = µ − Me 24.1111 − 25 = = −0.2287 σ 3.8873 A(B) = A. Iodice () µ − Me 25.8889 − 25 = = 0.3029 σ 2.9345 Esercitazione 3 Statistica 39 / 16 Indice normalizzato di asimmetria Esercitazione 3 A. Iodice Si considerino tre studenti, A, B e C che nei primi 9 esami hanno riportato i seguenti voti: Ancora sugli indici di posizione A = {18, 20, 21, 23, 25, 26, 27, 27, 30} La variabilità B = {22, 23, 24, 24, 25, 27, 29, 29, 30} La varianza C = {21, 22, 23, 24, 25, 26, 27, 28, 29} A(A) = µ − Me 24.1111 − 25 = = −0.2287 σ 3.8873 A(B) = µ − Me 25.8889 − 25 = = 0.3029 σ 2.9345 A(C) = A. Iodice () µ − Me 25 − 25 = =0 σ 2.7386 Esercitazione 3 Statistica 39 / 16 Indici di asimmetria Esercitazione 3 A. Iodice Ancora sugli indici di posizione La variabilità La varianza Standardizzazione di una variabile L’operazione di standardizzazione consiste nel sottrarre a ciascuna modalita xi la media µ, dividendo poi per lo scarto quadratico medio σ. Tale operazione consente il confronto tra distribuzioni con medie e varianze diverse. zi = A. Iodice () xi − µ σ Esercitazione 3 Statistica 40 / 16 Indici di asimmetria Esercitazione 3 A. Iodice Ancora sugli indici di posizione La variabilità La varianza A. Iodice () Esercitazione 3 Statistica 41 / 16 Indici di asimmetria Esercitazione 3 A. Iodice Ancora sugli indici di posizione La variabilità La varianza A. Iodice () Esercitazione 3 Statistica 42 / 16 Indici di asimmetria Esercitazione 3 A. Iodice Ancora sugli indici di posizione La variabilità La varianza A. Iodice () Esercitazione 3 Statistica 43 / 16 Indici di asimmetria Esercitazione 3 A. Iodice Ancora sugli indici di posizione indice di asimmetria di Fisher γ n n i=1 i=1 1X 1X γ= (zi )3 = n n La variabilità La varianza A. Iodice () Esercitazione 3 xi − µ σ 3 Statistica 44 / 16 Indici di asimmetria Esercitazione 3 A. Iodice Ancora sugli indici di posizione indice di asimmetria di Fisher γ n n i=1 i=1 1X 1X γ= (zi )3 = n n La variabilità La varianza xi − µ σ 3 se γ > 0 allora la distribuzione asimmetrica positiva se γ < 0 allora la distribuzione asimmetrica negativa se γ = 0 allora la distribuzione simmetrica A. Iodice () Esercitazione 3 Statistica 44 / 16 Indice di asimmetria di Fisher γ Esercitazione 3 A. Iodice Si considerino tre studenti, A, B e C che nei primi 9 esami hanno riportato i seguenti voti: Ancora sugli indici di posizione A = {18, 20, 21, 23, 25, 26, 27, 27, 30} La variabilità B = {22, 23, 24, 24, 25, 27, 29, 29, 30} La varianza C = {21, 22, 23, 24, 25, 26, 27, 28, 29} A. Iodice () Esercitazione 3 Statistica 45 / 16 Indice di asimmetria di Fisher γ Esercitazione 3 A. Iodice Si considerino tre studenti, A, B e C che nei primi 9 esami hanno riportato i seguenti voti: Ancora sugli indici di posizione A = {18, 20, 21, 23, 25, 26, 27, 27, 30} La variabilità B = {22, 23, 24, 24, 25, 27, 29, 29, 30} La varianza C = {21, 22, 23, 24, 25, 26, 27, 28, 29} n n 1X 1 X xi − µ 3 18 − 24.1111 3 3 γ(A) = (zi ) = = + n n σ 3.8873 i=1 i=1 30 − 24.1111 3 20 − 24.1111 3 + + ... + = −1.1799 3.8873 3.8873 A. Iodice () Esercitazione 3 Statistica 45 / 16 Indice di asimmetria di Fisher γ Esercitazione 3 A. Iodice Ancora sugli indici di posizione La variabilità La varianza n n 22 − 25.8889 3 1X 1 X xi − µ 3 3 = + γ(B) = (zi ) = n n σ 2.9345 i=1 i=1 23 − 25.8889 3 30 − 25.8889 3 + + ... + = 1.3445 2.9345 2.9345 A. Iodice () Esercitazione 3 Statistica 46 / 16 Indice di asimmetria di Fisher γ Esercitazione 3 A. Iodice Ancora sugli indici di posizione La variabilità La varianza n n 22 − 25.8889 3 1X 1 X xi − µ 3 3 = + γ(B) = (zi ) = n n σ 2.9345 i=1 i=1 23 − 25.8889 3 30 − 25.8889 3 + + ... + = 1.3445 2.9345 2.9345 n n 1X 1 X xi − µ 3 21 − 25 3 (zi )3 = = + n n σ 2.7386 i=1 i=1 3 22 − 25 29 − 25 3 + + ... + =0 2.7386 2.7386 γ(C) = A. Iodice () Esercitazione 3 Statistica 46 / 16