Indici STATISTICI Nella ricerca scientifica e tecnologica, così come nelle scienze economiche, sociali e politiche, è importante misurare la reale efficacia di interventi sul sistema oggetto di studio. Ciò significa valutare gli effetti complessivi indotti da una causa nota, pur nella mutevolezza ed instabilità dei risultati individuali. A tal riguardo, la Statistica ha proposto numerosi indici statistici, aventi quale obiettivo proprio la misurazione di due componenti del fenomeno oggetto di studio e di interesse scientifico: la consistenza della sistematicità, cioè la centralità, ovvero l’attitudine che hanno i fenomeni ad assumere tendenzialmente una certa dimensione all’osservazione, e la variabilità o mutabilità, cioè la dispersione, ovvero l’attitudine che hanno i fenomeni ad assumere dimensioni e tendenze diverse all’osservazione, nel tempo e nello spazio. La consistenza della sistematicità, ovvero la centralità, è misurata dai cosiddetti indici di posizione (o indici di tendenza centrale o indicatori di posizione o misure di tendenza centrale), o medie statistiche o ancora più semplicemente medie, in grado di esprimere e sintetizzare la posizione di una distribuzione di frequenza mediante un valore reale rappresentativo della globalità del fenomeno, riassumendone gli aspetti ritenuti più importanti. Tali indici si possono ricavare effettuando operazioni che coinvolgono: - tutti i termini della serie (in tal caso gli indici di posizione maggiormente usati, denominati medie analitiche o di calcolo, sono la media aritmetica, la media geometrica, la media armonica e la media quadratica); - solo alcuni termini della serie, che si differenziano dagli altri per particolari caratteristiche (in tal caso gli indici di posizione maggiormente usati, denominati medie posizionali o di posizione, sono la mediana, la moda, i quantili). Nonostante il concetto di media sia primitivo e percepito con immediatezza da ogni persona, la sua misura risulta arbitraria, dal momento che il criterio di sintesi che si utilizza dipende strettamente dalle informazioni ritenute più rilevanti e, quindi, dagli obiettivi per i quali la stessa media viene calcolata. Sono state introdotte, pertanto, numerose definizioni di media delle quali, però, verranno di seguito riportate solo le più significative: una media secondo Cauchy di una variabile X è un qualunque valore reale M intermedio tra il minimo min(x) ed il massimo max(x) di una distribuzione di frequenza, cioè tale che: min(x) ≤ M ≤ max(x) requisito questo che prende il nome di criterio di internalità; una media secondo Chisini di una variabile X è un qualunque valore reale M intermedio, tra il minimo min(x) ed il massimo max(x), il quale, rispetto ad una funzione sintetica delle osservazioni, ne lascia inalterato il valore, cioè tale che: f(x1, x2, …, xn) = f(M, M, …, M) Il senso di tale definizione deriva dal tentativo di trovare un unico valore M che, sostituito a ciascuna modalità di un’unità statistica, non cambia la predetta funzione. Affinché, però, tale requisito, detto criterio di rappresentatività, diventi operativo, occorre specificare f in funzione della natura (additiva, moltiplicativa, inversa, …) della variabile e della sua trasferibilità: è da ciò, infatti, che derivano le molteplici tipologie di medie delle quali verranno riportate, nel seguito, le più utili e quelle maggiormente diffuse. La media aritmetica, denominata semplicemente media ed indicata con Ma, usata per riassumere con un solo numero un insieme di n dati relativi ad un fenomeno misurabile, ovvero in presenza di variabili quantitative qualora la differenza tra un dato ed il precedente risulti costante, è ottenuta dividendo la somma di tutti gli n valori per il numero n di osservazioni; in formule è data da: Ma x x ... xn 1 n xi 1 2 n i 1 n La media aritmetica di n numeri, dunque, è quel numero che, sostituito a ciascuno di essi, lascia invariata la somma totale e non può essere maggiore del valore più grande né minore del valore più piccolo. Essendo, inoltre, la media statistica per eccellenza, consente un’ottima correzione degli errori accidentali commessi in una rilevazione statistica, risultando così utile, nonostante la sua scarsissima resistenza ai valori eccezionali, in tutti i campi della scienza e della tecnica in cui vengono effettuate misurazioni di qualunque genere. La media aritmetica, dunque, rappresenta il baricentro dei dati e quindi propone un valore che equiripartisce il fenomeno tra le unità statistiche, pervenendo così a decisioni nelle quali contano, a parità numerica, gli estremi molto più dei valori centrali: la media aritmetica, infatti, costituisce un indice di equilibrio generale. Esempio. Dati i seguenti cinque numeri (n = 5): x1 = 10; x2 = 13; x3 = 9; x4 = 7; x5 = 12 la loro media aritmetica sarà uguale a: Ma 1 5 1 1 51 xi 10 13 9 7 12 51 10,2 5 i 1 5 5 5 Si osservi che, sostituendo a ciascun xi (i = 1, …, 5) il valore della media Ma e sommando i risultati, si ottiene: 10,2 10,2 10,2 10,2 10,2 5 M a 5 10,2 51 che è proprio la somma degli xi: 10 + 13 + 9 + 7 + 12 = 51 La media aritmetica ponderata P, usata soprattutto per evidenziare l’importanza, ovvero il peso, dei diversi valori di un carattere quantitativo, è ottenuta dividendo la somma dei prodotti dei numeri per i loro pesi non negativi, cioè per le frequenze dei singoli valori, per la somma dei pesi stessi; in formule è data da: P n 1 n p i 1 x p i 1 i i x1 p1 x2 p2 ... xn pn p1 p2 ... pn i Si osservi, a tal riguardo, che nella definizione di media aritmetica le modalità, e quindi le unità statistiche, concorrono “alla pari” nella determinazione della media: ciascuna modalità, infatti, “conta” per 1/n nella somma dei prodotti che definisce la media Ma. Tuttavia, esistono numerose situazioni reali nelle quali tale approccio non risulta corretto perché le unità statistiche possiedono importanza, esperienza o credibilità differenti tra loro (ad esempio, dopo la riforma universitaria che ha introdotto il sistema dei crediti per misurare l’impegno richiesto per ciascun insegnamento, è giusto valutare la carriera universitaria compiuta da uno studente ponderando i singoli voti con i crediti acquisiti nel corrispondente esame; in tal modo si fornisce maggiore rilevanza ai risultati conseguiti nelle materie che hanno richiesto un maggiore impegno di tempo). Per ogni tipo di media, dunque, sarà possibile ponderare i dati, assegnando a ciascuno di essi un peso diverso: anche se per semplificare il discorso, infatti, è sembrato opportuno soffermarsi solo sulla media aritmetica ponderata, non si deve affatto pensare che questa sia il solo tipo di media ponderata esistente. Esempio. Un’industria costruisce tre diversi tipi di copertoni per automobili: A, B, C. Il tempo necessario per costruire i copertoni è riportato nella seguente tabella: TIPO TEMPO (minuti) PEZZI PRODOTTI A 45 400 B 15 2500 C 18 1500 Utilizzando solo la seconda colonna della tabella, risulta possibile calcolare il tempo medio necessario per costruire un generico copertone: Ma 45 15 18 78 26 minuti 3 3 Guardando anche la terza colonna della tabella, però, si può osservare che l’industria produce molti copertoni di tipo B e pochi di tipo A, motivo per cui se si vuol calcolare un tempo medio di produzione che tenga conto dei copertoni effettivamente prodotti, occorre ponderare i tre diversi tempi con dei pesi corrispondenti al numero di pezzi prodotti. Il tempo medio di produzione diventa, quindi: P 45 400 15 2500 18 1500 18000 37500 27000 82500 18,75 minuti 400 2500 1500 4400 4400 Ne segue, dunque, che la media ponderata rappresenta un valore più realistico rispetto a quella aritmetica. La media geometrica, usata quando le variabili quantitative risultano non lineari ma ottenute da un prodotto o da un rapporto di valori lineari non negativi e diversi da zero, si ottiene estraendo la radice n-esima del prodotto degli n termini; in formule è data da: Mg n n x i n x1 x2 ... xn i 1 La media geometrica, considerata come quel valore che sostituito a ciascuno degli n dati ne lascia inalterato il prodotto, è usata soprattutto quando i dati non sono numerosi, i termini della distribuzione presentano valori molto differenti tra loro ed il rapporto tra un dato ed il precedente risulta costante (ad esempio, la determinazione del tasso di interesse medio equivalente alla sequenza dei tassi variabili, nel regime di capitalizzazione composta). Esempio. Dati i seguenti cinque numeri (n = 5): x1 = 10; x2 = 13; x3 = 9; x4 = 7; x5 = 12 la loro media geometrica sarà uguale a: 5 M g xi 5 10 13 9 7 12 5 98280 9,97 i 1 La media armonica, usata nello studio di variabili quantitative tra loro inversamente proporzionali, ovvero quando si deve trovare il valore medio, non del fenomeno considerato, ma di un fenomeno che è l’inverso del primo (ad esempio, prezzo di un bene e potere d’acquisto della moneta, interesse effettivo che cresce al decrescere del costo del titolo, …), è pari al reciproco della media aritmetica dei reciproci dei termini; in formule è data da: Mh n n 1 x i 1 i n 1 1 1 ... x1 x2 xn La media armonica, dunque, è quel valore tale che il suo reciproco, sostituito ai dati, che devono essere tutti positivi, fa rimanere invariata la somma dei reciproci dei dati stessi: viene usata, infatti, per mediare rapporti di tempo. Esempio. Dati i seguenti cinque numeri (n = 5): x1 = 10; x2 = 13; x3 = 9; x4 = 7; x5 = 12 la loro media armonica sarà uguale a: Mh 5 5 1 x i 1 i 5 5 5 16380 5 9,72 1 1 1 1 1 1638 1260 1820 2340 1365 8423 8423 10 13 9 7 12 16380 16380 La media quadratica si ottiene estraendo la radice quadrata della media aritmetica dei quadrati degli n termini; in formule è data da: 1 n p p x1p x2p ... xnp M p x1 , x2 ,..., xn xi n i 1 n p Tale media, denominata anche media di precisione, usata tutte le volte che alle differenze tra i termini ed il valore medio si dà il significato di deviazione o errore del valore esatto, ovvero nei casi in cui alcuni termini considerati risultano negativi e si desidera quindi eliminare la loro influenza, trova applicazione soprattutto nell’ambito della teoria degli errori. Esempio. Dati i seguenti dieci numeri (n = 10): x1 = 1; x2 = 1; x3 = 2; x4 = 2; x5 = 3; x6 = 3; x7 = 4; x8 = 4; x9 = 5; x10 = 5 la loro media quadratica sarà uguale a: M 2 x1 , x2 ,..., x10 1 10 2 1 2 2 xi 1 1 22 22 32 32 42 42 52 52 10 i 1 10 1 1 1 4 4 9 9 16 16 25 25 1 1 1 4 4 9 9 16 16 25 25 10 10 110 11 3,31 10 Tra le varie medie sopra descritte, dunque, sussiste la seguente relazione: Mh M g Ma M p La mediana è quell’indice di posizione che, una volta ordinate in senso crescente le osservazioni di un fenomeno, divide la distribuzione in due gruppi di uguale numerosità: al primo gruppo, infatti, appartengono le osservazioni uguali o inferiori alla mediana; al secondo gruppo, invece, quelle superiori o uguali alla mediana. La mediana, dunque, è la modalità dell’unità statistica che occupa il posto centrale nella distribuzione ordinata delle osservazioni. Dato cioè un insieme costituito da n intensità, x1, x2, …, xn, la determinazione della mediana è diversa a seconda che n sia pari o dispari, precisamente: - se n è pari, la mediana è data dalla semisomma delle intensità individuate dai seguenti due posti centrali, cioè dalla media aritmetica dei due valori centrali, ovvero: C1 x n , C2 x n 2 - 2 1 Me C1 C2 2 se n è dispari, la mediana è data dall’intensità individuata dal posto centrale nella distribuzione, ovvero: M e x n 1 2 La mediana, pertanto, si può calcolare per tutte quelle variabili le cui modalità possono essere ordinate, ovvero per le variabili qualitative ordinali, e per tutte le variabili quantitative: risulta, infatti, più conveniente usarla qualora si voglia esprimere il valore centrale di distribuzioni di caratteri che non possono essere misurati “esattamente” (ad esempio, i caratteri psicologici graduabili) oppure qualora non si possa far riferimento alla distribuzione normale, proprio grazie alla sua capacità di essere rappresentativa della posizione della distribuzione anche in presenza di valori estremi notevolmente di versi da tutti gli altri. La mediana, dunque, minimizza i costi complessivi ed è soprattutto resistente ai valori estremi: rappresenta, infatti, un indice per decisioni che implicano costi elevati nei casi estremi. Esempio. Date le seguenti intensità (n = 7, numero dispari): 3; 15; 9; 2; 6; 12; 5 la loro mediana si ottiene ordinando dapprima le intensità in ordine crescente, ovvero: x1 = 2; x2 = 3; x3 = 5; x4 = 6; x5 = 9; x6 = 12; x7 = 15 e poi considerando l’intensità che occupa il posto centrale, cioè Me = x4 = 6. Del resto, dalla formula: M e x n1 x71 x8 x4 6 2 2 2 si può concludere analogamente che la mediana è data proprio dall’intensità che occupa il quarto posto, ovvero Me = x4 = 6. Esempio. Date le seguenti intensità (n = 8, numero pari): 7; 16; 2; 3; 9; 12; 15; 5 la loro mediana si ottiene ordinando dapprima le intensità in ordine crescente, ovvero: x1 = 2; x2 = 3; x3 = 5; x4 = 7; x5 = 9; x6 = 12; x7 = 15; x8 = 16 e poi considerando la semisomma delle intensità che occupano i due posti centrali, x4 = 7; x5 = 9 cioè: Me 7 9 16 8 2 2 Del resto, dalle formule: C1 x n x8 x4 7, C2 x n x8 x41 x5 9 2 2 2 1 2 1 si può concludere analogamente che la mediana è data proprio dalla semisomma delle intensità che occupano il quarto (x4 = 7) ed il quinto posto (x5 = 9), ovvero: Me 7 9 16 8 2 2 La moda o norma della distribuzione di frequenza X, indicata con il simbolo M0 e calcolabile per caratteri sia quantitativi sia qualitativi, non risentendo dei valori estremi, rappresenta la modalità, o classe di modalità, caratterizzata dalla massima frequenza (assoluta o relativa), ovvero il valore numerico che, nella distribuzione di frequenza, è maggiormente presente rispetto agli altri. A tal riguardo occorre evidenziare che la moda è una modalità, non una frequenza. Se si rappresenta, pertanto, la distribuzione di frequenza in termini grafici, si può affermare che la moda corrisponde al picco della distribuzione che, di conseguenza, risulterà zeromodale se non ammette alcun valore modale ovvero nessun picco, unimodale se ne ammette uno solo (in tal caso la moda ha significato di sintesi), bimodale se ne ammette due, trimodale se ne ammette tre, … Per poter determinare, quindi, la classe modale risulta opportuno ricorrere all’istogramma, individuando l’intervallo di altezza massima, ovvero il punto di massimo della curva; la classe con la maggiore densità media, corrispondente proprio all’altezza dell’istogramma, sarà quella modale. La moda, dunque, minimizza gli scontenti ed è utilizzata in tutte quelle situazioni ove il consenso ed il numero delle singole unità ha significato per la decisione: la moda, infatti, è un indice utile per individuare la modalità più rappresentativa. Esempio. Data la seguente successione di termini (n = 13): x1 = 3; x2 = 5; x3 = 9; x4 = 3; x5 = 5; x6 = 7; x7 = 3; x8 = 2; x9 = 9; x10 = 3; x11 = 4; x12 = 3; x13 = 6 la loro moda è data dal termine che compare con maggiore frequenza, ovvero è M0 = 3 perché compare 5 volte. Esempio. Data la variabile X = numero di esami sostenuti da sei studenti ed osservati i seguenti valori: STUDENTI Nicola Mary Eleonora Beatrice Davide Christian ESAMI 30 19 8 7 27 10 si può concludere che la variabile X non ha moda, ovvero è zero modale, essendo la moda definita come la modalità più frequente: non esiste, infatti, nessuna modalità (numero di esami) ripetuta più delle altre e tutte le modalità hanno la stessa frequenza assoluta pari ad uno studente. Qual è la modalità più alta? 30 Qual è la modalità più frequente? Nessuna in quanto tutte hanno la stessa frequenza pari ad 1. Per individuare la moda di una variabile, dunque, bisogna chiedersi in primo luogo qual è la variabile e poi quali sono le modalità e qual è la modalità con la frequenza più alta. I quantili sono le intensità che dividono, dopo aver ordinato i dati, una distribuzione di frequenza in un certo numero di parti uguali (ad esempio, la mediana è quel valore che divide in due parti uguali l’insieme delle unità ordinate per grandezza, ovvero la distribuzione è divisa, rispetto a tale valore, in due parti ognuna contenente il 50% delle unità). Se si divide la distribuzione in due parti si parla di terzili (il primo terzile è quello che lascia alla sua sinistra un terzo delle osservazioni e alla sua destra i rimanenti due terzi; il secondo terzile è quello che lascia alla sua sinistra i due terzi e alla sua destra un terzo rimanente). Se si divide la distribuzione in tre parti si parla di quartili (il primo quartile Q1 lascia alla sua sinistra il 25% dei casi e alla sua destra il rimanente 75%; il secondo quartile Q2, che coincide con la mediana, lascia alla sua sinistra il 50% dei casi e alla sua destra il rimanente 50%; il terzo quartile Q3 lascia alla sua sinistra il 75% dei casi e alla sua destra il rimanente 25%). Se si divide la distribuzione in nove parti si parla di decili, …, in novantanove parti si parla di centili, in cento parti si parla di percentili. Pertanto, se X è un carattere con n modalità ordinate x1, x2, …, xn (x1 ≤ x2 ≤ … ≤ xn), per il calcolo dei quartili si procede in maniera analoga a quanto visto in precedenza per la mediana: - se n è pari: xn xn Q1 - 4 4 1 2 se n è dispari: Q1 x n 1 4 I quantili, dunque, si possono calcolare per tutte quelle variabili per le quali risulta possibile ordinarne le modalità, ovvero per variabili qualitative ordinali, oltre che per tutte le variabili quantitative. Esempio. Date le seguenti intensità (n = 7, numero dispari): 20; 65; 2; 10; 37; 15; 3 il loro quartile Q1 si ottiene ordinando dapprima le intensità in ordine crescente, ovvero: x1 = 2; x2 = 3; x3 = 10; x4 = 15; x5 = 20; x6 = 37; x7 = 65 e poi considerando l’intensità che occupa il posto n 1 7 1 8 2 partendo dalla prima 4 4 4 osservazione, ovvero Q1 = x2 = 3. Analogamente il terzo quartile Q3 si ottiene considerando l’intensità che occupa sempre il secondo posto partendo, però, dall’ultima osservazione, ovvero Q3 = x6 = 37. Esempio. Date le seguenti intensità (n = 8, numero pari): 20; 65; 83; 10; 37; 15; 3; 2 il loro quartile Q1 si ottiene ordinando dapprima le intensità in ordine crescente, ovvero: x1 = 2; x2 = 3; x3 = 10; x4 = 15; x5 = 20; x6 = 37; x7 = 65; x8 = 83 e poi considerando come primo quartile Q1 le intensità identificate dalle posizioni n 8 2, 4 4 n 8 1 1 2 1 3 , precisamente x2 = 3; x3 = 10; effettuando infine la semisomma tra tali 4 4 numeri, si ottiene: Q1 3 10 13 6,5 2 2 Per determinare poi il terzo quartile Q3 bisogna effettuare la semisomma tra le intensità che occupano sempre la seconda e la terza posizione, partendo però da sinistra, ovvero: Q3 37 65 102 51 2 2 La variabilità o mutabilità, ovvero la dispersione, è misurata, invece, dai cosiddetti indici di variabilità, in grado di discriminare tra situazioni tra loro molto differenziate, cosa questa per la quale l’utilizzo dei soli indici di posizione potrebbe risultare, non solo non sufficiente, ma addirittura fuorviante. La variabilità di un fenomeno, ovvero la sua attitudine ad assumere differenti modalità, e di conseguenza diversi valori quantitativi in un certo periodo di tempo o in seguito all’influenza di un altro fenomeno, è caratterizzata dai seguenti due aspetti: - dispersione: pone in rilievo di quanto le varie intensità o osservazioni differiscano da una media prestabilita ovvero si addensino intorno ad una determinata media; - disuguaglianza o variabilità reciproca: evidenzia la diversità delle varie intensità o osservazioni tra loro. Gli indici di variabilità si distinguono in: - assoluti: sono espressi nella stessa unità di misura del fenomeno di cui calcolano la dispersione o la disuguaglianza oppure in funzione di suddetta unità di misura (campo di variazione, scarto semplice medio, varianza, scarto quadratico medio o deviazione standard); - relativi: prescindono dall’unità di misura del fenomeno e si ottengono rapportando due misure assolute oppure un indice assoluto al suo massimo; sono pertanto adatti per effettuare confronti tra fenomeni diversi (coefficiente di variazione). Il campo di variazione o range, R(X), di una sequenza di numeri è l’indice assoluto di variabilità più semplice da calcolarsi: è ottenuto, infatti, dalla differenza tra il valore massimo e quello minimo; in formule è dato da: R(X) = max(xi) – min(xi) Esempio. Se si considerano le seguenti valutazioni delle tre prove degli esami di stato riportate da quattro studenti: STUDENTI Nicola Mary Eleonora Giacomo PRIMA PROVA 3 5 8 9 SECONDA PROVA 2 7 8 8 TERZA PROVA 6 7 6 6 allora i range delle tre prove sono dati rispettivamente da: R1(X) = 9 – 3 = 6 R2(X) = 8 – 2 = 6 R3(X) = 7 – 6 = 1 mentre le rispettive medie aritmetiche sono date da: M a 1 3 5 8 9 25 6,25 4 4 M a 2 2 7 8 8 25 6,25 4 4 M a 3 6 7 6 6 25 6,25 4 4 Si può osservare, quindi, che nella prima e terza prova il range, pari a 6, è superiore rispetto a quello della seconda prova, i dati sono più dispersi ed i risultati più eterogenei; nella seconda prova, in cui il range è pari ad 1, invece, i dati sono più concentrati ed i risultati più omogenei. La distribuzione della prima prova, inoltre, risulta diversa da quella della seconda prova, nonostante entrambe le prove presentino lo stesso range. Dunque: - più R è piccolo più i dati sono concentrati, più R è grande più i dati sono dispersi; - R è espresso nella stessa unità di misura dei dati; - R tiene conto solo dei dati estremi della distribuzione e non di tutti i dati: distribuzioni diverse ma con gli stessi valori estremi, cioè, hanno uguale range. Lo scarto semplice medio S(Ma) di una sequenza di numeri x1, x2, …, xn è la media aritmetica dei valori assoluti degli scarti dei numeri stessi dalla loro media aritmetica Ma; in formule è dato da: S M a x1 M a x2 M a ... xn M a n Si osservi che occorre considerare gli scarti in valore assoluto poiché ciò che interessa è lo scostamento di ogni dato dalla media e non se il dato è minore o maggiore del valore medio stesso. Del resto, com’è facile verificare, la media aritmetica degli scarti, non considerati in valore assoluto, vale sempre zero. Esempio. Se si considerano le seguenti valutazioni delle tre prove degli esami di stato riportate da quattro studenti: STUDENTI Nicola Mary Eleonora Giacomo PRIMA PROVA 3 5 8 9 SECONDA PROVA 2 7 8 8 TERZA PROVA 6 7 6 6 allora, essendo: M a 1 M a 2 M a 3 6,25 gli scarti medi delle tre prove sono dati rispettivamente da: S M a 1 3 6,25 5 6,25 8 6,25 9 6,25 4 S M a 2 2 6,25 7 6,25 8 6,25 8 6,25 S M a 3 6 6,25 7 6,25 6 6,25 6 6,25 4 4 3,25 1,25 1,75 2,75 9 2,25 4 4 4,25 0,75 1,75 1,75 8,5 2,125 4 4 0,25 0,75 0,25 0,25 1,5 0,375 4 4 Si può osservare, quindi, che nella prima prova lo scarto, pari a 2,25 (ovvero i valori della sequenza si discostano mediamente di 2,25 dalla media), è superiore rispetto a quello della terza prova, i dati sono più dispersi ed i risultati più eterogenei; nella terza prova, in cui lo scarto è pari a 0,375, invece, i dati sono più concentrati ed i risultati più omogenei. La distribuzione della prima prova, inoltre, risulta diversa da quella della seconda prova. Dunque: - più S(Ma) è piccolo più i dati sono concentrati, più S(Ma) è grande più i dati sono dispersi; - S(Ma) è espresso nella stessa unità di misura dei dati; - S(Ma) tiene conto di tutti i dati della distribuzione. La varianza di una sequenza di numeri x1, x2, …, xn è la media aritmetica dei quadrati degli scarti dei numeri stessi dalla loro media aritmetica Ma; in formule è data da: x1 M a 2 x2 M a 2 ... xn M a 2 2 n dove Dev x1 M a x2 M a ... xn M a , ovvero il numeratore della varianza, è detta 2 2 2 devianza. Da un punto di vista sostanziale, però, la varianza presenta un notevole inconveniente, ovvero non è direttamente confrontabile con la media o con altri valori della distribuzione proprio perché espressa nell’unità di misura del fenomeno elevata al quadrato. Lo scarto quadratico medio o deviazione standard di una sequenza di numeri x1, x2, …, xn, più sensibile dello scarto semplice medio, e per questo utilizzato sia per piccole variazioni nella distribuzione dei dati intorno alla media sia per ovviare al problema della varianza sopra illustrato, è la radice quadrata della varianza; in formule è dato da: x1 M a 2 x2 M a 2 ... xn M a 2 n Si osservi che tra lo scarto semplice medio e lo scarto quadratico medio vale la seguente diseguaglianza: S M a Esempio. Se si considera la seguente sequenza di otto valori: x1 = 4, x2 = 7, x3 = 9, x4 = 13, x5 = 14, x6 = 18, x7 = 21, x8 = 34 la cui media aritmetica è: Ma 4 7 9 13 14 18 21 34 120 15 8 8 si ottiene la varianza pari a: 2 4 152 7 152 9 152 13 152 14 152 18 152 21 152 34 152 8 112 82 62 22 12 32 62 192 8 e lo scarto quadratico medio pari a: 632 79 8 121 64 36 4 1 9 36 361 8 632 79 8,8882 8 Il coefficiente di variazione CV, indice di variabilità relativo maggiormente usato, è definito dal rapporto tra la deviazione standard ed la media aritmetica; in formule è dato da: CV Ma Si osservi che il coefficiente di variazione, espresso in genere in termini percentuali moltiplicando CV per 100, è indipendente dall’unità di misura, ovvero è un numero puro utilizzato, sia per misurare la variazione media del fenomeno in rapporto alla sua media aritmetica, sia per confrontare la variabilità relativa di un fenomeno in circostanze differenti (ad esempio, la variabilità della distribuzione per Età tra le varie regioni, la distribuzione dei Redditi per nazioni e per anno, la variabilità del Peso rispetto al sesso, …). Il coefficiente di variazione, inoltre, è necessario tutte le volte che si intende confrontare la variabilità di due fenomeni espressi in unità di misure non confrontabili (ad esempio, la variabilità del Peso rispetto a quella dell’Altezza, la variabilità dei Consumi di carburante rispetto alla variabilità dell’Usura dei pneumatici per una determinata marca di autovetture, …).