Fonti e strumenti statistici per la comunicazione Prof.ssa Isabella Mingo A.A. 2014-2015 Stesso valore medio per distribuzioni diverse ui X11 X12 X13 A 22 1 21 B 22 8 21 C 20 10 21 D 23 32 21 E 19 34 21 F 20 41 21 M 21 21 21 • Un uguale valore medio può sintetizzare distribuzioni molto diverse tra loro • Nell’esempio le tre distribuzioni hanno la medesima media aritmetica, ma la tendenza di ogni unità ad assumere valori diversi dalla media è differente in ciascuna distribuzione a.a. 2014-2015 1 Variabilità o Dispersione Attitudine di un fenomeno ad assumere diverse modalità Caratteri quantitativi: variabilità e dispersione Caratteri qualitativi: mutabilità Misure di sintesi Indici di variabilità/dispersione Indici di mutabilità Caratteri quantitativi La variabilità/dispersione La variabilità o la dispersione di una distribuzione esprime la tendenza dei caratteri o dei fenomeni ad assumere differenti valori. Requisiti di un indice di variabilità-dispersione: Assume valore minimo se e sole se tutte le u.s. presentano la stessa modalità Positivo se c’è variabilità o dispersione Aumenta all’aumentare della diversità tra le modalità assunte dalle u.s. Non cambia se le frequenze vengono moltiplicate per una costante positiva a.a. 2014-2015 2 Indici di variabilità e dispersione Indici di variabilità reciproca La variabilità si misura considerando tutte le differenze tra le modalità della distribuzione presentate dalle u.s. prese due a due Differenze Medie Indici di dispersione rispetto ad un valore centrale La dispersione si misura con gli scarti tra le modalità presentate dalle u.s. e un indice di dimensione della distribuzione (M o Me) Varianza Scostamento (scarto) quadratico medio Nella pratica i due termini vengono spesso usati come sinonimi Caratteri quantitativi Varianza E’ la media dei quadrati degli scarti dalla media aritmetica Si calcola sommando gli scarti elevati al quadrato e dividendoli per la numerosità della distribuzione. n 2 (x M) j Var( X ) 2( X ) j1 N La radice quadrata della varianza è la deviazione standard o scarto quadratico medio 3 Esempio: calcolo della varianza e dello scarto quadratico medio 10 N 10 xj U.S. Temperatura Minima A (xj - M) (xj - M)2 6.9 47.61 9 B -2 -4.1 16.81 C 4 1.9 3.61 D -3 -5.1 26.01 E -2 -4.1 16.81 F 0 -2.1 4.41 G 6 3.9 15.21 H 4 1.9 3.61 I -4 -6.1 37.21 9 6.9 47.61 J Var ( X ) 10 j 1 M 218.9 21.89 10 21 2.1 10 • Il numeratore della varianza è detto devianza • L’elevazione a quadrato trasforma tutte le differenze negative in positive e mette in maggiore risalto le differenze grandi rispetto a quelle piccole. • La varianza non possiede la stessa unità di misura dei valori della distribuzione 2 10 10 Osservazioni: 218.9 x j M j 1 •La radice quadrata della varianza è la deviazione standard o scarto quadratico medio. Ha la stessa unità di misura dei valori della distribuzione. ( X ) Var ( X ) 21.89 4.679 Devianza - Varianza-Scarto quadratico medio Calcolo da una distribuzione unitaria Devianza Dev( X ) x1 M 2 x2 M 2 xN M 2 Varianza (non ha la stessa unità di misura del carattere) Scostamento quadratico medio (deviazione standard) Var ( X ) x1 M 2 x2 M 2 xN M 2 N x1 M 2 x2 M 2 xN M 2 N 4 Esempio: calcolo della varianza e dello scarto quadratico medio Distribuzione degli studenti di SDC frequentanti la facoltà nell’a.a. 2001/2002 per Numero di Corsi Frequentati Num. Corsi Freq. 1 2 3 4 5 6 7 Totale nj xjnj 15 43 103 80 32 8 2 283 (x j -M )2 (x j -M )2 n j 15 86 309 320 160 48 14 952 5,57 1,85 0,13 0,41 2,69 6,97 13,25 83,55 79,55 13,39 32,80 86,08 55,76 26,50 377,63 K 7 N 283 7 x jnj M j 1 283 952 3.36 283 7 2 x j M n j Var( X ) j 1 283 377.63 1.33 283 ( X ) Var( X ) 1.33 1.15 Devianza - Varianza-Scarto quadratico medio Calcolo da una distribuzione semplice di frequenze • Devianza Dev( X ) x1 M2 n1 xj M2 nj xK M2 nK Varianza (non ha la stessa unità di misura del carattere) Var( X ) Scostamento quadratico medio (deviazione standard) x1 M 2 n1 x j M 2 n j xK M 2 nK N x1 M 2 n1 x j M 2 n j xK M 2 nK N 5 Proprietà della varianza e Var sono valori medi : forniscono il valor medio della dispersione dei valori assunti dalle u.s. rispetto ad un valore centrale della distribuzione Sono pari a zero se tutte le u.s. presentano la stessa modalità del carattere ha la stessa unità di misura del carattere è invariante per trasformazioni lineari Var( X ) Var(Y ) a 2Var( X ) x j y j axj b ( X ) (Y ) a ( X ) Esempio: invarianza per trasformazioni lineari M ( X ) M (Y ) aM ( X ) b x j y j ax j b Var ( X ) Var (Y ) a 2Var ( X ) ( X ) (Y ) a ( X ) X=Temperatura in Gradi Centigradi Y=Temperatura in Gradi Fahrenheit U.S. 1983 1984 1985 1986 1987 Temperatura Temperatura Gradi Centigradi Gradi Fahrenheit X Y 18.4 65.12 16.8 62.24 16.9 62.42 17.7 63.86 16.8 62.24 M ( X ) 17.32 Var( X ) 0.4056 Trasformazione lineare Y 1.8 X 32 a 1.8 b 32 M (Y ) (1.8 17.32) 32 63.18 Var(Y ) (1.8)2 0.406 3.24 0.406 1.315 6