Lezione 7 - Indici statstici : media, moda, mediana, varianza 1 INDICI STATISTICI MEDIA, MODA, MEDIANA, VARIANZA GRUPPO MAT06 – Dip. Matematica, Università di Milano - Probabilità e Statistica per le Scuole Medie - SILSIS - 2007 Lezione 7 - Indici statstici : media, moda, mediana, varianza 2 Principali Indici Statistici di posizione { MODA MEDIANA MEDIA SCARTO QUADRATICO MEDIO INDICE di dispersione di forma { { VARIANZA RANGE ASIMMETRIA (SKEWNESS) CURTOSI ( KURTOSIS) GRUPPO MAT06 – Dip. Matematica, Università di Milano - Probabilità e Statistica per le Scuole Medie - SILSIS - 2007 Lezione 7 - Indici statstici : media, moda, mediana, varianza 3 INDICI DI POSIZIONE Frequenza Consentono di valutare l’ordine di grandezza delle manifestazioni e servono per localizzare la distribuzione, ovvero individuare attorno a quale valore del carattere si accentra la distribuzione stessa. Moda Media Mediana X Sono espressi nella stessa unità di misura con cui si estrinseca il fenomeno MODA E' definita come il valore che ha la frequenza più alta. MEDIANA E' quel valore al di sotto del quale cadono la metà dei valori campionari. GRUPPO MAT06 – Dip. Matematica, Università di Milano - Probabilità e Statistica per le Scuole Medie - SILSIS - 2007 Lezione 7 - Indici statstici : media, moda, mediana, varianza 4 INDICI DI POSIZIONE Frequenza Moda Media Mediana MEDIA Aritmetica n ∑X X = i=1 n i X E' quel valore che corrisponde alla somma di tutti i valori diviso il numero dei valori stessi. Rappresenta il valore che sostituito a ciascun xi lascia invariata la intensità totale (somma) dove: Xi = esito i-ma misura - n = numero dei dati (taglia del campione) GRUPPO MAT06 – Dip. Matematica, Università di Milano - Probabilità e Statistica per le Scuole Medie - SILSIS - 2007 Lezione 7 - Indici statstici : media, moda, mediana, varianza 5 MODA E MEDIA sono indici di posizione, poiché la loro variazione sposta appunto la posizione della curva (verso destra o verso sinistra) in funzione del segno della variazione. densita' di probabilita' 280 NELLA CURVA NORMALE (simmetrica) 240 200 MEDIA= MODA = MEDIANA f(x) 160 120 80 media=2.06 40 moda=0.1 mediana=0.45 0 moda=mediana=media 600 x 540 480 420 n.osservaz. 360 300 240 180 120 60 0 <= 1,345 (2,69;4,035] (1,345;2,69] (5,38;6,726] (4,035;5,38] (8,071;9,416] (6,726;8,071] GRUPPO MAT06 – Dip. Matematica, Università di Milano - Probabilità e Statistica per le Scuole Medie - SILSIS - 2007 Lezione 7 - Indici statstici : media, moda, mediana, varianza 6 ESEMPIO 1 utilizzo strumento di analisi: statistica descrittiva Numero di componenti familiari 0,5 0,4 media 0,2 moda 0,1 0 1,000 Frequenze relative componenti nucleo f amiliare 3,000 5,000 7,000 9,000 11,000 Media = 4.5 > 4 = mediana=moda 0,5 Ci sono più osservazioni alla sinistra della media 0,4 0,3 La distribuzione è più concentrata alla sinistra della media MA la coda è più lunga a destra 0,2 0,1 studenti.xls media 0,3 0 1 2 3 4 5 6 7 8 9 10 11 12 GRUPPO MAT06 – Dip. Matematica, Università di Milano - Probabilità e Statistica per le Scuole Medie - SILSIS - 2007 Lezione 7 - Indici statstici : media, moda, mediana, varianza 7 altezza media = 169 > 168 = mediana>Moda=160 Ci sono più osservazioni alla sinistra della media La distribuzione è più concentrata alla sinistra della media e la coda è più lunga a destra altezza - ampiezza = 1 cm altezza - ampiezza=3cm 450 400 300 250 198 195 192 189 186 183 180 177 174 171 168 165 194 191 188 185 182 179 176 173 170 167 164 161 158 155 152 149 162 50 0 159 0 156 50 200 150 100 100 146 studenti.xls 150 153 350 300 250 200 150 utilizzo strumento di analisi: statistica descrittiva ESEMPIO 2 GRUPPO MAT06 – Dip. Matematica, Università di Milano - Probabilità e Statistica per le Scuole Medie - SILSIS - 2007 Lezione 7 - Indici statstici : media, moda, mediana, varianza 8 MISURE DI DISPERSIONE xmax -xmin RANGE (Campo di variazione) SCARTO MEDIO ASSOLUTO VARIANZA (Media degli Scarti al Quadrato) σ2 = s2 = VARIANZA CAMPIONARIA (Calcolata da Excel) s= DEVIAZIONE STANDARD CAMPIONARIA CV = σ X COEFFICIENTE DI VARIAZIONE GRUPPO MAT06 – Dip. Matematica, Università di Milano - Probabilità e Statistica per le Scuole Medie - SILSIS - 2007 Lezione 7 - Indici statstici : media, moda, mediana, varianza 9 l’importanza della varianza Media uguale Deviazione Standard Diversa Media uguale (2) e Varianza diversa 0,34 e 7,68 rispettivamente CHI1 80 400 70 350 60 300 50 250 40 200 No of obs 30 150 20 100 10 50 0 0 -0,2 0,0 0,2 0,4 0,6 0,8 1,0 1,2 1,4 1,6 1,8 2,0 0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 Expected Normal Upper Boundaries (x <= boundary) GRUPPO MAT06 – Dip. Matematica, Università di Milano - Probabilità e Statistica per le Scuole Medie - SILSIS - 2007 Lezione 7 - Indici statstici : media, moda, mediana, varianza 10 ESEMPI 1-2 studenti.xls utilizzo strumento di analisi: statistica descrittiva Componenti familiari e altezza Calcolare 1.range 2. Scostamento medio assoluto 3. varianza 4.scarto quadratico medio 5. Coefficiente di variazione GRUPPO MAT06 – Dip. Matematica, Università di Milano - Probabilità e Statistica per le Scuole Medie - SILSIS - 2007 Lezione 7 - Indici statstici : media, moda, mediana, varianza 11 ESEMPIO 3 Media > mediana = = moda Più osservazioni a sinistra della media Dev. Stand. piccola rispetto al range Non c’è molta dispersione GRUPPO MAT06 – Dip. Matematica, Università di Milano - Probabilità e Statistica per le Scuole Medie - SILSIS - 2007 Lezione 7 - Indici statstici : media, moda, mediana, varianza 12 Ci si aspetta una distribuzione, con una lunga coda a destra e la maggior parte della distribuzione concentrata a sinistra con un picco intorno alla media=mediana. Frequenze età 0,40 0,35 0,30 0,25 0,20 0,15 0,10 0,05 0,00 19-20 20-21 21-22 22-23 23-24 24-25 25-27 27-33 33-50 >50 GRUPPO MAT06 – Dip. Matematica, Università di Milano - Probabilità e Statistica per le Scuole Medie - SILSIS - 2007 Lezione 7 - Indici statstici : media, moda, mediana, varianza 13 I dati raggruppati …e se non abbiamo a disposizione i dati grezzi, ma solo le distribuzioni di frequenza? Come determiniamo gli indici di sintesi? NUMERO DI FIGLI FREQUENZA xi fi 0 1 2 3 4 5 6 9 Totale 5 6 15 13 4 3 3 1 50 Tabella: Distribuzione di frequenza del numero di figli di 50 famiglie di una comunità Caso discreto CLASSE DI VALORI FREQUEN ZA CLASSE fi 10-19 20-29 30-39 40-49 50-59 60-69 4 66 47 36 12 4 Totale 169 Tabella: Distribuzione delle età di 169 soggetti Caso raggruppamento per classi GRUPPO MAT06 – Dip. Matematica, Università di Milano - Probabilità e Statistica per le Scuole Medie - SILSIS - 2007 Lezione 7 - Indici statstici : media, moda, mediana, varianza 14 Caso discreto : LA MEDIA PONDERATA ESEMPIO: k x= ∑m f i =1 k FREQUENZA xi fi 0 1 2 3 4 5 6 9 Totale 5 6 15 13 4 3 3 1 50 Somma degli elementi del campione i i ∑f i =1 NUMERO DI FIGLI i =n taglia del campione Tabella: Distribuzione di frequenza del numero di figli di 50 famiglie di una comunità k x= ∑m f i =1 k i i ∑f i =1 = 0 × 5 + 1× 6 + K + 9 × 1 = 2.66 5 + 6 + ... + 1 i GRUPPO MAT06 – Dip. Matematica, Università di Milano - Probabilità e Statistica per le Scuole Medie - SILSIS - 2007 Lezione 7 - Indici statstici : media, moda, mediana, varianza 15 LA MEDIA PER DATI RAGGRUPPATI IN CLASSI k mi fi valore centrale della classe i-ma x= Frequenza della classe i-ma ∑m f i =1 k ESEMPIO: C LA S S E D I VA LOR I 10-19 20-29 30-39 40-49 50-59 60-69 V A LO R E C E N T R A L E C LA SSE FR E Q UE N ZA C LA SS E mi fi m i fi 14.5 24.5 35.5 44.5 54.5 64.5 4 66 47 36 12 4 58.0 1617.0 1621.5 1602.0 654.0 258.0 169 5810.5 Totale i i ∑f i =1 Somma degli elementi del campione i =n taglia del campione k x= ∑m f i =1 k i i ∑f i =1 = 5810.5 = 34.48 169 i GRUPPO MAT06 – Dip. Matematica, Università di Milano - Probabilità e Statistica per le Scuole Medie - SILSIS - 2007 Lezione 7 - Indici statstici : media, moda, mediana, varianza 16 LA VARIANZA PER DATI RAGGRUPPATI IN CLASSI mi fi k valore centrale della classe i-ma s2 = Frequenza della classe i-ma ∑ (m − x ) 2 i i =1 k ∑f i =1 i −1 fi =n -1 ESEMPIO: C LASSE DI VA LOR I 10-19 20-29 30-39 40-49 50-59 60-69 FR EQUENZA C LASSE VALORE CENTRALE CLASSE mi fi (m i - x) 14.5 24.5 35.5 44.5 54.5 64.5 4 66 47 36 12 4 -19.88 -9.88 .12 10.18 20.12 30.12 Totale (m i - x) 2 395.2144 97.6144 .0144 102.4144 404.2144 907.2144 169 (m i - x) 2 f i 1580.8576 6442.5504 .6768 3686.9184 4857.7728 3628.8576 20197.6336 k s2 = ∑ (m − x ) 2 i i =1 k ∑f i =1 i −1 fi =− 20197.6336 = 120.224 168 GRUPPO MAT06 – Dip. Matematica, Università di Milano - Probabilità e Statistica per le Scuole Medie - SILSIS - 2007