Le medie LE MEDIE Italo Nofroni Le medie (o valori medi) sono indici di tendenza centrale e costituiscono un modo semplice ed immediato per sintetizzare in un solo valore i dati eterogenei raccolti in un collettivo Statistica medica Le medie Le medie Medie Le medie vengono classificate in Medie ferme Medie lasche Medie ferme: per il calcolo richiedono l’utilizzo di tutti i valori disponibili Aritmetica Moda Geometrica Mediana Armonica Quantili Medie lasche: per il calcolo si utilizzano solo alcuni dei valori disponibili Quadratica Le medie Le medie ferme Medie ferme Media aritmetica Data una seriazione, si ottiene come somma dei prodotti di ciascuna modalità per la rispettiva frequenza, diviso la somma delle frequenze In formula K M ( x) = x = ∑ i =1 K ∑ i =1 xi ni ni Per distribuzioni semplici: ni = 1 1 Le medie ferme Le medie ferme Esempio 1 Numero di figli ni x in i 0 8 0 1 14 14 2 20 40 3 6 18 4 4 16 5 2 10 Totale 54 98 La media aritmetica Quindi… x= 98 = 1.8148 ≅ 1.81 54 Le medie ferme seriazioni simmetriche dati che variano in progressione aritmetica Le medie ferme Nel caso di variabili continue le cui modalità sono raggruppate in classi, per il calcolo della media si prende usualmente il valore centrale (medio) di ogni classe, ipotizzando l’equidistribuzione dei dati all’interno della classe stessa Le medie ferme E’ la media più utilizzata, la media per antonomasia, ma il suo campo di applicazione ideale è per Se l’ipotesi di equidistribuzione non fosse accettabile (classi aperte…), come valore medio della classe si può scegliere un valore arbitrario ma plausibile, oppure è necessario conoscere analiticamente i veri valori delle unità statistiche e tramite questi calcolare il vero valore medio della classe Le medie ferme Esempio 2 Età al parto ni Valore classe Fino a 15 3 ? 15 - 20 10 ? 20 - 25 36 22.5 …………… …………… …………… …………… …………… …………… 45 e oltre 8 ? Nota la media aritmetica, si possono calcolare Gli scarti si = xi − x Gli scostamenti purché shi = xi − h h≠x 2 Le medie ferme Le medie ferme Proprietà della media aritmetica Proprietà della media aritmetica 1 Il valore della media è sempre compreso tra il minimo e il massimo dei valori presi in esame 2 Se un collettivo è diviso in gruppi di cui sono note le medie, la media generale è data dalla media delle medie di gruppo ponderate con la numerosità di gruppo x1 ≤ x ≤ xK Le medie ferme Esempio 3 altezza media numerosità Maschi 172 cm 100 Femmine 166 cm 200 gruppo Quanto sarà l’altezza media complessiva indipendentemente dal sesso? Le medie ferme Esempio 3 Esempio 3 Le medie ferme x tot = xtot = xM nM + xF nF nM + nF ovvero 172 x100 + 166 x 200 = 168 100 + 200 Le medie ferme Proprietà della media aritmetica gruppo altezza media numerosità Maschi 172 cm 100 Femmine 166 cm 200 3 La somma algebrica degli scarti è sempre uguale a 0 K Come si vede, la media totale è spostata verso quella del gruppo con numerosità maggiore ∑s n i =1 i i = 0 3 Le medie ferme Le medie lasche Proprietà della media aritmetica Medie lasche 4 La somma dei quadrati degli scarti è sempre minore della somma dei quadrati degli scostamenti K ∑ si 2 ni < i =1 K ∑s i =1 2 h i ni Le medie lasche Esempio 4 (seriazione) E’ data dalla modalità con la massima frequenza E’ l’unica media che si può applicare indifferentemente a serie e a seriazioni ed appunto questa la sua maggiore utilità Le medie lasche Numero di figli ni 0 8 Massima frequenza Numero di figli ni 0 8 1 14 Esempio 4 (seriazione) 1 14 2 20 2 20 3 6 3 6 4 4 4 4 5 2 5 2 Totale 54 Totale 54 Numero di figli ni 0 8 1 14 2 20 3 6 4 4 5 2 Le medie lasche Massima frequenza …quindi Le medie lasche Totale 54 Graficamente… Massima frequenza 25 20 Massima frequenza frequenza Esempio 4 (seriazione) Moda …quindi 15 10 5 0 0 Mo = 2 1 2 3 4 5 num ero di figli Mo = 2 4 Le medie lasche Le medie lasche Esempio 5 (serie) Stato civile ni Stato civile ni 23 Esempio 5 (serie) celibe/nubile celibe/nubile 23 coniugato/a 27 Mo = coniugato/a coniugato/a 27 divorziato/a 4 divorziato/a 4 vedovo/a 6 vedovo/a 6 Totale 60 Totale 60 Le medie lasche Le medie lasche Può interessare anche la moda secondaria 25 frequenza 20 15 Mo = 2 10 Mo2 = 4 Nel caso di una variabile continua espressa in classi, tutte di uguale ampiezza, si può individuare, col metodo già noto, la classe modale 5 0 0 1 2 3 4 5 numero di figli Le medie lasche Le medie lasche Esempio 6 Esempio 6 Altezza (cm) ni Altezza (cm) ni 150 - 159 49 150 - 159 49 160 – 169 54 160 – 169 54 170 - 179 61 Classe modale = 170 - 179 170 - 179 61 180 - 189 16 180 - 189 16 Totale 180 Totale 180 5 Le medie lasche Le medie lasche Nel caso di una variabile continua espressa in classi di ampiezza diversa, per individuare la classe modale si deve calcolare la densità di frequenza = ni/ampiezza classe Le medie lasche Esempio 7 Esempio 7 Età ni ni/classe 20 – 24 25 – 29 30 – 39 40 – 59 60 - 69 Totale 20 30 40 42 36 168 20/5 = 4 30/5 = 6 40/10 = 4 42/20 = 2.1 36/10 = 3.6 - Le medie lasche Esempio 7 Età ni ni/classe Età ni ni/classe 20 – 24 25 – 29 30 – 39 40 – 59 60 - 69 Totale 20 30 40 42 36 168 20/5 = 4 30/5 = 6 40/10 = 4 42/20 = 2.1 36/10 = 3.6 - 20 – 24 25 – 29 30 – 39 40 – 59 60 - 69 Totale 20 30 40 42 36 168 20/5 = 4 30/5 = 6 40/10 = 4 42/20 = 2.1 36/10 = 3.6 - Classe modale = 25 - 29 Le medie lasche Le medie lasche Esempio 8: (distribuzione semplice, N dispari) La mediana Data una seriazione ordinata (crescente o decrescente), la mediana è il valore centrale, ovvero quel valore che la divide in due parti uguali Altezza 147 153 154 159 163 171 182 6 Le medie lasche Le medie lasche Esempio 8: (distribuzione semplice, N dispari) Esempio 9: (distribuzione semplice, N pari) Altezza 147 153 154 159 163 171 182 Valore centrale Me = 159 Le medie lasche Le medie lasche Esempio 9: (distribuzione semplice, N pari) Valori centrali Peso 45 51 54 59 63 69 77 84 Le medie lasche Età ni Peso 45 51 54 59 63 69 77 84 Nel caso di distribuzioni di frequenza, occorre 1) Ordinare la seriazione (nel caso non lo sia) 2) Calcolare le frequenze cumulate 3) Calcolare N/2 Me = (59 +63)/2 = 61 4) Se N dispari il valore centrale è nel posto N/2 5) Se N pari i valori centrali sono nei posti N/2 e N/2 +1 6) Individuare in quale frequenza cumulata si trova la mediana e quindi a quale modalità corrisponde Esempio 10: N dispari Le medie lasche Ni Età ni Esempio 10: N dispari Ni 20 8 8 20 8 8 21 11 19 21 11 19 22 23 42 22 23 42 23 44 86 23 44 86 24 52 138 24 52 138 25 27 165 25 27 165 26 20 185 26 20 185 Totale 185 Totale 185 Posto centrale: 93° N/2 = 92.5 7 Le medie lasche Esempio 10: N dispari Età ni Ni 20 8 8 Posto centrale: 93° N/2 = 92.5 Le medie lasche Esempio 11: N pari Altezza ni Ni 145 - 149 11 11 150 - 154 12 23 155 - 159 14 37 21 11 19 22 23 42 23 44 86 160 - 164 15 52 165 - 169 22 74 24 52 138 25 27 165 170 - 174 60 134 185 175 e oltre 66 200 Totale 200 26 20 Totale 185 Le medie lasche Me = 24 Esempio 11: N pari Le medie lasche Esempio 11: N pari Altezza ni Ni Altezza ni Ni 145 - 149 11 11 145 - 149 11 11 150 - 154 12 23 150 - 154 12 23 155 - 159 14 37 155 - 159 14 37 160 - 164 15 52 160 - 164 15 52 165 - 169 22 74 165 - 169 22 74 170 - 174 60 134 170 - 174 60 134 175 e oltre 66 200 175 e oltre 66 200 Totale 200 Totale 200 Posti centrali N/2 = 100° N/2 + 1 = 101° Le medie lasche Posti centrali N/2 = 100° N/2 + 1 = 101° Me = 170 - 174 Le medie lasche I quantili La mediana è particolarmente utile nella sintesi di distribuzioni asimmetriche; in questo caso infatti la media aritmetica, considerando anche i valori estremi anomali, finirebbe col sovrastimare il fenomeno Valori che consentono di suddividere la seriazione considerata in un numero prefissato di parti uguali 8 Le medie lasche Le medie lasche Usualmente si utilizzano i: Percentili: dividono la seriazione in 100 parti uguali La mediana, dividendo la seriazione in 2 parti uguali, è un quantile Decili: individuano 10 parti uguali Corrisponde al secondo quartile e al cinquantesimo percentile Quartili: individuano 4 parti uguali Terzili: individuano 3 parti uguali 9