Marilena Pillati - Seminari di Statistica (SVIC) "Le medie" Le medie Sono misure sintetiche che consentono il passaggio da una pluralità di informazioni a una sola modalità Nella famiglia delle medie si distinguono: { { medie lasche o di posizione determinate in base alla loro frequenza o alla posizione occupata nella graduatoria delle osservazioni individuali medie analitiche calcolate con operazioni algebriche sui valori del carattere Medie { Medie analitiche z z z { Media aritmetica Media geometrica Media armonica Medie di posizione z z z Moda Mediana Quantili 1 Marilena Pillati - Seminari di Statistica (SVIC) "Le medie" Media aritmetica La media aritmetica di un insieme di n valori osservati x1, x2, …, xn di un carattere quantitativo X è pari alla somma dei valori osservati divisa per il loro numero: x = n 1 (x1 + x2 + L + xn ) = 1 ∑ xi n n i =1 Media aritmetica La media aritmetica è quella costante k che sostituita a ciascun valore individuale x1, …, xn lascia inalterato l’ammontare del carattere n ∑ x j = nk → k= j =1 u ∑ i =1 x i ni = nk → k = 1 n n ∑x j =x j =1 1 n u ∑x n i i =x i =1 2 Marilena Pillati - Seminari di Statistica (SVIC) "Le medie" Calcolo della media aritmetica Espressione generale per il calcolo della media aritmetica x= c n c = ammontare totale del carattere n = numero di unità statistiche Media aritmetica per un protocollo elementare Collettivo in esame 88 individui iscritti al corso di Statistica Carattere osservato Voto conseguito all’esame di Statistica Protocollo elementare {29, 29, 24, 20, 22, 28, 19, 19, 21, 26, 20, 24, 21, 23, 28, 22, 29, 26, 23, 28, 30, 20, 27, 22, 27, 20, 26, 29, 29, 23, 23, 24, 22, 25, 27, 26, 23, 18, 19, 20, 26, 22, 24, 20, 22, 21, 29, 30, 19, 24, 24, 26, 29, 25, 28, 26, 22, 27, 27, 29, 26, 26, 22, 27, 24, 24, 24, 21, 18, 22, 28, 23, 21} x= c n c = 29+29+…+23+21 = 2140 n = 88 19, 24, 26, 26, 29, 25, 25, 22, 29, 30, 25, 18, 25, 30, 20, x = 24,32 3 Marilena Pillati - Seminari di Statistica (SVIC) "Le medie" Media aritmetica per un protocollo elementare Disponendo del protocollo elementare l’espressione per il calcolo della media aritmetica è n c x= = n ∑ xi i=1 n = 1 n ∑ xi n i=1 Media aritmetica Media aritmetica del reddito: del numero di componenti: 33364 2,77 4 Marilena Pillati - Seminari di Statistica (SVIC) "Le medie" Popolazione residente nella provincia di Bologna al 01-01-2005 Età media italiani: 46,20 anni Età media stranieri: 29,57 anni Popolazione in eta’ lavorativa residente nella provincia di Bologna al 01-01-2005 Età media italiani: 41,73 anni Età media stranieri: 34,54 anni Media aritmetica per una distribuzione di frequenza x= c= k ∑ ci i=1 c = 2140 x= c n = k ∑ xini i=1 n = 88 2140 = 24,32 88 5 Marilena Pillati - Seminari di Statistica (SVIC) "Le medie" Media aritmetica per una distribuzione di frequenza Disponendo della distribuzione di frequenza di un carattere quantitativo discreto, con le modalità non espresse in intervalli, l’espressione per il calcolo della media aritmetica è data da: k c x = = n ∑x n i i i =1 k ∑n i i =1 Distribuzione delle famiglie per n° di componenti N° Componenti Famiglie 1 2 3 4 5 6 5 11 3 9 1 1 30 Totale N° Comp medio = 2.77 (calcolato a partire dal protocollo elementare) N° Comp medio = 1 ⋅ 5 + 2 ⋅ 11 + 3 ⋅ 3 + 4 ⋅ 9 + 5 ⋅ 1 + 6 ⋅ 1 83 = = 2.77 30 30 6 Marilena Pillati - Seminari di Statistica (SVIC) "Le medie" Media aritmetica per una distribuzione di frequenza con classi intervallari Quando in una distribuzione la variabile X è divisa in intervalli non si può calcolare l’ammontare effettivo del carattere, ma solo cercare di approssimarlo assumendo che tutte le unità della i-esima classe abbiano la medesima modalità k c x = = n ∑ xˆ n i i i =1 k ∑n i i =1 La modalità x̂ i è posta pari al valore centrale dell’intervallo per classi chiuse, mentre per classi aperte è necessario scegliere un valore che sintetizzi la distribuzione del carattere su quell’intervallo Esempio di media per una distribuzione con classi intervallari Tempo di percorrenza sui 30 metri di un campione di 98 atleti. Determinare il tempo medio di percorrenza sui 30 metri. x= c n c = 550 n = 98 x= 550 = 5,61 98 7 Marilena Pillati - Seminari di Statistica (SVIC) "Le medie" Distribuzione delle famiglie per reddito del nucleo familiare Famiglie Val centrale Reddito ≤ € 10.000 € 5 000 € 15 000 € 10.000 --| € 20.000 € 20.000 --| € 30.000 € 30.000 --| € 50.000 Totale Reddito medio Reddito medio (1) (2) € 135 000 € 200 000 € 200 000 30 € 995 000 € 25 000 € 40 000 € 75 000 > € 50.000 € 10 000 2 9 8 5 6 € 450 000 = € 33 364 = € 995 000 / 30 = € 33 166,67 (1) Calcolato a partire dal protocollo elementare (2) Calcolato a partire dalla distribuzione di frequenza Distribuzione delle aziende agricole per classe di superficie (in migliaia di ettari) al 4° censimento generale dell’agricoltura (21 ottobre 1990) - Fonte: Istat Classe di superficie xj-1 |-- xj fino a 1 1 |-- 2 2 |-- 3 3 |-- 5 5 |-- 10 10 |-- 20 20 |-- 50 50 e oltre Totale N° aziende (in migliaia) xi* xi* ni 997 591 336 374 354 201 115 55 3023 0,5 1,5 2,5 4 7,5 15 35 175 498,5 886,5 840 1496 2655 3015 4025 9625 23041 Superficie media effettiva 22703 = 7,51 3023 Superficie media approssimata x = 1 n u ∑x i =1 * i ni Superficie totale effettiva (in migliaia di ha) 482 815 799 1412 2436 2747 3432 10580 22703 = 23041 = 7,62 3023 8 Marilena Pillati - Seminari di Statistica (SVIC) "Le medie" Proprietà di associatività della media aritmetica Dato un collettivo di n unità suddiviso in g gruppi di numerosità n1, n2, … , ng si ha x = 1 n n ∑ xj = j =1 x1n1 + x2 n2 + . . . + x g ng n1 + n2 + . . . + ng = 1 n g ∑x n i i i =1 Distribuzione delle famiglie per numero di componenti e per sesso del capofamiglia M F 1 3 2 5 2 5 6 11 3 2 1 3 4 8 1 9 5 1 0 1 6 1 0 1 Totale 20 10 30 media 3.1 2.1 N° Componenti x = x M ⋅ nM + x F ⋅ nF 3,1 ⋅ 20 + 2,1 ⋅ 10 = = 2,77 nM + nF 30 9 Marilena Pillati - Seminari di Statistica (SVIC) "Le medie" Media aritmetica ponderata Se nel calcolo della media aritmetica si vuole attribuire importanza diversa alle modalità di un carattere, si assegna ad ognuna di esse un peso che ne esalti o ne diminuisca l’importanza. La media aritmetica ponderata di un carattere quantitativo x con k modalità x1, x2, … , xk alle quali sono attribuiti pesi p1, p2, … , pk k Mp = x1 p1 + x2 p2 + ... + x j p j + ... + x k pk p1 + p2 + ... + p j + ... + pk ∑x j pj j =1 k = ∑p j j =1 La media aritmetica non funziona sempre… BOLOGNA 04-feb 05-feb 06-feb 07-feb 08-feb 09-feb 10-feb 11-feb 12-feb 13-feb 70 44 37 59 60 82 69 48 86 60 Data la serie di numeri indice a base mobile di PM10 qual è l’indice medio nel periodo che va dal 4 al 9 febbraio? t-1It 04-feb 05-feb 06-feb 07-feb 08-feb 09-feb 10-feb - 0.629 0.841 1.595 1.017 1.367 0.842 11-feb 0.696 12-feb 13-feb 1.792 0.698 Media aritmetica dei 5 indici = 1.089 Se però considero tale indice medio nel periodo d’interesse non ottengo a partire dal dato PM104feb=70 il valore PM109feb=82 Infatti: 70 · (1.089 · 1.089 · 1.089 · 1.089 · 1.089) = 107 ≠ 82 10 Marilena Pillati - Seminari di Statistica (SVIC) "Le medie" Ricordando che: 4feb I 9feb = 4feb I5feb ⋅5feb I6 feb ⋅6 feb I7feb ⋅7feb I8feb ⋅8feb I9feb 4feb I9feb = 0,629 ⋅ 0,841 ⋅ 1,595 ⋅ 1,017 ⋅ 1,367 = 1,17 Un’opportuna costante k da sostituire ai singoli indici giornalieri dovrà essere tale che k 5 = 1,17 k = 5 1,17 = 1,032 da cui: Media geometrica t-1I t 04-feb 05-feb 06-feb 07-feb 08-feb 09-feb - 0.629 0.841 1.595 1.017 1.367 10-feb 0.842 11-feb 0.696 12-feb 13-feb 1.792 0.698 Media geometrica dei 5 indici = 1,032 Se considero tale indice medio nel periodo d’interesse ottengo a partire dal dato PM104feb=70 il valore PM109feb=82 Infatti: 70 · (1,032 · 1,032 · 1,032 · 1,032 · 1,032) = 82 11 Marilena Pillati - Seminari di Statistica (SVIC) "Le medie" Media geometrica La media geometrica di n valori distinti è data dalla radice n-esima del loro prodotto n 0 M ( X ) = n ∏ x j = x0 , xj > 0 j =1 per osservazioni raggruppate in una distribuzione la media geometrica è così definita 0M ( X ) = k n ∏x = x0 , ni i xi > 0 i =1 Media geometrica anni 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 tassi di rendimento fondi obbligazionari -0,013 0,104 0,094 0,066 0,052 0,003 0,043 0,028 0,022 0,016 anni 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 tassi di rendimento fondi azionari -0,036 0,013 0,084 0,303 0,222 0,357 -0,088 -0,17 -0,263 0,101 ; Un investitore nel ’94 ha differenziato il suo portafoglio fondi, investendo un capitale C in fondi obbligazionari e un capitale C’ in fondi azionari. Quale tipologia di fondo è risultata, nel decennio considerato, più remunerativa, ovvero ha presentato un rendimento medio annuo più elevato? 12 Marilena Pillati - Seminari di Statistica (SVIC) "Le medie" Media geometrica C (1 + i1 )10 = C (1 + i1994 )(1 + i1995 )...(1 + i2003 ) ′ )(1 + i1995 ′ )...(1 + i2003 ′ ) C ′(1 + i2 )10 = C ′(1 + i1994 i1 = 10 (1 + i1994 )(1 + i1995 )...( 1 + i2003 ) ′ )(1 + i1995 ′ )...( 1 + i2003 ′ ) i2 = 10 (1 + i1994 i1 = 10 0,987 ⋅1,104 ⋅ ... ⋅1,016 = 0,041 i2 = 10 0,964 ⋅1,013 ⋅ ... ⋅1,101 = 0,035 Media armonica Problema Un ciclista percorre una salita con velocità v costante e ridiscende per la strada con velocità ancora costante ma pari al triplo della precedente. La velocità media dell’intero percorso di andata e ritorno è…. La velocità media aritmetica è 2v ma non è la risposta esatta, perché tale velocità non conserva il tempo di percorrenza effettivo 13 Marilena Pillati - Seminari di Statistica (SVIC) "Le medie" Media armonica Detta s la lunghezza del percorso (sola andata), i tempi di percorrenza per l’andata e il ritorno sono t1=s/v (andata) e t2=s/3v (ritorno). La velocità media dell’intero viaggio sarà quindi: 2s 2s 2s 2 3v 3 = = = = 2⋅ = v t1 + t 2 s + s 4 2 ⎛1 1 ⎞ 1 + 1 s⎜ + ⎟ v 3v ⎝ v 3v ⎠ v 3v Media armonica −1 M (X ) = n n −1 1 ∑x i =1 M (X ) = i n k 1 ni ∑ i =1 xi xi≠0 Condizione di invarianza n 1 ∑x i i = n⋅ 1 h con h= n n 1 i i ∑x 14