Marilena Pillati - Elementi di Statistica e Informatica (SVIC) "Le medie (II parte)" Moda È la modalità che nell’insieme delle osservazioni si presenta con la frequenza più elevata Esempio: Residenti nella provincia di Bologna per zona altimetrica di residenza Zona altimetrica di residenza Provincia di residenza BOLOGNA Montagna interna 53.274 Collina 577.937 Pianura 313.068 TOTALE 944.279 Moda: collina Mediana E’ la modalità che occupa il posto centrale nella successione ordinata (non decrescente o non crescente) delle n osservazioni individuali. Il posto centrale è quello che divide il collettivo in due parti di uguale numerosità: una parte formata dalle unità statistiche che presentano una modalità precedente o uguale alla mediana e una parte formata dalle unità statistiche che presentano una modalità successiva o uguale alla mediana. Per n dispari la mediana occupa il posto (n + 1) 2 -esimo. Per n pari esistono due posti centrali ( n 2 -esimo e n 2 + 1 -esimo) 1 Marilena Pillati - Elementi di Statistica e Informatica (SVIC) "Le medie (II parte)" 2 Marilena Pillati - Elementi di Statistica e Informatica (SVIC) "Le medie (II parte)" Calcolo della mediana a partire da una distribuzione di frequenza Per individuare la mediana in una distribuzione è necessario determinare le frequenze cumulate Se il carattere è quantitativo e le classi sono definite da intervalli di modalità, la mediana non può essere individuata esattamente Æ si determina un valore per la mediana ipotizzando che nella classe mediana le unita’ siano distribuite uniformemente Distribuzione delle famiglie per titolo di studio del capofamiglia Frequenze relative Frequenze cumulate 0 0.00 0 15 0.50 15 Licenza media inferiore 7 0.23 22 Diploma professionale (3 anni) 1 0.03 23 Diploma scuola media superiore 6 Diploma universitario 0 0.20 0.00 29 29 Laurea Specializzazione post-laurea 0.00 29 0.03 30 Titolo di studio Frequenze assolute Nessuno Licenza elementare 0 1 3 Marilena Pillati - Elementi di Statistica e Informatica (SVIC) "Le medie (II parte)" Distribuzione delle famiglie per numero di componenti N° Componenti Frequenze assolute Frequenze relative Frequenze cumulate 1 5 0.17 5 2 11 0.37 16 3 3 0.10 19 4 9 0.30 28 5 1 0.03 29 6 1 0.03 30 Totale 30 1 Distribuzione delle famiglie per reddito del nucleo familiare Famiglie Reddito ≤ € 10.000 € 10.000 --| € 20.000 € 20.000 --| € 30.000 € 30.000 --| € 50.000 > € 50.000 Totale 20 000 2 9 8 5 6 30 Freq cumulata 2 11 19 24 30 passo=10000/8=1250 m1=20000+4*1250=25000 m2=20000+5*1250=26250 30 000 me=(m1+m2)/2=(25000+26250)/2=25625 4 Marilena Pillati - Elementi di Statistica e Informatica (SVIC) "Le medie (II parte)" Distribuzione delle aziende agricole per classe di superficie (in migliaia di ettari) al 4° censimento generale dell’agricoltura (21 ottobre 1990) - Fonte: Istat Classe di superficie xj-1 |-- xj fino a 1 1 |-- 2 2 |-- 3 3 |-- 5 5 |-- 10 10 |-- 20 20 |-- 50 50 e oltre Totale N° aziende (in migliaia) Freq. Cumulate Freq. relative cumulate 997 591 336 374 354 201 115 55 3023 997 1588 1924 2298 2652 2853 2968 3023 0,33 0,53 0,64 0,76 0,88 0,94 0,98 1,00 (n + 1)/2 = 1512 Passo=1/591 Posizione dell’unità mediana all’interno della classe: 1512-997 = 515 Me=1+514*(1/591) = 1,869 (si moltiplica per 514 e non 515 perché l’estremo inferiore è compreso nella classe e si assume che la prima unità della classe assuma tale valore) Quantili Sono medie di posizione che suddividono la successione ordinata in un certo numero di parti ugualmente numerose Quartili Sono medie di posizione che suddividono la successione Ordinata in 4 parti ugualmente numerose. Avremo quindi 3 quartili Percentili Sono medie di posizione che suddividono la successione ordinata in 100 parti ugualmente numerose. Avremo quindi 99 percentili 5 Marilena Pillati - Elementi di Statistica e Informatica (SVIC) "Le medie (II parte)" Box - plot max + 3° quartile IQR mediana 1° quartile − min Popolazione in età lavorativa 60 età 50 40 30 20 10 italiani stranieri totale 6