Marilena Pillati - Elementi di Statistica e Informatica (SVIC)
"Le medie (II parte)"
Moda
È la modalità che nell’insieme delle osservazioni
si presenta con la frequenza più elevata
Esempio: Residenti nella provincia di Bologna per zona altimetrica di
residenza
Zona altimetrica di residenza
Provincia di residenza
BOLOGNA
Montagna interna
53.274
Collina
577.937
Pianura
313.068
TOTALE
944.279
Moda:
collina
Mediana
E’ la modalità che occupa il posto centrale nella successione
ordinata (non decrescente o non crescente) delle n
osservazioni individuali.
Il posto centrale è quello che divide il collettivo in due parti
di uguale numerosità: una parte formata dalle unità
statistiche che presentano una modalità precedente o uguale
alla mediana e una parte formata dalle unità statistiche che
presentano una modalità successiva o uguale alla mediana.
Per
n dispari la mediana occupa il posto (n + 1) 2 -esimo.
Per
n pari esistono due posti centrali ( n 2 -esimo e n 2 + 1 -esimo)
1
Marilena Pillati - Elementi di Statistica e Informatica (SVIC)
"Le medie (II parte)"
2
Marilena Pillati - Elementi di Statistica e Informatica (SVIC)
"Le medie (II parte)"
Calcolo della mediana a partire da una
distribuzione di frequenza
Per individuare la mediana in una distribuzione è
necessario determinare le frequenze cumulate
Se il carattere è quantitativo e le classi sono
definite da intervalli di modalità, la mediana non
può essere individuata esattamente
Æ si determina un valore per la mediana
ipotizzando che nella classe mediana le unita’
siano distribuite uniformemente
Distribuzione delle famiglie
per titolo di studio del capofamiglia
Frequenze
relative
Frequenze
cumulate
0
0.00
0
15
0.50
15
Licenza media inferiore
7
0.23
22
Diploma professionale (3 anni)
1
0.03
23
Diploma scuola media superiore 6
Diploma universitario
0
0.20
0.00
29
29
Laurea
Specializzazione post-laurea
0.00
29
0.03
30
Titolo di studio
Frequenze
assolute
Nessuno
Licenza elementare
0
1
3
Marilena Pillati - Elementi di Statistica e Informatica (SVIC)
"Le medie (II parte)"
Distribuzione delle famiglie
per numero di componenti
N° Componenti
Frequenze
assolute
Frequenze
relative
Frequenze
cumulate
1
5
0.17
5
2
11
0.37
16
3
3
0.10
19
4
9
0.30
28
5
1
0.03
29
6
1
0.03
30
Totale
30
1
Distribuzione delle famiglie per reddito del
nucleo familiare
Famiglie
Reddito
≤ € 10.000
€ 10.000 --| € 20.000
€ 20.000 --| € 30.000
€ 30.000 --| € 50.000
> € 50.000
Totale
20 000
2
9
8
5
6
30
Freq cumulata
2
11
19
24
30
passo=10000/8=1250
m1=20000+4*1250=25000
m2=20000+5*1250=26250
30 000
me=(m1+m2)/2=(25000+26250)/2=25625
4
Marilena Pillati - Elementi di Statistica e Informatica (SVIC)
"Le medie (II parte)"
Distribuzione delle aziende agricole per classe di superficie (in
migliaia di ettari) al 4° censimento generale dell’agricoltura
(21 ottobre 1990) - Fonte: Istat
Classe di superficie
xj-1 |-- xj
fino a 1
1 |-- 2
2 |-- 3
3 |-- 5
5 |-- 10
10 |-- 20
20 |-- 50
50 e oltre
Totale
N° aziende
(in migliaia)
Freq.
Cumulate
Freq. relative
cumulate
997
591
336
374
354
201
115
55
3023
997
1588
1924
2298
2652
2853
2968
3023
0,33
0,53
0,64
0,76
0,88
0,94
0,98
1,00
(n + 1)/2 = 1512
Passo=1/591
Posizione dell’unità mediana all’interno della classe: 1512-997 = 515
Me=1+514*(1/591) = 1,869
(si moltiplica per 514 e non 515 perché l’estremo inferiore è compreso nella classe e si
assume che la prima unità della classe assuma tale valore)
Quantili
Sono medie di posizione che suddividono la successione
ordinata in un certo numero di parti ugualmente numerose
Quartili
Sono medie di posizione che suddividono la successione
Ordinata in 4 parti ugualmente numerose.
Avremo quindi 3 quartili
Percentili
Sono medie di posizione che suddividono la successione
ordinata in 100 parti ugualmente numerose.
Avremo quindi 99 percentili
5
Marilena Pillati - Elementi di Statistica e Informatica (SVIC)
"Le medie (II parte)"
Box - plot
max
+
3° quartile
IQR
mediana
1° quartile
−
min
Popolazione in età lavorativa
60
età
50
40
30
20
10
italiani
stranieri
totale
6