Statistica Descrittiva: approfondimenti File

Modulo
STATISTICA DESCRITTIVA
1
Unità Didattiche:
1 – La Statistica
2 – Le elaborazioni statistiche
OBIETTIVI DIDATTICI
2
SAPERE:
illustrare le fasi di una indagine statistica;
definire e riconoscere le medie statistiche;
definire e riconoscere la moda e la mediana;
illustrare il concetto di variabilità;
definire e riconoscere i rapporti statistici;
SAPER FARE:
la rappresentazione di dati statistici attraverso tabelle e grafici;
la lettura e l’interpretazione di tabelle e grafici di dati statistici;
il calcolo delle medie statistiche, della moda e della mediana;
il calcolo della variabilità;
il calcolo dei rapporti statistici.
1 – LA STATISTICA
3
LA STATISTICA
4
La Statistica è l’applicazione del metodo
scientifico allo studio dei fenomeni
collettivi
Statistica Metodologica (S. Descrittiva)
raccogliere ed elaborare i dati allo scopo di descrivere i
fenomeni collettivi;
Statistica Matematica (S. Induttiva)
studiare i fenomeni collettivi allo scopo di trarre previsioni
relative al comportamento futuro.
I FENOMENI COLLETTIVI
5
Insieme di fenomeni singoli, tutti dello stesso
tipo: p. es. i fenomeni naturali, sociali,
economici, demografici, sanitari, scolastici, …
TIPICI fenomeni naturali (caduta di un
grave, disintegrazione dell’atomo, reazioni
chimiche, …)
ATIPICI fenomeni sociali, economici,
demografici, sanitari, scolastici, … (frequenza
scolastica, tipo di abbigliamento, …)
L’INDAGINE STATISTICA
6
POPOLAZIONE insieme omogeneo di elementi (non
necessariamente di persone)
INDIVIDUO unità statistica, cioè il singolo elemento
della popolazione; semplice (se corrisponde ad un
singolo elemento, p.es. una persona) - composto (se
corrisponde ad un gruppo di elementi, p.es. un nucleo
familiare)
CARATTERI STATISTICI aspetti della popolazione
che devono essere analizzati; qualitativi (titolo di studio,
età, sesso, …) o quantitativi (n° di figli, n° di impiegati,
quantità prodotte, …); si manifestano in modalità
DATI STATISTICI i valori che si ricavano
CARATTERI STATISTICI
7
C. QUALITATIVI espressi in forma verbale, possono avere
varie manifestazioni.
Esempi:
Colore degli occhi: celesti, grigi, neri, …
Titolo di studio: l. elementare, l. media, diploma, laurea
C. QUANTITATIVI espressi da un numero, che ne
rappresenta il valore, in modo discreto oppure continuo.
Esempi:
Numero di figli in una famiglia
Temperature di una località
MUTABILE STATISTICA carattere statistico qualitativo
VARIABILE STATISTICA carattere statistico quantitativo
FREQUENZA n° di volte in cui si è manifestata la modalità
INTENSITA’ misura della modalità
LE FASI DELL’INDAGINE STATISTICA
8
1) Analisi del fenomeno
2) Rilevazione (raccolta e spoglio) dei dati
3) Rappresentazione (tabulare e grafica) dei dati
4) Elaborazione (matematica) dei dati
5) Interpretazione dei dati
LE TABELLE E I GRAFICI
9
T. a semplice entrata si rappresenta un solo carattere
c. quantitativo, si parla di seriazione statistica
c. qualitativo, si parla di serie statistica
s.
s.
s.
s.
s.
storica (temporale)
geografica (territoriale)
rettilinea
ciclica
sconnessa
T. a doppia entrata si rappresentano due o più caratteri
t. di contingenza, se i caratteri sono entrambi qualitativi,
t. di correlazione, se i caratteri sono entrambi quantitativi,
t. miste, se uno è qualitativo e l’altro è quantitativo
Grafici diagrammi in coordinate cartesiane o polari,
istogrammi, ortogrammi, areogrammi,
cartogrammi, ideogrammi
ESEMPIO 1 – serie statistica
10
Distribuzione degli studenti italiani secondo il tipo di scuole
(A.s. 1984/85, ISTAT, Annuario Statistico Italiano, 1985, pag. 137)
Tipi di
scuole
Materne
Elementari
Medie
Superiori
TOTALE
N
1
2
3
4
N° alunni
iscritti
1.639.377
3.909.365
2.797.766
2.546.772
10.893.280
Esprime le frequenze del fenomeno
“Iscrizioni scolastiche” secondo le modalità
del carattere qualitativo “Tipi di scuole"
DIAGRAMMA CARTESIANO
AREOGRAMMA
(N° alunni iscritti per tipo di scuola)
15%
23%
Elementari
Medie
Superiori
N° alunni iscritti
Materne
4.000.000
3.500.000
3.000.000
2.500.000
2.000.000
1.500.000
36%
26%
1
2
3
Tipi di scuole
4
ESEMPIO 1- bis
11
N° alunni iscritti
ORTOGRAMMA
4.000.000
3.500.000
3.000.000
2.500.000
2.000.000
1.500.000
1.000.000
500.000
0
ORTOGRAMMA
Ogni rettangolo ha per base un segmento
generico e l’altezza proporzionale alla
frequenza
Materne
Elementari
Medie
Superiori
Tipi di scuole
ISTOGRAMMA
4.000.000
3.500.000
3.000.000
Materne
2.500.000
ISTOGRAMMA
Ogni rettangolo ha per base un segmento
proporzionale alla modalità e la sua area
è proporzionale alla frequenza.
Elementari
2.000.000
Medie
1.500.000
Superiori
1.000.000
500.000
0
N° alunni iscritti
Se le basi sono tutte uguali, le altezze
sono proporzionali alle frequenze, come
nell’ORTOGRAMMA.
ESEMPIO 2 – serie storica
12
Depositi a risparmio delle aziende di credito (valori assoluti in milioni di lire)
(ISTAT, Annuario Statistico Italiano, 1985, pag. 506)
Anni
1979
1980
1981
1982
1983
Esprime le intensità del fenomeno "Risparmio in
depositi bancari" secondo le modalità del
carattere qualitativo "Tempo-Anni"
DIAGRAMMA CARTESIANO
180.000
AREOGRAMMA
Depositi a risparmio
(in miliardi di lire)
15%
26%
17%
23%
170.000
160.000
150.000
140.000
130.000
120.000
110.000
100.000
19%
1979
Depositi a risparmio (in miliaridi di lire)
Depositi a
risparmio
(miliardi di lire)
101.630
112.939
124.817
148.403
169.554
1980
1981
1982
1979
1983
1980
1981
Anni
1982
1983
ESEMPIO 3 – serie ciclica
13
Temperatura media nella città di VERONA nel 1990
Temperatura C°
5
8
10
14
16
21
25
21
18
15
10
6
Esprime le intensità del fenomeno
"Temperatura media di una località in C°"
secondo le modalità del carattere qualitativo
"Tempo-Mesi"
DIAGRAMMA CARTESIANO
30
Temperature in C°
Mesi
Gennaio
Febbraio
Marzo
Aprile
Maggio
Giugno
Luglio
Agosto
Settembre
Ottobre
Novembre
Dicembre
25
20
15
10
5
0
1
2
3
4
5
6
Mesi
7
8
9
10
11
12
ESEMPIO 5 – serie storica
14
Distribuzione mensile dei matrimoni celebrati in un determinato Comune
Anni 1989 e 1990
N° matrimoni
(migliaia)
1989
1990
32
28
25
30
16
21
42
39
30
35
34
38
25
21
38
33
45
51
42
43
23
27
34
31
386
397
Mesi
Gennaio
Febbraio
Marzo
Aprile
Maggio
Giugno
Luglio
Agosto
Settembre
Ottobre
Novembre
Dicembre
TOTALI
DIAGRAMMA POLARE (radar)
Distribuzione dei matrimoni
Gennaio
60
Dicembre
Febbraio
50
40
Novembre
Marzo
30
20
1989
ISTOGRAMMA
Ottobre
50
0
Aprile
40
30
Settembre
20
Maggio
10
Agosto
Mesi
Dicembre
Novembre
Ottobre
Settembre
Agosto
Luglio
Giugno
Maggio
Aprile
Marzo
Febbraio
0
Gennaio
N° matrimoni (in migliaia)
10
1990
60
Giugno
Luglio
1989
1990
ESEMPI 11 e 12 – tabelle a doppia entrata
15
Distribuzione della popolazione del Piemonte secondo il sesso e le province di residenza
(ISTAT, 1985, pag. 21)
Province
Torino
Vercelli
Novara
Cuneo
Asti
Alessandria
TOTALI
Sesso
Maschi
Femmine
1.129.899
1.194.474
187.804
206.838
243.151
262.200
269.790
275.717
103.741
110.314
222.719
240.715
2.157.104
2.290.258
TOTALI
2.324.373
394.642
505.351
545.507
214.055
463.434
4.447.362
Tabella di contingenza
Caratteri entrambi qualitativi
(mutabile statistica doppia)
Distribuzione di 100 abitazioni secondo il numero di vani ed i componenti della famiglia
N° vani
1
2
3
4
5
TOTALI
1
10
6
3
1
0
20
Componenti famiglia
2
3
4
5
4
1
0
0
10
5
2
0
10
12
8
2
3
8
4
2
1
2
1
1
28
28
15
5
6
0
0
1
2
1
4
TOTALI
15
23
36
20
6
100
Tabella di correlazione
Caratteri entrambi quantitativi
(variabile statistica doppia)
2 – LE ELABORAZIONI STATISTICHE
16
TIPI DI ELABORAZIONI STATISTISCHE
Le medie (indici di posizione)
Medie di calcolo (m. ferme):
aritmetica, geometrica, quadratica, armonica
Medie di posizione (m. lasche):
mediana, moda
La variabilità (indici di variabilità)
Campo di variazione (o di escursione),
Scarto semplice medio,
Scarto quadratico medio,
Coefficiente di variazione (di variabilità),
Concentrazione
I rapporti statistici
R. di composizione, di derivazione, di frequenza, di durata
Numeri indici
17
MEDIA ARITMETICA
18
N
xi
yi
1
x1 y1
2
x2 y2
.
.
.
Semplice:
n
x1 + x2 + ... + xn
Ms =
=
n
∑x
i =1
i
n
Ponderata:
.
n
.
n
xn yn
∑
∑
x1 ⋅ y1 + x2 ⋅ y2 + ... + xn ⋅ yn
Mp =
=
y1 + y2 + ... + yn
∑x ⋅y
i
i =1
n
∑y
i =1
i
i
MEDIA GEOMETRICA
19
N
xi
yi
1
x1 y1
2
x2 y2
Semplice:
Gs = n x1 ⋅ x2 ⋅ ... ⋅ xn = n
n
∏x
i
i =1
.
.
.
Ponderata:
.
G p = x1 ⋅ x2 ⋅ ... ⋅ xn
N
.
n
xn yn
∏
∑
y1
y2
yn
=
n
N
∏x
i =1
n
N = ∑ y1 + y2 + ... + yn
i =1
yn
n
MEDIA ARMONICA
20
N
xi
yi
1
x1 y1
2
x2 y2
.
.
.
Semplice:
As =
n
1 1
1
+ + ... +
x1 x2
xn
=
n
n
1
∑
i =1 xi
Ponderata:
.
n
.
n
xn yn
∑
y1 + y2 + ... + yn
Ap =
=
yn
y1 y2
+ + ... +
x1 x2
xn
∑y
i =1
n
i
yi
∑
i =1 xi
MEDIA QUADRATICA
21
N
xi
yi
1
x1 y1
2
x2 y2
.
Semplice:
n
Qs =
x12 + x22 + ... + xn2
=
n
2
x
∑ i
i =1
n
.
.
Ponderata:
.
.
n
xn yn
∑
Qp =
x12 ⋅ y1 + x22 ⋅ y2 + ... + xn2 ⋅ yn
=
y1 + y2 + ... + yn
n
2
x
∑ i ⋅ yi
i =1
n
∑y
i =1
i
OSSERVAZIONI
22
M. Aritmetica è la più utilizzata perché rappresenta il
valore di equidistribuzione del fenomeno
M. Geometrica si utilizza:
• se i dati statistici sono tutti positivi
• quando ha senso moltiplicare fra di loro i dati statistici
M. Quadratica si utilizza:
• per eliminare l’effetto del segno
• se i valori sono o molto piccoli oppure molto grandi
M. Armonica si utilizza se ha senso calcolare gli inversi
A<G<M<Q
ESEMPI DI MEDIA ARITMETICA
23
Confronto dei due gruppi
frequenza frequenza valore
A
B
centrale
classi
1,20 - 1,40
1,40 - 1,60
1,60 - 1,80
1,80 - 2,00
2,00 - 2,20
2
6
8
5
1
22
1
3
8
3
1
16
1,30
1,50
1,70
1,90
2,10
xy A
xy B
2,60
9,00
13,60
9,50
2,10
36,80
1,30
4,50
13,60
5,70
2,10
27,20
Mp(A) = 1,67
Mp(B) = 1,70
9
8
7
Frequenze
Gruppo A
Gruppo B
misura
misura
N° ordine del salto N° ordine del salto
(m)
(m)
1
1,36
1
1,95
2
1,46
2
2,16
3
1,62
3
1,95
4
1,54
4
1,84
5
1,94
5
1,62
6
1,85
6
1,74
7
1,75
7
1,78
8
1,88
8
1,64
9
1,61
9
1,30
10
1,90
10
1,62
11
1,65
11
1,72
12
1,53
12
1,58
13
1,36
13
1,75
14
1,67
14
1,45
15
1,46
15
1,73
16
1,60
16
1,48
17
1,50
27,31
18
1,67
19
1,65
Ms(A) = 1,67
20
1,78
Ms(B) = 1,71
21
2,12
22
1,86
36,76
6
5
4
3
2
1
0
1,20 - 1,40
1,40 - 1,60
1,60 - 1,80
1,80 - 2,00
Classi
frequenza A
frequenza B
2,00 - 2,20
ESEMPI DI MEDIA GEOMETRICA SEMPLICE
24
Anno
Prezzo
(Euro)
1990
1991
1992
1993
1994
5,8
6,4
6,6
6,2
6,8
Variazione
rispetto
all'anno
precedente
1,1034
1,0313
0,9394
1,0968
Gs =
1,0406
Tasso medio di variazione dei prezzi =
4,06%
Anno
Produzione
(tonnellate)
1992
1993
1994
1995
1996
1997
98,0
125,0
145,5
143,0
165,0
213,0
Variazione
rispetto
all'anno
precedente
1,2755
1,1640
0,9828
1,1538
1,2909
Gs =
1,1680
Tasso medio di variazione della produzione =
16,80%
ESEMPI DI MEDIA ARMONICA SEMPLICE
25
Tempo
Prezzo al litro
della benzina
(Euro)
I
II
III
IV
0,96
1,02
1,05
1,08
1/x
1,04
0,98
0,95
0,93
3,90
As = 1,03
Costo medio di 1 litro di benzina =
Giorno
della
settimana
Tempo (min)
impiegato per
percorrere 14 km
Velocità
media
(km/h)
30
20
24
21
35
28
42
35
40
24
Lunedì
Martedì
Mercoledì
Giovedì
Venerdì
As = 32,31
Velocità media =
km/h
32,31
€
1,03
1/x
Città
Prezzo
unitario
(Euro)
0,04
0,02
0,03
0,03
0,04
0,15
Milano
Francoforte
Marsiglia
Bruxelles
0,85
0,70
1,10
0,95
As = 0,88
Potere d'acquisto =
1/x
1,18
1,43
0,91
1,05
4,57
1,14
ESEMPI DI MEDIA QUADRATICA
26
1)
2)
La seguente tabella riporta le variazioni
Siano dati 7 quadrati: uno di lato 3 m, uno di
della temperatura relative ad alcuni giorni
lato 4 m, due di lato 7 m e tre di lato 10 m.
di una settimana rispetto alla temperatura
Volendo sostituirli con sette quadrati uguali
media stagionale. Calcolare il valore della
aventi complessivamente la stessa area,
variazione media della temperatura.
calcolare la misura comune del lato.
Giorni
Variazioni di
temperatura
(°C)
Lunedì
Martedì
Mercoledì
Giovedì
Venerdì
-2,5
1,5
0,8
-1,5
-2,4
2
x
6,25
2,25
0,64
2,25
5,76
17,15
lato
quadrati
x
N.
quadrati
y
3
4
7
10
1
1
2
3
7
Qp =
Qs = 1,85
7,77
x2
x2y
9
16
49
100
9
16
98
300
423
MODA, MEDIANA E FRATTILI
27
La MODA (o valore normale) di una distribuzione statistica
ordinata in senso crescente è il dato al quale corrisponde la
massima frequenza.
La MEDIANA (o valore mediano) di una distribuzione
statistica ordinata in senso crescente è il dato che
bipartisce la distribuzione.
• Se i dati sono in n° dispari la mediana è il dato che occupa la posizione
centrale;
• Se i dati sono in n° pari la mediana è la media aritmetica dei due dati che
occupano la posizione centrale;
• Se i dati hanno le frequenze, anche se suddivise in classi, si devono
calcolare le frequenze cumulate.
I FRATTILI di una distribuzione statistica ordinata in senso
crescente sono i dati che dividono in parti uguali la
distribuzione:
• Quartili, dividono in 4 parti: Q1, Q2, Q3 (Q2 è la mediana)
• Decili, dividono in 10 parti; D1, D2, … D9
• Percentili, dividono in 100 parti; P1, P2, … P99
ESEMPI DI MODA
28
6
10
9
5
8
Valori con frequenze
1
2
5
1
2
1
1
1
1
1
Massima frequenza = 5
Moda = 3
Frequenza
N. alunni
4
5
6
7
8
2
9
3
9
2
N°alunni
1
2
3
4
5
7
8
10
12
15
Voto
Frequenze
Valori
Frequenze
discreti
7
4
3
2
4
2
1
1
0
0
2
3
4
9
5
7
8
10
12
Valori
Tempo
Frequenza
impiegato
N. alunni
(min)
Tempo
impiegato
(min)
73
240
190
121
32
5
Frequenza max. =
Classe Modale =
00 - 10
10 - 15
15 - 20
20 - 25
25 - 35
35 - 45
45 - 60
240
10 - 20
15
4
5
6
7
8
Voti
Classi di ampiezza uguale
00 - 10
10 - 20
20 - 30
30 - 40
40 - 50
50 - 60
5
3
1
Frequenza max. =
Moda = 5 e 7
6
Classi di ampiezze diverse
Rapporto tra
Frequenza Ampiezza Frequenza ed
N. alunni
classe
Ampiezza
classe
73
10
7,3
106
5
21,2
134
5
26,8
143
5
28,6
158
10
15,8
35
10
3,5
12
15
0,8
Massimo rapporto Frequenza/Ampiezza classe =
Classe Modale =
20 - 25
29
ESEMPI DI MEDIANA
29
Valori singoli
Valori
ordinati in
senso
crescente
4
7
8
9
10
12
55
1
2
3
4
5
6
7
Mediana =
9
Valori
36
22
41
8
33
46
38
44
Valori
ordinati in
senso
crescente
8
22
33
36
38
41
44
46
Mediana = 37
1
2
3
4
5
6
7
8
Valori con frequenze
Classi di frequenze
N° fratelli
Frequenza
N° allievi
Frequenze
cumulate
0
1
2
3
4
5
6
3
8
7
4
1
1
1
3
11
18
22
23
24
25
F.C. dispari
Mediana =
13
2
Tempo
Frequenza Frequenze
impiegato
N. alunni
cumulate
(min)
00 - 10
10 - 20
20 - 30
30 - 40
40 - 50
50 - 60
73
240
190
121
32
5
F.C. dispari
Mediana =
331
20,9
73
313
503
624
656
661
ESEMPIO DI MEDIE SEMPLICI
30
Paesi della C.E.E.
(anno 1987)
Francia
Germania Federale
Italia
Belgio-Lussemburgo
Paesi Bassi
Danimarca
Irlanda
Regno Unito
Media Aritmetica M =
Media Geometrica G =
Media Quadratica Q =
Media Armonica A =
Moda =
Mediana =
Consumo annuo di
2
alimenti surgelati
x
x
pro-capite (in kg)
5,4
5,4
29,16
6,0
6,0
36,00
2,2
2,2
4,84
6,3
6,3
39,69
9,7
9,7
94,09
13,7
13,7
187,69
3,7
3,7
13,69
13,1
13,1
171,61
SOMME
60,1
576,77
PRODOTTI 2.892.501,3
7,5
6,4
8,5
5,4
Danimarca
Paesi Bassi
1/x
0,19
0,17
0,45
0,16
0,10
0,07
0,27
0,08
1,49
Paesi della C.E.E.
(anno 1987)
Italia
Irlanda
Francia
Germania Federale
Belgio-Lussemburgo
Paesi Bassi
Regno Unito
Danimarca
Consumo annuo di
alimenti surgelati
pro-capite (in kg)
2,2
3,7
5,4
6,0
6,3
9,7
13,1
13,7
13,7 è la massima frequenza
30,55 è il caso in cui la frequenza cumulata è dispari
Frequenze
cumulate
2,2
5,9
11,3
17,3
23,6
33,3
46,4
60,1
ESEMPIO DI MEDIE PONDERATE
31
classi x
5 - 15
15 - 25
25 - 35
35 - 45
45 - 55
55 - 65
frequenza
valore
y
centrale x
2
5
10
12
7
8
44
Media Aritmetica M =
Media Geometrica G =
Media Quadratica Q =
Media Armonica A =
Classe modale =
Mediana =
10
20
30
40
50
60
210
39,3
36,3
41,8
32,4
35 - 45
39,2
xy
x
y
x
2
xy
2
1/x
y/x
20
100
300
480
350
480
1730
1,0000E+02
3,2000E+06
5,9049E+14
1,6777E+19
7,8125E+11
1,6796E+14
4,1599E+68
100
400
900
1600
2500
3600
200
2000
9000
19200
17500
28800
76700
0,10
0,05
0,03
0,03
0,02
0,02
0,20
0,25
0,33
0,30
0,14
0,13
1,36
Classi di uguale ampiezza già ordinate
Frequenza massima =
12
Frequenza Cumulata pari, quindi: 44/2 = 22
INTERPOLAZIONE LINEARE
35
17
35+x
22
45
29
(45 - 35)
(29 -17) (35+x - 35) (22 -17)
10
12
x
5
x = 10 * 5 / 12
Frequenze
cumulate
2
7
17
29
36
44
LA VARIABILITA’
32
xmax − xmin
Campo di variazione (o di escursione):
n
Scarto semplice medio:
SM =
n
∑ x −M
i =1
i
SM =
n
∑ x −M ⋅y
i =1
i
n
∑y
i =1
∑ (x
n
Scarto quadratico medio: σ =
Varianza: σ 2
i =1
i
−M
n
)
∑ (x
σ=
Coefficiente di variazione (o di variabilità):
i =1
i
)
n
2
i
2
− M ⋅ yi
i
n
∑y
i =1
CV =
σ
M
i
ESEMPIO DI STUDIO DELLA VARIABILITA’
33
Da una analisi condotta in un campione di 1000 famiglie
del Nord Italia e 1000 famiglie del Sud Italia per rilevare
il numero dei locali delle case di abitazione, si sono
rilevati i seguenti dati; studiare la variabilità del
fenomeno.
N. locali
1
2
3
4
5
6
7
Famiglie Famiglie
del Nord del Sud
83
113
117
235
325
288
213
215
176
112
68
28
18
9
VARIABILITA’ FAMIGLIE DEL NORD
34
N. locali
1
2
3
4
5
6
7
28
Famiglie
del Nord
83
117
325
213
176
68
18
1000
xy
x-M
|x-M|
(x-M)2
|x-M|y
(x-M)2y
83
234
975
852
880
408
126
3558
-2
-1
0
1
2
3
4
2
1
0
1
2
3
4
13
4
1
0
1
4
9
16
35
166
117
0
213
352
204
72
1124
332
117
0
213
704
612
288
2266
3
6
1,124
1,505
0,5018
50,18%
Media aritmentica M =
Campo di variazione =
Scostamento semplice medio SM =
Scostamento quadratico medio σ =
Coefficiente di variazione CV =
VARIABILITA’ FAMIGLIE DEL SUD
35
N. locali
1
2
3
4
5
6
7
28
Famiglie
del Sud
113
235
288
215
112
28
9
1000
xy
x-M
|x-M|
(x-M)2
|x-M|y
(x-M)2y
113
470
864
860
560
168
63
3098
-2
-1
0
1
2
3
4
2
1
0
1
2
3
4
13
4
1
0
1
4
9
16
35
226
235
0
215
224
84
36
1020
452
235
0
215
448
252
144
1746
3
6
1,020
1,321
0,4405
44,05%
Media aritmentica M =
Campo di variazione =
Scostamento semplice medio SM =
Scostamento quadratico medio σ =
Coefficiente di variazione CV =
CONCLUSIONE
36
N. locali
1
2
3
4
5
6
7
N. locali
1
2
3
4
5
6
7
Famiglie
del Nord
83
117
325
213
176
68
18
Famiglie
del Sud
113
235
288
215
112
28
9
Media aritmentica M =
Campo di variazione =
Scostamento semplice medio SM =
Scostamento quadratico medio σ =
Coefficiente di variazione CV =
3
6
1,124
1,505
0,5018
50,18%
Media aritmentica M =
Campo di variazione =
Scostamento semplice medio SM =
Scostamento quadratico medio σ =
Coefficiente di variazione CV =
3
6
1,020
1,321
0,4405
44,05%
Le due distribuzioni hanno lo stesso valore medio, ma quella relativa alle
famiglie del Sud presenta una variabilità minore rispetto a quella delle
famiglie del Nord, perché ha gli scostamenti medi, semplice e
quadratico, e il coefficiente di variazione inferiori.
LA CONCENTRAZIONE – METODO DI LORENZ
37
Valori
xi
Frequenze
yi
x1
y1
…
…
∑
Intensità
xy
Frequenze
ass. cum.
Intensità
ass.cum.
Frequenze
rel. cum.
Intensità
rel.cum.
∑
Intensità
rel. cum.
D
Rapporto di concentrazione
area di concentrazione
RC = -------------------------------------- =
area di concentrazione massima
C
area triangolo OD’D – somma aree trapezi
= -----------------------------------------------area triangolo OD’D
B
A
O
A’
Frequenze
rel. cum.
B’
C’
D’
0 ≤ RC ≤ 1
IL RAPPORTO DI CONCENTRAZIONE
38
Intensità
rel. cum.
Intensità
rel. cum.
B
RC = 1
B
massima
concentrazione
spezzata di concentrazione
O
RC = 0
Frequenze A
rel. cum.
O
Intensità
rel. cum.
D
equidistribuzione
C
0 < RC < 1
B
concentrazione
variabile
A
O
A’
B’
C’
D’
Frequenze
rel. cum.
FrequenzeA
rel. cum.
ESEMPIO DI STUDIO DELLA CONCENTRAZIONE
39
Studiare la concentrazione del reddito di 200 persone.
Classi di reddito (milioni di €)
0-4
4-8
N° di persone
40
50
Classi
0
0
4
8
12
16
0
4
8
12
16
20
Valori
Frequenze
Frequenze
centrale
Intensità xy
y
ass. cum.
x
0
0
0
0
2
40
80
40
6
50
300
90
10
80
800
170
14
20
280
190
18
10
180
200
200
8 - 12
80
12 - 16
20
16 - 20
10
Intensità
ass. cum.
Frequenze
rel. cum.
Intensità
rel. cum.
0
80
380
1180
1460
1640
0,00
0,20
0,45
0,85
0,95
1,00
0,00
0,05
0,23
0,72
0,89
1,00
Area triangolo =
Area triangolo T1 =
Area trapezio T2 =
Area trapezio T3 =
Area trapezio T4 =
Area trapezio T5 =
RC =
0,5
0,005
0,035
0,190
0,080
0,047
0,2841
Il reddito è poco concentrato.
Intensità rel. cum.
Grafico di Lorenz
28,41%
1,00
0,90
0,80
0,70
0,60
0,50
0,40
0,30
0,20
0,10
0,00
0,00
0,10
0,20
0,30
0,40
0,50
0,60
0,70
0,80
0,90
Frequenze rel. cum .
Curva di concentrazione
Retta di equidistribuzione
1,00
I RAPPORTI STATISTICI
40
Un rapporto statistico è il rapporto tra due dati
statistici, generalmente espresso in percentuale.
Rapporto di composizione
Rapporto di coesistenza
Rapporto di derivazione
Rapporto di durata
Rapporto di ripetizione
Rapporto di densità
I numeri indici sono rapporti statistici ottenuti
assumendo un dato della distribuzione come base di
riferimento; sono generalmente espressi in percentuale.
Numeri indici a base fissa
Numeri indici a base mobile
ESEMPI DI RAPPORTI STATISTICI
41
R. di composizione
Distribzione della spesa (in milioni di €) per
tipologia di spettacolo in Italia nel 2000.
Rapporti di
Spesa (in
Tipo di spettacolo
composizione
milioni €)
(in %)
Teatro e concerti
212.118
11,65
Cinema
303.787
16,68
Trattenimento vari
914.230
50,21
Manifestazioni sportive
390.652
21,46
1.820.787
100,00
R. di derivazione
In un Comune si sono rilevati i seguenti dati.
Anno
N°
nati
N°
morti
N°
matrimoni
1993
1994
1995
1996
1997
1998
1999
2000
980
794
776
746
731
777
683
597
714
735
705
678
653
593
583
531
53
99
61
53
54
53
47
40
R. di densità
Popolazione dell'Italia Settentrionale.
Regioni
Emilia-Romagna
Friuli-Venezia Giulia
Liguria
Lombardia
Piemonte
Toscana
Trentino-Alto Adige
Veneto
Val d'Aosta
Abitanti (in Superficie Densità
migliaia)
(in km2) (ab./km2)
3.946
1.244
1.864
8.866
4.542
3.578
869
4.300
114
Quoziente di Quoziente di Quoziente di
Popolazione natalità (per mortalità (per nuzialità (per
1000 abitanti) 1000 abitanti) 1000 abitanti)
76.414
12,82
9,34
0,69
76.735
10,35
9,58
1,29
78.018
9,95
9,04
0,78
78.018
9,56
8,69
0,68
78.158
9,35
8,35
0,69
78.707
9,87
7,53
0,67
78.720
8,68
7,41
0,60
78.850
7,57
6,73
0,51
22.122
7.845
5.414
23.851
25.399
22.992
13.613
18.315
3.262
178
159
344
372
179
156
64
235
35
ESEMPIO DI NUMERI INDICI
42
Serie storica della produzione di energia elettrica e di benzina, nel periodo
1984-1988.
Numeri indici
Numeri indici a
Produzione
semplici (base: 1984
base mobile
= 100)
Anni
Energia
Energia
Energia
Benzina
Benzina
Benzina
elettrica
elettrica
elettrica
(migliaia
(migliaia
(migliaia
(milioni di
(milioni di
(milioni
di t)
di t)
di t)
kwh)
kwh)
di kwh)
1984
182.669
16.521
100
100
1985
185.740
17.344
102
105
102
105
1986
192.330
18.125
105
110
104
105
1987
201.372
17.629
110
107
105
97
1988
203.561
17.776
111
108
101
101
Numeri indici semplici (base: 1984=100)
Produzione
115
110
105
100
1984
1985
1986
1987
1988
Anni
Energia elettrica (milioni di kwh)
Benzina (migliaia di t)