Presentazione di PowerPoint - Dipartimento di Scienze Politiche e

Campus di Arcavacata
Università della
Calabria
Corso di statistica
ARCAVACATA a.a 2009-2010
1
INDIRIZZO E-MAIL:
 [email protected]
Statistica
a) Insieme di metodi finalizzati allo studio (mediante
l’analisi) di fenomeni reali
b) Metodologia strumentale per l’analisi della realtà allo
scopo di trarre leggi e regole generali per obiettivi
predefiniti (Scienza o metodo?)
c) Scienza delle decisioni in condizioni di incertezza
…… in altre parole
“La statistica riguarda tutte le “operazioni” che rientrano
in un processo di indagine finalizzato all’accrescimento
della conoscenza “.
Perché l’indagine statistica?
3
obiettivi
informazioni
Metodi
statistici
risultati
4
Indagine Statistica
Fasi
1. Definizione degli obiettivi (generali, parziali) in funzione
dei vincoli (di tempo, di costo)
2. Raccolta (Rilevazione) dei dati
a) Dati derivanti da misurazioni, da questionario, da basi
di dati
b) Rilevazioni semplici o complesse
5
Elaborazione dei dati
Memorizzazione
Codifica/Ricodifica
Analisi statistica
Descrittiva/Inferenziale,
Univariata/Multivariata
Presentazione dei risultati
Riformulazione delle ipotesi di ricerca / Ridefinizione
degli obiettivi
6
TERMINOLOGIA
Rilevazioni statistiche
Complesso delle operazioni rivolte ad acquisire una o più
informazioni su un insieme di elementi (caratteri) oggetto di
studio.
Caratteristiche:
- semplici/complesse
- derivanti da risposte o da misure
- globali (censimenti) / parziali (rilevazioni campionarie)
Unità statistica: entità su cui viene condotta la rilevazione
statistica
Popolazione: insieme di tutte le unità statistiche facenti parte
di un collettivo di riferimento
Campione: sottoinsieme della popolazione
7
I Caratteri Statistici
Insieme di fenomeni oggetto di studio riguardanti le
caratteristiche che differenziano tra loro le unità statistiche
L’espressione del carattere nelle unità statistiche si denomina
modalità o intensità
Tipologie
a) Caratteri quantitativi (VARIABILI): assumono intensità
rappresentate da numeri reali
• Variabili continue
• Variabili discrete
b) Caratteri qualitativi (MUTABILI): assumono modalità
rappresentate da attributi non numerici
• Nominali
• Ordinali
• Dicotomici
Tutti i caratteri possono essere resi dicotomici
8
Tipi di caratteri ed operazioni possibili
Tipo di carattere
QUANTITATIVI
QUALITATIVI
Nominale
Esempi
Operazioni possibili
"stato civile",
uguaglianza/disuguaglianza
"zona di redidenza"
Ordinale
"titolo di studio",
"professione"
uguaglianza/disuguaglianza
ordinamento
Dicotomico
"genere",
"condizione
occupazionale"
uguaglianza/disuguaglianza
Discreto
"numero di
componenti il
nucleo familiare",
"numero di esami
sostenuti"
uguaglianza/disuguaglianza
ordinamento
calcolo di indicatori
numerici
Continuo
"reddito",
"temperatura"
uguaglianza/disuguaglianza
ordinamento
calcolo di indicatori
numerici
9
Cosa si studia al corso di Statistica 1?
I.
Statistica descrittiva:
Distribuzioni di frequenza
Rappresentazioni grafiche
Indici di posizione, variabilità e forma
Omogeneità ed eterogeneità
Relazioni statistiche (connessione, indipendenza in media,
correlazione)
II. Statistica Inferenziale:
Probabilità
Variabili Casuali
Modelli per variabili casuali
10
La matrice (50 unità statistiche, 9 caratteri)
FATT
SM
AZIENDA
I c e P a c k a g i n g1 0 2 1
Agricola Italiana Alimentari
109
Alimentare
Antonio Amato & C.
233
Alimentare
Argel
199
Alimentare
Bauli
354
Health Care
Beiersdorf
Ice Packaging 145
Bertana
467
Bevande
Birra Peroni Industriale
177
Alimentare
C. & V. Zuegg
161
Alimentare
Cameo
158
Health Care
Cartiera Lucchese
Ice Packaging 115
Centrale del Latte Firenze
Ice Packaging 108
Centrale del Latte Milano
1444
Alimentare
Cirio Polenghi De Rica
493
Health Care
Colgate Palmolive
Ice Packaging 185
Cooperlat
Ice Packaging 285
Danone
242
Bevande
Davide Campari
386
Alimentare
Dolma
981
Alimentare
Eridania Zuccherifici
105
Alimentare
Eurico Italia
103
Bevande
F.lli Averna
I c e P a c k a g i n g2 0 1 2
Galbani
104
Alimentare
Gelati Sanson
Ice Packaging 521
Granarolo Felsinea
131
Health Care
Hatù
129
Alimentare
Illy Caffè
138
Alimentare
Italkali
228
Health Care
Johnson Wax
Ice Packaging 457
Kraft Gen. Foods-Proc. Meats
Ice Packaging 163
Latteria Soresinese
103
Alimentare
Lindt e Sprungli
308
Alimentare
Massalombarda Colombani
609
Health Care
Mira Lanza
Ice Packaging 142
Montorsi Blasi
Ice Packaging 189
Montorsi Francesco
107
Alimentare
Oleificio Zucchi
130
Health Care
Paglieri
Ice Packaging 354
Pavo
593
Alimentare
Perfetti
604
ealth Care
H.
L. & C
Procter & Gamble div
324
Alimentare
Progeo
149
Health Care
Reckitt & Colman
430
Alimentare
S.f.i.r.
323
Alimentare
San Carlo
181
Health Care
Sara Lee De Italy
443
Health Care
Scott
378
Alimentare
Trinity Alimentari
Ice Packaging 228
Unicarni
157
Health Care
Unikay
122
Alimentare
Unione Laboratori
FATEST
12%
10%
4%
10%
50%
7%
5%
10%
14%
35%
0%
0%
18%
13%
15%
12%
45%
12%
45%
90%
10%
12%
10%
5%
0%
27%
6%
4%
20%
13%
12%
20%
29%
19%
20%
18%
5%
10%
3%
25%
11%
0%
5%
1%
7%
0%
10%
10%
8%
0%
ADD94
2600
292
323
1320
640
135
1176
225
326
378
192
385
1477
933
208
678
576
205
2001
2664
136
6266
285
294
445
206
813
205
1410
273
566
893
783
264
236
92
273
98
614
1390
503
119
551
293
343
964
608
167
396
517
NSTAB
6
2
2
1
2
1
4
2
2
2
3
1
3
1
3
1
5
1
11
1
1
8
1
8
1
1
6
0
3
1
1
4
2
4
5
1
2
1
4
4
2
0
4
7
2
3
2
1
3
2
NPF
2500
500
332
335
1200
50
137
150
260
350
150
60
270
250
800
106
600
500
30
1700
30
300
150
650
2500
100
250
150
450
300
800
500
260
277
1375
310
1300
300
200
70
280
170
10
158
350
280
90
450
260
810
NMP
250
10
1200
1940
1861
25
257
600
650
150
15
25
500
500
200
600
4000
20
0
160
190
2500
1200
420
2000
195
500
1599
1000
120
5000
200
861
947
1619
350
10000
100
1000
1000
135
135
15
20
2800
390
14
150
20
1440
NCLIENT
10000
20000
30000
11000
16000
600
2000
3000
2000
11700
6000
2000
20000
1200
16600
45000
80000
12000
400
3000
20000
100000
23000
28000
18000
17500
20000
1350
8500
3500
18000
7000
1200
17400
9925
730
8000
12000
143000
1200
3000
4300
500
200000
2500
4000
1300
1500
2000
11900
NFORN
200
60
130
317
2900
200
130
1000
770
990
1000
200
100
60
130
1200
800
2040
1200
10000
200
5080
300
1400
500
153
35
220
650
150
1700
960
1980
1800
1900
61
1000
1190
25
30
100
30
2100
100
150
560
1880
1200
10
1160
Un campione di 50 aziende appartenenti alle imprese produttrici di
beni di largo consumo.
Rif.: M. Caputo (a cura di) Organizzare la logistica per l’Efficient Consumer
11
Response, CEDAM, 1998
Legenda dei caratteri considerati:
SM
FATT
FATEST
ADD94
NSTAB
NPF
NMP
NCLIENT
NFORN
Settore Merceologico
Fatturato (in miliari di lire)
Percentuale fatturato per
vendite all’estero
Numero Addetti
Numero Stabilimenti
Numero codici Prodotti Finiti
Numero codici Materie Prime
Numero Clienti
Numero Fornitori
Obiettivo: Descrivere i dati costruendo distribuzioni
di frequenza ed “opportune” rappresentazioni
grafiche
12
Tipologia di caratteri osservati:
SM
Settore
Merceologico
FATT
Fatturato
FATEST
Percentuale
fatturato per
vendite
all’estero
ADD94
Numero Addetti
NSTAB
NMP
Numero
Stabilimenti
Numero codici
Prodotti Finiti
Numero codici
Materie Prime
NCLIENT
Numero Clienti
NFORN
Numero Fornitori
NPF
Qualitativo Nominale
Quantitativo
Continuo
Quantitativo
Continuo
Quantitativo
Discreto
Quantitativo
Discreto
Quantitativo
Discreto
Quantitativo
Discreto
Quantitativo
Discreto
Quantitativo
Discreto
Per costruire la distribuzione di frequenza dei
caratteri
osservati
per
le
aziende
incluse
nel
campione bisogna contare, per ciascun carattere,
quante
volte
si
presenta
ciascuna
modalità/intensità.
13
Carattere qualitativo nominale
SETTORE MERCEOLOGICO
Caratterizzazione della mutabile
Modalità
Abbreviazione
Alimentare
A
Health Care
H
Ice Packaging
I
Bevande
B
Significato
Drogheria Food,
Petfood
Cura della
persona,cura e pulizia
della casa
Deperibili, Surgelati,
Congelati, Gelati
Beverage
14
La successione delle modalità è la seguente:
I,A,A,A,H,I,B,A,A,H,I,I,A,H,I,I,B,A
,A,A,B,I,A,I,H,A,A,H,I,I,A,A,H,I,I,
A,H,I,A,H,A,H,A,A,H,H,A,I,H,A
Sono stati riportati i settori merceologici elencati
nella prima colonna della matrice dei dati
sostituendo l’abbreviazione alla dicitura per esteso.
15
In simboli:
Distribuzione di frequenza
Freque
Frequenza
nza
Modalità
relativa
assoluta
Ice Packaging
14
0,28
Alimentare
21
0,42
Health Care
12
0,24
Bevande
3
0,06
Totale
50
1,00
X  Carattere osservato
n Numero di unità statistiche
k  Numero di
xi 
ni 
fi 
modalità/intensità di X
i-esima
modalità/intensità di X
Frequenza assoluta
della i-esima modalità xi
Frequenza relativa della
i-esima modalità xi
f i  ni
X
ni
x1
n1
f1
x2
n2
f2
xi
ni
fi
xk
nk
fk
Totale
n
1
n
16
Distribuzione di frequenza
n1  n2 
I)

k
i 1
II )
f1  f 2 

k

i 1
fi  1
ni
x1
n1
f1
x2
n2
f2
xi
ni
fi
xk
nk
fk
Totale
n
1
 ni 1  ni  ni 1 
 ni  n
f i  ni
X
n
 nk 1  nk 
,k
i  1, 2,

 0  ni  n
 f i 1  f i  f i 1 
 f k 1  f k 
,k
i  1, 2,

 0  fi  1
17
Carattere qualitativo nominale: Rappresentazioni
grafiche
Diagramma a barre
Frequenze assolute
Distribuz ione delle az iende per settore
merceologico (frequenz e assolute)
25
20
15
10
5
0
Alimentare
Health Care
Ice
Packaging
Bevande
N.B. E’ possibile costruire il diagramma a barre riportando in
ordinata le frequenze assolute OPPURE le frequenze relative, la
forma della rappresentazione risulta invariata.
Frequenza relative
Distribuzione delle aziende per settore merceologico
(frequenze relative)
0.5
0.4
0.3
0.2
0.1
0
Alimentare
Health Care
Ice Packaging
Bevande
18
Carattere qualitativo nominale: Rappresentazioni
Grafico a torta
grafiche
Dis tr ibuzione de lle azie nde pe r s e ttor e
m e r ce ologico (fr e que nze as s olute )
6%
28%
42%
24%
A limentare
Health Care
Ice Packaging
Bevande
Carattere quantitativo discreto
NUMERO DI STABILIMENTI
La successione delle intensità osservate è la seguente:
6,2,2,1,2,1,4,2,2,2,3,1,3,1,3,1,5
,1,11,1,1,8,1,8,1,1,6,0,3,1,1,4,2
,4,5,1,2,1,4,4,2,0,4,7,2,3,2,1,3,
2
19
Distribuzione di frequenza
Intensità
Frequenza
assoluta
xi
0
1
2
3
4
5
6
7
8
11
Totale
ni
2
16
12
6
6
2
2
1
2
1
50
Frequenza relativa
ni
n
fi 
0,04
0,32
0,24
0,12
0,12
0,04
0,04
0,02
0,04
0,02
1,00
Frequenza
relativa cumulata
Fi 
i

fl
l 1
0,04
0,36
0,60
0,72
0,84
0,88
0,92
0,94
0,98
1,00
Frequenza relativa cumulata: somma delle frequenze relative
fino alla i-esima intensità. Si può calcolare per ogni tipo di
distribuzione di frequenza.
F1 
Fk 
1

l 1
k

f l  f1 ;
F2 
2

f l  f1  f 2 ;
l 1
f l  f1  f 2 
 fi 
 f k  1;
l 1
N.B. Valgono tutte le altre proprietà viste per le distribuzioni di frequenza dei
caratteri qualitativi
20
Rappresentazioni grafiche del carattere “Numero di
stabilimenti”
Frequenza assoluta
Distribuz ione delle az iende per numero di
stabilimenti (frequenz e assolute)
20
15
10
5
0
0
1
2
3
4
5
6
7
8
11
8
11
Numero di stabilimenti
Distribuz ione delle az iende per numero di
stabilimenti (frequenz e relative)
Frequenza relativa
0,4
0,3
0,2
0,1
0
0
1
2
3
4
5
6
7
Nume ro di sta bilime nti
Distribuzione
delle aziende
per numero di
stabilimenti
2,0%
4,0%
2,0%
4,0%
4,0%
4,0%
32,0%
12,0%
12,0%
24,0%
0
1
2
3
4
5
6
7
8
11
21
Suddivisione in classi
Le intensità di un carattere quantitativo discreto
possono essere anche suddivise in classi, per cui si
può considerare una distribuzione di frequenza
tenendo conto delle classi di intensità
I possibili criteri di raggruppamento di una distribuzione
in classi di intensità sono:
1.Classi equiampie
2.Classi di diversa ampiezza e diversa frequenza
CLASSI EQUIAMPIE
Fasi:
1.Si ordinano le intensità del carattere osservato in
senso non decrescente
2.Si fissa il numero delle classi k
3.Si calcola l’ampiezza delle classi d attraverso il
rapporto:
d 
xmax  xmin
k
in cui xmax ed xmin rappresentano il valore massimo ed
il valore minimo della distribuzione le cui intensità
devono essere suddivise in classi
4.Si costruisce la distribuzione di frequenza
22
Carattere “N. di stabilimenti”: suddivisione delle intensità in
5 classi equiampie
Fissiamo k=5 per la suddivisione in classi della
variabile numero di stabilimenti.
L’ampiezza delle classi sarà data da:
d 
11  0
 2, 20  2, 00
5
Trattandosi di un carattere quantitativo discreto è
possibile approssimare per difetto 2,20 e quindi
considerare classi di ampiezza 2.
Le classi saranno:
0  xi  2,
Prima classe
2 < xi  4,
Seconda Classe
4 < xi  6,
Terza Classe
6 < xi  8
Quarta Classe
8 < xi  11
Quinta Classe
23
Carattere “N. di
distribuzione in classi
stabilimenti”:
costruzione
della
La successione ordinata delle intensità osservate è la
seguente:
0,0,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,2,
2,2,2,2,2,2,2,2,2,2,2,3,3,3,3,3,3,4,4,
4,4,4,4,5,5,6,6,7,8,8,
11
La distribuzione in classi equiampie della variabile
numero di stabilimenti risulta:
Classi
xi  xl  xi 1
0 |--| 2
2 --| 4
4 --| 6
6 --| 8
8 --| 11
Totale
Frequenza
assoluta
ni
30
12
4
3
1
50
Frequenza
relativa
fi
n
 i
n
0,60
0,24
0,08
0,06
0,02
1,00
Frequenza
relativa
cumulata
Fi 
i

fl
l 1
0,60
0,84
0,92
0,98
1,00
N.B. Valgono tutte le altre proprietà viste per le distribuzioni di frequenza dei
caratteri qualitativi e quantitativi discreti
24
CLASSI DI DIVERSA AMPIEZZA E FREQUENZA
Fasi:
1.Si
ordinano
le
modalità
del
carattere
osservato in senso non decrescente
2.Si fissano il numero delle classi k e le loro
ampiezze di
3.Si costruisce la distribuzione di frequenza
Carattere “N. di stabilimenti”: suddivisione delle intensità in
5 classi di diversa ampiezza e frequenza
Si immagini che, per motivi di convenienza,
fissano le seguenti classi di intensità:
0  xi  1,
Prima classe
1 < xi  3,
Seconda Classe
3 < xi  5,
Terza Classe
5 < xi  7
Quarta Classe
7 < xi  11
Quinta Classe
si
25
Considerando ancora la successione ordinata delle
intensità:
0,0,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,2,
2,2,2,2,2,2,2,2,2,2,2,3,3,3,3,3,3,4,4,
4,4,4,4,5,5,6,6,7,8,8,11
Classi
xi  xl  xi 1
Freq.
assoluta
ni
Freq.
relativa
fi 
ni
n
Frequenza
relativa
cumulata
Fi 
i

fl
l 1
0 |--| 1
1 --| 3
3 --| 5
5 --| 7
7 --| 11
Totale
18
18
8
3
3
50
0,36
0,36
0,16
0,06
0,06
1,00
0,36
0,72
0,88
0,94
1,00
26
Distribuzioni di frequenza
per caratteri quantitativi continui
Poiché
i
caratteri
quantitativi
continui
spesso
presentano un numero elevatissimo di diverse intensità,
si ricorre quasi sempre al raggruppamento delle
intensità in classi.
I
possibili
criteri
di
raggruppamento
di
una
distribuzione in classi sono:
1.Classi equiampie
2.Classi equifrequenti
3.Classi di diversa ampiezza e diversa frequenza
I criteri 1 e 3 sono uguali al caso della suddivisione in
classi di un carattere quantitativo discreto.
CLASSI EQUIFREQUENTI
Fasi:
1.Si ordinano le intensità del carattere osservato in
senso non decrescente
2.Si fissa la frequenza da assegnare ad ogni classe ni
3.Si determinano gli estremi delle classi a partire
dalla distribuzione ordinata della intensità
4.Si costruisce la distribuzione di frequenza
27
Carattere quantitativo continuo
FATTURATO
Si ipotizzi di voler determinare una distribuzione in
classi in cui ogni classe ha una frequenza assoluta pari
a 10 (ni=10 i=1,…..,k).
La distribuzione ordinata delle modalità è la seguente:
103,103,104,105,107,108,109,115,
122,129,130,131,138,142,145,149,
157,158,161,163,177,181,185,189,
199,228,228,233,242,285,308,323,
324,354,354,378,386,430,443,457,
467,493,521,593,604,609,981,1.021
1.444,2.012
Le classi saranno:
103  xi  129,
Prima classe
129 < xi  163,
Seconda Classe
163 < xi  285,
Terza Classe
285 < xi  457
Quarta Classe
457 < xi  2.012
Quinta Classe
28
Carattere “Fatturato”: Classi equifrequenti
Classi
xi  xl  xi 1
103 |--| 129
129 --| 163
163 --| 285
285 --| 457
457 --| 2.012
di
26
34
122
172
1555
Totale
0.008
Ampiez
za della
classe
Frequenza
relativa
fi
n
 i
n
0,20
0,20
0,20
0,20
0,20
Densità di
frequenza
hi 
fi
di
0,008
0,006
0,002
0,001
0,000
Somma
delle aree
Pl 
i
d h
l
l
l 1
0,20
0,40
0,60
0,80
1,00
1,00
Istogramma del fatturato
(classi equifrequenti e densità di frequenza)
0.006
Densità di
requenza
0.004
0.002
0.0
500
1000
1500
2000
classi di modalità
29
Carattere “Fatturato”: Classi equiampie
Come cambia la distribuzione se consideriamo 5 classi equiampie
(k=5)?
d 
xmax  xmin
2.012  103

 381, 80
k
5
Classi
xi  xl  xi 1
103,0 |--| 484,8
484,8 --| 866,6
866,6 --| 1.248,4
1248,4 --| 1.630,2
1630,2 --| 2.012,0
Totale
Classi
xi  xl  xi 1
103,0 |--| 484,8
484,8 --| 866,6
866,6 --| 1.248,4
1248,4 --| 1.630,2
1630,2 --| 2.012,0
Totale
Freq.
Ass.
ni
41
5
2
1
1
50
Ampiez
za della
classe
di
381,8
381,8
381,8
381,8
381,8
Freq.
relativa
fi 
ni
n
0,82
0,10
0,04
0,02
0,02
1,00
Freq.
relativa
fi
n
 i
n
0,82
0,10
0,04
0,02
0,02
1,00
Frequenza relativa
cumulata
i
Fi 

fl
l 1
0,82
0,92
0,96
0,98
1,00
Densità di
frequenza
f
hi  i
di
0,00215
0,00026
0,00010
0,00005
0,00005
Somma
delle aree
Pl 
i
d h
l
l
l 1
0,82
0,92
0,96
0,98
1,00
30
Carattere “N.ro di stabilimenti”: Classi equiampie
Classi
xi  xl  xi 1
fi
di
0 |--| 2
2 --| 4
4 --| 6
6 --| 8
8 --| 11
Totale
densità di
frequenza
Freq.
relativa
Ampiez
za della
classe
2
2
2
2
3
Densità di
frequenza
n
 i hi  f i
n
di
0,60
0,24
0,08
0,06
0,02
1,00
0,30
0,12
0,040
0,030
0,0067
Somma
delle aree
Pl 
i
d
l hl
l 1
0,60
0,84
0,92
0,98
1,00
Istogramma normalizzato del numero di stabilimenti
(classi equiampie)
0.30
0.25
0.20
0.15
0.10
0.05
0.0
0
2
4
6
8
10
classi di modalità
31
Rappresentazioni grafiche
1. Variabili qualitative
Diagramma a barre
Diagramma a torta
Frequenze assolute
Distribuz ione delle az iende per settore
merceologico (frequenz e assolute)
25
20
15
10
5
0
Alimentare
Health Care
Ice
Packaging
Bevande
• Variabili nominali o ordinali
• Frequenze assolute o relative
2. Variabili quantitative discrete
Diagramma a bastoni
Diagramma a torta
12
10
8
6
4
2
0
0
1
2
3
4
5
6
7
• Frequenze assolute o relative
32
3. Variabili quantitative continue
3.1 Istogramma
rettangoli = classi
base = ampiezza della classe di
altezza = densità di frequenza hi
bi  di  x i  x i 1
ni
hi 
i  1, d
2,i
,k
area del imo rettangolo = frequenza della ima classe
A i  bi  h i  d i 
ni
di
 ni
area totale A = n
33
Esempio 1: variabile X
suddivisa in 2 classi di diverse ampiezza e frequenza
xi-1 - xi
0 - 100
100 - 150
ni
40
20
Istogramma delle frequenze assolute
45
40
30
20
15
0
Apparentemente sembrerebbe che le unità statistiche sono più
concentrate nella prima classe, ma in realtà dovremmo tener presente
che è vero che la frequenza nella prima classe è doppia rispetto alla
frequenza nella seconda, ma è pur vero che la prima classe ha anche
un’ampiezza doppia rispetto alla seconda.
34
Istogramma delle densità di frequenza (normalizzato)
0,6
0,4
0,4
0,4
0,2
0
Rappresentando la densità di frequenza, invece, risulta evidente
che le due classi sono perfettamente omogenee relativamente al
modo in cui le unità statistiche si distribuiscono tra di esse.
35
Istogramma normalizzato in cui la densità di frequenza è
calcolata sulle frequenze relative
bi  di  x i  x i 1
fi
hi 
di
base = ampiezza della classe di
altezza = densità di frequenza hi
area del rettangolo = frequenza relativa della classe
A i  bi  h i  d i 
fi
di
 fi
area totale A = 1
36
Dati: 30 consumatori di succhi di frutta
n. bottiglie
prezzo
CH
prezzo
MM
sconto CH
sconto
MM
fedele
CH
fedele
MM
ID. cliente
scelta
Negozio
1
2127027
CH
2
1,86
2,13
0,470
0,540
0,933
0,067
Coloniali
2
2128058
CH
5
1,99
2,09
0,100
0,400
0,400
0,600
Bar
3
2128231
CH
5
2,09
2,09
0,200
0,400
0,820
0,180
Bar
4
2128363
CH
5
2,09
2,09
0,200
0,400
0,978
0,022
Bar
5
2128389
CH
4
2,09
2,09
0,200
0,400
0,795
0,205
S.market
6
2130153
CH
5
2,09
2,09
0,200
0,400
0,384
0,616
Bar
7
2131060
CH
6
1,99
2,09
0,100
0,400
0,986
0,014
Bar
8
2131060
CH
2
2,09
2,09
0,200
0,400
0,993
0,007
Bar
9
2131060
CH
4
2,09
2,09
0,200
0,400
0,994
0,006
Bar
10
2131631
CH
3
1,99
2,09
0,100
0,400
1,000
0,000
Bar
11
2131631
CH
5
2,09
2,09
0,200
0,400
1,000
0,000
Bar
12
2133751
CH
6
1,86
2,13
0,470
0,540
0,520
0,480
Coloniali
13
2136325
MM
5
2,09
2,09
0,200
0,400
0,342
0,658
S.market
14
2136838
MM
5
2,09
2,09
0,200
0,400
0,000
1,000
S.market
15
2137778
MM
2
1,75
1,99
0,160
0,300
0,351
0,649
D. Autom.
16
2138081
MM
1
1,99
2,09
0,100
0,400
0,500
0,500
S.market
17
2138081
CH
3
1,99
2,09
0,100
0,400
0,400
0,600
S.market
18
2138685
CH
4
1,69
1,69
0,300
0,200
0,320
0,680
Coloniali
19
2142976
CH
5
1,86
2,13
0,470
0,540
0,314
0,686
Coloniali
20
2143495
MM
5
1,75
1,99
0,160
0,300
0,131
0,869
D. Autom.
21
2143644
MM
2
1,75
1,99
0,160
0,300
0,248
0,752
D. Autom.
22
2143644
MM
3
1,86
2,13
0,470
0,540
0,220
0,780
Coloniali
23
2144956
CH
6
2,09
2,09
0,200
0,400
0,533
0,467
S.market
24
2147207
MM
5
1,99
2,09
0,100
0,400
0,670
0,330
S.market
25
2147207
CH
4
1,86
2,13
0,470
0,540
0,629
0,371
Coloniali
26
2147207
MM
1
2,09
2,09
0,200
0,400
0,450
0,550
S.market
27
2147660
CH
5
1,86
2,13
0,470
0,540
0,913
0,087
Coloniali
28
2147819
CH
1
1,86
2,13
0,470
0,540
0,500
0,500
Coloniali
29
2148098
CH
4
1,86
2,13
0,470
0,540
0,803
0,197
Coloniali
30
2149252
CH
6
1,75
1,99
0,160
0,300
0,895
0,105
D. Autom.
37
Carattere
scelta
n. bottiglie
prezzo CH
prezzo MM
sconto CH
sconto MM
fedele MM
fedele CH
negozio
Descrizione
marca prescelta
numero di bottiglie acquistate
prezzo della marca CH
prezzo della marca MM
sconto per il prodotto CH
sconto per il prodotto MM
indicatore di fedeltà per il prodotto MM
indicatore di fedeltà per il prodotto CH
rivenditore del prodotto
38
Esempio 2
Carattere: “fedele CH”
Distribuzione di frequenza di 5 classi equiampie
n = 30
di 
x max  x min
5
Fedele CH
Totale
 0, 2
5
ni
0 |—| 0,2
0,2 —| 0,4
0,4 —| 0,6
0,6 —| 0,8
0,8 —| 1

1 0
fi
2
9
5
3
11
30
0,06
0,30
0,17
0,10
0,37
1
Fi
0,06
0,36
0,53
0,63
1
hi 
fi
di
0,3
1,5
0,85
0,5
1,85
39
Istogramma delle frequenze relative
0,4
0,37
0,3
0,3
0,2
0,17
0,1
0,1
0
0,06
0
0,2
0,4
0,6
0,8
1
Istogramma delle densità di frequenza
2
1,85
1,5
1,5
1
0,85
0,5
0,5
0,3
0
0
0,2
0,4
0,6
0,8
1
In questo caso le due rappresentazioni sono ugualmente valide, ma solo
in quanto le classi hanno la stessa ampiezza
40
Esempio 3
Carattere: “fedele CH”
Distribuzione di frequenza di 5 classi equifrequenti
n = 30
ni = 30 : 5 = 6
Fedele CH
di
0 |—| 0,32
0,32 —| 0,45
0,45 —| 0,67
0,67 —| 0,93
0,93 —| 1
ni
0,32
0,13
0,22
0,26
0,07
Totale
fi
6
6
6
6
6
30
hi 
Fi
0,2
0,2
0,2
0,2
0,2
1
0,2
0,4
0,6
0,8
1
fi
di
0,625
1,538
0,909
0,769
2,857
41
Istogramma delle frequenze assolute
4
3
2
0
1
frequenza assoluta
5
6
Is togramma (c las s i equif requenti)
0.0
0.2
0.4
0.6
0.8
1.0
c l as s i di modal i tà
Istogramma delle densità di frequenza
2.0
1.5
1.0
0.0
0.5
densità di frequenza
2.5
Is togramma (c las s i equif requenti e dens ità di f requenz a)
0.0
0.2
0.4
0.6
0.8
1.0
c l as s i di modal i tà
In questo caso è evidente che il primo grafico non è adeguato a
rappresentare la distribuzione di frequenza.
42
In sintesi l’istogramma:
• considera l’intensità con cui le frequenze si addensano
all’interno delle diverse classi
• è sensibile a cambiamenti dei criteri di raggruppamento
delle intensità in classi
• permette di
distribuzioni
confrontare
“graficamente”
diverse
43
Esempio 4: Confronto grafico tra diversi criteri di raggruppamento delle
classi
Carattere “Fatturato”
A. Classi equifrequenti
Classi
xi  xl  xi 1
103 |--| 129
129 --| 163
163 --| 285
285 --| 457
457 --| 2.012
Ampiez
za della
classe
n
 i
n
fi
di
26
34
122
172
1555
Totale
0.008
Frequenza
relativa
0,20
0,20
0,20
0,20
0,20
Densità di
frequenza
f
hi  i
di
0,008
0,006
0,002
0,001
0,000
Somma
delle aree
Pl 
i
d h
l
l
l 1
0,20
0,40
0,60
0,80
1,00
1,00
Istogramma del fatturato
(classi equifrequenti e densità di frequenza)
0.006
Densità di
requenza
0.004
0.002
0.0
500
1000
classi di modalità
1500
2000
44
B. Classi equiampie
Come cambia la distribuzione se consideriamo 5 classi equiampie?
Classi
di
103,0 | -- | 484,8
484,8 -- | 866,6
866,6 -- | 1.248, 4
1248,4 -- | 1.630,2
1630,2 -- | 2.012,0
Totale
Densità di
frequenza
381,8
381,8
381,8
381,8
381,8
fi
n
i

h

i
fi
di
n
0,82
0,10
0,04
0,02
0,02
1,00
0,00215
0,00026
0,00010
0,00005
0,00005
F
0,82
0,92
0,96
0,98
1,00
Istogramma del fatturato
(classi equiampie e densità di frequenza)
0.0020
0.0015
0.0010
0.0005
0.0
500
1000
classi di modalità
1500
2000
45
C. Classi di diversa ampiezza e frequenza
La gran parte delle aziende incluse nel campione ha un
fatturato compreso tra 100 e 500 milioni (I classe).
Domanda : La distribuzione del fatturato delle aziende
appartenenti alla prima classe di fatturato può
considerarsi uniforme?
Risposta : consideriamo la seguente distribuzione in
classi:
100| -- |200, 200 --|300, 300 -- |400,
-- |2.100
400 -- |500, 500
Classi
100 |
200
300
400
500
-- | 200
-- | 300
-- | 400
-- | 500
-- | 2.100
Totale
di
100
100
100
100
1.600
n
i

fi
n
0,50
0,10
0,14
0,10
0,16
1,00
hi  f i
di
0,0050
0,0010
0,0014
0,0010
0,0001
F
0,50
0,60
0,74
0,84
1,00
46
Confronto grafico: quale suddivisione in classi approssima meglio
i dati originari?
0.008
Istogramma del fatturato
(classi equifrequenti e densità di frequenza)
0.006
Densità di
requenza
0.004
0.002
0.0
500
Densità di
frequenza
1000
1500
2000
classi di modalità
Istogramma del fatturato
(classi equiampie e densità di frequenza)
0.0020
0.0015
0.0010
0.0005
0.0
500
1000
1500
2000
classi di modalità
Densità di
frequenza
Istogramma del fatturato
(classi di diversa ampiezza e frequenza e densità di frequenza)
0.005
0.004
0.003
0.002
0.001
0.0
500
1000
1500
2000
classi di modalità
47
Densità di
frequenza
Istogramma del fatturato
(classi di diversa ampiezza e frequenza e densità di frequenza)
0.005
0.004
0.003
0.002
0.001
0.0
500
1000
classi di modalità
1500
2000
Come si evince dall’istogramma, la densità di
frequenza è più elevata in corrispondenza della
prima classe (da 100 a 200 miliardi), per cui la
distribuzione del fatturato delle aziende
appartenenti alla prima classe di fatturato (100 – 500)
relativa al caso delle classi equifrequenti
NON
può considerarsi uniforme.
48
3.2 Funzione di ripartizione empirica
#  X  xl
frequenza relativa delle unità 
Fl  

n
 statistiche con modalità  xl 
l 1

l  2

l i

l  k


n1
n
n  n2
 1
n
F1  f1 
F2  f1  f 2
Fi  f1  f 2 
Fk  f1  f 2 
 fi 
 fi 
 fk 
n1  n2 
n
n1  n2 
 ni
 ni 
n
 nk
1
Proprietà:
1. 0  Fl  1
2. Fl è non decrescente
F  1
3. F  0;
4. Fl è continua da destra
49
Rappresentazione grafica
Carattere “Fatturato”
Classi equiampie
1,0
0,8
0,6
0,4
0,2
0,0
103
484,8
866,6
1284,4
1630,2
2012
2500
1.00
0.90
0.80
0.70
0.60
0.50
0.40
0.30
0.20
0.10
0.00
103
484,8
866,6
1284,4
1630,2
2012
50
Confronto tra i diversi criteri di
raggruppamento
a)
classi equifrequenti
1.00
0.90
0.80
0.70
0.60
0.50
0.40
0.30
0.20
0.10
0.00
b) classi equiampie
1.00
0.90
0.80
0.70
0.60
0.50
0.40
0.30
0.20
0.10
0.00
c) classi di diversa ampiezza e frequenza
1.00
0.90
0.80
0.70
0.60
0.50
0.40
0.30
0.20
0.10
0.00
51
LE RELAZIONI STATISTICHE
Riguardano lo studio delle relazioni tra due o più caratteri
statistici.
Due o più caratteri vengono analizzati simultaneamente al
fine di evidenziare i legami intercorrenti tra di essi.
Nel caso delle relazioni tra due caratteri, l’oggetto dello
studio è la distribuzione doppia (o bivariata) rappresentabile
in una tabella a doppia entrata.
52
LA DISTRIBUZIONE DOPPIA
carattere in colonna
frequenza marginale di
riga
carattere in riga
j-ma modalità (intensità) di Y
Y
X
x1
y1
y2

yj

yh
n11
n12

n1 j

n1h
n1
x2
n21
n22

n2 j

n2 h
n2








xi
ni1
ni 2

nij

nih
ni 








xk
nk 1
nk 2

nkj

nkh
nk 
n1
n 2

n j

n h
n
i-ma modalità (intensità)
frequenza congiunta di xi ed
di X
yj
frequenza marginale di colonna
53
LA DISTRIBUZIONE DOPPIA
Caratteristiche principali
• Se dividiamo ogni cella per n otteniamo la tabella doppia per
frequenze relative
• Valgono per estensione tutte le proprietà viste per le
distribuzioni semplici
• n  frequenza congiunta
ij
• ni   totali di riga 
h
n
ij
j 1
n j  totali di colonna 
•
n
•
k
h
n
i 1
j 1
ij

n
i
i

k
n
i 1
ij
n
j
j
54
X
LA DISTRIBUZIONE DOPPIA
Frequenze relative
y1
y2
yj
yh
x1
f11
f12
f1 j
f1h
f1
x2
f 21
f 22
f2 j
f2h
f 2
xi
f i1
fi 2
f ij
f ih
fi
xk
f k1
fk 2
f kj
f kh
fk 
f 1
f 2
f j
f h
1
Y
f ij  frequenza
relativa
f i   totali di riga 
h

j 1
f ij
f  j  totali di colonna 
1
k
h

i 1
j 1
f ij 

i
congiunta
k

f ij
i 1
f i 

f j
j
55
ESEMPIO
A partire dalla successione delle intensità riguardanti i caratteri Fatturato
(FATT) e Fatturato Estero (FATEST) si costruisca la distribuzione doppia di
frequenze rappresentandola in una tabella a doppia entrata suddividendo le
intensità dei due caratteri nei modi seguenti:
FATT:
200, 200 -| 300, 300 -| 400, 400 -| 500, >500
FATEST:
5%, 5% -| 10%, 10% -| 25%, 25% -| 50%, >50%
FATT
1021, 109, 233, 199, 354, 145, 467, 177, 161, 158, 115, 108,
1444, 493, 185, 285, 242, 386, 981, 105, 103, 2012, 104, 521,
131, 129, 138, 228, 457, 163, 103, 308, 609, 142, 189, 107, 130,
354, 593, 604, 324, 149, 430, 323, 181, 443, 378, 228, 157, 122,
FATEST
12,00%,
10,00%,
4,00%,
10,00%,
50,00%,
7,00%,
5,00%,
10,00%, 14,00%, 35,00%, 0,00%, 0,00%, 18,00%, 13,00%,
15,00%, 12,00%, 45,00%, 12,00%, 45,00%, 90,00%, 10,00%,
12,00%, 10,00%, 4,50%, 0,00%, 27,00%, 6,00%, 4,00%, 20,00%,
13,00%, 12,00%, 20,00%, 29,00%, 19,00%, 20,00%, 18,00%,
5,00%, 10,00%, 3,00%, 25,00%, 10,60%, 0,00%, 5,00%, 1,00%,
7,00%, 0,00%, 10,00%, 10,00%, 8,00%, 0,00%
56
Bisogna considerare le coppie di intensità così come esse si
presentano nella successione e collocarle in una delle celle
della seguente tabella a doppia entrata:
Fatturato
Fatturato Estero
5%
5%-|10%
10%-|25%
>50%
25%-|50%
200
200 -| 300
300 -| 400
400 -| 500

>500
Ad esempio la prima coppia di intensità (FATT=1021,
FATEST=12%) va collocata nella cella corrispondente alla
quinta
riga
(FATT
>
500)
e
terza
colonna
(10%
<FATEST<25%) della tabella (
) .
Procedendo in questo modo per ogni coppia di intensità e
contando la frequenza in ogni cella si ottiene la seguente
tabella a doppia entrata relativa ad una distribuzione doppia di
frequenza.
Fatturato
(X)
200
200 -| 300
300 -| 400
400 -| 500
>500
Totale
Fatturato Estero (Y)
5%
6
2
1
3
2
14
5%-|10%
10%-|25%
25%-|50%
>50%
9
1
2
0
0
12
7
1
3
2
4
17
2
1
1
0
2
6
1
0
0
0
0
1
Totale
25
5
7
5
8
50
57
DISTRIBUZIONI MARGINALI
Fatturato
200
200 -| 300
300 -| 400
400 -| 500
>500
Totale
Freq.
ass.
25
5
7
5
8
50
Fatturato
estero
5%
Freq.
ass.
14
12
17
6
1
50
5% -| 10%
10%-| 25%
25%-|50%
>50%
Totale
DISTRIBUZIONI CONDIZIONATE DI X
X y j  5%
Fatturato
200
200 -| 300
300 -| 400
400 -| 500
>500
Totale
Freq.
ass.
6
2
1
3
2
14
X 25%  y j  50%
Fatturato
200
200 -| 300
300 -| 400
400 -| 500
>500
Totale
Freq.
ass.
2
1
1
0
2
6
X 5%  y j  10%
Fatturato
200
200 -| 300
300 -| 400
400 -| 500
>500
Totale
Freq.
ass.
9
1
2
0
0
12
X 10%  y j  25%
Fatturato
200
200 -| 300
300 -| 400
400 -| 500
>500
Totale
Freq.
ass.
7
1
3
2
4
17
X y j  50%
Fatturato
200
200 -| 300
300 -| 400
400 -| 500
>500
Totale
Freq.
ass.
1
0
0
0
0
1
58
DISTRIBUZIONI CONDIZIONATE DI Y
Y xi  200
Fatturato
estero
5%
5% -| 10%
10%-| 25%
25%-|50%
>50%
Totale
Freq.
ass.
6
9
7
2
1
25
Y 400  xi  500
Fatturato
estero
5%
5% -| 10%
10%-| 25%
25%-|50%
>50%
Totale
Freq.
ass.
3
0
2
0
0
5
Y 200  xi  300
Fatturato
estero
5%
5% -| 10%
10%-| 25%
25%-|50%
>50%
Totale
Freq.
ass.
2
1
1
1
0
5
Y 300  xi  400
Fatturato
estero
5%
5% -| 10%
10%-| 25%
25%-|50%
>50%
Totale
Freq.
ass.
1
2
3
1
0
7
Y xi  500
Fatturato
estero
5%
5% -| 10%
10%-| 25%
25%-|50%
>50%
Totale
Freq.
ass.
2
0
4
2
0
8
Sulle
distribuzioni
condizionate
e
marginali
è
possibile calcolare tutte le statistiche univariate
(indici di posizione, indici di variabilità, indici di
forma, etc.).
59
Misure di tendenza centrale
Sono misure sintetiche che posizionano la distribuzione di
frequenza di un fenomeno e consentono il passaggio da
una pluralità di informazioni ad un solo numero
L’obiettivo è di consentire di effettuare confronti nel
tempo, nello spazio o tra circostanze differenti
• Media
• Moda
 Mediana
 Quartili
• Quantili
 Decili
 Percentili
60
Moda
La Moda (o “norma” o “valore normale”) di una distribuzione
è rappresentata dal valore (qualitativo o numerico) che
presenta la frequenza assoluta o relativa più elevata.
Sintetizzare una distribuzione con la sua moda equivale
ad assumere come valore “più rappresentativo” quello che
si è verificato più spesso.
L’uso della moda ha tanto più senso quanto più la sua
frequenza si differenzia rispetto a quella delle altre
modalità o intensità
61
Variabili nominali
Carattere SCELTA
SCELTA
CH
MM
Totale
ni
Mo = CH
fi
21
9
30
0,7
0,3
1
Variabili quantitative discrete
Carattere NUMERO DI BOTTIGLIE
N. bottiglie
1
2
3
4
5
6
Totale
ni
Mo = 5
3
4
3
5
11
4
30
fi
0,10
0,13
0,10
0,17
0,37
0,13
1
62
Distribuzioni in classi
• Classi equiampie: la classe modale è la classe a cui corrisponde la
frequenza più elevata
• Classi equifrequenti o di diversa ampiezza e frequenza: la classe
modale è la classe a cui corrisponde la densità di frequenza più
elevata
Carattere PREZZO CH, classi equiampie (primi 20
consumatori)
f
hi 
Classe
1,69
1,77
1,85
1,93
2,01
Mo
ni
fi
i
di
Fi
|—| 1,77
3
0,15
0,15
—| 1,85
0
0
0,15
—| 1,93
3
0,15
0,30
—| 2,01
5
0,25
0,55
2,09
=—|
classe
modale = 92,01 0,45
--| 2,09 1
Totale
20
1
1,875
0
1,875
3,125
5,625
63
Istogramma normalizzato
3
2
0
1
densità di frequenza
4
5
Is togramma normaliz z ato del c arattere PREZZO CH
(c las s i equiampie)
1.7
1.8
1.9
2.0
2.1
c las s i di intens ità
Funzione di ripartizione empirica
4
3
2
1
0
densità di frequenza
5
6
Funz ione di ripartiz ione empiric a del c arattere PREZZO CH
(c las s i equiampie)
1.7
1.8
1.9
2.0
2.1
c las s i di intens ità
64
Carattere Fatturato, classi equifrequenti
Classi
xi  xl  xi 1
103 |--| 129
129 --| 163
163 --| 285
285 --| 457
457 --| 2.012
Totale
Ampiez
za della
classe
di
Frequenza
relativa
n
fi  i
n
26
34
122
172
1555
Densità di
frequenza
hi 
0,20
0,20
0,20
0,20
0,20
1,00
fi
di
0,008
0,006
0,002
0,001
0,000
Classe modale = 103 |--| 129
0.008
Istogramma del fatturato
(classi equifrequenti e densità di frequenza)
0.006
Densità di
requenza
0.004
0.002
0.0
500
1000
1500
2000
classi di modalità
65
Distribuzioni bimodali o plurimodali
Carattere NEGOZIO
Negozio
Bar
Coloniali
ni
D. automatico
Supermarket
Totale
fi
9
9
0,30
0,30
4
8
30
0,13
0,27
1
Il carattere presenta due modalità con la massima frequenza,
dunque le due mode sono:
Mo1 = Bar
Mo2 = Coloniali
Distribuzione zeromodale
X
x1
x2
Totale
ni
fi
20
20
40
Mo = ???
0,5
0,5
1
66
I QUANTILI
Valori
che
bipartiscono
la
distribuzione
intensità/modalità in due gruppi disgiunti.
 Mediana
Quantili
 Quartili
 Decili
delle
N:B. Quando si calcolano i quantili è
sempre neces-sario ordinare le
intensi-tà/modalità in senso non
decrescente
MEDIANA Percentili
I. Valore che bipartisce la distribuzione ordinata delle
intensità/modalità x(1),……,x(n) in due gruppi della stessa
numerosità
II.
Intensità/modalità dell’unità statistica che occupa il posto
centrale nella distribuzione ordinata x(1),……,x(n)
III. Intensità/modalità in corrispondenza della quale la funzione
di ripartizione è pari a 0,5 (FME = 0,5)
IV. E’ quel valore Me tale che tra il minimo x(1) ed Me vi sono
n/2 intensità/modalità (II Quartile Q2 )
67
Caratteri quantitativi discreti
x i 
intensità che occupa la i-esima posizione nella successione ordinata
delle intensità (i=1,….,n)
 x
 


Me  



n 

2 
 x
n

1 

 2

2
x
n 1 


2 

se n è pari
se n è dispari
N.B. Se n è pari, la mediana può non corrispondere a nessuna
delle intensità osservate.
Caratteri qualitativi ordinali
Si individuano le 2 modalità:
x(Me-1)
tale che F(x(Me-1) )<0,5
x(Me)
tale che
F(x(Me))  0,5
Me x(Me) , perché tra le ni unità che possiedono modalità xMe
sarà certamente compresa quella (se n è dispari) o quelle (se n è
68
pari) di posto centrale.
Carattere NUMERO DI BOTTIGLIE
1
3
5
5
1
3
5
5
1
4
5
6
2
4
5
6
2
4
5
6
2
4
5
6
2
4
5
3
5
5
n = 30
Essendo n pari la mediana è ottenuta come:
xn  xn
Me 
2
2
1
2

x1 5  x1 6
4  5

 4 ,5
2
2
Eliminando l’ultima osservazione: n = 29
Essendo n dispari:
Me  x n1  x 29 1  x15  4
2
2
69
Caratteri quantitativi continui
| x
Classe mediana
: classex in corrispondenza
della quale la
funzione di ripartizione empirica passa (anche idealmente) per il
punto 0,5.
Me 1
Me  xMe 1 
xMe 1
xMe
FMe
 xMe
 xMe 1 
Me
0, 5  FMe 1
FMe  FMe 1
estremo inferiore della classe mediana
estremo superiore della classe mediana
Valore della Funzione di ripartizione in corrispondenza della
classe mediana
FMe 1 Valore della Funzione di ripartizione in corrispondenza della
classe che precede la classe mediana
70
classe mediana
F
0,5
F
Me
Me-1
x
N.B. L’area tratteggiata
Me-1
Me
x
Me
è pari a 0,5
71
Ci
[5,27; 15,43]
]15,43; 25,59]
]25,59; 35,76]
]35,76; 45,92]
]45,92; 56,08]
]56,08; 66,24]
Totale
ni
13
7
5
1
2
2
30
fi
0,43
0,23
0,17
0,03
0,07
0,07
1,00
Fi
0,43
0,66
0,83
0,87
0,93
1,00
1. Individuazione della classe mediana
CMe = Ci : Fi = min (Fi > 0,5)
] 15,43;
25,59 ]
2. Stima della mediana all’interno della classe
Me  15 , 43 
10 ,16
0 , 67  0 , 43
 0 ,5
 0 , 43   18 , 39
72
QUARTILI
Primo Quartile: E’ quel valore Q1 tale che tra il minimo x(1) e Q1
vi sono n/4 intensità.
Q1
x n 




 4

 x
 x n
 n



r
s




 4

 4


2

se
n
4
è un numero intero
se
n
4
non è un numero intero
ed r ed s sono le differenze tra
n
4
e i due interi più vicini
Caratteri qualitativi ordinali
Si individuano le 2 modalità:
x(Q1-1)
tale che F(x(Q1 -1) )<0,25
x(Q1)
tale che F(x(Q1))  0,25
Q1 x(Q1) , perché tra le ni unità che possiedono modalità xQ1 sarà
certamente compresa quella (se n/4 è intero) o quelle (se n/4 non
è intero) di posto n/4.
73
Terzo Quartile: E’ quel valore Q3 tale che tra il minimo x(1) e Q3
vi sono 3n/4 intensità.
Q1
x 3 n 
3n

se
è un numero intero



4
 4 

 x
 x 3 n
 3n


r 
 s se 3n non è un numero intero



4
4




4

2

ed r ed s sono le differenze tra
3n
4
e i due interi più vicini
Caratteri qualitativi ordinali
Si individuano le 2 modalità:
x(Q3-1)
tale che F(x(Q3 -1) )<0,75
x(Q3)
tale che F(x(Q3) )  0,75
Q3 x(Q3) , perché tra le ni unità che possiedono modalità xQ3 sarà
certamente compresa quella (se n/4 è intero) o quelle (se n/4 non
è intero) di posto 3n/4.
74
Calcolo dei quartili per una distribuzione semplice
Carattere NUMERO DI BOTTIGLIE
1
3
5
5
1
3
5
5
1
4
5
6
Considerando le
numerosità n’:
2
4
5
6
2
4
5
6
2
4
5
6
n = 30
due
2
4
5
semi-distribuzioni,
3
5
5
ciascuna
di
n
 15
2
n' 
Q1  x n' 1  x 8  3
2
Q2  Me  4,5
Q3  x
n' 1
n' 
2
 x2 3  5
75
Caratteri quantitativi continui

0, 25  FQ1 1

0, 75  FQ3 1
Q1  xQ1 1 

xQ1  xQ1 1
Q3  xQ3 1 

xQ3  xQ3 1
FQ1  FQ1 1
FQ3  FQ3 1
DECILI
q-mo Decile: E’ quel valore Dq tale che tra il minimo x(1) e Dq vi sono
(q·n)/10 intensità.
Per una distribuzione si possono calcolare fino a 9 Decili
PERCENTILI
q-mo Percentile: E’ quel valore Pq tale che tra il minimo x(1) e Pq
vi sono (q·n)/100 intensità.
Per una distribuzione si possono calcolare fino a 99 Percentili
Per il calcolo dei Decili e dei Percentili si utilizzano le stesse
formule (adattate allo specifico indice) utilizzate per il calcolo
della Mediana.
76
I quartili di una distribuzione in classi saranno determinati
in base alla formula per il generico quantile xpx:
x P x  x P x 1 
x P x  x P x 1
FP x  FP x 1
Fdes iderata  FP x1 
in cui, individuata la classe di riferimento, si sostituirà ad
Fdesiderata il valore 0,25 per Q1, 0,5 per Q2 (Me) e 0,75 per Q3.
CQ1 = Ci : Fi = min (Fi > 0,25) = C1
10 ,16
Q1  5 , 27 
 0 , 25  0 
0 , 43
Q3
CQ3 = Ci : Fi = min (Fi > 0,25) = C3
10,16
0,75
 25,59 
0,83  0,67
 10 , 9
 0,67   30,67
77