Statistica descrittiva
Statistica descrittiva - Probabilità e Statistica I a.a. 04/05
1
=
Cos ’è la Statis tica?
• Analisi e inter pr etaz ione dei dati
attr aver so concetti e str umenti di
tipo matematico.
contesto
Scelta dei
dati
astr az ione
contesto
Metodologia
statistica
Inter pr etaz ione
Statistica descrittiva - Probabilità e Statistica I a.a. 04/05
2
1
T ipi di dati
• NOMINALE ( n o oper az ion i , n o con f r on t i )
• ORDINALE ( n o oper az i on i,
s ì con f r on t i )
• RAPPORTO ( s ì
oper az ion i s om m a/ di f f er en z a,
s ì con f r on t i - z er o var i abi le)
• INTERVALLARE ( s ì
oper az ion i , s ì con f r on t i
z er o f is s o)
Statistica descrittiva - Probabilità e Statistica I a.a. 04/05
3
Il campionamento S tatis tico
Uno dei principi base della statistica è il seguente: è possibile
caratterizzare un insieme di dati (popolazione) ispezionandone
Un piccolo sottoinsieme scelto in maniera casuale (campione).
Test
Caratterizzare la
popolazione
?
DATI
Metodi statistici
Statistica descrittiva - Probabilità e Statistica I a.a. 04/05
INFERENZA
Popolazione
incognita
4
2
IST OGRAMMA
Esempio: costruire un istogramma per visualizzare le anomalie
verificatesi nella produzione di un certo tipo di blocchetto metallico.
3 . 56
3 . 48
3 . 46
3 . 56
3 . 48
3 . 50
3 . 50
3 . 52
3 . 42
3 . 47
3 . 43
3 . 48
3 . 52
3 . 46
3 . 49
3 . 50
3 . 44
3 . 56
3 . 50
3.38
3 . 41
3 . 55
3.48
3.59
3 . 37
3 . 52
3 . 48
3 . 63
3 . 47
3 . 44
3 . 32
3 . 59
3 . 49
3 . 50
3 . 40
3 . 47
3.45
3.45
3 . 52
3 . 38
3.44
3.44
3 . 34
3 . 52
3.49
3.46
3 . 43
3 . 48
3.46
3.52
3.30
3.31
3.46
3.46
3.46
3.46
3.40
3.48
3 . 52
3 . 41
3 . 54
3 . 50
3.48
3 . 45
3 . 46
3 . 56
3.46
3 . 34
3 . 51 3 . 48
3 . 50 3 . 52
3.45 3.46
3 . 44 3 . 47
3 . 50
3 . 46
3.54
3 . 47
3.50
3.48
3 . 46
3 . 45
3 .68
3 . 60 3.46
3 . 46 3.52
3.48 3 . 49
3 . 48 3 . 54
3.52
3.56
3.41
3 . 47
3 . 48
3.54
3 . 41
S CE L T A DE L L E CL AS S I AP P R OPR IAT A
Statistica descrittiva - Probabilità e Statistica I a.a. 04/05
t ro
Al
5
67
3,
5
57
5
3,
47
3,
5
3
1
1
40
30
20
10
0
37
32
38
10
Frequenz a
5
3
3
9
3,
3 . 275 − 3 . 325
3 . 325 − 3 . 375
3 . 375 − 3 . 425
3 . 425 − 3 . 475
3 . 475 − 3 . 525
3 . 525 − 3 . 575
3 . 575 − 3 . 625
3 . 625 − 3 . 675
3 . 675 − 3 . 725
27
Freq.assolute
3,
Classi
5
Fornisce una stima della “legge di probabilità” che descrive una caratteristica della popolazione.
Statistica descrittiva - Probabilità e Statistica I a.a. 04/05
6
3
Quali s ono le caratteris tiche del prodotto?
Statistica descrittiva - Probabilità e Statistica I a.a. 04/05
7
o
lt r
A
5
5
5
67
3,
57
3,
47
3,
37
5
Diagr amma
di fr equenz a
3,
F requenz a
Percentuali
La differ enz a tr a
fr equenz a e
per centuale
0,4
0,3
0,2
0,1
0
3,2
75
3,3
25
3,3
75
3,4
25
3,4
75
3,5
25
3,5
75
3,6
25
3,6
75
3,7
25
A lt
ro
3,
27
5
40
30
20
10
0
tro
40
30
20
10
0
3,
27
5
3,
37
5
3,
47
5
3,
57
5
3,
67
5
• E’ possibile costruire una
legge generale per il procedimento di costruzione dei
blocchetti?
Frequenza
Al
• Qual è lo spessore più frequente dei blocchetti?
• Quanto è grande la dispersione?
• Ha un solo massimo?
• La distribuzione è simmetrica o
asimmetrica?
• C’è un evidente andamento?
Statistica descrittiva - Probabilità e Statistica I a.a. 04/05
8
4
Distribuzione Cumulativ a
tr o
5
Al
72
5
3,
67
5
3,
62
5
3,
57
5
3,
52
5
3,
5
47
3,
3,
42
5
5
37
3,
32
3,
3,
27
5
1
0 ,8
0 ,6
0 ,4
0 ,2
0
Statistica descrittiva - Probabilità e Statistica I a.a. 04/05
9
I diagrammi a torta
L’area di ogni fetta rappresenta la frequenza relativa di occorrenza dei dati nelle classi.
F requenz a
3,275
3,325
3,375
3,425
3,475
3,525
3,575
3,625
3,675
Statistica descrittiva - Probabilità e Statistica I a.a. 04/05
10
5
Grafici di s erie s toriche (o temporali)
Statistica descrittiva - Probabilità e Statistica I a.a. 04/05
11
Indici delle distr ibuz ioni di fr equenz a
Posiz ione
Più a s inis tr a
Più a destr a
Var iabilità
Meno var iabile
più var iabile
Statistica descrittiva - Probabilità e Statistica I a.a. 04/05
12
6
Simmetr ia
Asimmetr ica
simmetr ica
Coda sinistr a
Coda destra
Statistica descrittiva - Probabilità e Statistica I a.a. 04/05
13
La moda
Dato cui cor r isponde la fr equenz a più
alta.
A lberghi di A ssisi per categoria
40
35
30
25
freq 20
15
10
5
0
Freq.m odale
1 stella
m oda
2 stelle 3 stelle
4 stelle
categoria
Statistica descrittiva - Probabilità e Statistica I a.a. 04/05
14
7
La mediana
Dato che è più gr ande del 50% delle
osser vaz ioni e più piccola del 50% delle
osser vaz ioni
D istribuzione per titolo distudio
25
60
50
20
40
15
30
10
20
5
10
0
0
Analfa Alfabe Elem en
D iplom
M edia
Laurea
beti
ti
tari
a
frequenza
1
9
20
12
6
1
cum ulata
1
10
30
42
48
49
m ediana
Statistica descrittiva - Probabilità e Statistica I a.a. 04/05
1 n
µ = ∑ xi
n i =1
La media
18
16
14
Non r isente delle code
16
simmetr ia
12
10
8
6
15
14
12
10
8
6
4
2
0
4
2
-4
-3
-2
-1
0
1
2
M e=M
3
0
4
-4
20
18
16
14
12
10
8
6
4
2
0
-3
-2
-1
0
1
2
3
M e M 1<M 2
4
5
25
20
15
10
5
0
-4
-3
-2
-1
0
1
2
3
4
-4
-3
-2
-1
0
Statistica descrittiva - Probabilità e Statistica I a.a. 04/05
M e<M
1
M <M e
2
3
4
16
8
Quantili e Per centili
p ∈ (0,1)
x p : P{X ≤ x p }= F ( x p ) = p
0,2
1
0,18
0,9
0,16
0,8
Pr(X <=xp)
0,14
0,12
0,7
0,6
0,1
F(x)
0,5
0,08
0,4
p
0,06
0,3
0,04
0,2
0,02
0
0
2
4
xp
6
1-p
8
0,1
0
10
12
14
16
18
0
2
4
6
8
10
12
Statistica descrittiva - Probabilità e Statistica I a.a. 04/05
14
16
18
17
Indicator i elementar i di var iabilità
• Campo di var iaz ione (r ange): R= x(1)-x(n)
• Differ enz a inter quar tile:D I=Q 3-Q 1
50%
x(1)
Q1
Q3
Campo di var iaz ione
Diff er enza inter quar tile
x(n)
Statistica descrittiva - Probabilità e Statistica I a.a. 04/05
18
9
Var ianz a e scar to quadr atico medio
xi-m
m
xi
2
1 n
2
s = ∑ (xi − m ) ⇒ s =
n i =1
2
1 n
∑ (xi − m)
n i =1
Statistica descrittiva - Probabilità e Statistica I a.a. 04/05
19
As immetr ia
3RVLWLYD
1HJDWLYD
1XOOD
distribuzione con coda destra
distribuzione con coda sinistra
distribuzione con due code equi-pesanti
Cur tos i
positiva
nulla
negativa
Statistica descrittiva - Probabilità e Statistica I a.a. 04/05
20
10
S T AT IS T ICA DE S CR IT T IVA DA E XCE L
Colonna1
Media
Errore standard
Mediana
Moda
Deviazione standard
Varianza campionaria
Curtosi
Asimmetria
Intervallo
Minimo
Massimo
Somma
Conteggio
3,4764
0,006279
3,48
3,46
0,062789
0,003942
1,550284
-0,10859
0,38
3,3
3,68
347,64
100
Statistica descrittiva - Probabilità e Statistica I a.a. 04/05
21
11