Statistica e probabilità
Università degli Studi di Sassari
Facoltà di Medicina veterinaria
Corso di Laurea in
Medicina veterinaria
Anno Accademico 2015/2016
Docente: Dott.ssa Rita Marras
LEZIONE 1 – INTRODUZIONE
Dopo aver esplicato alcuni concettibase e definizioni, ci concentreremo
sulla predisposizione delle distribuzioni
di frequenza e relativi grafici.
Che cosa è la Statistica
La Statistica può essere definita come un insieme di
tecniche che hanno come scopo la conoscenza
quantitativa dei fenomeni collettivi
Operazioni tipiche delle analisi statistiche sono:
il conteggio
la classificazione
la misurazione
la sintesi tramite modelli esplicativi dei fenomeni reali
Caratteri, unità statistiche, collettivo
• Qualche definizione:
–
–
–
–
unità statistica
collettivo o popolazione
carattere
modalità del carattere
• Vari tipi di collettivo:
– di stato o di movimento
– empirico o teorico
– finito o infinito
La rilevazione dei dati
La raccolta delle informazioni può essere completa oppure parziale
È completa quando si esaminano tutte le unità
statistiche che compongono la popolazione
oggetto di studio
È parziale quando ci si limita a studiare un
sottoinsieme, detto “campione” dell’insieme
di riferimento
Pregi:
Pregi:
•
•
•
•
•
•
Accuratezza delle stime anche a livelli territoriali
molto spinti
Ricchezza delle informazioni raccolte
Esaustività
Difetti:
•
•
•
Costo elevato
Tempi di elaborazione dei dati molto lunghi
Qualità dei dati non sempre elevata
Continuità della rilevazione
Economicità
Indagini più mirate e approfondite
Difetti:
•
•
Riferimento territoriale non troppo spinto
Variabilità campionaria
Popolazioni e campioni
Statistica descrittiva e inferenza
La statistica descrittiva
fornisce gli strumenti per
sintetizzare ed esplicitare in
modo corretto il modo in
cui il fenomeno si è
manifestato nel collettivo
(popolazione) osservato
Mediante l’inferenza
statistica è possibile
misurare e controllare
l’attendibilità delle
informazioni provenienti da
un campione del collettivo
(popolazione) osservato
Sapere di che tipo è la variabile oggetto di studio è fondamentale, perché per ciascuna abbiamo
analisi e indagini specifiche, che non sono applicabili (o sono comunque inadatte) alle altre.
Nominali
(Colore occhi, sesso,
etc.)
Qualitative
Ordinali
(Livello di un
parametro, come il
reddito o il dolore)
Variabili
Discrete
( Numero di figli o di
capi di bestiame)
Quantitative
Continue
( Altezza, peso, etc.)
Le distribuzioni statistiche
Le distribuzioni statistiche descrivono il modo in cui uno o più
caratteri si distribuiscono in un dato collettivo
Un singolo carattere  distribuzioni semplici
Due caratteri  distribuzioni doppie
Più di due caratteri  distribuzioni multiple
L’elenco delle modalità osservate, unità per unità si chiama
distribuzione unitaria
Distribuzione unitaria multipla
Unità
Sesso
Età
Reddito
Statura (cm)
Colore degli
occhi
1
Maschio
22
0.7
173
nero
2
Femmina
18
0.2
168
marrone
3
Femmina
34
1.6
165
marrone
4
Maschio
42
2.5
180
nero
5
Femmina
50
3.2
163
azzurro
6
Femmina
12
0.1
160
nero
7
Maschio
46
3.8
177
marrone
8
Maschio
72
1.3
164
verde
9
Femmina
27
1.2
158
azzurro
10
Femmina
48
1.7
170
nero
11
Femmina
35
1.9
167
nero
12
Maschio
84
0.8
159
marrone
13
Femmina
21
0.4
174
azzurro
14
Femmina
44
1.8
164
verde
15
Maschio
56
1.9
177
nero
16
Femmina
58
3.2
172
nero
17
Femmina
37
2.1
166
marrone
18
Femmina
16
0.1
160
marrone
19
Maschio
73
1.6
170
azzurro
20
Maschio
64
2.2
184
verde
Distribuzioni di frequenze semplici
Sesso
freq.
maschi
8
da 10 a 30
6
femmine
12
da 30 a 50
7
Totale
20
da 50 a 70
4
da 70 a 90
3
Totale
20
Colore degli occhi
freq.
Età
Statura
freq.
freq.
nero
7
da 150 a 160
2
marrone
6
da 160 a 170
9
azzurro
4
da 170 a 180
7
verde
3
da 180 a 190
2
Totale
20
Totale
20
Distribuzione di frequenze assolute
• Frequenza assoluta nj
numero di volte che la modalità di un carattere viene
osservata nel collettivo (N)
• Distribuzione di frequenze assolute
associa alle modalità che può assumere un carattere X le
corrispondenti frequenze assolute
Frequenze relativa e percentuale
• La frequenza relativa fj è la frazione di collettivo che presenta la
modalità j-esima ossia
fj 
nj
N
• La frequenza percentuale pj è uguale alla frequenza relativa
moltiplicata per 100
Esempi:
distribuzione unitaria, assoluta, relativa, percentuale
Distribuzione unitaria per il sesso
Unità
Sesso
1
M
2
F
3
4
5
…
…
F
M
F
…
…
Distribuzione frequenza assoluta
Sesso
Frequenza
relativa
Frequenza
percentuale
(%)
Sesso
Frequenza assoluta
M
8
M
0,4
40,0
F
12
F
0,6
60,0
Totale
20
Totale
1
100,0
Frequenza cumulata
La frequenza cumulata di una classe è data dalla somma
della frequenza della classe con quella delle classi
precedenti
j
Frequenza assoluta cumulata:
Nj   ni
i1
j
Frequenza relativa cumulata:
Fj   fi
i1
Esempi: frequenze
Titolo di
studio
Frequenza
assoluta
Frequenza
assoluta
cumulata
Media
3
3
Diploma
6
Laurea
11
Totale
20
Frequenza
relativa
Frequenza
relativa
percentuale
Frequenza
relativa
cumulata
Frequenza
percentuale
cumulata
0,15
15
0,15
15
9
0,30
30
0,45
45
20
0,55
55
1,00
100
1,00
100
Rappresentazioni grafiche delle distribuzioni semplici
• Grafici a barre o a nastri
4. 000
• Grafici ad aree
3. 500
3. 000
2. 500
2. 000
1. 500
1. 000
500
0
19 9 5
• Istogramma
• Grafici a torta
Gen.
50
Dic.
Feb.
40
30
Nov.
• Grafici a radar
Mar.
20
10
0
Ott.
Apr.
Set.
Mag.
Ago.
Giu.
Lug.
• Cartogramma
• Diagramma
1995
1996
1997
1998
1999
2000
2001
19 9 6
19 9 7
19 9 8
19 9 9
2000
2001