A cura di:
Manuela Mangione
•Cos’è?
Una scienza che studia dei fenomeni collettivi
fornendo strumenti che servono per ottenere tutte
le informazioni che possono interessare
• Perché studiare la statistica?
Una delle esigenze fondamentali della società moderna
è la possibilità di avere informazioni corrette e in
modo rapido
sintesi di dati sotto forma di
sondaggi, grafici,...
Statistica descrittiva
Si occupa della raccolta, del riordino, nonché della
presentazione e dell’analisi dei dati ottenuti dalla studio
di un fenomeno collettivo
Statistica inferenziale
Si occupa di estendere i risultati ottenuti con la
statistica descrittiva a insiemi più numerosi di quelli
studiati (sondaggi di voto e exit-pool).
• 2300 a. C. : scritti cinesi con annotazioni su misure di terreni e
numerazioni degli abitanti
• Bibbia : censimenti degli Ebrei da parte degli Egizi; censimenti
demografici e catasti da parte del popolo egizio
• Impero Romano : varie registrazioni dei dati relativi all’Impero
• Medioevo : scarsa documentazione
• 1600 1700 : tabelle comparative delle risorse geografiche ed
economiche dei vari Stati
• 1800 Laplace : calcolo delle probabilità, si associa modelli
probabilistici allo studio di fenomeni statistici
• 1900 : statistica come scienza autonoma , formalizzazione
dell’inferenza statistica
Fasi di un indagine statistica
• Definizione degli obiettivi
• Individuazione del fenomeno e del collettivo
• Raccolta dei dati
• Spoglio e trascrizione dei dati
• Elaborazione dei dati
• Interpretazione dei risultati e divulgazione
Raccolta dei dati
•Natura dei dati
•Metodi di raccolta dei dati (globale o campionaria)
• Rilevazioni preliminari o definitive; occasionali,
periodiche o continue
•Tecnica di raccolta dei dati ( uso di registri , intervista,
compilazione di questionari con risposta aperta o chiusa)
Organi predisposti alla raccolta dei dati
Spoglio e trascrizione dei dati
•Enumerazione dei dati
•Classificazione
•Trascrizione in tabelle (semplici , complesse, a doppia
entrata) (serie e seriazioni)
ELABORAZIONE DEI DATI
1) Considerando gli studenti della classe si prepari una tabella
semplice dalla quale risulti la loro distribuzione per età. Grafico
2) Considerando gli studenti della classe costruire una tabella
composta per stabilire il numero di fratelli e sorelle
degli studenti stessi. Grafico
3) Costruire una tabella a doppia entrata per classificare il numero
degli studenti in base al colore dei capelli e degli occhi.
ELABORAZIONE DEI DATI
Esercizio proposto
Ad un concorso partecipano 398 persone le quali provengono da
diverse scuole secondo quanto mostra la seguente tabella:
Scuola di provenienza Num Candidati Rapporti Rapporti %
Liceo Classico
84
0,211
21,11
Liceo Scientifico
52
0,131
13,07
Istituto Tecnico Comm
120
0,302
30,15
Altri Istituti Tecnici
96
0,241
24,12
Istituto Magistrale
32
0,080
8,04
Altre Scuole
14
0,035
3,52
Totale
398
1
100
Calcolare qual è il peso di ciascuna scuola sul numero totale dei
candidati. (Rapporti di composizione)
ELABORAZIONE DEI DATI
Misure di tendenza centrali
Misure di variabilità
Misure di concentrazione
ELABORAZIONE DEI DATI
Misure di tendenza centrali
Data una distribuzione di dati disposti in ordine crescente o
decrescente si definisce media un qualunque valore non minore
del più piccolo e non maggiore del più grande
Esempio: 7 10 20 52
Importanza: fornisce un’indicazione sintetica dei dati di una
distribuzione secondo un criterio stabilito a priori
• Medie di calcolo (medie ferme)
•Medie di posizione
ELABORAZIONE DEI DATI
Medie di calcolo: Media aritmetica
Media aritmetica semplice: (proporre ad allievi)
Esempio 1: Consideriamo gli arrivi di ospiti stranieri, nella totalità
degli esercizi ricettivi italiani, per i mesi estivi dell’anno xxxx:
Mesi
Giugno
Arrivi ( in
migliaia di
unità)
Calcolare la presenza media di stranieri nei mesi
2.257
estivi
Luglio
2.989
Agosto
2.632
Settembre
2.694
M = 2643 migliaia
ELABORAZIONE DEI DATI
Medie di calcolo: Media aritmetica
Esempio 2 (proporre ad allievi): Calcolare il numero medio dei vani delle
abitazioni occupate in una certa provincia italiana con i dati della seguente
tabella:
Media aritm ponderata=
N. vani
1
2
3
4
5
6
7 o più
TOTALE
N. abitazioni x*p
5.044
5044
43.939
87878
67.855
203565
75.254
301016
41.842
209210
10.760
64560
8.441
67528
253.135
938.801
3,71
ELABORAZIONE DEI DATI
Medie di calcolo: Media aritmetica
n
•Media aritmetica semplice:
xi
I =1
n
n
•Media aritmetica ponderata:
xipi
I =1
n
pi
i=1
•Caratteristiche e proprietà della media aritmetica:
• la somma degli scarti dalla media aritmetica è nulla;
• la somma dei quadrati degli scarti dalla media è minima
ELABORAZIONE DEI DATI
(ancora un esempio di media aritmetica nel caso di
distribuzione per classi)
Classi di età Numero di persone Valori centrali Vc*num pers
20-25
10
22,5
225
27,5
25-30
15
412,5
32,5
650
30-35
20
37,5
412,5
35-40
11
42,5
127,5
40-45
3
47,5
47,5
45-50
1
1875
Totale
60
Media 31,25
NB = il calcolo, in questo caso, viene effettuato sostituendo a ciascuna
classe il termine centrale
Altre medie di calcolo
• Media geometrica semplice e ponderata (Mg)
•
Media quadratica semplice e ponderata (M2)
• Media armonica semplice e ponderata (Ma)
In pratica qual è meglio usare?
Non è possibile fissare regole precise:
dipenderà dal tipo di problema che
suggerirà di usare una piuttosto che
l’altra….
M2 > M > Mg > M a
Altre medie di calcolo
(esercizi da proporre agli allievi)
1) Deposito un capitale di 1 euro in banca per 3 anni. La banca mi
calcola gli interessi ad un tasso composto annuo del 7% per il
primo anno, 7.5% per il secondo, 8% per il terzo. Determinare il
tasso medio applicato dalla banca.
2) Con una bilancia di precisione sono state determinate le
differenze di peso tra 4 lamine di titanio rispetto a una di
riferimento, ottenendo i seguenti valori - 4, 3, 5, - 3. Determinare
la differenza media del peso delle lamine da quella di riferimento.
3) Per 3 anni consecutivi ho speso, per riscaldare il mio
appartamento, sempre lo stesso importo di 500 euro, acquistando il
metano a euro 0,29 /MC il primo anno, a euro 0,32/MC il secondo
e a euro 0,32/MC il terzo. Voglio determinare il costo medio di un
MC di metano per l’intero periodo.
ELABORAZIONE DEI DATI
Medie di posizione: Moda
Moda o termine modale di una distribuzione è il termine al quale
corrisponde la massima frequenza
Es: Nota la distribuzione
Esito lancio di un dado:
Frequenze
1
7
2
11
3
4
5
9 14 6
6
3 Totale 50
Moda? 4
N. B. = Non si può parlare di moda nel caso di una distribuzione non
ponderata oppure nel caso in cui, pur essendo la distribuzione
ponderata , i termini si presentano tutti con la stessa frequenza (sono
tutte mode!!).
ELABORAZIONE DEI DATI
Medie di posizione: Moda
Caso di distribuzione per classi
A) se le classi hanno tutte uguale ampiezza, si dice classe modale quella
a cui corrisponde la maggiore frequenza
B) se le classi non hanno uguale ampiezza, la classe modale è quella a
cui corrisponde il più alto rapporto tra frequenza e ampiezza della classe
Classi
0-100
100-200
200-400
400-600
600-1000
Frequenze
5000
6500
12300
14200
18400
Ampiezza
classi
100
100
200
200
400
Freq/amp
Classe modale
50
65
400-600
61,5
71
46
ELABORAZIONE DEI DATI
Medie di posizione: Mediana
La mediana è il termine che occupa il posto centrale nella
distribuzione quando i dati son disposti in ordine cresecente
Es Distribuzioni semplici: 3, 8, 6, 21, 15
Me :8 e se aggiungessi
Me= (8+15)/2=11,5
anche il termine 45?
Distribuzioni ponderate: Termini Frequenze Freq cumulate
20
21
22
23
26
30
60/2=30
Me = 21
Totale
12
20
18
7
2
1
60
12
32
50
57
59
60
ELABORAZIONE DEI DATI
Medie di posizione: Mediana
400/2= 200
Distribuzioni per classi:
Classi di età Frequenze Frequenze cumulate
20-30
60
60
30-40
92
152
40-50
114
266
50-60
86
352
60-70
40
392
70-80
8
400
Totale
400
Me= 40 + x
48:114=x:10
x = 4,21
Me = 44,21
Ipotesi:i dati si
distribuiscono
all’interno della classe
in modo uniforme