L’indagine statistica
DEFINIZIONE. La statistica è la disciplina che si occupa della raccolta di dati quantitativi relativi a
diversi fenomeni, della loro elaborazione e del loro utilizzo a fini di conoscenza, oppure di azione.
DEFINIZIONE. Si chiama carattere ogni aspetto di un fenomeno collettivo che si vuole analizzare.
I caratteri si possono suddividere in:
 qualitativi: espressi da un nome o da un aggettivo, come ad esempio i tipi di programmi che si
preferisce guardare in TV;
 quantitativi: espressi da numeri e divisi in caratteri discreti e caratteri continui.
In ognuna delle due tipologie si possono distinguere:
• caratteri sconnessi: tra le cui modalità si possono solo stabilire relazioni di uguaglianza o
diversità, ad esempio il luogo di nascita;
• caratteri ordinati: tra le cui modalità si può stabilire una relazione di ordine, ad esempio l’altezza
di una persona.
DEFINIZIONE. L’insieme degli individui a cui ci rivolgiamo per prendere informazioni circa il
carattere da indagare si chiama popolazione. Ogni elemento della popolazione prende il nome di
unità statistica.
DEFINIZIONE. Si chiama modalità ogni possibile valore dato dall’unità statistica al carattere preso
in esame.
La statistica
1
La raccolta dei dati
La raccolta dei dati può avvenire mediante:
Censimento
Interessa l’intera popolazione di una nazione.
Rilevamento totale
Si utilizza quando la popolazione statistica è formata da un numero ridotto di elementi.
Rilevamento per campione
Si utilizza quando la popolazione statistica assume dimensioni consistenti.
La statistica
2
L’elaborazione dei dati
DEFINIZIONE. La frequenza assoluta di un dato statistico è il numero di volte in cui tale dato si
presenta nell’indagine statistica.
Consideriamo i seguenti dati relativi al peso di 20 alunni di una scuola.
Peso (in kg)
Frequenza
assoluta
50 kg
43
5
Claudio
43 kg
50
4
43 kg
Mara
39 kg
47
3
Giovanni
50 kg
Nicola
47 kg
39
3
Matteo
39 kg
Nora
43 kg
42
2
Silvio
43 kg
Pietro
50 kg
37
2
Sara
37 kg
Simone
43 kg
Enrico
50 kg
Giovanna
42 kg
48
1
Totale
20
Stefano
48 kg
Andrea
47 kg
Anna
37 kg
Giulia
42 kg
Luca
39 kg
Giorgio
Marco
47 kg
Paolo
È possibile disporre i dati in una tabella delle frequenze.
La statistica
3
L’elaborazione dei dati
DEFINIZIONE. La frequenza relativa di un dato statistico è data dal rapporto fra la sua frequenza
assoluta e il totale delle osservazioni; la frequenza relativa percentuale è data dal prodotto fra la
sua frequenza relativa e 100.
Relativamente all’esempio precedente degli alunni:
Peso (in kg)
Frequenza
assoluta
Frequenza
relativa
Frequenza
relativa %
43
5
5 : 20 = 0,25
0,25  100 = 25%
50
4
4 : 20 = 0,20
0,20  100 = 20%
47
3
3 : 20 = 0,15
0,15  100 = 15%
39
3
3 : 20 = 0,15
0,15  100 = 15%
42
2
2 : 20 = 0,10
0,10  100 = 10%
37
2
2 : 20 = 0,10
0,10  100 = 10%
48
1
1 : 20 = 0,05
0,05  100 = 5%
Totale
20
1
100%
La statistica
4
La sintesi dei dati
Quando si devono fare confronti fra diverse situazioni, è necessario introdurre un valore di sintesi che
caratterizzi il fenomeno studiato.
Tale valore viene detto indice di posizione e può essere definito in diversi modi, in relazione cioè
agli obiettivi che si pone l’indagine.
I più importanti indici di posizione sono:
 la media aritmetica
 la mediana
 la moda
La statistica
5
La media aritmetica
DEFINIZIONE. Si chiama media aritmetica di un insieme di dati statistici numerici il valore che si
ottiene addizionando tutti i dati e dividendo la somma ottenuta per il numero di dati. In simboli:
x + x2 + ... + xn
media aritmetica = 1
n
ESEMPIO
Se un alunno ha i seguenti voti:
Italiano: 6
Storia: 4
Scienze: 8
Geografia: 5
Matematica: 7
Inglese: 9
la media aritmetica dei voti si calcola nel seguente modo:
6 + 4 + 8 + 5 + 7 + 9 39
=
= 6,5
6
6
La statistica
6
La mediana
DEFINIZIONE. Si chiama mediana di un insieme di dati statistici il valore che nella serie di dati,
disposti in ordine crescente (o decrescente), occupa il posto centrale.
Se la serie è costituita da un numero pari di elementi allora la mediana è la media aritmetica dei due
elementi centrali.
ESEMPIO
Data la distribuzione:
2
4
5
6
9
11
14
20
Il termine centrale cade nell’intervallo tra 6 e 9, pertanto:
Mediana = (6 + 9) : 2 = 7,5
La statistica
7
La moda
DEFINIZIONE. Si chiama moda di un insieme di dati statistici il valore che si presenta con maggiore
frequenza.
ESEMPIO
La moda della distribuzione BLU VERDE ROSSO BIANCO BLU GIALLO GIALLO BLU è
MODA = Blu
Può anche capitare che in un’indagine statistica ci siano più di un valore modale. Ad esempio
la moda della distribuzione
18
10
15
12
18
15
20
è
MODA = 15 ; 18
Se sono presenti due valori modali, la distribuzione viene detta bimodale.
La statistica
8
I numeri indice
DEFINIZIONE. I numeri indice sono rapporti statistici che si realizzano tra i termini di una serie di
dati quantitativi di un fenomeno e un termine della serie stessa, preso come riferimento, denominato
valore standard e al quale si attribuisce il valore 100.
In pratica quindi bisogna impostare la seguente proporzione
valore anno : valore standard = x : 100
I risultati che otteniamo risolvendo le diverse proporzioni si chiamano numeri indice e il loro utilizzo
fa capire in modo più immediato ed efficace come variano in percentuale i dati della nostra indagine.
La statistica
9
I numeri indice
Analizziamo l’andamento delle vendite di autovetture da parte di una concessionaria dal 2006 al 2011.
Anni
Autovetture
vendute
2006
526
2007
593
2008
634
2009
667
2010
702
2011
899
• per l’anno 2006
→
numero indice = 100
• per l’anno 2007
→
593 : 526 = x : 100
→
x
593 100
 112,7
526
• per l’anno 2008
→
634 : 526 = x : 100
→
x
634 100
 120,5
526
• per l’anno 2009
→
667 : 526 = x : 100
→
x
667 100
 126,8
526
• per l’anno 2010
→
702 : 526 = x : 100
→
x
702 100
 133,5
526
• per l’anno 2011
→
899 : 526 = x : 100
→
x
899 100
 170,9
526
Possiamo ora ordinare in una tabella i valori ottenuti:
Anni
2006
2007
2008
2009
2010
2011
Autovetture vendute
526
593
634
667
702
899
Numeri indice
100
112,7
120,5
126,8
133,5
170,9
0
12,7%
20,5%
26,8%
33,5%
70,9%
Variazione percentuale
La statistica
10