STATISTICA La statistica è lo studio dei metodi di raccolta ed analisi

STATISTICA
La statistica è lo studio dei metodi di raccolta ed analisi dei dati relativi ad un certo fenomeno
collettivo per trarne conclusioni e fare previsioni.
Vi sono due fasi fondamentali dello studio statistico:
1. Raccolta dei dati.
2. Elaborazione dei dati.
Dati statistici:



POPOLAZIONE: insieme di persone od oggetti sui quali si effettua una indagine statistica.
UNITA’ STATISTICA: ciascun elemento di una popolazione statistica.
CAMPIONE: parte della popolazione rappresentativa di tutto un gruppo.
La statistica si divide in:
Deduttiva o Descrittiva: utilizza strumenti matematici
per descrivere i dati relativi ad una certa popolazione.
Inferenziale o Induttiva: dalle informazioni su un
campione elabora conclusioni su tutta la popolazione.
Le caratteristiche di una popolazione sono dette carattere, cioè caratteristiche distintive di
ciascuna unità statistica. Il carattere è descritto attraverso le modalità con cui si può manifestare.
Si distinguono perciò:

Caratteri qualitativi cioè caratteri le cui modalità sono espresse con parole.
Esempio: sesso Maschi/Femmine
Inoltre i caratteri qualitativi si dividono in:
o Discreti se possono assumere un numero finito di valori, o al più una infinità
numerabile
 X € Ν (Ν: numeri Naturali)
o Continui se possono assumere gli infiniti valori di un intervallo Reale
 X € Ʀ (Ʀ: numeri Reali)

Caratteri quantitativi cioè caratteri le cui modalità sono espresse numericamente.
Esempio: età 15/16/17
LE FREQUENZE
1. Frequenza assoluta: n. di volte in cui una modalità si presenta in una distribuzione di dati
(Fa)
2. Frequenza relativa: rapporto tra la frequenza assoluta ed il n° totale delle unità statistiche
(Fr)
3. Frequenza relativa percentuale: F% =Fr*100
Esempio:
n° allievi 25 Maschi:3 Femmine: 22
Fr (M) = 3/25 = 0,12 = 12% Fr (F) = 22/25= 0,88 = 88%
4. Frequenza cumulata: è la somma della frequenza assoluta corrispondente ad una data
modalità con tutte le frequenze assolute precedenti (le modalità devono perciò essere
ordinate in modo crescente). Analogamente possono essere definite la frequenza relativa
cumulata e la frequenza percentuale cumulata.
SERIE e SERIAZIONI
I dati statistici si possono rappresentare mediante tabelle:
 Se il carattere è qualitativo le tabelle si dicono serie statistiche.
Esempio:
Elettrodomestico
Frequenza
Apparecchio TV
7
Lavatrice
10
Forno
8
Aspirapolvere
15
Totale
40
L’insieme delle modalità del carattere qualitativo a cui si associano le rispettive frequenze
definiscono una mutabile statistica.
Le serie storiche sono tabelle che mostrano la successione dei valori di un fenomeno in
tempi successivi.
 Se il carattere è quantitativo le tabelle si dicono seriazioni statistiche.
L’insieme delle modalità del carattere quantitativo a cui si associano le rispettive frequenze
definiscono una variabile statistica.
Esempio:
Spesa sostenuta Frequenza Fr% Fc Fcr%
dai clienti
0-300
12
30% 12 30%
300-600
18
45% 30 75%
600-900
6
15% 36 90%
900-1200
4
10% 40 100%
Totale
40
Spesso le modalità di un carattere quantitativo sono suddivise in classi, dunque le
frequenze sono quelle delle classi.
RAPPRESENTAZIONE GRAFICA DEI DATI STATISTICI
Esistono diversi tipi di grafici su cui vengono rappresentati i dati statistici e le corrispondenti
frequenze.
1. ORTOGRAMMA grafico formato da rettangoli separati tra loro le cui altezze sono pari alle
frequenze assolute e basi fisse
N° clienti
15
Elettrodomestico
Apparecchio TV
Lavatrice
Forno
Aspirapolvere
Totale
10
8
7
Frequenza
7
10
8
15
40
Elettrodomestici
TV
LAVATRICE
FORNO
ASPIRAP
.
2. ISTOGRAMMA i rettangoli possiedono basi proporzionali all’ampiezza delle classi e le aeree
proporzionali alle frequenze; se le classi hanno la stessa ampiezza le altezze devono essere
calcolate in modo che le aree siano proporzionali alle frequenze. Se si uniscono i punti
medi dei lati superiori dei rettangoli si ottiene una spezzata che si chiama poligono delle
frequenze.
n. clienti
Spesa sostenuta
dai clienti
0-300
300-600
600-900
900-1200
Totale
18
12
6
4
spesa
300
600
900
1200
1500
Frequenza
12
18
6
4
40
3. AREOGRAMMA in cui le aree dei settori sono proporzionali alle frequenze espresse in
percentuale.
Apparecchio TV
Lavatrice
Forno
Aspirapolvere
17%
38%
25%
20%
4. DIAGRAMMA CARTESIANO
Frequenza
Spesa sostenuta
dai clienti
0-300
300-600
600-900
900-1200
Totale
18
12
6
4
150
300
450
Spesa sostenuta
600
Esempio
Voti compito in classe di matematica
Voti
Fa
Fr
F%
Fcum Cum rel
3
1
0,05 5%
1
0,05
4
4
0,2 20%
5
0,25
5
3
0,15 15%
8
0,40
6
5
0,25 25%
13
0,65
7
2
0,1 10%
15
0,75
8
4
0,2 20%
19
0,95
9
1
0,05 5%
20
1
Tot
20
1
100%
Cum rel %
5%
25%
40%
65%
75%
95%
100%
Frequenza
12
18
6
4
40