Concetti base - Classificazione dei caratteri

Introduzione
Concetti base
Distribuzioni statistiche
Concetti base - Classificazione dei caratteri
Antonello Maruotti
.
A. Maruotti
.
.
.
.
.
Outline
1 Introduzione
2 Concetti base
3 Distribuzioni statistiche
.
.
.
.
.
.
Introduzione
Concetti base
Distribuzioni statistiche
La Statistica
Una citazione: Giuseppe Leti
La mente umana non sa sintetizzare numericamente i risultati di
un elevato numero di osservazioni di fatti che invece percepisce
singolarmente
Cosa è la statistica?
Strumento conoscitivo atto ad analizzare in termini quantitativi un
fenomeno collettivo
.
A. Maruotti
.
.
.
.
.
Introduzione
Concetti base
Distribuzioni statistiche
La Statistica
Statistica descrittiva: Insieme di metodologie atte a descrivere,
riassumere le caratteristiche della distribuzione di una
o più variabili statistiche. L’obiettivo viene perseguito
rilevando le variabili (o caratteri) di interesse su di un
collettivo (popolazione).
Statistica inferenziale: Ha gli stessi obiettivi della statistica
descrittiva, ma tenta di perseguirli rilevando solo una
parte della popolazione. La parte (campione) viene
scelta casualmente. Questo implica (vantaggio) l’uso
dello strumento matematico del calcolo delle
probabilità
.
A. Maruotti
.
.
.
.
.
Introduzione
Concetti base
Distribuzioni statistiche
Terminologia essenziale
Unità statistica: l’oggetto elementare al quale riferiamo le singole
osservazioni.
Collettivo o popolazione: l’insieme delle unità statistiche omogenee
rispetto a una o più caratteristiche.
Carattere o variabile: la caratteristica oggetto di rilevazione di
ciascuna unità statistica (ad es. Titolo di Studio,
Reddito, Età)
Modalità del carattere: il modo con cui si presenta un carattere.
Ciascun carattere è presente in ogni unità con una
determinata modalità.
.
A. Maruotti
.
.
.
.
.
Introduzione
Concetti base
Distribuzioni statistiche
Classificazione dei caratteri
Qualitativi: le modalità esprimono un attributo, una qualità
dell’unità.
Sconnessi: non esiste un ordinamento tra le
modalità.
Ordinati: esiste un ordine naturale tra le modalità
Quantitativi: se le modalità sono numeri che esprimono una
misura o una quantità.
Discreti: le modalità sono quantità distinte
preventivamente individuabili ed
elencabili (geralmente numeri interi).
Continui: le modalità possono assumere qualsiasi
numero reale.
.
A. Maruotti
.
.
.
.
.
Introduzione
Concetti base
Distribuzioni statistiche
Relazioni ed operazioni tra modalità
Relazioni ed operazioni
tra modalità
Uguaglianza/Disuguaglianza
Ordinamento
Addizione/Sottrazione
Tipologia di caratteri
Qualitativi Qualitativi Quantitativi
sconnessi
ordinati
v
v
v
x
v
v
x
x
v
.
A. Maruotti
.
.
.
.
.
Introduzione
Concetti base
Distribuzioni statistiche
Esempi
Qualitativi
sconnessi
ordinati
Sesso
Titolo di studio
Religione
Grado di soddisfazione
Luogo di nascita Posizione in graduatoria
Quantitativi
discreti
continui
# di figli
Peso
Voto ad un esame Reddito
# pezzi prodotti
Altezza
.
A. Maruotti
.
.
.
.
.
Introduzione
Concetti base
Distribuzioni statistiche
Fissiamo le idee
L’insieme dei dati è costituito da tutte le misurazioni
effettuate su ognuna delle unità statistiche prese in esame.
Ad ogni unità corrispondono le modalità per ciascuno dei
caratteri osservati.
Ad ogni carattere corrisponde l’insieme delle modalità
osservate sul collettivo.
.
A. Maruotti
.
.
.
.
.
Introduzione
Concetti base
Distribuzioni statistiche
Distribuzioni unitarie
Definizione
Definiamo distributzione unitaria semplice di un carattere
l’elencazione delle modalità osservate, unità per unità, nel
collettivo osservato. Si parla di distribuzione unitaria multipla
quando tale elencazione si riferisce a più di un carattere.
Limite
La distribuzione unitaria, pur descrivendo fedelmente i caratteri
osservati, riportando per ogni unità le modalità dei caratteri presi
in esame, non consente di cogliere in maniera sintetica le
caratteristiche del fenomeno oggetto di studio.
.
A. Maruotti
.
.
.
.
.
Introduzione
Concetti base
Distribuzioni statistiche
Distribuzioni di frequenze
Definizione
La distributzione di frequenze semplice associa alle modalità
assunte dal carattere X , qualitativo o quantitativo, le
correspondenti frequenze
X
x1
x2
..
.
Freq. Assolute
n1
n2
..
.
xK
Totale
nK
n
.
A. Maruotti
.
.
.
.
.
Introduzione
Concetti base
Distribuzioni statistiche
Frequenze relative e percentuali
Definizione
Date n unità statistiche di cui nk presentano la k-esima modalità,
si definisce frequenza relativa k-esima il rapporto fk = nnk e
frequenza percentuale il prodotto pk = nnk × 100 = fk × 100.
Utili per capire l’importanza di una modalità nel collettivo ma
anche per eseguire confronti tra distribuzioni relative alla
stessa variabile in collettivi diversi.
La somma delle frequenze relative è pari a 1.
La somma delle frequenze percentuali è uguale a 100.
.
A. Maruotti
.
.
.
.
.
Introduzione
Concetti base
Distribuzioni statistiche
Rappresentare la distribuzione di frequenze
X
x1
x2
..
.
Freq. Assolute
n1
n2
..
.
Freq. Relative
f1
f2
..
.
Freq. Percentuali
p1
p2
..
.
xK
Totale
nK
n
fK
1
pK
100
.
A. Maruotti
.
.
.
.
.
Introduzione
Concetti base
Distribuzioni statistiche
Le frequenze cumulate
Definizione
Data un carattere X con K modalità ordinate in senso crescente,
si indica con Nk = n1 + n2 + · · · + nk la frequenza assoluta
cumulata, con Fk = f1 + f2 + · · · + fk la frequenza relativa cumulata
e con Pk = p1 + p2 + · · · + pk la frequenza percentuale cumulata.
Utili per capirela frequenza con cui si presentano modalità di
ordine inferiore o uguale ad una certa modalità.
L’ultima delle frequenze assolute cumulate (NK ) è pari a n.
L’ultima delle frequenze relative cumulate (FK ) è pari a 1.
L’ultima delle frequenze percentuali cumulate (PK ) è pari a
100.
.
A. Maruotti
.
.
.
.
.
Introduzione
Concetti base
Distribuzioni statistiche
Caratteri con modalità raggruppate in classi
Se il carattere che si vuole analizzare presenta moltissime modalità
distinte, si possono avere notevoli difficoltà nela comprensione dei
dati osservati. In questi casi è conveniente procedere ad
un’aggregazione delle modlità.
Se il carattere è quantitativo si suddivide l’insieme delle possibili
modalità in intervalli tra loro disgiunti, ottenendo una suddivisione
in classi del carattere.
Come definire le classi:
il loro numero deve essere abbastanza piccolo da fornire una sintesi
adeguata, ma sufficientemente grande, da mantenere l’informazione
con un livello accetabile di dettaglio;
le classi devono comprendere tutte le possibili modalità del carattere;
se possibile, si costruiscano classi aventi la stessa ampiezza.
.
A. Maruotti
.
.
.
.
.