lezione.1.1 - Dipartimento di Scienze Politiche

LEZIONE 1.1
corso di statistica
Francesco Lagona
Università Roma Tre
LEZIONE 1.1 – p. 1/18
Introduzione al corso
•
sito: http://scienzepolitiche.uniroma3.it/flagona/
◦
programma, slides ed esercitazioni: materiali didattici:
(A-L)
•
orario di ricevimento: giovedi’ 18-20 (ufficio 4.16)
•
articolazione del corso (8 CFU):
•
◦
I PARTE: STATISTICA DESCRITTIVA
◦
II PARTE: CALCOLO DELLE PROBABILITÀ
◦
III PARTE: INFERENZA STATISTICA
articolazione del corso (3 CFU):
◦
•
statistica
I PARTE: STATISTICA DESCRITTIVA (marzo)
il programma per un numero diverso di CFU (se ammissibili) va concordato con me
LEZIONE 1.1 – p. 2/18
il questionario
• esempio di indagine statistica: somministrazione di un
questionario ad un gruppo di individui
• caratteristiche di un’indagine statistica: cosa chiediamo? a
chi lo chiediamo?
◦ le domande del questionario: VARIABILI STATISTICHE
(o caratteri)
◦ gli individui che rispondono al questionario: UNITÀ
STATISTICHE (l’insieme delle unità statistiche si chiama
popolazione)
• i risultati dell’indagine: cosa hanno risposto?
◦ le risposte del questionario: MODALITÀ
• i risultati della rilevazione possono essere organizzati
all’interno di una tabella unità-variabili
LEZIONE 1.1 – p. 3/18
esempio
Tabella 1: Una tipica tabella unità-variabili
variabili
unità
genere
residenza
giudizio
numero esami
età
distanza
Marta
femmina
Roma
sufficiente
2
21
5
Gianluca
maschio
Roma
scarsa
3
20
3
Sandro
maschio
Frascati
buona
4
20
30
...
...
...
LEZIONE 1.1 – p. 4/18
tabella unità-variabili
variabili
unità
X1
X2
...
Xk
...
XK
1
x11
x12
...
x1k
...
x1K
2
..
.
x21
..
.
x22
..
.
...
..
.
x2k
..
.
...
..
.
x2K
..
.
i
..
.
xi1
xi2
...
xik
...
xiK
n
xn1
xn2
...
xnk
...
xnK
•
xik : modalità della variabile Xk espressa dall’unità i
•
colonna k: distribuzione unitaria della variabile Xk
•
riga i: profilo dell’unità i
LEZIONE 1.1 – p. 5/18
matrice unità-variabili

x11
x21
..
.
x12
x22
..
.
. . . x1k
. . . x2k
..
.
. . . x1K
. . . x2K
..
.





X=
 xi1 xi2 . . . xik . . . xiK

..
..
..
 ..
 .
.
.
.
xn1 xn2 . . . xnk . . . xnK











• vettore colonna xk = (x1k . . . xik . . . xnK ): distribuzione
unitaria della variabile Xk
• vettore riga xT = (xi1 . . . xij . . . xiK ): profilo dell’unità i
i
LEZIONE 1.1 – p. 6/18
tipologia delle variabili statistiche
qualitative sconnesse
qualitative ordinabili
quantitative
discrete
quantitative
continue
LEZIONE 1.1 – p. 7/18
tipologia delle variabili statistiche
• il supporto di una variabile statistica è l’insieme delle
modalità che essa assume
• le variabili statistiche si distinguono secondo le
caratteristiche assunte dal supporto
◦ il supporto di una variabile ha sempre la seguente
caratteristica minimale: date le modalità xi e xj
espresse da due unità i e j è sempre possibile stabilire
quali delle due affermazioni è vera
xi = xj
xi 6= xj
◦ variabili con un supporto di questo tipo si chiamano
qualitative sconnesse
◦ esempi di variabili qualitative sconnesse: genere,
nazionalità, residenza, lingua madre, stato civile, ...
LEZIONE 1.1 – p. 8/18
variabili qualitative ordinabili
• le modalità di una variabile sono ordinabili quando per due
modalità xi 6= xj è sempre possibile stabilire quali delle due
affermazioni è vera
xi ≺ xj
xj ≺ xi
• variabili con supporto di questo tipo si chiamano variabili
qualitative ordinabili
• esempi: titolo di studio, giudizio su un prodotto o servizio, ...
LEZIONE 1.1 – p. 9/18
variabili quantitative discrete
• le modalità di una variabile sono quantitative quando sono
definite sulla base di un sistema di riferimento numerico che
contiene l’origine (indicata con il numero 0) e un’unità di
misura u, tale per cui le modalità sono espresse come
multipli di u
• le variabili con un supporto di questo tipo si distinguono in
variabili quantitative discrete e quantitative continue
• quantitative discrete
◦ indicano di solito il numero di volte con cui si è verificato
un evento
◦ l’unità di misura u è univocamente determinata e indica
il manifestarsi di un singolo evento
◦ esempi: numero di esami sostenuti, numero di incidenti
automobilistici o di ricoveri ospedalieri, il numero di figli,
il numero di componenti di un nucleo familiare, ...
LEZIONE 1.1 – p. 10/18
variabili quantitative continue
•
quantitative continue
•
indicano di norma la misurazione di un fenomeno
•
è di norma possibile definire le modalità come multipli di diverse unità di misura
•
esempi: altezza, peso, reddito, età, durata, distanza, temperatura, pressione,
velocità, ...
riassumendo:
variabili
genere
residenza
giudizio
numero esami
distanza
(qual. sconn.)
(qual. sconn.)
(qual. ord.)
(quant. discr.)
(quant.cont.)
Marta
femmina
Roma
sufficiente
2
5
Gianluca
maschio
Roma
scarsa
3
3
Sandro
maschio
Frascati
buona
4
30
...
...
unità
...
LEZIONE 1.1 – p. 11/18
distribuzioni di frequenza
• concentriamo l’attenzione su una singola distribuzione
univariata: (x1 . . . xi . . . xn )
• caso 1: il genere (qualitativa sconnessa con supporto
{M, F })
◦ distribuzione unitaria: (M, F, M, F, F, F, M, F, F, M )
◦ distribuzione di frequenze assolute (nk ), relative (fk ) e
percentuali (pk ):
xk
M
F
nk
4
6
10
fk
0.4
0.6
1
pk
40
60
100
LEZIONE 1.1 – p. 12/18
distribuzioni di frequenza
• caso 2: residenza (qualitativa sconnessa con supporto
{RM, V T, LT, M I}):
◦ distribuzione unitaria:
(RM, V T, LT, LT, M I, RM, RM, M I, M I, M I)
◦ distribuzioni di frequenza
xk
RM
VT
LT
MI
nk
3
1
2
4
10
fk
0.3
0.1
0.2
0.4
1
pk
30
10
20
40
100
LEZIONE 1.1 – p. 13/18
distribuzioni di frequenza
• caso 3: giudizio su un prodotto (qualitativa ordinabile con
supporto {scarso, suf f, discreto} = {S, SS, D})
◦ distribuzione unitaria:
(S, SS, SS, D, S, D, S, SS, SS, SS, SS, D)
◦ distribuzioni di frequenza
xk
S
SS
D
nk
3
6
3
12
fk
0.25
0.5
0.25
1
pk
25
50
25
100
LEZIONE 1.1 – p. 14/18
distribuzioni di frequenza
• caso 4: numero di auto possedute (quantitativa discreta con
supporto 0, 1, 2, 3, 5)
◦ distribuzione unitaria:
(3, 2, 3, 1, 2, 1, 2, 2, 1, 0, 2, 5, 2, 2, 1, 0, 3, 1, 3, 1, 3, 3, 2, 0, 0)
◦ distribuzioni di frequenza
xk
0
1
2
3
5
nk
4
6
8
6
1
25
fk
0.16
0.24
0.32
0.24
0.04
1
pk
16
24
32
24
4
100
LEZIONE 1.1 – p. 15/18
diagrammi a barra
xk
nk
xk
nk
RM
3
M
4
VT
1
F
6
LT
2
10
MI
1
0
0.0
1
0.5
2
1.0
3
1.5
4
2.0
5
2.5
6
3.0
7
F
M
LT
MI
RM
VT
LEZIONE 1.1 – p. 16/18
diagrammi a barra
xk
nk
xk
nk
0
4
S
3
1
7
SS
4
2
8
D
2
3
7
B
2
4
3
11
6
1
0
0
1
2
4
2
6
3
8
4
30
S
SS
D
B
0
1
2
3
4
x
5
6
LEZIONE 1.1 – p. 17/18
diagrammi a barra
• l’ampiezza delle barre è arbitraria ma fissata
• rispetto all’asse delle ascisse:
◦ nel caso di variabili sconnesse, le barre sono collocate
in punti arbitrari ma equidistanti
◦ nel caso di variabili ordinabili, le barre sono equidistanti
e collocate secondo l’ordine delle modalità
◦ nel caso di variabili discrete, le barre sono collocate
sulle modalità del supporto
• i diagrammi a barra possono essere costruiti anche per
distribuzioni di frequenze relative e percentuali (la forma del
diagramma non muta, cambia solo l’unità di misura
dell’asse delle ordinate)
LEZIONE 1.1 – p. 18/18