MZ2009_6.2_TEST STATISTICI - Dipartimento di Sociologia e

“Teoria e metodi della ricerca sociale e organizzativa”
Corso di Laurea in Scienze dell’Organizzazione
Facoltà di Sociologia
Università Milano-Bicocca
2009
Simone Sarti
21 maggio 2009
1
Test di significatività
2
Test di significatività
Se testiamo un’ipotesi su un campione, quanto le
conclusioni che traiamo sono “vere” anche nella
popolazione?
3
Test di significatività
VARIABILI CARDINALI
Test di significatività zeta
su una variabile
4
In un comune il sindaco ritiene di finanziare nuovamente un
servizio pubblico se il giudizio di un campione di cittadini sarà
superiore a 6 (in una scala da 1 a 10).
Vengono intervistati, tramite selezione di un campione
casuale semplice, 300 cittadini.
Il campione ha come giudizio medio 6,5 e deviazione
standard 3,8.
CAMPIONE n=300
Y  6,5
S y  3,8
5
Hp di lavoro:
Giudizio > 6
y  6
Hp nulla:
Giudizio <= 6
 y  6
Quindi testiamo l’ipotesi che il giudizio nella popolazione
sia minore o uguale a 6.
6
Logica falsificazionista, Ipotesi
Per corroborare H1 devo falsificare H0.
Non verifico H1, ma ne falsifico l’ipotesi “opposta”
attraverso un test empirico che mi porterà ad accettare o
respingere H0.
Se rifiuto H0, allora l’ipotesi di lavoro H1 viene corroborata.
Se “accetto” H0, non possiamo escludere che la differenza
non sia dovuta al caso, l’ipotesi di lavoro H1 viene
falsificata.
ATTENZIONE: Nella logica falsificazionista H0 non è
un’ipotesi alternativa che sostituisce H1. Più
correttamente occorrerebbe affermare che H0 non può
essere rifiutata, non che H0 è accettata.
7
Logica falsificazionista, errori
Realtà del fenomeno
Esito
del test
H0 vera
H0 falsa
H0 non
rifiutata
No errore
Errore
II tipo (β)
H0
rifiutata
Errore
I tipo (α)
No errore
8
  pRifiutoH 0 H 0 vera
α è la probabilità teorica di rifiutare a priori l’H0 quando
questa è vera.
α viene fissata arbitrariamente, solitamente si utilizza
una soglia del 5 %.
α = 0,05
9
Errore di falso rifiuto
L’errore di 1° tipo (o alfa) è la probabilità che
stabiliamo a priori per rifiutare l’ipotesi nulla.
Maggiore è alfa, maggiore è la possibilità di
commettere un errore del primo tipo, cioè di rifiutare
H0 quando questa è vera. Viceversa, minore è alfa, più
siamo sicuri di non commettere questo errore.
  pRifiutoH 0 H 0 vera
10
Dal teorema del limite centrale sappiamo che la distribuzione
delle medie campionarie tratta da una popolazione con media
mu e dev.std. sigma, segue una distribuzione normale con
media e deviazione standard pari a:
Y  Y
Y 

2
Y
n
11
Non essendo conosciuta la varianza della popolazione,
usiamo le deviazioni standard del campione per stimare
l’errore standard (ossia la dev.std delle medie campionarie).
e.s.  ˆ Y 
2
Y
s
n
Useremo la distribuzione t di Student
12
Ricapitolando ...
Ipotesi nulla Ho
Livello di significatività:
Y  6
2,5%, ALFA uguale a 0,025
n = 300
13
t  1,98
In termini di punti standard il 97,5%
di tutte le medie campionarie sono
comprese nell’intervallo tra meno
infinito e + 1,98:
  0,025
Area
Non Rifiuto Ho
Area
Rifiuto Ho
0,975
T
0
Y  6
0,025
Punti std
t
CONFRONTO TRA FENOMENO OSSERVATO E IPOTESI
Possiamo calcolare il punteggio tY in punti standard risultante dalla
differenza del punteggio osservato sul campione con il punteggio che
dovremmo trovare nel caso fosse “vera” l’ipotesi nulla, cioè =6.
H0 Y  6
Campione osservato
tY =
Effetto del test
Errore standard
tY 
Y  Y
sY2
n
6,5  6

 2,28
3,8
300
Errore standard della distribuzione
delle medie campionarie
15
Confrontiamo l’esito del test (tY = 2,28) con la soglia della zona di rifiuto (tα = 1,98).
Rifiutiamo l’ipotesi nulla H0.
Ci allontaniamo abbastanza dall’ipotesi nulla per essere “ragionevolmente certi” che
nella popolazione il giudizio sia maggiore di 6, con un livello di significatività del
97,5%.
Soglia
+1,98
0,975
tY
T
0
+2,28
Y  6
Y  6,5
IPOTESI NULLA
CAMPIONE
CONFRONTO TRA FENOMENO OSSERVATO E IPOTESI
Possiamo anche effettuare il test utilizzando i valori osservati, ossia
calcolando il giudizio corrispondente alla soglia di 1,98 punti standard.
Per poi confrontarlo con la media campionaria 6,5.
Y  Y  t   Y
Y
Y  6  0,44
Y  6,44
0,975
6,5
Y
6
T
0
IPOTESI
NULLA
Y  6
6,44
+1,98
+2,28
Y  6,5
CAMPIONE
I due modi di testare l’ipotesi sono equivalenti. Nel primo testiamo
l’ipotesi sui punteggi standardizzati, nell’altro sui valori assoluti.
Il livello di significatività e gli esiti del test sono i medesimi.
Valore tY associato alla
differenza tra il punteggio
campionario e l’ipotesi
tY 
Y0  Y
Y
2,28
Valore t
6,5
Giudizio
tY  Y  Y0  Y
Punteggio associato al
valore tY
Y  Y  tY  Y
18
I due modi di testare l’ipotesi sono equivalenti. Nel primo testiamo
l’ipotesi sui punteggi standardizzati, nell’altro sui valori assoluti.
Il livello di significatività e gli esiti del test sono i medesimi.
Punteggio associato al
limite superiore dell’I.C.
Y  Y  t Y
6,44
Giudizio
t Y  Y  Y
Valore tα associato al
limite superiore dell’I.C.
t 
Y  Y
Y
1,98
Valore t
19
20
Test di significatività
VARIABILI CARDINALI
Test di significatività zeta
tra due gruppi
21
Poniamo che in una data popolazione (N=100000)
misuriamo il reddito, che ha media 1375 e deviazione
standard 852.
Di questa popolazione sappiamo che una parte è laureata
e l’altra non lo è.
22
Poniamo di voler testare l’ipotesi che il titolo di studio sia
associato ad un reddito medio differente.
Per fare questo estraiamo un campione casuale (semplice)
di 150 individui (n=150).
23
CAMPIONE N=150
Report
reddito Reddito mens ile (euro)
TITOLO SESSO
1 LAUREATO
2 NON LAUREATO
Totale
YL  1338
Media
1338.29
1164.41
1261.78
N
84
66
150
Deviazione
s td.
579.833
596.071
591.421
YNL  1164
YL  YNL  174
24
25
Hp di lavoro:
Vi sono differenze nei livelli di reddito
secondo il titolo di studio.
Hp nulla:
Non vi sono differenze
 L   NL
 L   NL
 L   NL  0
26
Logica falsificazionista, Ipotesi
Per corroborare H1 devo falsificare H0.
Non verifico H1, ma ne falsifico l’ipotesi “opposta”
attraverso un test empirico che mi porterà ad accettare o
respingere H0.
Se rifiuto H0, allora l’ipotesi di lavoro H1 viene corroborata.
Se “accetto” H0, non possiamo escludere che la differenza
non sia dovuta al caso, l’ipotesi di lavoro H1 viene
falsificata.
ATTENZIONE: Nella logica falsificazionista H0 non è
un’ipotesi alternativa che sostituisce H1. Più
correttamente occorrerebbe affermare che H0 non può
essere rifiutata, non che H0 è accettata.
27
Logica falsificazionista, errori
Realtà del fenomeno
Esito
del test
H0 vera
H0 falsa
H0 non
rifiutata
No errore
Errore
II tipo (β)
H0
rifiutata
Errore
I tipo (α)
No errore
28
  pRifiutoH 0 H 0 vera
α è la probabilità teorica di rifiutare a priori l’H0 quando
questa è vera.
α viene fissata arbitrariamente, solitamente si utilizza
una soglia del 5 %.
α = 0,05
29
Errore di falso rifiuto
L’errore di 1° tipo (o alfa) è la probabilità che
stabiliamo a priori per rifiutare l’ipotesi nulla.
Maggiore è alfa, maggiore è la possibilità di
commettere un errore del primo tipo, cioè di rifiutare
H0 quando questa è vera. Viceversa, minore è alfa, più
siamo sicuri di non commettere questo errore.
  pRifiutoH 0 H 0 vera
30
Dal teorema del limite centrale si deriva che:
la distribuzione della differenza tra due medie campionarie
tratte da due popolazioni con media muL e muNL, e dev.std.
sigmaL e sigmaNL, segue una distribuzione normale con
media e deviazione standard pari a:
Y Y   L   NL
L
 Y
NL
L YNL 


2
L
nL


2
NL
nNL
31
Non essendo conosciute le varianze dei due gruppi, laureati
e non laureati, usiamo le deviazioni standard dei campioni.
2
L
2
NL
s
s
ˆ YL YNL  

nL nNL
32
CAMPIONE N=150
Report
reddito Reddito mens ile (euro)
TITOLO SESSO
1 LAUREATO
2 NON LAUREATO
Totale
YL  1338
Media
1338.29
1164.41
1261.78
N
84
66
150
Deviazione
s td.
579.833
596.071
591.421
sL
s NL
YNL  1164
YL  YNL  174
33
Ricapitolando ...
Ipotesi nulla Ho
Livello di significatività:
NL= 84
 L   NL  0
5%, ALFA uguale a 0,05
NNL=66
34
Y  t 2   Y
Il 95% di tutte le medie
campionarie sono comprese
nell’intervallo:
t 2  1,98
  0,05
Area
Rifiuto Ho
Area
Non Rifiuto Ho
p(t)
0,95
0,025
0,025
T
 t 2
 t 2
35
CONFRONTO TRA FENOMENO OSSERVATO E IPOTESI
Calcoliamo i punti standard t(L-NL) risultante dal confronto tra la
differenza osservata fra i campioni ed il punteggio che dovremmo
trovare nel caso fosse vera l’ipotesi nulla, cioè =0.
Campione osservato
t L  NL 

Y

L
H0
 YNL    L   NL  174  0

 1,79
2
2
96,9
sL s NL

nL nNL
Errore standard della distribuzione
delle medie campionarie
36
Non rifiutiamo l’ipotesi nulla H0.
La differenza tra i gruppi “laureati” e “non laureati” non diverge
significativamente da zero. Non possiamo escludere che la differenza
osservata nei campioni non sia dovuta a semplice effetto del caso.
Non ci allontaniamo abbastanza dall’ipotesi nulla per essere
“ragionevolmente certi” che nella popolazione vi sia differenza nel
reddito dei due gruppi
Soglia
-1,98
Soglia
+1,98
0,95
T
0
 L   NL 
IPOTESI NULLA
+1,79
Y
L
 YNL 
CAMPIONE
Se aumentiamo l’ampiezza del campione a 300 ...
Ipotesi nulla Ho
 L   NL  0
Differenza osservata:
YL  YNL  296
Livello di significatività:
5%, ALFA uguale a 0,05
nL= 181
nNL=120
Report
reddito Reddito mens ile (euro)
TITOLO
1 LAUREATO
2 NON LAUREATO
Totale
Media
1524.45
1227.98
1406.26
N
181
120
301
Deviazione
s td.
812.186
808.203
822.209
38
Calcoliamo i punti standard t(L-NL) risultante dal confronto tra la
differenza osservata fra i campioni ed il punteggio che dovremmo
trovare nel caso fosse vera l’ipotesi nulla, cioè =0.
t L  NL 

Y

L
 YNL    L   NL 
2
L
2
NL
s
s

nL nNL
296  0

 3,10
95,3
39
Rifiutiamo l’ipotesi nulla H0.
La differenza tra i gruppi “laureati” e “non laureati” diverge significativamente
da zero. A livello di significatività del 5% possiamo affermare che nella
popolazione laureati e non laureati hanno redditi differenti.
Ci allontaniamo dall’ipotesi nulla a sufficienza per essere “ragionevolmente
certi” che nella popolazione vi sia differenza nel reddito dei due gruppi.
Soglia
-1,96
Soglia
+1,96
0,95
T
0
 L   NL 
IPOTESI NULLA
+3,10
Y
L
 YNL 
CAMPIONE
41
Test di significatività
VARIABILI CATEGORIALI
Test del Chi-quadrato
(MONOVARIATA)
42
In un convegno internazionale una sessione è
composta da scienziati delle seguenti nazionalità.
Italiani
Francesi
Inglesi
Tedeschi
Spagnoli
N
75
29
36
19
81
240
%
31,3
12,1
15,0
7,9
33,8
100,0
43
Test di significatività
Poniamo l’ipotesi che la composizione dei
membri del convegno non sia distribuita
ugualmente secondo la nazionalità.
Infatti, considerate cinque le nazioni che
partecipano al convegno, avremmo dovuto
avere che alla sessione partecipassero il 20
% di scienziati per nazione.
44
Hp di lavoro:
Vi sono differenze nella partecipazione al
convegno secondo la nazionalità.
Hp0 nulla:
Non vi sono differenze. 20% per nazione.
45
Calcoliamo le differenze per misurare quanto
il fenomeno osservato si discosta dalla
situazione ipotizzata:
O
E
N
%
Hp0 N/5
(O-E)2
(O-E)2/E
Italiani
75
31,3
48
729
15,2
Francesi
29
12,1
48
361
7,5
Inglesi
36
15,0
48
144
3
Tedeschi
19
7,9
48
841
17,5
Spagnoli
81
33,8
48
1089
22,7
240
100,0
240
Ipotesi nulla
Totale 65,9
Chi-Quadrato χ2
Maggiore è il valore di χ 2 , più siamo lontani
dall’ipotesi di equidistribuzione.
i=1…K
K
 
2
i 1
f  f 
 0
2
* 2
i
i
fi
*
Dove f*i è la frequenza attesa
47
Chi-Quadrato χ2
K
 
2
i 1
f  f 
* 2
i
i
fi
*
 65,9
Il chi-quadrato che abbiamo osservato
costituisce una misura della distanza dall’ipotesi
nulla di equidistribuzione (20% di scienziati per
nazione).
48
Distribuzione del Chi-Quadrato χ2
Il chi-quadrato ha una funzione di densità nota,
ma variabile secondo i gradi di libertà.
I gradi di libertà, nell’esempio proposto, sono k-1,
dove k sono le modalità.
I gradi di libertà rappresentano le frequenze di
cella che possiamo “liberamente” inserire dato il
totale. Oppure, costituiscono i vincoli minimi
necessari a riempire tutte le celle.
49
Gradi di libertà = k – 1
N
Italiani
Francesi
Inglesi
Tedeschi
Spagnoli
N
Molto
Abbastanza
Poco
Per niente
N
Maschi
Femmine
100
100
100
gdl = 4
gdl = 3
gdl = 1
50
φ(χ2)
Funzione di densità di χ2

φ(χ2)
g
2
2
 ( ) 

g
 
2
2
g

1 
2
2
e
2  0


0
0
 (  )d   1
2
χ2
51
Il χ2
E’ FUNZIONE DEI GRADI DI LIBERTA’

φ(χ2)
2
 ( ) 

g
 
2
2
g=1
g=4
g=10
g
2


0
g

1 
2
2
e
 (  )d   1
2
2  0
g=20
0
χ2
52
Distribuzione nota della v.c. χ2
  dt  1  
pT  13,44  0,8    
t
0
φ(χ2) Funzione di densità di χ2
AREA di NON
Rifiuto di H0
2
con gl=10
AREA di
Rifiuto di H0
 0
2
0.80
0
0.20
13,44
χ2
53
Logica falsificazionista, errori
Realtà del fenomenmo
Esito
del
test
H0 vera
H0 falsa
H0 non
rifiutata
No errore
Errore
II tipo (β)
H0
rifiutata
Errore
I tipo (α)
No errore
54
  pRifiutoH 0 H 0 vera
α è la probabilità teorica di rifiutare a priori l’H0 quando
questa è vera.
α viene fissata arbitrariamente, solitamente si utilizza
una soglia del 5 %.
α = 0,05
55
Livello di significatività α ; costituisce l’area di RIFIUTO di H0,
ossia l’area di ACCETTAZIONE di H1

g

2
2
2  g  
 
2
g

1 
2
2
e d 
g = gradi di libertà
 0
2
α
0
χ2α
χ2
Ricapitolando …
Il chi-quadrato osservato è uguale a 65,9.
I gradi di libertà sono 4.
Hp nulla:
Non vi sono differenze: 20% per nazione
Livello di significatività alfa=0,05
57
α
Valore critico del Chi-quadro
0
58
Rifiutiamo H0.
Respingiamo l’ipotesi nulla di equidistribuzione.
Con una significatività statistica dello 0,05 accettiamo
che gli scienziati non rappresentano allo stesso modo
le nazioni che partecipano alla sessione.
φ(χ2) Funzione di densità di χ2
con gl=4
AREA di Rifiuto di H0
e accettazione di H1
0.95
0
0.05
9,49
χα2
65,9
χ2