20. Verifica delle Ipotesi

Teoria dei Fenomeni Aleatori
AA 2012/13
Verifica delle Ipotesi Statistiche Parametriche
• Data la v.a. X con distribuzione
F ( x; θ ) , che
dipenderà da uno o più parametri (con θ scalare o
vettore), una ipotesi statistica parametrica è
un'assunzione riguardante i valori di θ.
• La verifica delle ipotesi è un processo mediante il
quale si stabilisce se un'ipotesi statistica può essere
considerata valida oppure no.
Docenti: Gaspare Galati – Gabriele Pavan
1
Teoria dei Fenomeni Aleatori
AA 2012/13
Ipotesi Nulla ed Ipotesi Alternativa
Si indichi con D lo spazio dei parametri θ.
Su D si effettua una partizione in due sottinsiemi:
D0
e
D1
• L'ipotesi nulla (o di base) H 0 è: θ∈ D0 .
• L'ipotesi alternativa H 1 è: θ ∈ D1 .
L'ipotesi nulla, che deve essere verificata, è in genere
basata sulla esperienza.
Docenti: Gaspare Galati – Gabriele Pavan
2
Teoria dei Fenomeni Aleatori
AA 2012/13
Ipotesi Semplici e Composte
• Un'ipotesi è semplice se l'insieme dei parametri ad
essa associato ( D0 per H 0 , D1 per H 1 ) è costituito da
un solo elemento, altrimenti si dice che l'ipotesi è
composta.
• H 0 è, nella maggior parte dei casi, semplice: θ = θ0 .
• Tipicamente l'insieme D1 è invece costituito da uno
dei seguenti tre insiemi di valori di θ:
θ ≠ θ0
Docenti: Gaspare Galati – Gabriele Pavan
θ > θ0
θ < θ0
3
Teoria dei Fenomeni Aleatori
AA 2012/13
Il Test Statistico
• Il test statistico è una regola di decisione che
consente, sulla base dei dati sperimentali, di
(accettare o) rifiutare, in termini probabilistici, H 0 .
• Lo spazio dei campioni generati sotto l'ipotesi nulla
H 0 viene “partizionato” in due sottoinsiemi:
Da (regione di accettazione)
Dc (regione critica)
Docenti: Gaspare Galati – Gabriele Pavan
4
Teoria dei Fenomeni Aleatori
AA 2012/13
Il Test Statistico
• La partizione dovrà essere tale che f ( x | H 0 ) sia
“trascurabile” in Dc ed invece elevata in Da .
Probabilità di Errore di Primo Tipo
α = P { X ∈ Dc H 0 }
α è detto anche livello di significatività del test.
Probabilità di Errore di Secondo Tipo
β ( θ ) = P { X ∉ Dc H 1 }
La quantità 1 − β è chiamata potenza del test.
Docenti: Gaspare Galati – Gabriele Pavan
5
Teoria dei Fenomeni Aleatori
AA 2012/13
Probabilità di errore in un test sulla media di campione
f X x H1
f X x H0
0
Da
x
Dc
Le ipotesi sono le seguenti:
H 0 : { X = θ0 = 0}
Docenti: Gaspare Galati – Gabriele Pavan
,
H 1 : { X = θ}
con θ > 0
6
Teoria dei Fenomeni Aleatori
AA 2012/13
Verifica delle Ipotesi Statistiche Parametriche
• Al variare di H 0 e di H 1 (ovvero di θ0 e θ nello spazio
dei parametri), α ( θ0 ) e β ( θ ) descrivono due funzioni.
• Di norma θ0 è fissato e quindi α è fissata.
• β ( θ ) è chiamata la caratteristica operativa del test.
• L'obiettivo di rendere simultaneamente minimi (al
limite nulli) i due errori α e β è irrealizzabile.
Docenti: Gaspare Galati – Gabriele Pavan
7
Teoria dei Fenomeni Aleatori
AA 2012/13
Verifica delle Ipotesi Statistiche Parametriche
• Il test è condotto assegnando un valore ad α e
scegliendo la Dc in modo da minimizzare β (test più
potente).
• Se la Dc non dipende da θ il test è detto
uniformemente più potente.
Docenti: Gaspare Galati – Gabriele Pavan
8
Teoria dei Fenomeni Aleatori
AA 2012/13
Statistica del Test
Il test può essere condotto sui campioni
{xi }
i = 1, 2,..., n
oppure su una loro funzione
g ( x1 , x2 ,..., xn )
Si può allora formare la variabile aleatoria
Q = g ( X 1 , X 2 ,..., X n )
detta statistica del test.
Docenti: Gaspare Galati – Gabriele Pavan
9
Teoria dei Fenomeni Aleatori
AA 2012/13
Statistica del Test
• Se l'ipotesi H 0 viene verificata usando una statistica
Q, le regioni critica e di accettazione sono di norma
segmenti dell'asse reale (spesso sono semirette).
• H 0 è rigettata se q = g ( x1 , x2 ,..., xn ) ∈ Dc .
• Le probabilità d'errore sono quindi:
α = P {Q ∈ Dc H 0 } =
∫
Dc
β ( θ ) = P {Q ∉ Dc H 1 } =
Docenti: Gaspare Galati – Gabriele Pavan
fQ ( q θ0 ) dq
∫
Da
fQ ( q θ ) dq
10
Teoria dei Fenomeni Aleatori
AA 2012/13
Verifica delle Ipotesi Statistiche Parametriche
Esempio: Per una v.a. X, con densità f ( x; θ ) , si vuole
verificare:
H 0 : θ = θ0 (semplice)
contro una delle ipotesi alternative H 1 (composte):
1. θ ≠ θ0
2. θ > θ0
3. θ < θ0
Si suppone di usare la stessa statistica Q = g ( X ) in
tutti i tre casi.
Docenti: Gaspare Galati – Gabriele Pavan
11
Teoria dei Fenomeni Aleatori
AA 2012/13
Esempio (segue)
• Si determina la densità di probabilità di Q = g ( X ) .
• Si fissa un valore per il livello di significatività α del
test.
• Si determinare la regione critica Dc .
Essa dipende da quale delle tre ipotesi alternative
viene considerata.
Docenti: Gaspare Galati – Gabriele Pavan
12
Teoria dei Fenomeni Aleatori
AA 2012/13
Esempio (segue)
Caso 1) L’ipotesi alternativa è: θ ≠ θ0
La regione critica è: q < c1 e q > c2
α=
∫
c1
−∞
fQ ( q θ0 ) dq +
∫
+∞
c2
fQ ( q θ0 ) dq
c1 e c2 si scelgono in modo da minimizzare la
lunghezza c2 − c1 .
Per semplificare i calcoli:
∫
c1
−∞
α
fQ ( q θ0 ) dq =
2
Docenti: Gaspare Galati – Gabriele Pavan
;
∫
+∞
c2
α
fQ ( q θ0 ) dq =
2
13
Teoria dei Fenomeni Aleatori
AA 2012/13
Esempio (segue caso 1)
Q
0
Q
1
2
2
c1
Dc
q
c2
Dc
Caratteristica operativa risultante β ( θ )
Docenti: Gaspare Galati – Gabriele Pavan
14
Teoria dei Fenomeni Aleatori
AA 2012/13
Esempio (caso 2)
Caso 2) L’ipotesi alternativa è θ > θ0
La regione critica è: q > c
α=
∫
+∞
c
fQ ( q θ0 ) dq
c = q1−α
dove q1−α è il percentile 1 − α della statistica del test Q.
La caratteristica operativa è:
β ( θ )=
Docenti: Gaspare Galati – Gabriele Pavan
∫
c
−∞
fQ ( q θ ) dq
15
Teoria dei Fenomeni Aleatori
AA 2012/13
Esempio (segue caso 2)
Q
0
Q
c
Dc
q
Caratteristica operativa risultante β ( θ )
Docenti: Gaspare Galati – Gabriele Pavan
16
Teoria dei Fenomeni Aleatori
AA 2012/13
Esempio (caso 3)
Caso 3) L’ipotesi alternativa è θ < θ0
La regione critica è: q < c
α=
∫
c
−∞
fQ ( q θ0 ) dq
c = qα
La caratteristica operativa è invece
β ( θ) =
∫
+∞
c
Docenti: Gaspare Galati – Gabriele Pavan
f ( q θ ) dq
17
Teoria dei Fenomeni Aleatori
AA 2012/13
Esempio (caso 3 segue)
Q
Q
Dc
0
c
q
Caratteristica operativa risultante β ( θ )
Docenti: Gaspare Galati – Gabriele Pavan
18
Teoria dei Fenomeni Aleatori
AA 2012/13
Verifica delle Ipotesi Statistiche Parametriche
• Se β ( θ ) è troppo elevata si può ridurla aumentando il
valore di α fino al massimo consentito.
• Se β dovesse risultare ancora troppo elevato, si può
aumentare il numero dei campioni.
• Dopo aver determinato Dc in base al valore di α ed
aver calcolato β ( θ ) , che dipende da H 1 , l'ipotesi
nulla viene respinta se il valore della statistica del
test cade nella regione critica.
Docenti: Gaspare Galati – Gabriele Pavan
19
Teoria dei Fenomeni Aleatori
AA 2012/13
Valore Probabilistico: p-value
Un’informazione
più
completa
della
semplice
informazione binaria: test superato / non superato è
fornita dal cosiddetto:
p =
*
p-value:
∫
+∞
q*
Q
0
Q
c
Docenti: Gaspare Galati – Gabriele Pavan
fQ ( q | θ0 ) dq
Dc
q
20
Teoria dei Fenomeni Aleatori
AA 2012/13
Valore Probabilistico: p-value (cont.)
p* =
p-value:
∫
q*
−∞
fQ ( q | θ0 ) dq
Q
Q
Dc
c
0
q
Il p-value è ottenuto dalla funzione di densità della
statistica del test nell’ipotesi H 0 .
Docenti: Gaspare Galati – Gabriele Pavan
21
Teoria dei Fenomeni Aleatori
AA 2012/13
Valore Probabilistico: p-value (cont.)
• Se la statistica del test (in corrispondenza ad un rilevamento
fatto q* ) dà luogo ad un p-value più basso del livello di
significatività α si respinge H 0 .
• Il p-value p* fornisce un’indicazione della “verosimiglianza”
dell’ipotesi H 0 , che cresce al crescere di p* .
• Tuttavia valori di p* troppo vicini all’unità possono far
sospettare che i dati su cui è stata calcolata la statistica del
test siano stati truccati per indurre a propendere per l’ipotesi
H0 .
Docenti: Gaspare Galati – Gabriele Pavan
22
Teoria dei Fenomeni Aleatori
AA 2012/13
Test sul Valor Medio
Data la v.a. X con valore atteso η, si vuole verificare:
H 0 : η = η0
contro una delle tre ipotesi alternative
H 1 : η ≠ η0 , η > η0 , η < η0
2
σ
La varianza
di X può essere nota oppure incognita,
in quest’ultimo caso si utilizza la varianza campionaria
nella definizione della statistica del test.
Docenti: Gaspare Galati – Gabriele Pavan
23
Teoria dei Fenomeni Aleatori
AA 2012/13
Test sul Valor Medio - Varianza nota (segue)
Si utilizza la statistica:
X − η0
Q=
σ n
1
•X =n
n
∑x
i
media campionaria distribuita
i =1
σ2
con legge gaussiana: E ⎣⎡ X ⎤⎦ = η , Var ⎡⎣ X ⎤⎦ =
n
(esatta se X è Normale, asintotica se non lo è).
• n è la numerosità del campione.
Docenti: Gaspare Galati – Gabriele Pavan
24
Teoria dei Fenomeni Aleatori
AA 2012/13
Test sul Valor Medio - Varianza nota (segue)
• Sotto l'ipotesi di base:
H 0 : η = η0
Q è distribuita con legge Gaussiana standard.
• Se si considera l’ipotesi alternativa:
H 1 : η ≠ η0
si tratta di una ipotesi bilaterale.
Docenti: Gaspare Galati – Gabriele Pavan
25
Teoria dei Fenomeni Aleatori
AA 2012/13
fQ (z) = N(0,1)
2
2
z
Da
zα / 2 = − z1−α / 2
z1−α / 2
Regione di accettazione: test sul valor medio.
Caso Bilaterale
Docenti: Gaspare Galati – Gabriele Pavan
26
Teoria dei Fenomeni Aleatori
AA 2012/13
Test sul Valor Medio - Varianza nota (segue)
Se si considera l’ipotesi H 1 : η > η0 , (ipotesi unilaterale).
fQ (z)
z
Da
z1−α
Regione di accettazione, test sul valor medio.
Caso unilaterale
Docenti: Gaspare Galati – Gabriele Pavan
27
Teoria dei Fenomeni Aleatori
AA 2012/13
Test sul Valor Medio - Varianza nota (segue)
Calcolo della caratteristica operativa:
• Ipotesi H 1 : η ≠ η0
{
}
β ( η) = P z α ≤ Q ≤ z1− α H 1 =
=
∫
2
⎡ ( u − η )2 ⎤
1
Q
⎢
⎥ du =
exp −
2
⎢
⎥
2π
⎣
⎦
z1−α / 2
zα / 2
(
2
) (
= G z1− α − ηQ − G z α − ηQ
con G ( x ) =
Docenti: Gaspare Galati – Gabriele Pavan
2
1
2π
∫
x
−∞
2
)
2
− t2
e dt Gaussiana Standard.
28
Teoria dei Fenomeni Aleatori
AA 2012/13
Test sul Valor Medio - Varianza nota (segue)
( )
f (q)
H1
H0
2
2
q
0
q
Da
Calcolo della potenza del test sul valore medio.
Caso bilaterale.
Docenti: Gaspare Galati – Gabriele Pavan
29
Teoria dei Fenomeni Aleatori
AA 2012/13
Test sul Valor Medio - Varianza nota (segue)
• Ipotesi H 1 : η > η0
β ( η) = P {Q ≤ z1−α H 1 } =
=
∫
z1−α
−∞
⎡ ( u − η )2 ⎤
1
Q
⎢
⎥ du = G ( z1−α − ηQ )
exp −
2
⎢
⎥
2π
⎣
⎦
• Ipotesi H 1 : η < η0
β ( η) = P {Q ≥ zα H 1 } =
=
∫
∞
zα
⎡ ( u − η )2 ⎤
1
Q
⎢
⎥ du = 1 − G ( zα − ηQ )
exp −
2
⎢
⎥
2π
⎣
⎦
Docenti: Gaspare Galati – Gabriele Pavan
30
Teoria dei Fenomeni Aleatori
AA 2012/13
Test sul Valor Medio - Varianza nota (segue)
( )
1
1-
H1 :
=
0
0
( )
( )
1-
1-
H1 : >
0
H1 :
0
<
0
0
Errore di secondo tipo del test sul valore medio
Docenti: Gaspare Galati – Gabriele Pavan
31
Teoria dei Fenomeni Aleatori
AA 2012/13
Test sul Valor Medio - Varianza Incognita
• Si utilizza la varianza “corretta” del campione:
1
S =
n −1
2
n
∑( X − X )
2
i
i =1
σ ⎞
⎛
⎟ , la v.a.
Assumendo X Normale: N ⎜ η ;
n⎠
⎝
2
ha distribuzione
Docenti: Gaspare Galati – Gabriele Pavan
S
( n − 1) 2
σ
χ 2 ( n − 1) .
32
Teoria dei Fenomeni Aleatori
AA 2012/13
Test sul Valor Medio - Varianza Incognita
• Come statistica del test può essere usata la v.a.:
X − η0
Q=
S/ n
che risulta distribuita secondo la legge t di Student con
n − 1 gradi di libertà.
X − η0
T ( n − 1) =
S/ n
Docenti: Gaspare Galati – Gabriele Pavan
33
Teoria dei Fenomeni Aleatori
AA 2012/13
Infatti:
X − η0
Z=
,
σ/ n
2
S
W = ( n − 1) 2
σ
sono indipendenti, con
Z è una N ( 0,1) , W è una χ 2 ( n − 1)
Z
W / ( n − 1)
=
X − η0
σ/ n
X − η0
=
2 S/ n
n
1
S
−
( )
σ 2 ( n − 1)
è distribuito come una Student con ( n − 1 ) gradi di libertà.
Docenti: Gaspare Galati – Gabriele Pavan
34
Teoria
T
dei Fenome
eni Aleatori
AA 2012/13
3
Variab
V
ile di S
Studentt:
Docenti:
D
Gaspare Galati – Gabriele
e Pavan
35
Teoria dei Fenomeni Aleatori
AA 2012/13
Test sul Valor Medio - Varianza Incognita
• Per la determinazione delle regioni critiche e di
accettazione si procede in modo analogo al caso
della varianza nota.
Docenti: Gaspare Galati – Gabriele Pavan
36
Teoria dei Fenomeni Aleatori
AA 2012/13
Test sul Valor Medio - Varianza Incognita (segue)
a) H 1 : η ≠ η0
Reg. Acc.: t α2 ( n − 1) ≤ q ≤ t1− α2 ( n − 1)
Reg. Crit.: q > t α2 ( n − 1)
b) H 1 : η > η0
Reg. Acc.: q ≤ t1−α ( n − 1)
Reg. Crit.: q > t1−α ( n − 1)
c) H 1 : η < η0
Reg. Acc.: q ≥ tα ( n − 1)
Reg. Crit.: q < tα ( n − 1)
Docenti: Gaspare Galati – Gabriele Pavan
37
Teoria dei Fenomeni Aleatori
AA 2012/13
Test sul Valor Medio - Varianza Incognita (segue)
• La funzione di potenza si calcola dopo aver
determinato la distribuzione di probabilità della
statistica Q sotto l'ipotesi H 1 .
• Nel caso di H 1 : η ≠ η0 la v.a. Q è distribuita secondo
una legge t di Student non centrale.
Docenti: Gaspare Galati – Gabriele Pavan
38
Teoria dei Fenomeni Aleatori
AA 2012/13
Test sulla Varianza
• Data una v.a. X distribuita secondo una legge
N ( η; σ ) si vuole verificare l’ipotesi:
H 0 : σ = σ0
contro
H 1 : σ ≠ σ0 oppure ( σ > σ0 , σ < σ0 )
• La statistica assunta per il test è diversa a seconda
che si supponga η (il valore atteso di X) noto oppure
no.
Docenti: Gaspare Galati – Gabriele Pavan
39
Teoria dei Fenomeni Aleatori
AA 2012/13
Test sulla Varianza - Valore Atteso Noto
• Si può usare la seguente statistica di test
n
Q=
∑
i =1
( X i − η)
2
2
σ0
L’uso della questa statistica si giustifica come segue.
• Sotto l'ipotesi H 0 la v.a. Q segue una legge Chi
Quadro con n gradi di libertà, essendo la somma dei
quadrati di n variabili aleatorie Gaussiane standard.
Docenti: Gaspare Galati – Gabriele Pavan
40
Teoria dei Fenomeni Aleatori
AA 2012/13
Test sulla Varianza - Valore Atteso Noto (segue)
Esempio: Gli errori di due strumenti di misura che si
vogliono confrontare, sono distribuiti secondo una legge
Normale con valore atteso nullo.
• Errore del I° strumento V0 :
N ( 0; σ0 = 0.1mm ) .
• Errore del II° strumento V1 : N ( 0;σ )
con σ incognito.
• Le ipotesi da verificare sono:
H 0 : σ = σ0 = 0.1 mm e H 1 : σ ≠ σ0
• Il livello di confidenza desiderato è α = 0.05 .
Docenti: Gaspare Galati – Gabriele Pavan
41
Teoria dei Fenomeni Aleatori
AA 2012/13
Test sulla Varianza - Valore Atteso Noto (segue)
Esempio (segue):
Per effettuare il test si eseguono 10 misure di uno stesso
oggetto lungo η = 8 mm con lo stesso strumento. Le
misure forniscono 10 campioni di:
X = η + Vi
xi = 8.15 ; 7.93 ; 8.22 ; 8.04 ; 7.85 ;
7.95 ; 8.06 ; 8.12 ; 7.86 ; 7.92
Docenti: Gaspare Galati – Gabriele Pavan
42
Teoria dei Fenomeni Aleatori
AA 2012/13
Test sulla Varianza - Valore Atteso Noto (segue)
Esempio (segue):
La statistica del test vale
10
q=
∑
( xi − 8 )
i =1
0.01
2
= 14.64
I limiti della regione di accettazione sono:
χ
2
0 .0 2 5
(1 0 ) =
3 .2 5
χ
2
0 .9 7 5
(1 0 ) =
2 0 .4 8
Poiché q ricade entro questi limiti H 0 : σ = σ0 non viene
respinta.
Docenti: Gaspare Galati – Gabriele Pavan
43
Teoria dei Fenomeni Aleatori
AA 2012/13
Test sulla Varianza - Valore Atteso Incognito
• Se η è incognito lo si può stimare mediante
1
X=
n
n
∑X
i
i =1
La statistica del test è quindi:
n
Q=
∑
i =1
( Xi − X )
2
2
σ0
• Avendo usato nel definire Q un vincolo (l'espressione
2
χ
di X ), la sua distribuzione è una ( n − 1) .
Docenti: Gaspare Galati – Gabriele Pavan
44
Teoria dei Fenomeni Aleatori
AA 2012/13
Test sulla Varianza - Valore Atteso Incognito (segue)
Se nell'esempio precedente la lunghezza dell'oggetto η
non è nota, dal campione si ricava:
10
X = 8.01 ;
q=
∑
i =1
( xi − X )
0.01
2
= 14.54
Usando lo stesso livello di confidenza ( α = 0.05 ), i limiti
della regione di accettazione sono i percentili:
2
χ0.025
( 9 ) = 2.70
2
χ0.975
( 9 ) = 19.02
q ricade all'interno della regione di accettazione, anche
in questo caso l'ipotesi H 0 non viene respinta.
Docenti: Gaspare Galati – Gabriele Pavan
45
Teoria dei Fenomeni Aleatori
AA 2012/13
Test sulla Probabilità
• Dato un evento A, con probabilità p = P ( A ) , si può
verificare se la sua probabilità è uguale a p0 .
L'ipotesi di base è quindi:
H 0 : p = p0
contro una delle tre ipotesi:
H 1 : p ≠ p0 , p > p0 , p < p0
Docenti: Gaspare Galati – Gabriele Pavan
46
Teoria dei Fenomeni Aleatori
AA 2012/13
Test sulla Probabilità
• Come statistica del test può essere utilizzato il
numero k di volte in cui l'evento A si è verificato nel
corso di n prove.
• La v.a. K ha una distribuzione Binomiale con
E [ K ] = np e Var [ K ] = npq ( q = 1 − p ).
• Se l'ipotesi alternativa è
H 1 : p ≠ p0 ,
allora il test è
bilaterale e può essere condotto come segue:
Docenti: Gaspare Galati – Gabriele Pavan
47
Teoria dei Fenomeni Aleatori
AA 2012/13
Test sulla Probabilità
a) si sceglie un valore per il livello di significatività α;
b) si determinano il più grande intero k1 ed il più
piccolo intero k2 tali che:
k1
⎛ n ⎞ k n −k α
⎜ k ⎟ p0 ⋅ q0 ≤ 2
k =0 ⎝ ⎠
∑
n
⎛ n ⎞ k n −k α
⎜ k ⎟ p0 ⋅ q0 ≤ 2
k = k2 ⎝ ⎠
∑
c) si conta il numero k di successi (realizzazioni di A)
in n prove;
d) non si respinge H 0 se k1 < k < k2 .
Docenti: Gaspare Galati – Gabriele Pavan
48
Teoria dei Fenomeni Aleatori
AA 2012/13
Test sulla Probabilità (segue)
• La Prob. di errore di I° tipo ottenuta è minore di α .
P (X = k)
n =9
k1 = 1
k2 = 7
H0
H1
2
2
1
k1
2
3
4
5
6
7
8
9
10
k
k2
p = p0 = 0.4 (ipotesi H0) e p = 0.6 (ipotesi H1)
Docenti: Gaspare Galati – Gabriele Pavan
49
Teoria dei Fenomeni Aleatori
AA 2012/13
Test sulla Probabilità (segue)
• La caratteristica operativa è ( H 1 : p ≠ p0 ):
k 2 −1
⎛ n ⎞ k n −k
β ( p ) = P {k1 < K < k2 H 1 } =
⎜k ⎟ p q
k = k1 +1 ⎝ ⎠
∑
• Se il campione ha dimensione elevata (n grande):
k1 = np0 + z α np0 (1 − p0 ) ; k2 = np0 − z α np0 (1 − p0 )
2
2
⎛ k2 − np ⎞
⎛ k1 − np ⎞
β( p) = G ⎜
⎟ −G⎜
⎟
⎝ npq ⎠
⎝ npq ⎠
con G ( x ) di distribuzione della Gaussiana standard.
Docenti: Gaspare Galati – Gabriele Pavan
50
Teoria dei Fenomeni Aleatori
AA 2012/13
Test di Scorrelazione
• Date due variabili aleatorie X ed Y, si vuole verificare
se esse sono tra loro scorrelate oppure no.
H 0 : r = 0 e H1 : r ≠ 0
Il test può essere condotto come segue:
• Si prelevano n coppie di campioni ( xi , yi )
• Si stima
r̂
(coefficiente di correlazione campionario)
rˆ =
∑ ( xi − X )( yi − Y )
∑ ( xi − X ) ∑ ( yi − Y )
2
2
i = 1, ..., n; X ed Y indicano le medie campionarie.
Docenti: Gaspare Galati – Gabriele Pavan
51
Teoria dei Fenomeni Aleatori
AA 2012/13
Test di Scorrelazione (segue)
• Si introduce la variabile di Fisher W, legata ad r̂ da:
1 1 + rˆ
W = ln
2 1 − rˆ
• Si utilizza come statistica del test è
Q =W n −3
Sotto H 0 , la v.a. W segue approssimativamente, per
1 ⎞
⎛
n grande, una distribuzione normale N ⎜ 0;
⎟;
n−3 ⎠
⎝
pertanto Q è distribuita come Gaussiana standard.
Docenti: Gaspare Galati – Gabriele Pavan
52
Teoria dei Fenomeni Aleatori
AA 2012/13
Le Ipotesi Statistiche Non Parametriche
• Nel caso di ipotesi statistiche non parametriche le
ipotesi
da
confrontare
non
dipendono
da
un
parametro ma sono del tipo:
H 0 : F ( x ) = F0 ( x )
e
H 1 : F ( x ) ≠ F0 ( x )
cioè si tratta di verificare se la v.a. X segue o meno
una fissata distribuzione di probabilità F0 ( x ) .
• Test di Kolmogorov - Smirnov (K.S.)
• Test del Chi Quadro
Docenti: Gaspare Galati – Gabriele Pavan
53
Teoria dei Fenomeni Aleatori
AA 2012/13
Test di Kolmogorov - Smirnov (K.S.)
• Lo scopo di questo test è di verificare se la funzione
di distribuzione F ( x ) della v.a. X corrisponde ad una
dato modello:
H 0 : F ( x ) = F0 ( x )
e
H 1 : F ( x ) ≠ F0 ( x )
• Si fa uso della distribuzione empirica F̂ ( x ) : funzione
1
, con n
a gradini in numero di n di altezza
n
numerosità del campione.
Docenti: Gaspare Galati – Gabriele Pavan
54
Teoria
T
dei Fenome
eni Aleatori
AA 2012/13
3
Test di Kolmogo
orov - Smirn
S
nov (se
egue)
Fu
unzion
ne di distribuz
zione empiric
e
ca F̂ ( x ) = Fn ( x )
e modell
m
o F0 ( x ) = FX ( x )
Docenti:
D
Gaspare Galati – Gabriele
e Pavan
55
Teoria dei Fenomeni Aleatori
AA 2012/13
Test di Kolmogorov - Smirnov (segue)
• La F̂ ( x ) è a sua volta aleatoria e dà luogo ad una
famiglia aleatoria di funzioni F̂ ( x ) . Si può quindi
formare la seguente statistica:
Q = max Fˆ ( xi ) − F0 ( xi )
xi
• La
distribuzione
FQ ( q )
non
dipende
dalla
distribuzione F ( x ) .
Docenti: Gaspare Galati – Gabriele Pavan
56
Teoria dei Fenomeni Aleatori
AA 2012/13
Test di Kolmogorov - Smirnov (segue)
• Verifica: se Y è una v.a. con distribuzione FY ( y ) ,
ottenuta da y = g ( x ) (invertibile), si ha
−1
⎡
FY ( y ) = FX ⎣ g ( y ) ⎤⎦
e, per ogni campione aleatorio yi = g ( xi ) , i = 1,..., n :
FY ( yi ) = FX ⎡⎣ g −1 ( yi ) ⎤⎦
da cui risulta:
max Fˆ X ( x ) − FX ( x ) = max FˆY ( y ) − FY ( y )
xi
Docenti: Gaspare Galati – Gabriele Pavan
yi
57
Teoria dei Fenomeni Aleatori
AA 2012/13
Test di Kolmogorov - Smirnov (segue)
• La forma esatta di FQ ( q ) è comunque complicata.
FQ ( q ) = P {Q ≤ q} = 1 − 2
∞
∑ ( −1 )
k =1
k −1
2 2
⎡
exp ⎣ −2nk q ⎤⎦
Si può usare la seguente approssimazione dovuta a
Kolmogoroff (sviluppo al primo ordine):
(
FQ ( q ) ≅ 1 − 2 exp −2nq
2
)
1
per q >
n
dove n è il numero dei campioni usato per la stima
empirica di F ( x ) .
Docenti: Gaspare Galati – Gabriele Pavan
58
Teoria dei Fenomeni Aleatori
AA 2012/13
Test di Kolmogorov - Smirnov (segue)
Regione di accettazione:
• Se l'ipotesi di base H 0 è vera, si ha
E ⎡⎣ Fˆ ( x ) ⎤⎦ = F0 ( x )
Poiché Q assume solamente valori positivi,
H0
è
rigettata se, definita una costante positiva "c", la
statistica del test assume un valore maggiore di c.
• Si fissa un livello di significatività α, il valore di c si
determina mediante la relazione:
Docenti: Gaspare Galati – Gabriele Pavan
59
Teoria dei Fenomeni Aleatori
AA 2012/13
Test di Kolmogorov - Smirnov (segue)
Regione di accettazione:
P {Q > c H 0 } = α
(
α = P {Q > c H 0 } = 1 − FQ ( c ) ≈ 2 exp −2nc
2
)
1
⎛α⎞
c = − ⋅ ln ⎜ ⎟
2n ⎝ 2 ⎠
e quindi la regola di decisione è:
• Se q ≤ c non si respinge H 0
• Se q > c si respinge H 0
Docenti: Gaspare Galati – Gabriele Pavan
60
Teoria dei Fenomeni Aleatori
AA 2012/13
Test di Kolmogorov - Smirnov, Esempio numerico
Da una rilevazione del quoziente di intelligenza ( xi ) su
40 studenti, si ottengono i seguenti risultati:
xi
75
80
85
F̂ ( xi ) .025 .075 .15
90
95
100 105 110 115 120
.275 .425 .625 .775 .875 .925 .975
F0 ( xi ) .006 .023 .067 .159 .308 .500 .691 .841 .933 .977
Δxi
.019 .052 .083 .116 .117 .125 .084 .034 .008 .002
H 0 : F0 ( x ) legge Normale N ( η = 100,σ = 10 ) .
Docenti: Gaspare Galati – Gabriele Pavan
61
Teoria dei Fenomeni Aleatori
AA 2012/13
Test di Kolmogorov - Smirnov, Esempio numerico
Il massimo di Δ ( x ) = Fˆ ( x ) − F0 ( x ) si ha per x = 100 e
vale 0.125.
Per un livello di confidenza α = 0.05 si ha inoltre:
1 0.05
c = − ln
= 0.2147
80
2
Poiché il valore della statistica
q = Δ ( 100 ) = 0.125 < c
l'ipotesi di base non viene respinta.
Docenti: Gaspare Galati – Gabriele Pavan
62
Teoria dei Fenomeni Aleatori
AA 2012/13
Il Test del Chi-Quadro
• Scopo del test è stabilire se i dati ottenuti da un
esperimento ben si adattano ad un modello teorico.
• Per questo si consideri una partizione A1 , A2 ,....., Am
dello spazio degli eventi.
• Si desidera testare l’ipotesi che le probabilità
pi = P ( Ai ) hanno m assegnati valori p0i :
H 0 : pi = poi
contro l’ipotesi:
Docenti: Gaspare Galati – Gabriele Pavan
H 1 : pi ≠ poi
i=1,...,m
per qualche i
63
Teoria dei Fenomeni Aleatori
AA 2012/13
Il Test del Chi-Quadro (segue)
• Per effettuare il test si ripete l’esperimento n volte
denotando con ki il numero di volte in cui si verifica
l’evento Ai .
• La probabilità (Binomiale generalizzata)
P { Ai occorre ki volte} =
n!
p1k1 p2k2 ⋅⋅⋅ piki ⋅⋅⋅ pmkm
=
k1 ! k 2 !⋅⋅⋅ ki !⋅⋅⋅ ! km !
m
essendo:
∑k = n , ∑ p = 1
i
i =1
Docenti: Gaspare Galati – Gabriele Pavan
m
i
i =1
64
Teoria dei Fenomeni Aleatori
AA 2012/13
Il Test del Chi-Quadro (segue)
• Se si suppone n “grande” ( n >> 1) e p0i “piccolo”
(1 − p0i ≅ 1)
il che si può ottenere in base ad
un’opportuna scelta di m, la Binomiale generalizzata
può essere approssimata come:
P { Ai occorre ki volte} ≈
2 ⎫
⎧⎪ 1 ⎡ ( k − np )2
⎤
−
k
np
(
)
⎪
m
m
1
1
exp ⎨ − ⎢
+ ⋅⋅⋅ +
⎥⎬
2
np
np
1
m
⎢
⎥⎦ ⎪⎭
⎪⎩
⎣
≈
m −1
( 2πn ) p1 ⋅⋅⋅ pm
Docenti: Gaspare Galati – Gabriele Pavan
65
Teoria dei Fenomeni Aleatori
AA 2012/13
Il Test del Chi-Quadro (segue)
Nell'ipotesi H 0 si ha pi = p0i . Si sceglie come statistica:
m
Q=
∑
( ki − np0i )
Statistica di Pearson
np0i
i =1
Le variabili aleatorie
n
essendo
2
∑( k − np
i
0i
( ki − np0i )
np0i
)=0
2
2
χ
(1) . Inoltre
sono
solo m − 1 di esse sono
i =1
2
χ
( m − 1) .
indipendenti, quindi Q segue una legge
Docenti: Gaspare Galati – Gabriele Pavan
66
Teoria dei Fenomeni Aleatori
AA 2012/13
Il Test del Chi-Quadro (segue)
Il test procede come segue:
• Si osservano i valori di ki e si calcola il valore di q.
2
χ
• Si fissa un valore di α e si calcola 1−α ( m − 1)
• Non si respinge l’ipotesi H 0 se e solo se
m
q=
∑
i =1
( ki − np0i )
np0i
2
<χ
2
1−α
( m − 1)
Sotto H 1 la statistica Q è distribuita secondo una legge
Chi Quadro non centrale che dipende dai valori pi ≠ p0i .
Docenti: Gaspare Galati – Gabriele Pavan
67
Teoria dei Fenomeni Aleatori
AA 2012/13
Il Test del Chi-Quadro: Esempio
Si vuole verificare l'ipotesi che un dado non sia truccato.
m = 6. Sotto l’ipotesi:
1
H 0 : p0i =
6
i = 1,2,...,6
Lanciando il dado 450 volte si ottengono i valori:
i 1
2
ki 66 60
1
np0i = 450 ⋅ = 75
6
Docenti: Gaspare Galati – Gabriele Pavan
3
4
5
6
84 72
81
87
6
q=
∑
i =1
( ki − 75 )
75
2
= 7.68
68
Teoria dei Fenomeni Aleatori
AA 2012/13
Il Test del Chi-Quadro: Esempio
Se si adotta un livello di confidenza α = 0.05 si ha:
2
χ0.95
( 5 ) = 11.07
essendo 5 il numero di gradi di libertà.
Poiché
q = 7.68 < 11.07
l'ipotesi
H0
non può essere respinta sulla base di questi
dati sperimentali.
Docenti: Gaspare Galati – Gabriele Pavan
69
Teoria dei Fenomeni Aleatori
AA 2012/13
Statistica di Pearson Modificata
• Se un certo numero di parametri tra quelli che
definiscono H 0 è incognito (per esempio r delle m
probabilità p0i ), l'ipotesi nulla si dice incompleta.
• Questi parametri mancanti devono essere stimati. Se
per la stima si applica il criterio ML:
m
Q̂ =
∑
i =1
( ki − npˆ 0i )
2
ˆ 0i
np
Statistica di Pearson modificata
Dove
p̂0i
è il valore stimato (o noto).
Docenti: Gaspare Galati – Gabriele Pavan
70
Teoria dei Fenomeni Aleatori
AA 2012/13
Statistica di Pearson Modificata
• Per valori elevati di n la statistica di Pearson è
distribuita secondo una legge:
χ 2 ( m − r − 1)
• La regione critica è quindi:
q̂ > χ12−α ( m − r − 1)
• In sostanza la stima di r quantità, utilizzate nel test,
tramite gli stessi campioni del test diminuisce
ulteriormente della quantità r i gradi di libertà.
Docenti: Gaspare Galati – Gabriele Pavan
71
Teoria dei Fenomeni Aleatori
AA 2012/13
Test del χ e Conformità tra Dati e Funzione Densità
2
• Si vuole verificare
⎧⎪ f X ( x ) = f0 ( x )
⎨
⎪⎩ f X ( x ) ≠ f0 ( x )
se è vero H 0
se è vero H 1
• Le osservazioni (dati) costituiscono un campione
aleatorio di numerosità n.
• In alternativa al test KS si può utilizzare il test del χ
2
suddividendo il dominio delle realizzazioni di X in m
classi:
Docenti: Gaspare Galati – Gabriele Pavan
C1 , C2 ,..., Cm
72
Teoria dei Fenomeni Aleatori
AA 2012/13
Test del χ e Conformità tra Dati e Funzione Densità
2
• Si calcolano le
p0i =
∫
f0 ( x ) dx
Ci
cioè le probabilità che una osservazione appartenga
alla classe i-esima, se è vera H 0 .
• Si determinano i valori di ki e si esegue il test come
illustrato in precedenza.
Docenti: Gaspare Galati – Gabriele Pavan
73
Teoria dei Fenomeni Aleatori
AA 2012/13
Test del χ e Conformità tra Dati e Funzione Densità
2
Esempio: Per un tempo di 30 minuti un radar esplora lo
spazio aereo circostante. Sono registrati 146 rilevamenti
così distribuiti in 6 intervalli di 5 minuti:
Intervallo N. Numero di rilevamenti
1
2
3
4
5
6
Docenti: Gaspare Galati – Gabriele Pavan
33
24
18
34
15
22
74
Teoria dei Fenomeni Aleatori
AA 2012/13
Esempio (segue)
Si verifichi, con una probabilità di errore del I° tipo di
0.05, se i rilevamenti sono un fenomeno stazionario
(uniforme nel tempo) o no. Si ripeta la verifica per una
probabilità di errore del I° tipo di 0.01.
T = 30 minuti
i
1
2
N = 146
3
4
5
6
Intervallo di tempo 0 ÷ 5 5 ÷ 10 10 ÷ 15 15 ÷ 20 20 ÷ 25 25 ÷ 30
ki
Docenti: Gaspare Galati – Gabriele Pavan
33
24
18
34
15
22
75
Teoria dei Fenomeni Aleatori
AA 2012/13
Esempio (segue)
Per verificare che i rilevamenti sono un fenomeno
uniforme nel tempo:
1
P0i =
6
∀i = 1,2,...,6
Utilizzando il test del Chi-quadro si ha:
6
q=
∑
( ki − Np0i )
i =1
• α = 0.05
• α = 0.01
q>
2
χ0.95
2
Np0i
( 5 ) = 11.07
= 12.38
H 0 è respinta.
2
q < χ0.99
( 5 ) = 15.08 H 0 non è respinta.
Docenti: Gaspare Galati – Gabriele Pavan
76