Teoria dei Fenomeni Aleatori AA 2012/13 Verifica delle Ipotesi Statistiche Parametriche • Data la v.a. X con distribuzione F ( x; θ ) , che dipenderà da uno o più parametri (con θ scalare o vettore), una ipotesi statistica parametrica è un'assunzione riguardante i valori di θ. • La verifica delle ipotesi è un processo mediante il quale si stabilisce se un'ipotesi statistica può essere considerata valida oppure no. Docenti: Gaspare Galati – Gabriele Pavan 1 Teoria dei Fenomeni Aleatori AA 2012/13 Ipotesi Nulla ed Ipotesi Alternativa Si indichi con D lo spazio dei parametri θ. Su D si effettua una partizione in due sottinsiemi: D0 e D1 • L'ipotesi nulla (o di base) H 0 è: θ∈ D0 . • L'ipotesi alternativa H 1 è: θ ∈ D1 . L'ipotesi nulla, che deve essere verificata, è in genere basata sulla esperienza. Docenti: Gaspare Galati – Gabriele Pavan 2 Teoria dei Fenomeni Aleatori AA 2012/13 Ipotesi Semplici e Composte • Un'ipotesi è semplice se l'insieme dei parametri ad essa associato ( D0 per H 0 , D1 per H 1 ) è costituito da un solo elemento, altrimenti si dice che l'ipotesi è composta. • H 0 è, nella maggior parte dei casi, semplice: θ = θ0 . • Tipicamente l'insieme D1 è invece costituito da uno dei seguenti tre insiemi di valori di θ: θ ≠ θ0 Docenti: Gaspare Galati – Gabriele Pavan θ > θ0 θ < θ0 3 Teoria dei Fenomeni Aleatori AA 2012/13 Il Test Statistico • Il test statistico è una regola di decisione che consente, sulla base dei dati sperimentali, di (accettare o) rifiutare, in termini probabilistici, H 0 . • Lo spazio dei campioni generati sotto l'ipotesi nulla H 0 viene “partizionato” in due sottoinsiemi: Da (regione di accettazione) Dc (regione critica) Docenti: Gaspare Galati – Gabriele Pavan 4 Teoria dei Fenomeni Aleatori AA 2012/13 Il Test Statistico • La partizione dovrà essere tale che f ( x | H 0 ) sia “trascurabile” in Dc ed invece elevata in Da . Probabilità di Errore di Primo Tipo α = P { X ∈ Dc H 0 } α è detto anche livello di significatività del test. Probabilità di Errore di Secondo Tipo β ( θ ) = P { X ∉ Dc H 1 } La quantità 1 − β è chiamata potenza del test. Docenti: Gaspare Galati – Gabriele Pavan 5 Teoria dei Fenomeni Aleatori AA 2012/13 Probabilità di errore in un test sulla media di campione f X x H1 f X x H0 0 Da x Dc Le ipotesi sono le seguenti: H 0 : { X = θ0 = 0} Docenti: Gaspare Galati – Gabriele Pavan , H 1 : { X = θ} con θ > 0 6 Teoria dei Fenomeni Aleatori AA 2012/13 Verifica delle Ipotesi Statistiche Parametriche • Al variare di H 0 e di H 1 (ovvero di θ0 e θ nello spazio dei parametri), α ( θ0 ) e β ( θ ) descrivono due funzioni. • Di norma θ0 è fissato e quindi α è fissata. • β ( θ ) è chiamata la caratteristica operativa del test. • L'obiettivo di rendere simultaneamente minimi (al limite nulli) i due errori α e β è irrealizzabile. Docenti: Gaspare Galati – Gabriele Pavan 7 Teoria dei Fenomeni Aleatori AA 2012/13 Verifica delle Ipotesi Statistiche Parametriche • Il test è condotto assegnando un valore ad α e scegliendo la Dc in modo da minimizzare β (test più potente). • Se la Dc non dipende da θ il test è detto uniformemente più potente. Docenti: Gaspare Galati – Gabriele Pavan 8 Teoria dei Fenomeni Aleatori AA 2012/13 Statistica del Test Il test può essere condotto sui campioni {xi } i = 1, 2,..., n oppure su una loro funzione g ( x1 , x2 ,..., xn ) Si può allora formare la variabile aleatoria Q = g ( X 1 , X 2 ,..., X n ) detta statistica del test. Docenti: Gaspare Galati – Gabriele Pavan 9 Teoria dei Fenomeni Aleatori AA 2012/13 Statistica del Test • Se l'ipotesi H 0 viene verificata usando una statistica Q, le regioni critica e di accettazione sono di norma segmenti dell'asse reale (spesso sono semirette). • H 0 è rigettata se q = g ( x1 , x2 ,..., xn ) ∈ Dc . • Le probabilità d'errore sono quindi: α = P {Q ∈ Dc H 0 } = ∫ Dc β ( θ ) = P {Q ∉ Dc H 1 } = Docenti: Gaspare Galati – Gabriele Pavan fQ ( q θ0 ) dq ∫ Da fQ ( q θ ) dq 10 Teoria dei Fenomeni Aleatori AA 2012/13 Verifica delle Ipotesi Statistiche Parametriche Esempio: Per una v.a. X, con densità f ( x; θ ) , si vuole verificare: H 0 : θ = θ0 (semplice) contro una delle ipotesi alternative H 1 (composte): 1. θ ≠ θ0 2. θ > θ0 3. θ < θ0 Si suppone di usare la stessa statistica Q = g ( X ) in tutti i tre casi. Docenti: Gaspare Galati – Gabriele Pavan 11 Teoria dei Fenomeni Aleatori AA 2012/13 Esempio (segue) • Si determina la densità di probabilità di Q = g ( X ) . • Si fissa un valore per il livello di significatività α del test. • Si determinare la regione critica Dc . Essa dipende da quale delle tre ipotesi alternative viene considerata. Docenti: Gaspare Galati – Gabriele Pavan 12 Teoria dei Fenomeni Aleatori AA 2012/13 Esempio (segue) Caso 1) L’ipotesi alternativa è: θ ≠ θ0 La regione critica è: q < c1 e q > c2 α= ∫ c1 −∞ fQ ( q θ0 ) dq + ∫ +∞ c2 fQ ( q θ0 ) dq c1 e c2 si scelgono in modo da minimizzare la lunghezza c2 − c1 . Per semplificare i calcoli: ∫ c1 −∞ α fQ ( q θ0 ) dq = 2 Docenti: Gaspare Galati – Gabriele Pavan ; ∫ +∞ c2 α fQ ( q θ0 ) dq = 2 13 Teoria dei Fenomeni Aleatori AA 2012/13 Esempio (segue caso 1) Q 0 Q 1 2 2 c1 Dc q c2 Dc Caratteristica operativa risultante β ( θ ) Docenti: Gaspare Galati – Gabriele Pavan 14 Teoria dei Fenomeni Aleatori AA 2012/13 Esempio (caso 2) Caso 2) L’ipotesi alternativa è θ > θ0 La regione critica è: q > c α= ∫ +∞ c fQ ( q θ0 ) dq c = q1−α dove q1−α è il percentile 1 − α della statistica del test Q. La caratteristica operativa è: β ( θ )= Docenti: Gaspare Galati – Gabriele Pavan ∫ c −∞ fQ ( q θ ) dq 15 Teoria dei Fenomeni Aleatori AA 2012/13 Esempio (segue caso 2) Q 0 Q c Dc q Caratteristica operativa risultante β ( θ ) Docenti: Gaspare Galati – Gabriele Pavan 16 Teoria dei Fenomeni Aleatori AA 2012/13 Esempio (caso 3) Caso 3) L’ipotesi alternativa è θ < θ0 La regione critica è: q < c α= ∫ c −∞ fQ ( q θ0 ) dq c = qα La caratteristica operativa è invece β ( θ) = ∫ +∞ c Docenti: Gaspare Galati – Gabriele Pavan f ( q θ ) dq 17 Teoria dei Fenomeni Aleatori AA 2012/13 Esempio (caso 3 segue) Q Q Dc 0 c q Caratteristica operativa risultante β ( θ ) Docenti: Gaspare Galati – Gabriele Pavan 18 Teoria dei Fenomeni Aleatori AA 2012/13 Verifica delle Ipotesi Statistiche Parametriche • Se β ( θ ) è troppo elevata si può ridurla aumentando il valore di α fino al massimo consentito. • Se β dovesse risultare ancora troppo elevato, si può aumentare il numero dei campioni. • Dopo aver determinato Dc in base al valore di α ed aver calcolato β ( θ ) , che dipende da H 1 , l'ipotesi nulla viene respinta se il valore della statistica del test cade nella regione critica. Docenti: Gaspare Galati – Gabriele Pavan 19 Teoria dei Fenomeni Aleatori AA 2012/13 Valore Probabilistico: p-value Un’informazione più completa della semplice informazione binaria: test superato / non superato è fornita dal cosiddetto: p = * p-value: ∫ +∞ q* Q 0 Q c Docenti: Gaspare Galati – Gabriele Pavan fQ ( q | θ0 ) dq Dc q 20 Teoria dei Fenomeni Aleatori AA 2012/13 Valore Probabilistico: p-value (cont.) p* = p-value: ∫ q* −∞ fQ ( q | θ0 ) dq Q Q Dc c 0 q Il p-value è ottenuto dalla funzione di densità della statistica del test nell’ipotesi H 0 . Docenti: Gaspare Galati – Gabriele Pavan 21 Teoria dei Fenomeni Aleatori AA 2012/13 Valore Probabilistico: p-value (cont.) • Se la statistica del test (in corrispondenza ad un rilevamento fatto q* ) dà luogo ad un p-value più basso del livello di significatività α si respinge H 0 . • Il p-value p* fornisce un’indicazione della “verosimiglianza” dell’ipotesi H 0 , che cresce al crescere di p* . • Tuttavia valori di p* troppo vicini all’unità possono far sospettare che i dati su cui è stata calcolata la statistica del test siano stati truccati per indurre a propendere per l’ipotesi H0 . Docenti: Gaspare Galati – Gabriele Pavan 22 Teoria dei Fenomeni Aleatori AA 2012/13 Test sul Valor Medio Data la v.a. X con valore atteso η, si vuole verificare: H 0 : η = η0 contro una delle tre ipotesi alternative H 1 : η ≠ η0 , η > η0 , η < η0 2 σ La varianza di X può essere nota oppure incognita, in quest’ultimo caso si utilizza la varianza campionaria nella definizione della statistica del test. Docenti: Gaspare Galati – Gabriele Pavan 23 Teoria dei Fenomeni Aleatori AA 2012/13 Test sul Valor Medio - Varianza nota (segue) Si utilizza la statistica: X − η0 Q= σ n 1 •X =n n ∑x i media campionaria distribuita i =1 σ2 con legge gaussiana: E ⎣⎡ X ⎤⎦ = η , Var ⎡⎣ X ⎤⎦ = n (esatta se X è Normale, asintotica se non lo è). • n è la numerosità del campione. Docenti: Gaspare Galati – Gabriele Pavan 24 Teoria dei Fenomeni Aleatori AA 2012/13 Test sul Valor Medio - Varianza nota (segue) • Sotto l'ipotesi di base: H 0 : η = η0 Q è distribuita con legge Gaussiana standard. • Se si considera l’ipotesi alternativa: H 1 : η ≠ η0 si tratta di una ipotesi bilaterale. Docenti: Gaspare Galati – Gabriele Pavan 25 Teoria dei Fenomeni Aleatori AA 2012/13 fQ (z) = N(0,1) 2 2 z Da zα / 2 = − z1−α / 2 z1−α / 2 Regione di accettazione: test sul valor medio. Caso Bilaterale Docenti: Gaspare Galati – Gabriele Pavan 26 Teoria dei Fenomeni Aleatori AA 2012/13 Test sul Valor Medio - Varianza nota (segue) Se si considera l’ipotesi H 1 : η > η0 , (ipotesi unilaterale). fQ (z) z Da z1−α Regione di accettazione, test sul valor medio. Caso unilaterale Docenti: Gaspare Galati – Gabriele Pavan 27 Teoria dei Fenomeni Aleatori AA 2012/13 Test sul Valor Medio - Varianza nota (segue) Calcolo della caratteristica operativa: • Ipotesi H 1 : η ≠ η0 { } β ( η) = P z α ≤ Q ≤ z1− α H 1 = = ∫ 2 ⎡ ( u − η )2 ⎤ 1 Q ⎢ ⎥ du = exp − 2 ⎢ ⎥ 2π ⎣ ⎦ z1−α / 2 zα / 2 ( 2 ) ( = G z1− α − ηQ − G z α − ηQ con G ( x ) = Docenti: Gaspare Galati – Gabriele Pavan 2 1 2π ∫ x −∞ 2 ) 2 − t2 e dt Gaussiana Standard. 28 Teoria dei Fenomeni Aleatori AA 2012/13 Test sul Valor Medio - Varianza nota (segue) ( ) f (q) H1 H0 2 2 q 0 q Da Calcolo della potenza del test sul valore medio. Caso bilaterale. Docenti: Gaspare Galati – Gabriele Pavan 29 Teoria dei Fenomeni Aleatori AA 2012/13 Test sul Valor Medio - Varianza nota (segue) • Ipotesi H 1 : η > η0 β ( η) = P {Q ≤ z1−α H 1 } = = ∫ z1−α −∞ ⎡ ( u − η )2 ⎤ 1 Q ⎢ ⎥ du = G ( z1−α − ηQ ) exp − 2 ⎢ ⎥ 2π ⎣ ⎦ • Ipotesi H 1 : η < η0 β ( η) = P {Q ≥ zα H 1 } = = ∫ ∞ zα ⎡ ( u − η )2 ⎤ 1 Q ⎢ ⎥ du = 1 − G ( zα − ηQ ) exp − 2 ⎢ ⎥ 2π ⎣ ⎦ Docenti: Gaspare Galati – Gabriele Pavan 30 Teoria dei Fenomeni Aleatori AA 2012/13 Test sul Valor Medio - Varianza nota (segue) ( ) 1 1- H1 : = 0 0 ( ) ( ) 1- 1- H1 : > 0 H1 : 0 < 0 0 Errore di secondo tipo del test sul valore medio Docenti: Gaspare Galati – Gabriele Pavan 31 Teoria dei Fenomeni Aleatori AA 2012/13 Test sul Valor Medio - Varianza Incognita • Si utilizza la varianza “corretta” del campione: 1 S = n −1 2 n ∑( X − X ) 2 i i =1 σ ⎞ ⎛ ⎟ , la v.a. Assumendo X Normale: N ⎜ η ; n⎠ ⎝ 2 ha distribuzione Docenti: Gaspare Galati – Gabriele Pavan S ( n − 1) 2 σ χ 2 ( n − 1) . 32 Teoria dei Fenomeni Aleatori AA 2012/13 Test sul Valor Medio - Varianza Incognita • Come statistica del test può essere usata la v.a.: X − η0 Q= S/ n che risulta distribuita secondo la legge t di Student con n − 1 gradi di libertà. X − η0 T ( n − 1) = S/ n Docenti: Gaspare Galati – Gabriele Pavan 33 Teoria dei Fenomeni Aleatori AA 2012/13 Infatti: X − η0 Z= , σ/ n 2 S W = ( n − 1) 2 σ sono indipendenti, con Z è una N ( 0,1) , W è una χ 2 ( n − 1) Z W / ( n − 1) = X − η0 σ/ n X − η0 = 2 S/ n n 1 S − ( ) σ 2 ( n − 1) è distribuito come una Student con ( n − 1 ) gradi di libertà. Docenti: Gaspare Galati – Gabriele Pavan 34 Teoria T dei Fenome eni Aleatori AA 2012/13 3 Variab V ile di S Studentt: Docenti: D Gaspare Galati – Gabriele e Pavan 35 Teoria dei Fenomeni Aleatori AA 2012/13 Test sul Valor Medio - Varianza Incognita • Per la determinazione delle regioni critiche e di accettazione si procede in modo analogo al caso della varianza nota. Docenti: Gaspare Galati – Gabriele Pavan 36 Teoria dei Fenomeni Aleatori AA 2012/13 Test sul Valor Medio - Varianza Incognita (segue) a) H 1 : η ≠ η0 Reg. Acc.: t α2 ( n − 1) ≤ q ≤ t1− α2 ( n − 1) Reg. Crit.: q > t α2 ( n − 1) b) H 1 : η > η0 Reg. Acc.: q ≤ t1−α ( n − 1) Reg. Crit.: q > t1−α ( n − 1) c) H 1 : η < η0 Reg. Acc.: q ≥ tα ( n − 1) Reg. Crit.: q < tα ( n − 1) Docenti: Gaspare Galati – Gabriele Pavan 37 Teoria dei Fenomeni Aleatori AA 2012/13 Test sul Valor Medio - Varianza Incognita (segue) • La funzione di potenza si calcola dopo aver determinato la distribuzione di probabilità della statistica Q sotto l'ipotesi H 1 . • Nel caso di H 1 : η ≠ η0 la v.a. Q è distribuita secondo una legge t di Student non centrale. Docenti: Gaspare Galati – Gabriele Pavan 38 Teoria dei Fenomeni Aleatori AA 2012/13 Test sulla Varianza • Data una v.a. X distribuita secondo una legge N ( η; σ ) si vuole verificare l’ipotesi: H 0 : σ = σ0 contro H 1 : σ ≠ σ0 oppure ( σ > σ0 , σ < σ0 ) • La statistica assunta per il test è diversa a seconda che si supponga η (il valore atteso di X) noto oppure no. Docenti: Gaspare Galati – Gabriele Pavan 39 Teoria dei Fenomeni Aleatori AA 2012/13 Test sulla Varianza - Valore Atteso Noto • Si può usare la seguente statistica di test n Q= ∑ i =1 ( X i − η) 2 2 σ0 L’uso della questa statistica si giustifica come segue. • Sotto l'ipotesi H 0 la v.a. Q segue una legge Chi Quadro con n gradi di libertà, essendo la somma dei quadrati di n variabili aleatorie Gaussiane standard. Docenti: Gaspare Galati – Gabriele Pavan 40 Teoria dei Fenomeni Aleatori AA 2012/13 Test sulla Varianza - Valore Atteso Noto (segue) Esempio: Gli errori di due strumenti di misura che si vogliono confrontare, sono distribuiti secondo una legge Normale con valore atteso nullo. • Errore del I° strumento V0 : N ( 0; σ0 = 0.1mm ) . • Errore del II° strumento V1 : N ( 0;σ ) con σ incognito. • Le ipotesi da verificare sono: H 0 : σ = σ0 = 0.1 mm e H 1 : σ ≠ σ0 • Il livello di confidenza desiderato è α = 0.05 . Docenti: Gaspare Galati – Gabriele Pavan 41 Teoria dei Fenomeni Aleatori AA 2012/13 Test sulla Varianza - Valore Atteso Noto (segue) Esempio (segue): Per effettuare il test si eseguono 10 misure di uno stesso oggetto lungo η = 8 mm con lo stesso strumento. Le misure forniscono 10 campioni di: X = η + Vi xi = 8.15 ; 7.93 ; 8.22 ; 8.04 ; 7.85 ; 7.95 ; 8.06 ; 8.12 ; 7.86 ; 7.92 Docenti: Gaspare Galati – Gabriele Pavan 42 Teoria dei Fenomeni Aleatori AA 2012/13 Test sulla Varianza - Valore Atteso Noto (segue) Esempio (segue): La statistica del test vale 10 q= ∑ ( xi − 8 ) i =1 0.01 2 = 14.64 I limiti della regione di accettazione sono: χ 2 0 .0 2 5 (1 0 ) = 3 .2 5 χ 2 0 .9 7 5 (1 0 ) = 2 0 .4 8 Poiché q ricade entro questi limiti H 0 : σ = σ0 non viene respinta. Docenti: Gaspare Galati – Gabriele Pavan 43 Teoria dei Fenomeni Aleatori AA 2012/13 Test sulla Varianza - Valore Atteso Incognito • Se η è incognito lo si può stimare mediante 1 X= n n ∑X i i =1 La statistica del test è quindi: n Q= ∑ i =1 ( Xi − X ) 2 2 σ0 • Avendo usato nel definire Q un vincolo (l'espressione 2 χ di X ), la sua distribuzione è una ( n − 1) . Docenti: Gaspare Galati – Gabriele Pavan 44 Teoria dei Fenomeni Aleatori AA 2012/13 Test sulla Varianza - Valore Atteso Incognito (segue) Se nell'esempio precedente la lunghezza dell'oggetto η non è nota, dal campione si ricava: 10 X = 8.01 ; q= ∑ i =1 ( xi − X ) 0.01 2 = 14.54 Usando lo stesso livello di confidenza ( α = 0.05 ), i limiti della regione di accettazione sono i percentili: 2 χ0.025 ( 9 ) = 2.70 2 χ0.975 ( 9 ) = 19.02 q ricade all'interno della regione di accettazione, anche in questo caso l'ipotesi H 0 non viene respinta. Docenti: Gaspare Galati – Gabriele Pavan 45 Teoria dei Fenomeni Aleatori AA 2012/13 Test sulla Probabilità • Dato un evento A, con probabilità p = P ( A ) , si può verificare se la sua probabilità è uguale a p0 . L'ipotesi di base è quindi: H 0 : p = p0 contro una delle tre ipotesi: H 1 : p ≠ p0 , p > p0 , p < p0 Docenti: Gaspare Galati – Gabriele Pavan 46 Teoria dei Fenomeni Aleatori AA 2012/13 Test sulla Probabilità • Come statistica del test può essere utilizzato il numero k di volte in cui l'evento A si è verificato nel corso di n prove. • La v.a. K ha una distribuzione Binomiale con E [ K ] = np e Var [ K ] = npq ( q = 1 − p ). • Se l'ipotesi alternativa è H 1 : p ≠ p0 , allora il test è bilaterale e può essere condotto come segue: Docenti: Gaspare Galati – Gabriele Pavan 47 Teoria dei Fenomeni Aleatori AA 2012/13 Test sulla Probabilità a) si sceglie un valore per il livello di significatività α; b) si determinano il più grande intero k1 ed il più piccolo intero k2 tali che: k1 ⎛ n ⎞ k n −k α ⎜ k ⎟ p0 ⋅ q0 ≤ 2 k =0 ⎝ ⎠ ∑ n ⎛ n ⎞ k n −k α ⎜ k ⎟ p0 ⋅ q0 ≤ 2 k = k2 ⎝ ⎠ ∑ c) si conta il numero k di successi (realizzazioni di A) in n prove; d) non si respinge H 0 se k1 < k < k2 . Docenti: Gaspare Galati – Gabriele Pavan 48 Teoria dei Fenomeni Aleatori AA 2012/13 Test sulla Probabilità (segue) • La Prob. di errore di I° tipo ottenuta è minore di α . P (X = k) n =9 k1 = 1 k2 = 7 H0 H1 2 2 1 k1 2 3 4 5 6 7 8 9 10 k k2 p = p0 = 0.4 (ipotesi H0) e p = 0.6 (ipotesi H1) Docenti: Gaspare Galati – Gabriele Pavan 49 Teoria dei Fenomeni Aleatori AA 2012/13 Test sulla Probabilità (segue) • La caratteristica operativa è ( H 1 : p ≠ p0 ): k 2 −1 ⎛ n ⎞ k n −k β ( p ) = P {k1 < K < k2 H 1 } = ⎜k ⎟ p q k = k1 +1 ⎝ ⎠ ∑ • Se il campione ha dimensione elevata (n grande): k1 = np0 + z α np0 (1 − p0 ) ; k2 = np0 − z α np0 (1 − p0 ) 2 2 ⎛ k2 − np ⎞ ⎛ k1 − np ⎞ β( p) = G ⎜ ⎟ −G⎜ ⎟ ⎝ npq ⎠ ⎝ npq ⎠ con G ( x ) di distribuzione della Gaussiana standard. Docenti: Gaspare Galati – Gabriele Pavan 50 Teoria dei Fenomeni Aleatori AA 2012/13 Test di Scorrelazione • Date due variabili aleatorie X ed Y, si vuole verificare se esse sono tra loro scorrelate oppure no. H 0 : r = 0 e H1 : r ≠ 0 Il test può essere condotto come segue: • Si prelevano n coppie di campioni ( xi , yi ) • Si stima r̂ (coefficiente di correlazione campionario) rˆ = ∑ ( xi − X )( yi − Y ) ∑ ( xi − X ) ∑ ( yi − Y ) 2 2 i = 1, ..., n; X ed Y indicano le medie campionarie. Docenti: Gaspare Galati – Gabriele Pavan 51 Teoria dei Fenomeni Aleatori AA 2012/13 Test di Scorrelazione (segue) • Si introduce la variabile di Fisher W, legata ad r̂ da: 1 1 + rˆ W = ln 2 1 − rˆ • Si utilizza come statistica del test è Q =W n −3 Sotto H 0 , la v.a. W segue approssimativamente, per 1 ⎞ ⎛ n grande, una distribuzione normale N ⎜ 0; ⎟; n−3 ⎠ ⎝ pertanto Q è distribuita come Gaussiana standard. Docenti: Gaspare Galati – Gabriele Pavan 52 Teoria dei Fenomeni Aleatori AA 2012/13 Le Ipotesi Statistiche Non Parametriche • Nel caso di ipotesi statistiche non parametriche le ipotesi da confrontare non dipendono da un parametro ma sono del tipo: H 0 : F ( x ) = F0 ( x ) e H 1 : F ( x ) ≠ F0 ( x ) cioè si tratta di verificare se la v.a. X segue o meno una fissata distribuzione di probabilità F0 ( x ) . • Test di Kolmogorov - Smirnov (K.S.) • Test del Chi Quadro Docenti: Gaspare Galati – Gabriele Pavan 53 Teoria dei Fenomeni Aleatori AA 2012/13 Test di Kolmogorov - Smirnov (K.S.) • Lo scopo di questo test è di verificare se la funzione di distribuzione F ( x ) della v.a. X corrisponde ad una dato modello: H 0 : F ( x ) = F0 ( x ) e H 1 : F ( x ) ≠ F0 ( x ) • Si fa uso della distribuzione empirica F̂ ( x ) : funzione 1 , con n a gradini in numero di n di altezza n numerosità del campione. Docenti: Gaspare Galati – Gabriele Pavan 54 Teoria T dei Fenome eni Aleatori AA 2012/13 3 Test di Kolmogo orov - Smirn S nov (se egue) Fu unzion ne di distribuz zione empiric e ca F̂ ( x ) = Fn ( x ) e modell m o F0 ( x ) = FX ( x ) Docenti: D Gaspare Galati – Gabriele e Pavan 55 Teoria dei Fenomeni Aleatori AA 2012/13 Test di Kolmogorov - Smirnov (segue) • La F̂ ( x ) è a sua volta aleatoria e dà luogo ad una famiglia aleatoria di funzioni F̂ ( x ) . Si può quindi formare la seguente statistica: Q = max Fˆ ( xi ) − F0 ( xi ) xi • La distribuzione FQ ( q ) non dipende dalla distribuzione F ( x ) . Docenti: Gaspare Galati – Gabriele Pavan 56 Teoria dei Fenomeni Aleatori AA 2012/13 Test di Kolmogorov - Smirnov (segue) • Verifica: se Y è una v.a. con distribuzione FY ( y ) , ottenuta da y = g ( x ) (invertibile), si ha −1 ⎡ FY ( y ) = FX ⎣ g ( y ) ⎤⎦ e, per ogni campione aleatorio yi = g ( xi ) , i = 1,..., n : FY ( yi ) = FX ⎡⎣ g −1 ( yi ) ⎤⎦ da cui risulta: max Fˆ X ( x ) − FX ( x ) = max FˆY ( y ) − FY ( y ) xi Docenti: Gaspare Galati – Gabriele Pavan yi 57 Teoria dei Fenomeni Aleatori AA 2012/13 Test di Kolmogorov - Smirnov (segue) • La forma esatta di FQ ( q ) è comunque complicata. FQ ( q ) = P {Q ≤ q} = 1 − 2 ∞ ∑ ( −1 ) k =1 k −1 2 2 ⎡ exp ⎣ −2nk q ⎤⎦ Si può usare la seguente approssimazione dovuta a Kolmogoroff (sviluppo al primo ordine): ( FQ ( q ) ≅ 1 − 2 exp −2nq 2 ) 1 per q > n dove n è il numero dei campioni usato per la stima empirica di F ( x ) . Docenti: Gaspare Galati – Gabriele Pavan 58 Teoria dei Fenomeni Aleatori AA 2012/13 Test di Kolmogorov - Smirnov (segue) Regione di accettazione: • Se l'ipotesi di base H 0 è vera, si ha E ⎡⎣ Fˆ ( x ) ⎤⎦ = F0 ( x ) Poiché Q assume solamente valori positivi, H0 è rigettata se, definita una costante positiva "c", la statistica del test assume un valore maggiore di c. • Si fissa un livello di significatività α, il valore di c si determina mediante la relazione: Docenti: Gaspare Galati – Gabriele Pavan 59 Teoria dei Fenomeni Aleatori AA 2012/13 Test di Kolmogorov - Smirnov (segue) Regione di accettazione: P {Q > c H 0 } = α ( α = P {Q > c H 0 } = 1 − FQ ( c ) ≈ 2 exp −2nc 2 ) 1 ⎛α⎞ c = − ⋅ ln ⎜ ⎟ 2n ⎝ 2 ⎠ e quindi la regola di decisione è: • Se q ≤ c non si respinge H 0 • Se q > c si respinge H 0 Docenti: Gaspare Galati – Gabriele Pavan 60 Teoria dei Fenomeni Aleatori AA 2012/13 Test di Kolmogorov - Smirnov, Esempio numerico Da una rilevazione del quoziente di intelligenza ( xi ) su 40 studenti, si ottengono i seguenti risultati: xi 75 80 85 F̂ ( xi ) .025 .075 .15 90 95 100 105 110 115 120 .275 .425 .625 .775 .875 .925 .975 F0 ( xi ) .006 .023 .067 .159 .308 .500 .691 .841 .933 .977 Δxi .019 .052 .083 .116 .117 .125 .084 .034 .008 .002 H 0 : F0 ( x ) legge Normale N ( η = 100,σ = 10 ) . Docenti: Gaspare Galati – Gabriele Pavan 61 Teoria dei Fenomeni Aleatori AA 2012/13 Test di Kolmogorov - Smirnov, Esempio numerico Il massimo di Δ ( x ) = Fˆ ( x ) − F0 ( x ) si ha per x = 100 e vale 0.125. Per un livello di confidenza α = 0.05 si ha inoltre: 1 0.05 c = − ln = 0.2147 80 2 Poiché il valore della statistica q = Δ ( 100 ) = 0.125 < c l'ipotesi di base non viene respinta. Docenti: Gaspare Galati – Gabriele Pavan 62 Teoria dei Fenomeni Aleatori AA 2012/13 Il Test del Chi-Quadro • Scopo del test è stabilire se i dati ottenuti da un esperimento ben si adattano ad un modello teorico. • Per questo si consideri una partizione A1 , A2 ,....., Am dello spazio degli eventi. • Si desidera testare l’ipotesi che le probabilità pi = P ( Ai ) hanno m assegnati valori p0i : H 0 : pi = poi contro l’ipotesi: Docenti: Gaspare Galati – Gabriele Pavan H 1 : pi ≠ poi i=1,...,m per qualche i 63 Teoria dei Fenomeni Aleatori AA 2012/13 Il Test del Chi-Quadro (segue) • Per effettuare il test si ripete l’esperimento n volte denotando con ki il numero di volte in cui si verifica l’evento Ai . • La probabilità (Binomiale generalizzata) P { Ai occorre ki volte} = n! p1k1 p2k2 ⋅⋅⋅ piki ⋅⋅⋅ pmkm = k1 ! k 2 !⋅⋅⋅ ki !⋅⋅⋅ ! km ! m essendo: ∑k = n , ∑ p = 1 i i =1 Docenti: Gaspare Galati – Gabriele Pavan m i i =1 64 Teoria dei Fenomeni Aleatori AA 2012/13 Il Test del Chi-Quadro (segue) • Se si suppone n “grande” ( n >> 1) e p0i “piccolo” (1 − p0i ≅ 1) il che si può ottenere in base ad un’opportuna scelta di m, la Binomiale generalizzata può essere approssimata come: P { Ai occorre ki volte} ≈ 2 ⎫ ⎧⎪ 1 ⎡ ( k − np )2 ⎤ − k np ( ) ⎪ m m 1 1 exp ⎨ − ⎢ + ⋅⋅⋅ + ⎥⎬ 2 np np 1 m ⎢ ⎥⎦ ⎪⎭ ⎪⎩ ⎣ ≈ m −1 ( 2πn ) p1 ⋅⋅⋅ pm Docenti: Gaspare Galati – Gabriele Pavan 65 Teoria dei Fenomeni Aleatori AA 2012/13 Il Test del Chi-Quadro (segue) Nell'ipotesi H 0 si ha pi = p0i . Si sceglie come statistica: m Q= ∑ ( ki − np0i ) Statistica di Pearson np0i i =1 Le variabili aleatorie n essendo 2 ∑( k − np i 0i ( ki − np0i ) np0i )=0 2 2 χ (1) . Inoltre sono solo m − 1 di esse sono i =1 2 χ ( m − 1) . indipendenti, quindi Q segue una legge Docenti: Gaspare Galati – Gabriele Pavan 66 Teoria dei Fenomeni Aleatori AA 2012/13 Il Test del Chi-Quadro (segue) Il test procede come segue: • Si osservano i valori di ki e si calcola il valore di q. 2 χ • Si fissa un valore di α e si calcola 1−α ( m − 1) • Non si respinge l’ipotesi H 0 se e solo se m q= ∑ i =1 ( ki − np0i ) np0i 2 <χ 2 1−α ( m − 1) Sotto H 1 la statistica Q è distribuita secondo una legge Chi Quadro non centrale che dipende dai valori pi ≠ p0i . Docenti: Gaspare Galati – Gabriele Pavan 67 Teoria dei Fenomeni Aleatori AA 2012/13 Il Test del Chi-Quadro: Esempio Si vuole verificare l'ipotesi che un dado non sia truccato. m = 6. Sotto l’ipotesi: 1 H 0 : p0i = 6 i = 1,2,...,6 Lanciando il dado 450 volte si ottengono i valori: i 1 2 ki 66 60 1 np0i = 450 ⋅ = 75 6 Docenti: Gaspare Galati – Gabriele Pavan 3 4 5 6 84 72 81 87 6 q= ∑ i =1 ( ki − 75 ) 75 2 = 7.68 68 Teoria dei Fenomeni Aleatori AA 2012/13 Il Test del Chi-Quadro: Esempio Se si adotta un livello di confidenza α = 0.05 si ha: 2 χ0.95 ( 5 ) = 11.07 essendo 5 il numero di gradi di libertà. Poiché q = 7.68 < 11.07 l'ipotesi H0 non può essere respinta sulla base di questi dati sperimentali. Docenti: Gaspare Galati – Gabriele Pavan 69 Teoria dei Fenomeni Aleatori AA 2012/13 Statistica di Pearson Modificata • Se un certo numero di parametri tra quelli che definiscono H 0 è incognito (per esempio r delle m probabilità p0i ), l'ipotesi nulla si dice incompleta. • Questi parametri mancanti devono essere stimati. Se per la stima si applica il criterio ML: m Q̂ = ∑ i =1 ( ki − npˆ 0i ) 2 ˆ 0i np Statistica di Pearson modificata Dove p̂0i è il valore stimato (o noto). Docenti: Gaspare Galati – Gabriele Pavan 70 Teoria dei Fenomeni Aleatori AA 2012/13 Statistica di Pearson Modificata • Per valori elevati di n la statistica di Pearson è distribuita secondo una legge: χ 2 ( m − r − 1) • La regione critica è quindi: q̂ > χ12−α ( m − r − 1) • In sostanza la stima di r quantità, utilizzate nel test, tramite gli stessi campioni del test diminuisce ulteriormente della quantità r i gradi di libertà. Docenti: Gaspare Galati – Gabriele Pavan 71 Teoria dei Fenomeni Aleatori AA 2012/13 Test del χ e Conformità tra Dati e Funzione Densità 2 • Si vuole verificare ⎧⎪ f X ( x ) = f0 ( x ) ⎨ ⎪⎩ f X ( x ) ≠ f0 ( x ) se è vero H 0 se è vero H 1 • Le osservazioni (dati) costituiscono un campione aleatorio di numerosità n. • In alternativa al test KS si può utilizzare il test del χ 2 suddividendo il dominio delle realizzazioni di X in m classi: Docenti: Gaspare Galati – Gabriele Pavan C1 , C2 ,..., Cm 72 Teoria dei Fenomeni Aleatori AA 2012/13 Test del χ e Conformità tra Dati e Funzione Densità 2 • Si calcolano le p0i = ∫ f0 ( x ) dx Ci cioè le probabilità che una osservazione appartenga alla classe i-esima, se è vera H 0 . • Si determinano i valori di ki e si esegue il test come illustrato in precedenza. Docenti: Gaspare Galati – Gabriele Pavan 73 Teoria dei Fenomeni Aleatori AA 2012/13 Test del χ e Conformità tra Dati e Funzione Densità 2 Esempio: Per un tempo di 30 minuti un radar esplora lo spazio aereo circostante. Sono registrati 146 rilevamenti così distribuiti in 6 intervalli di 5 minuti: Intervallo N. Numero di rilevamenti 1 2 3 4 5 6 Docenti: Gaspare Galati – Gabriele Pavan 33 24 18 34 15 22 74 Teoria dei Fenomeni Aleatori AA 2012/13 Esempio (segue) Si verifichi, con una probabilità di errore del I° tipo di 0.05, se i rilevamenti sono un fenomeno stazionario (uniforme nel tempo) o no. Si ripeta la verifica per una probabilità di errore del I° tipo di 0.01. T = 30 minuti i 1 2 N = 146 3 4 5 6 Intervallo di tempo 0 ÷ 5 5 ÷ 10 10 ÷ 15 15 ÷ 20 20 ÷ 25 25 ÷ 30 ki Docenti: Gaspare Galati – Gabriele Pavan 33 24 18 34 15 22 75 Teoria dei Fenomeni Aleatori AA 2012/13 Esempio (segue) Per verificare che i rilevamenti sono un fenomeno uniforme nel tempo: 1 P0i = 6 ∀i = 1,2,...,6 Utilizzando il test del Chi-quadro si ha: 6 q= ∑ ( ki − Np0i ) i =1 • α = 0.05 • α = 0.01 q> 2 χ0.95 2 Np0i ( 5 ) = 11.07 = 12.38 H 0 è respinta. 2 q < χ0.99 ( 5 ) = 15.08 H 0 non è respinta. Docenti: Gaspare Galati – Gabriele Pavan 76