Test d’Ipotesi Corso di Teoria dell’Inferenza Statistica a.a. 2007/2008 Secondo Periodo Prof. Filippo DOMMA Corso di Laurea in MQEGA (Metodi Quantitativi per l’Economia e la Gestione delle Aziende) Facoltà di Economia – UniCal Il test statistico è una decisione operativa presa sulla base di risultati sperimentali, tenendo conto di considerazioni probabilistiche. La problematica del test può essere suddivisa in tre fasi: a. formulare una ipotesi sulla v.c. X; b. osservare il campione casuale; c. in base ai risultati campionari decidere se accettare o rifiutare l’ipotesi fatta. Test d'Ipotesi F. Domma 2 Definizione. Un’ipotesi statistica è una affermazione sulla distribuzione di una o più variabili casuali. Se l’ipotesi statistica specifica completamente la distribuzione della v.c. allora l’ipotesi è detta semplice; in caso contrario, viene chiamata ipotesi statistica composta. Le ipotesi verranno indicate con la lettera H. Esempi. Test d'Ipotesi Data una v.c. X~N(m,9) a. l’ipotesi H: m=15 è semplice perché specifica completamente la distribuzione della v.c. X; b. l’ipotesi H: m>15 è composta. F. Domma 3 Prima Fase. Dato un modello parametrico M={ X , P }, sia Q0 un sottoinsieme dello spazio parametrico Q. Si vuole verificare H 0 : Q0 Ipotesi NULLA contro H1 : Q1 dove Ipotesi ALTERNATIVA Q0 Q1 Q e Q0 Q1 L’ipotesi statistica riguardante la v.c. X e, quindi, il parametro , implica una bipartizione dello spazio parametrico Q in due regioni, Q0 e Q1, di cui una rappresenta l’ipotesi nulla H0 e la complementare rappresenta l’alternativa H1. Test d'Ipotesi F. Domma 4 Seconda Fase: consiste nell’estrazione dallo spazio campionario del campione x=(x1,…,xn). Terza Fase (prendere una decisione su H): viene condotta sullo spazio campionario. Più precisamente, si suddivide lo spazio campionario in due regioni, C0 e C1 tali che C0 C1 χ e C0 C1 Se x (x1 ,..., x n ) C1 Allora si accetta H0 Se x (x1 ,..., x n ) C0 Allora si rifiuta H0 Test d'Ipotesi F. Domma 5 Definizione. Sia C0 quel sottoinsieme dello spazio campionario che in accordo con un prefissato test, conduce al rifiuto dell’ipotesi H0, se il campione osservato x appartiene a C0. Allora C0 è detta regione critica ( o di rifiuto) del test. Test d'Ipotesi F. Domma 6 In sintesi, le fasi di un test possono essere così rappresentate: Spazio parametrico Θ Spazio campionario Θ1 Θ0 χ C0 H1 : Θ1 Se x appartiene a C0 allora rifiutoH0 Regione Critica C1 Regione di Accettazione H 0 : Θ0 Se x appartiene a C1 allora accetto H0 Da ciò deriva che la regola di decisione se accettare o rifiutare H0 è una bipartizione dello spazio campionario. Test d'Ipotesi F. Domma 7 Possiamo concludere affermando che: il test è una corrispondenza tra lo spazio campionario e lo spazio parametrico, dove il primo è suddiviso in due regioni (C0 e C1) secondo la regola di decisione ( è il fulcro del test ), mentre lo spazio parametrico è diviso in due regioni (Q0 e Q1) a seconda delle ipotesi da verificare. Naturalmente, la corrispondenza tra X e Q ha senso solo se valutata in termini probabilistici. Quindi, dobbiamo chiederci qual è la probabilità che il campione appartenga, ad esempio, alla regione critica, cioè: PX C0 / H i i=0,1, la quale può essere calcolata assumendo vera una delle ipotesi. Test d'Ipotesi F. Domma 8 In tale contesto, si possono avere quattro situazioni possibili, ottenute dalla combinazione dei due “stati di natura” (H0 vera, H0 falsa) con le due “azioni possibili” (accetto H0, rifiuto H0), cioè STATI di NATURA AZIONI POSSIBILI Test d'Ipotesi Vera H0 Accetto H0 G1 Rifiuto H0 E1 F. Domma Falsa H0 E2 G2 9 Descrizione degli eventi: G1: in base al campione decido di accettare H0 e H0 è vera; G2: in base al campione decido di rifiutare H0 e H0 è falsa; E1: in base al campione decido di rifiutare H0 e H0 è vera; E2: in base al campione decido di accettare H0 e H0 è falsa; Probabilità degli eventi: Pr G1 Pr Accetto H0 / H0 è vera Pr X C0 / H0 1 Pr G 2 Pr Rifiuto H0 / H0 è falsa Pr X C0 / H1 1 Pr E1 Pr Rifiuto H0 / H0 è vera Pr X C0 / H0 Pr E 2 Pr Accetto H0 / H0 è falsa Pr X C0 / H1 Test d'Ipotesi F. Domma 10 Spesso E1 viene definito come errore di primo tipo ed E2 errore di secondo tipo. Concludendo si ha: STATI di NATURA AZIONI POSSIBILI Test d'Ipotesi x C0 x C0 F. Domma Vera H0 1 Falsa H0 1 11 Definizione. Funzione di Potenza. La funzione di potenza di un test di un’ipotesi statistica H0 contro un’ipotesi alternativa H1, è quella funzione, definita per tutte le distribuzioni sotto considerazione (le ipotesi), che fornisce la probabilità che il campione cada nella regione critica C0 del test, cioè una funzione che fornisce la probabilità di rifiutare l’ipotesi sotto considerazione. Il valore della funzione di potenza in corrispondenza di un punto dello spazio parametrico è detta potenza del test. Formalizzando abbiamo: K() PX C0 / Hi Test d'Ipotesi F. Domma 12 Definizione. Livello di significatività. Il livello di significatività del test (o ampiezza della regione critica C0) è il valore massimo della funzione di potenza del test quando H0 è vera. Cioè: K(0 ) PX C0 / H 0 Se H0 è definita come : H0: = 0 K() sup PX C0 / H0 Q0 Se H0 è definita come : H0: Q 0 Test d'Ipotesi F. Domma 13 Si può osservare che l’ipotesi H0 riflette, in generale, la situazione precedente all’esperimento campionario, nel senso che accettando H0 la situazione non cambia. E’ dal rifiuto di H0 che bisogna cautelarsi in quanto tale rifiuto implica una modifica delle condizioni e delle acquisizioni ritenute valide in precedenza, il che implica per lo più costi, rischi, modifiche tecniche, nuove procedure operative, …ecc.. In tal modo si ritiene preferibile commettere un errore non modificando la realtà (errore di secondo tipo) piuttosto che correre il rischio di errare modificando la realtà (errore di primo tipo). Esempio. In un giudizio penale, l’imputato è innocente fino a prova contraria. E’ fondamentale che per il giudice sia H0 l’ipotesi che egli sia innocente. Secondo questa logica si ritiene ben più grave condannare un innocente (errore di I tipo) che assolvere un colpevole (errore di II tipo). Test d'Ipotesi F. Domma 14 Nel tentativo di definire un “buon” test, la ricerca va orientata verso il contenimento probabilistico degli errori, dando maggiore rilevanza all’errore di I tipo, senza ovviamente trascurare quello di II tipo. Un metodo per definire un test ottimale consiste nel fissare l’ampiezza d’errore di I tipo e minimizzare l’ampiezza d’errore di II tipo. Test d'Ipotesi F. Domma 15 Regione critica migliore di ampiezza Definizione. Sia C0 un sottoinsieme dello spazio campionario . Allora C0 è detta regione critica migliore di ampiezza , per verificare l’ipotesi semplice H0:= 0 contro l’ipotesi semplice H1:= 1 se, per ogni sottoinsieme A dello spazio campionario per il quale PX A / H 0 Si ha: i) PX C0 / H 0 ii ) PX C0 / H1 PX A / H1 Test d'Ipotesi F. Domma 16 In altri termini C0 è la regione critica migliore di ampiezza se tra tutte le altre regioni critiche della stessa ampiezza , possiede potenza maggiore o uguale rispetto a tutte le altre regioni critiche. Il test basato su una regione critica migliore è chiamato test più potente. Test d'Ipotesi F. Domma 17 Teorema. (di Neyman e Pearson). Sia X=(X1,…,Xn) un c.c. iid estratto da f(x;). Sia L(;x) la funzione di verosimiglianza di x. Siano 1 e 2 due valori fissati e distinti di tali che Q={: = 1 oppure = 2}; sia, infine, K un numero positivo. Se C0 è un sottoinsieme dello spazio campionario tale che: L( 1 ; x) i) k L( 2 ; x) L( 1 ; x) ii ) k L( 2 ; x) x C0 x C0 iii ) PX C0 / H 0 Allora C0 è una regione critica migliore di ampiezza per verificare l’ipotesi H0:= 1 contro l’ipotesi H1: = 2. Test d'Ipotesi F. Domma 18 Dimostrazione. Test d'Ipotesi F. Domma 19 Non sempre bisogna individuare C0 e k che soddisfano le condizioni poste dal teorema. Spesso si riesce a trasformare la disuguaglianza (i) in una disuguaglianza che riguarda una particolare statistica. Esempio. Test d'Ipotesi F. Domma 20 Test del Rapporto di Verosimiglianza Generalizzato Sia (X1,…,Xn) un c.c. iid estratto da f(x;). Supponiamo di voler effettuare il seguente test: H 0 : Q0 dove Q0 Q1 Q Test d'Ipotesi H1 : Q1 contro e Q0 Q1 F. Domma 21 Definizione. Rapporto di verosimiglianza Generalizzato. Sia L(; x) la funzione di verosimiglianza di un campione x. Si definisce rapporto di verosimiglianza generalizzato la quantità: sup L(; x) ( x) Q 0 sup L(; x) Q Test d'Ipotesi F. Domma 22 Osservazioni: 1. (x) è una funzione del campione osservato x. Sostituendo a x il c.c. X otteniamo (X) è una statistica in quanto non dipende dai valori del parametro . 2. I valori di (x) appartengono all’intervallo [0,1]. 3. I valori della statistica (X) sono usati per il seguente test: H 0 : Q0 contro H1 : Q1 Tramite il rapporto di verosimiglianza si stabilisce che: si rifiuta H0 (x) 0 Test d'Ipotesi F. Domma 23 Dove 0 è una costante determinata dal livello di significatività del test. Il test del rapporto di verosimiglianza generalizzato ha senso anche intuitivamente in quanto (x) tende ad essere piccolo quando H0 non è vera, dato che il denominatore tende ad essere maggiore del numeratore. Per un livello di significatività fissato il corrispondente valore di 0 tale che Pr (X) 0 / H0 può essere determinato in modo esatto solo se è nota la distribuzione campionaria della statistica (X), in altri casi è necessario far riferimento ad approssimazioni per grandi campioni. Test d'Ipotesi F. Domma 24 Esempio. Test d'Ipotesi F. Domma 25 Teorema. Sia X1, X2,… una successione di v.c. iid estratta da f(x;). Consideriamo il test H0:= 0 contro H1: 0 Assumiamo che la sequenza delle radici dell’equazione di verosimiglianza siano consistenti e che siano vere le condizioni di regolarità per la normalità asintotica degli stimatori di massima verosimiglianza. Allora, sotto H0 2 2 ln n (X) n (1) d E’ evidente che si rifiuta H0 se -2ln{(x)} è elevato. In particolare, fissato , se 2 ln{ (x)} 2 (1) rifiuto H 0 Test d'Ipotesi F. Domma 26 Teorema. Sia X1, X2,… una successione di v.c. iid estratta da f(x;). =(1,…, k)Qk Consideriamo il test H 0 : 1 10 , 2 02 ,..., r 0r , r 1 ,..., k H1 : 1 , 2 ,..., r 0 1 dove 0 2 , ,..., r 1 , ..., k 0 1 0 2 0 r 0 r Sono valori noti Non sono specificati Se sono soddisfatte alcune condizioni di regolarità, allora, sotto H0 2 ln n (X) n (r) d Test d'Ipotesi F. Domma 2 27 Test di Significatività a) Individuare una statistica (test) che si comporta in modo diverso sotto le due ipotesi H0 e H1; b) utilizzare il diverso comportamento della statistica per definire il test. Esempio. Dato un c.c. di dimensione 20 estratto da un v.c. N(m,1), si vuole verificare se H0: m=10 contro H1: m=15 Consideriamo la STATISTICA TEST media campionaria; sappiamo che: sotto H 0 1 X ~ N 10, 20 1 sotto H1 X ~ N 15, 20 Test d'Ipotesi F. Domma 28 Graficamente si ha: x Test d'Ipotesi F. Domma 29 1. Osservato il valore della media campionaria H0 se x è " vicino" a 15 rif. H0 H1 se x è " vicino" a 10 acc. H0 10 15 2. Possibili eventi tra 10 e 15 sono: G1: accetto H0 e H0 è vera; G2: rifiuto H0 e H0 è falsa; E1: rifiuto H0 e H0 è vera; E2: accetto H0 e H0 è falsa. Test d'Ipotesi F. Domma 30 3. Problema: costruire una regione (critica) C0 tale che: se x C0 rifiuto H 0 significa individuare, con qualche criterio, un punto (detto punto critico) tra 10 e 15 in modo tale che: se x x 0 x C0 H0 se x x 0 x C0 H1 x0 Test d'Ipotesi F. Domma C0 31 Fissato , sappiamo che Pr X C0 / H 0 Nel caso dell’esempio, fissato , si ha: Pr X x 0 / H 0 1 Pr X x 0 / H 0 X 10 x 0 10 x 0 10 1 Pr 1 z 0 1 1 / 20 1 / 20 1 / 20 dove x 0 10 z0 1 / 20 Si individua dalle tavole della N(0,1) Test d'Ipotesi F. Domma 32 Punto critico è dato da: z0 x 0 10 20 E’ il confine tra la Regione Critica e la Regione di Accettazione. Test d'Ipotesi F. Domma 33 Fasi per la costruzione di un Test di Significatività: 1. Si formulano le ipotesi; 2. Si individua la statistica test; 3. Si fissa il livello di significatività; 4. Si determinano i punti critici; 5. Si costruisce la regione critica; 6. Si estrae il campione e si verifica se il valore della statistica test appartiene oppure non appartiene alla regione critica; 7. Si decide se accettare o rifiutare l’ipotesi nulla. Test d'Ipotesi F. Domma 34 TEST sui parametri di una v.c. NORMALE Dato un c.c. iid di dimensione n, estratto da un v.c. N(m,s20), si vuole verificare se H0: m= m0 contro H1: m= m1 con m0 m1 La STATISTICA TEST media campionaria è tale che sotto H 0 sotto H1 Test d'Ipotesi X ~ Nm , X ~ N m0 , 1 F. Domma s 02 n s 02 n 35 GRAFICO Test d'Ipotesi F. Domma 36 Fissato , determiniamo il punto critico Pr X x 0 / H 0 1 Pr X x 0 / H 0 X m0 x0 m0 x0 m0 1 z 1 Pr 1 1 / n s / n s / n 0 0 dove x 0 m0 z s0 / n Si individua dalle tavole della N(0,1) Test d'Ipotesi F. Domma 37 Da quest’ultima il punto critico risulta essere: s0 x 0 m0 z n E, quindi, la regione critica è: s0 C0 x : x x 0 x : x m 0 z n Osservato il campione, si calcola la media campionaria se x x 0 rifiuto H0 se x x 0 accetto H 0 Test d'Ipotesi F. Domma 38 Calcolo della probabilità d’errore di II tipo: Pr X C0 / H1 Pr X x0 / H1 X m1 x 0 m1 Pr Pr Z z z s0 / n s0 / n Dato che m1 x0 allora Test d'Ipotesi z e s0 sono per ipotesi noti È stato calcolato in precedenza È noto, quindi, dalle tavole possiamo calcolare F. Domma 39 Calcolo della potenza del test: K 1 Pr rifiutare H0 / H0 è falsa X m1 x 0 m1 Pr X x 0 / H1 Pr s0 / n s0 / n Pr Z z 1 z Dove x 0 m1 z s0 / n Test d'Ipotesi F. Domma 40 Si evidenzia che i due errore, e , sono legati da una relazione inversa: - Al diminuire di , il punto critico si sposta a destra e, quindi, aumenta; - al diminuire di , il punto critico si sposta a sinistra e, quindi, aumenta Test d'Ipotesi F. Domma 41 Per diminuire contemporaneamente i due errori, bisogna aumentare la dimensione campionaria; infatti: abbiamo: x 0 m0 1 z Pr X x 0 / H 0 1 s / n 0 x 0 m0 n dove z s0 Dato che il punto critico è maggiore di m0, all’aumentare di n, z aumenta e, quindi, (z) aumenta. Di conseguenza, diminuisce. Test d'Ipotesi F. Domma 42 Al contrario, per l’errore di secondo tipo, si ha: X m1 x m 0 1 Pr X x 0 / H1 Pr z s0 / n s0 / n dove x 0 m1 z n s0 Dato che il punto critico è minore di m1, all’aumentare di n, z diminuisce e, quindi, (z)= diminuisce. Test d'Ipotesi F. Domma 43 TEST sulla media di una v.c. NORMALE Dato un c.c. iid di dimensione n, estratto da un v.c. N(m,s20), si vuole verificare se H0: m= m0 contro H1: m m0 Alternativa BILATERALE La STATISTICA TEST media campionaria è tale che sotto H 0 Test d'Ipotesi X ~ N m0 , F. Domma s 02 n 44 Intuitivamente rifiutiamo H0 per valori della media campionaria molto più grandi di m0 oppure molto più piccoli di m0. In questo caso si individuano due punti critici xs e xd tali che rifiutiamo H0 se x x s Test d'Ipotesi oppure F. Domma se x x d 45 Determinazione dei punti critici. Fissato l’errore di I tipo, ripartiamo sulle code in modo tale che: X m0 x s m0 s Pr X x s / H 0 Pr z 2 2 s / n s / n 0 0 X m 0 xd m 0 d Pr X xd / H 0 Pr 1 z 2 s 0 / n s 0 / n 2 Dalle tavole della N(0,1), calcoliamo z s z 2 s0 x s m0 z 2 n Test d'Ipotesi 2 e z d z 2 2 s0 x d m0 z 2 n F. Domma 46 Regione di rifiuto è data da C0 ( ) x : x xs , x xd s0 s0 x : x m 0 z , x m0 z 2 2 n n La regione critica può essere espressa anche nel seguente modo: C0 () z c : z c z , z c z dove Test d'Ipotesi x m0 zc s0 2 2 n F. Domma 47 La funzione di potenza del test dipende da m k (m) Pr X C0 () / H1 Pr X x s X x d / H1 Pr X x s / H1 Pr X x d / H1 X m X m xs m xd m Pr Pr s0 / n s0 / n s0 / n s0 / n xs m xd m Pr Z Pr Z s0 / n s0 / n xs m xd m 1 s0 / n s0 / n Test d'Ipotesi F. Domma 48 Esempio La degenza ospedaliera per il trattamento di una certa malattia per i pazienti della classe di età 20-40 si distribuisce normalmente con media incognita e deviazione standard pari a 2.1. Posto =0.01 e n=30, determinare: a. la zona di rifiuto del test H0:m=7 contro H1:m>7 b. la potenza del test di cui al punto precedente per m=7.6; 8.5; 9. Test d'Ipotesi F. Domma 49 TEST sulla media di una v.c. NORMALE Dato un c.c. iid di dimensione n, estratto da un v.c. N(m,s2), con varianza sconosciuta, si vuole verificare se H0: m= m0 contro H1: m m0 Alternativa BILATERALE La STATISTICA TEST media campionaria è tale che sotto H0 X ~ N m0 , s2 n Dato che la varianza è sconosciuta, la media campionaria non può essere utilizzata come statistica-test. Test d'Ipotesi F. Domma 50 Sotto H0 X m0 T ~ t (n 1) S/ n Fissato , ripartendo l’errore di primo tipo sulle code, si ha: X m 0 xs m 0 (s) Pr X xs / H 0 Pr Pr T t 2 2 s/ n S/ n X m0 xd m0 (d ) Pr X xd / H 0 Pr Pr T t 2 2 s/ n S/ n Test d'Ipotesi F. Domma 51 dove (s) t 2 xs m 0 s/ n (d ) t 2 xd m 0 s/ n Dalle tavole della t-student si evince che t ( s ) t ( n 1) 2 2 t ( d ) t ( n 1) 2 2 I punti critici risultano: s xs m0 t (n 1) 2 n Test d'Ipotesi s xd m 0 t (n 1) 2 n F. Domma 52 In definitiva la regione critica risulta essere: C0 ( ) x : x xs , x xd s s x : x m0 t (n 1) , x m0 t (n 1) 2 2 n n La regione critica può essere espressa anche nel seguente modo: C0 ( ) tc : tc t (n - 1) , tc t (n - 1) dove Test d'Ipotesi 2 2 x m0 tc s/ n F. Domma 53 Estratto il campione x=(x1,…,xn), si calcola la media campionaria e la varianza campionaria e si verifica se : tc C0 ( ) rifiuta Test d'Ipotesi F. Domma H0 54 Esempio. Una grande catena nazionale di punti vendita di articoli per la casa effettua una svendita di fine stagione di tosaerba. Il numero di tosaerba vendute durante questa liquidazione, in un campione di dieci negozi, è il seguente: 8, 11, 0, 4, 7, 8, 10, 5, 8, 3. Vi sono elementi per sostenere, ad un livello di significatività di 0.05, che durante questa svendita in media siano state svendute più di 5 tosaerba per negozio ? Assumete che il numero di tosaerba sia normalmente distribuito. Test d'Ipotesi F. Domma 55 Dualità tra Intervalli di Confidenza al 100(1-)% e Test di Significatività al livello . Dato un c.c. iid di dimensione n, estratto da un v.c. N(m,s20), con varianza nota, si vuole verificare se H0: m= m0 contro H1: m m0 Alternativa BILATERALE Regione critica s0 s0 C0 ( ) x : x m0 z , x m0 z 2 2 n n Regione di Accettazione s0 s0 A x : m0 z x m0 z 2 2 n n Test d'Ipotesi F. Domma 56 L’Intervallo di confidenza per m è: s0 I .C. x z 2 n s0 , x z n 2 Se H0:m=m0 e m0 appartiene all’I.C. allora accettiamo H0; infatti, si ha: s0 s0 m0 I .C. x z m0 x z 2 2 n n s0 s0 m0 - z x m0 z 2 2 n n x C0 ( ) accetto H0 Vale il viceversa. Test d'Ipotesi F. Domma 57 TEST sulla varianza di una v.c. NORMALE Dato un c.c. iid di dimensione n, estratto da un v.c. N(m,s2), con media e varianza sconosciute, si vuole verificare se H0: s= s0 contro H1: s s0 Alternativa UNILATERALE In tale contesto, sotto H0 sappiamo che (n 1) S 2 2 V ~ (n 1) 2 s0 Test d'Ipotesi F. Domma 58 Fissato , la regione critica è: C0 ( ) Vc : Vc (n 1) dove e 2 (n 1) s Vc 2 s0 2 Pr V ( n 1) 2 Test d'Ipotesi F. Domma 59 Esempio. Si consideri una popolazione statistica adattata da una v.v. Normale con media e varianza incognite. Si estrae un c.c. di numerosità n=16 E si determina il valore della varianza campionaria, s2=25. Si sottoponga a test unilaterale l’ipotesi nulla che la varianza della popolazione sia pari a 23 ad un livello di significatività dell’1%. Test d'Ipotesi F. Domma 60 TEST sulla differenza tra le medie di due v.c. NORMALI Siano X ed Y due v.c. indipendenti e normalmente distribuite, cioè X ~ Nm x , s 2 x X( m1) X ~ N mx , Test d'Ipotesi s 2x m F. Domma Y ~ N my , s 2 y Y( n1) Y ~ N my , s 2y n 61 Posto d=mx-my si vuole costruire il seguente test H0 : d 0 Primo caso: H0 : d 0 contro s 2 x e s 2 y note Stimatore naturale della differenza tra le medie Abbiamo visto che: D XY ED m x m y s s VD m n 2 x Test d'Ipotesi F. Domma 2 y 62 Sotto H0 2 2 s s y D ~ N 0 , x m n Rifiutiamo H0 se i valori di D sono molto diversi dallo zero. Test d'Ipotesi F. Domma 63 Fissato , calcoliamo i punti critici: D d s (s) Pr D d s / H 0 Pr P Z z r 2 V( D ) V( D ) D d d (d) Pr D d d / H 0 Pr Pr Z z 2 V( D ) V( D ) dove z (s) ds V( D ) Test d'Ipotesi ds s s m n 2 x 2 y z (d) F. Domma dd V( D ) dd s 2y s m n 2 x 64 Dalle tavole della N(0,1), si ha: z( s ) z z( d ) z 2 2 Sostituendo otteniamo i punti critici: d s z 2 s s m n 2 x 2 y dd z 2 s 2y s m n 2 x La regione critica è data da: C0 ( ) d : d ds , d dd con dxy Test d'Ipotesi F. Domma 65 Secondo caso: varianze sconosciute ma uguali Stimatore naturale della differenza tra le medie Si ha, inoltre, che ED m x m y s2x s2y s2 D XY s s 1 2 1 VD s m n m n 2 x 2 y Sotto H0 la quantità Z D D ~ N 0 , 1 2 1 1 s 2x s y s m n m n non è una statistica – test perché s è un parametro sconosciuto. Test d'Ipotesi F. Domma 66 Per quanto detto nelle lezioni sugli Intervalli di confidenza, la quantità D m x m x T ~ t( m n 2 ) 1 1 Sp m n dove S 2 p Test d'Ipotesi (m 1)S (n 1)S 2 x 2 y (m n 2) F. Domma 67 Sotto H0 la quantità D T ~ t( m n 2 ) 1 1 Sp m n È una statistica –test per verificare le ipotesi H0 : d 0 contro H0 : d 0 con d=mx-my. Test d'Ipotesi F. Domma 68 Fissato , calcoliamo i punti critici: D d s (s) Pr D d s / H 0 Pr P T t r 1 1 1 1 2 S s p m n p m n D d d (d) Pr D d d / H 0 Pr Pr T t 2 Sp m1 n1 s p m1 n1 dove t (s) sp Test d'Ipotesi ds 1 1 m n t (d) sp F. Domma dd 1 1 m n 69 Dalle tavole della t-Student, si ha: t( s ) t ( m n 2 ) t( d ) t ( m n 2) 2 2 Sostituendo otteniamo i punti critici: d s t ( m n 2 ) s p 1 m n1 dd t ( m n 2) sp 1 m n1 2 2 La regione critica è data da: C0 ( ) d : d ds , d dd con dxy Test d'Ipotesi F. Domma 70 Esempio. Per provare l’utilità terapeutica di due nuovi farmaci, A e B, un gruppo di ricercatori sperimenta entrambi su un gruppo casuale di 10 soggetti. I risultati sperimentali, misurati utilizzando un determinato indice, sono I seguenti: farmaco A: 25, 46, 39, 60, 24, 23, 38, 42, 50, 46 farmaco B: 43, 29, 38, 51, 44, 28, 23, 20, 56, 55 Supponendo che l’utilità terapeutica possa essere adattata statisticamente da distribuzioni normali e che le varianze delle due popolazioni siano uguali, determinare un intervallo di confidenza per la differenza delle utilità terapeutiche medie dei due farmaci al livello di confidenza del 99%. Inoltre, stabilire se la differenza tra le utilità medie è significativamente diversa da zero. Test d'Ipotesi F. Domma 71