Università di Macerata – Dipartimento di Scienze Politiche, della Comunicazione e delle Relaz. Internazionali a.a. 2014 2014--2015 La verifica delle ipotesi Cristina Davino L verifica La ifi d delle ll ipotesi i t i In molte circostanze il ricercatore si trova a dover decidere quale, quale tra le diverse situazioni possibili riferibili alla popolazione, è quella meglio sostenuta dalle evidenze empiriche. Ipotesi statistica: supposizione riguardante: un parametro della popolazione la forma della distribuzione della popolazione Un’ipotesi è un’affermazione che viene considerata vera a meno che l’evidenza empirica porti ad avere seri dubbi sulla sua validità e suggerisca i che h essa è ffalsa l Università di Macerata – Dipartimento di Scienze Politiche, della Comunicazione e delle Relaz. Internazionali Università di Macerata – Dipartimento di Scienze Politiche, della Comunicazione e delle Relaz. Internazionali a.a. 2014 2014--2015 La verifica delle ipotesi a.a. 2014 2014--2015 La verifica delle ipotesi Cristina Davino L verifica La ifi d delle ll ipotesi i t i Cristina Davino U esempio Un i La durata delle lampadine prodotte da una certa azienda ha media pari a 2000 ore e deviazione standard pari a 250 ore. ore Verifica delle ipotesi: processo utilizzato per stabilire, sulla base delle osservazioni campionarie, p , se l’ipotesi p formulata si può considerare esatta o meno Test statistico: regola che consente di discriminare tra i risultati campionari che portano ad accettare l’ipotesi e quelli lli che h portano t a rifiutarla ifi t l La produzione dell’ultima settimana è stata effettuata impiegando un nuovo tipo di materiale sulla cui qualità il responsabile della produzione avanza seri dubbi. Prima di mettere in vendita le lampadine prodotte si desidera, desidera dunque, dunque indagare sulla qualità del materiale impiegato e, in particolare, verificare se possa avere influito sulla durata delle lampadine. Si esamina allora un campione casuale di 100 lampadine prese dalla produzione settimanale e se ne misura la durata media, che risulta pari a 1955 ore. E’ possibile affermare, con significatività =0,05, che tale riduzione sia imputabile alla scarsa qualità del materiale utilizzato? • Le ipotesi (Nulla, H0, e Alternativa, H1) • Il livello di significatività () • La statistica di riferimento • La regola di decisione Università di Macerata – Dipartimento di Scienze Politiche, della Comunicazione e delle Relaz. Internazionali Università di Macerata – Dipartimento di Scienze Politiche, della Comunicazione e delle Relaz. Internazionali a.a. 2014 2014--2015 La verifica delle ipotesi a.a. 2014 2014--2015 La verifica delle ipotesi Cristina Davino L iipotesi Le t i Popolazione: L iipotesi Le t i X f x;θ Ipotesi nulla (H0): ipotesi sottoposta a verifica E’ l’ipotesi p preesistente rispetto p p all’esperimento p campionario, p , q quella che viene considerata valida fino a prova contraria, e comprende il sottoinsieme dei valori dello spazio parametrico che si vuole sottoporre a test. Tipicamente, ll’ipotesi ipotesi nulla è un un’ipotesi ipotesi di tipo semplice: Ipotesi statistica semplice: si riferisce ad un valore specifico del parametro Per P esempio i θ θ* H0 : = 0 Ipotesi statistica composta: si riferisce ad un insieme di possibili valori che il parametro della popolazione può assumere Per esempio Cristina Davino * * θ θ o θ θ * θ θ Ipotesi alternativa (H1): affermazione fatta in antitesi all’ipotesi nulla E’ costituita da un singolo g valore o da un insieme di valori p possibili p per e considerati alternativi a 0 : H1 : = 1 ; H1 : < 0 ; H1 : > 0 ; H1 : 0 Università di Macerata – Dipartimento di Scienze Politiche, della Comunicazione e delle Relaz. Internazionali Università di Macerata – Dipartimento di Scienze Politiche, della Comunicazione e delle Relaz. Internazionali a.a. 2014 2014--2015 La verifica delle ipotesi a.a. 2014 2014--2015 La verifica delle ipotesi Cristina Davino L iipotesi Le t i Ipotesi nulla (H0): ipotesi sottoposta a verifica Ipotesi alternativa (H1): affermazione fatta in antitesi all’ipotesi nulla E bene sottolineare che l’ipotesi E’ l ipotesi nulla e l’ipotesi l ipotesi alternativa non sono equivalenti ai fini della decisione decisione, nel senso che il test non è mai conclusivo circa H1, ma concerne solo la possibilità che dal campione si possa pervenire al rifiuto o al non rifiuto di H0. L ipotesi Le i t i H0 e H1 sono esaustive ti e disgiunte: di i t o vale l l’una l’ o vale l l’altra. l’ lt Cristina Davino T t e regola Test l di d decisione i i Una volta formulate le ipotesi, occorre decidere se, sulla base dell’evidenza empirica campionaria, l’ipotesi nulla H0 debba essere rifiutata o meno. E’ perciò ò necessario mettere a punto una regola che permetta di discriminare tra i risultati campionari che portano ad accettare l’ipotesi nulla e quelli che portano a rifiutarla. Questa regola costituisce il Il test è dunque una regola che permette di stabilire se le p osservazioni campionarie debbano ritenersi coerenti con l’ipotesi nulla oppure no. Poiché il valore campionario di un test statistico varia da campione a campione, il test statistico costituisce una variabile casuale che può assumere valori compresi in un insieme che costituisce lo spazio campionario del test secondo d una particolare ti l di distribuzione t ib i di probabilità che è la distribuzione campionaria Da un punto di vista operativo, del test un test è una statistica che fa corrispondere i d ad d ognii campione i casuale l (X1, …, Xn)un valore numerico che può essere classificato secondo due diverse possibilità: Università di Macerata – Dipartimento di Scienze Politiche, della Comunicazione e delle Relaz. Internazionali Università di Macerata – Dipartimento di Scienze Politiche, della Comunicazione e delle Relaz. Internazionali a.a. 2014 2014--2015 La verifica delle ipotesi a.a. 2014 2014--2015 La verifica delle ipotesi Cristina Davino T t e regola Test l di d decisione i i L regola La l di d decisione i i e gli li errorii Un test statistico da quindi luogo alla ripartizione dello spazio campionario in due sottoinsiemi complementari: un insieme A costituito dai valori del test che sono compatibili con l’ipotesi nulla H0, e un insieme C che raggruppa i valori del test considerati incompatibili con H0. Quest ultimo insieme è costituito dai Quest’ultimo e viene definito la regione critica del test valori del test che portano al rifiuto di A-priori sono possibili quattro eventi incompatibili legati all’ipotesi vera sulla popolazione ed alla decisione che si prende, a ciascuno di essi è associata una probabilità a-priori di verificarsi H0 Situazione vera H0 Quando il valore campionario di t cade nella regione critica, l’evidenza empirica del f fenomeno studiato di porta a ritenere i che h l’ipotesi l’i i H0 non possa essere considerata id valida, lid e quindi che non possa essere accettata come vera. Regione critica per un test statistico con ipotesi alternativa unidirezionale: Regione di rifiuto di H0 H0 : = 0 H1 : > 0 t Regione di rifiuto di H0 Regione di accettazione di H0 Regione critica per un test statistico con ipotesi alternativa bidirezionale: Regione di rifiuto di H0 H1 associata (cioè la probabilità di rifiutare H0) viene definita livello di Accetto H0 falsa H0 Errore II tipo Rifi to H0 vera Rifiuto e a H1 Errore I tipo H0 : = 0 H1 : 0 t Ipotizzando vera H0, la regione critica significatività i ifi i i à del d l test e iindicata di con . De ecision ne Regione di accettazione di H0 Cristina Davino Accettare o rifiutare H0 non può e non deve essere inteso come una dimostrazione della verità o meno di (altre ipotesi, p , diverse da H0, H0 ( avrebbero potuto essere accettate o rifiutate sulla base dello stesso campione) ma solo come una conclusione l i che h l’ l’evidenza id empirica i i è favorevole o meno all’ipotesi nulla. Università di Macerata – Dipartimento di Scienze Politiche, della Comunicazione e delle Relaz. Internazionali Università di Macerata – Dipartimento di Scienze Politiche, della Comunicazione e delle Relaz. Internazionali a.a. 2014 2014--2015 La verifica delle ipotesi a.a. 2014 2014--2015 La verifica delle ipotesi Cristina Davino L regola La l di d decisione i i e gli li errorii H0 H0 Ipotesi vera H1 Conclusione H1 Decisione giusta Errore I tipo 1- Errore II tipo Decisione giusta 1- P rifiutare H 0 | H 0 è vera P t x R | 0 P accettare H 0 | H 0 è falsa P t x A | 1 1 P rifiutare H 0 | H 0 è falsa P t x R | 1 Cristina Davino L verifica La ifi delle d ll ipotesi i t i sulla ll media di H 0 : 0 Le ipotesi: H : 1 0 Il livello di significatività: La statistica test: la v.c. media campionaria Il criterio di decisione: rifiutare il valore 0 come X media della popolazione se la media campionaria x è molto “distante” dal valore 0 ipotizzato sotto H0 Università di Macerata – Dipartimento di Scienze Politiche, della Comunicazione e delle Relaz. Internazionali Università di Macerata – Dipartimento di Scienze Politiche, della Comunicazione e delle Relaz. Internazionali a.a. 2014 2014--2015 La verifica delle ipotesi a.a. 2014 2014--2015 La verifica delle ipotesi Cristina Davino L verifica La ifi delle d ll ipotesi i t i sulla ll media di /2 /2 xI L verifica La ifi delle d ll ipotesi i t i sulla ll media di 2. 1. xS /2 2 0 z 2. 1. /2 z Cristina Davino /2 xI 2 /2 /2 /2 z xS 0 2 z 2 I valori critici: P x < x I + P x > xS oppure standardizzando Il confronto x x-0 x-0 P < -z + P > z 2 2 sotto H0 n n con x I e x S oppure z x 0 x- n con -z 2 e +z 2 La decisione Università di Macerata – Dipartimento di Scienze Politiche, della Comunicazione e delle Relaz. Internazionali Università di Macerata – Dipartimento di Scienze Politiche, della Comunicazione e delle Relaz. Internazionali a.a. 2014 2014--2015 La verifica delle ipotesi a.a. 2014 2014--2015 La verifica delle ipotesi Cristina Davino U esempio Un i La durata delle lampadine prodotte da una certa azienda ha media pari a 2000 ore e deviazione standard pari a 250 ore. ore La produzione dell’ultima settimana è stata effettuata impiegando un nuovo tipo di materiale sulla cui qualità il responsabile della produzione avanza seri dubbi. Prima di mettere in vendita le lampadine prodotte si desidera, desidera dunque, dunque indagare sulla qualità del materiale impiegato e, in particolare, verificare se possa avere influito sulla durata delle lampadine. Si esamina allora un campione casuale di 100 lampadine prese dalla produzione settimanale e se ne misura la durata media, che risulta pari a 1955 ore. E’ possibile affermare, con significatività =0,05, che tale riduzione sia imputabile alla scarsa qualità del materiale utilizzato? Cristina Davino U esempio Un i La produzione dell’ultima settimana è stata effettuata impiegando un nuovo tipo di materiale sulla cui qualità il responsabile della produzione avanza seri dubbi. Prima di mettere in vendita le lampadine prodotte si desidera, desidera dunque, dunque indagare sulla qualità del materiale impiegato e, e in particolare, verificare se possa avere influito sulla durata delle lampadine. Si esamina allora un campione casuale di 100 lampadine prese dalla produzione settimanale e se ne misura la durata media, che risulta pari a 1955 ore. E’ possibile affermare, con significatività =0,05, 0 05 che tale riduzione sia imputabile alla scarsa qualità del materiale utilizzato? =2000 =250 H0: = 2000 H1: < 2000 x 1955 n =100 = 0,05 X ~N z = -1,645 1. • Le ipotesi (Nulla, H0, e Alternativa, H1) • Il livello di significatività () • La statistica di riferimento n 1955 Z c 1975 2000 2 2. 1 Zc -1 0 Z Rifiuto H0 se: ; X n x 0 z n 1955 2000 1, 8 250 100 -1,8 < -1,645 X 5% • La regola di decisione =0,05 Rifiuto H0 Valore critico non standardizzato: 0 1, 645 n 1955 < 1958,9 Rifiuto H0 1958, 9 Università di Macerata – Dipartimento di Scienze Politiche, della Comunicazione e delle Relaz. Internazionali Università di Macerata – Dipartimento di Scienze Politiche, della Comunicazione e delle Relaz. Internazionali a.a. 2014 2014--2015 La verifica delle ipotesi a.a. 2014 2014--2015 La verifica delle ipotesi Cristina Davino U esempio Un i L verifica La ifi delle d ll ipotesi i t i sulla ll media di La durata delle lampadine prodotte da una certa azienda ha media pari a 2000 ore e deviazione standard pari a 250 ore. L produzione La d i d ll’ lti dell’ultima settimana tti è stata t t effettuata ff tt t impiegando i i d un nuovo tipo ti di materiale t i l di cuii sii ignorano i l le performance. Prima di mettere in vendita le lampadine prodotte si desidera, dunque, indagare sulla qualità del materiale impiegato e, in particolare, verificare se possa influire sulla durata delle lampadine. Si esamina allora un campione casuale di 100 lampadine prese dalla produzione settimanale e se ne misura la durata media, che risulta pari a 2010 ore. E E’ possibile affermare, con significatività =0,05, 0,05, che tale variazione sia imputabile al nuovo materiale utilizzato? H0: = 2000 H1: 2000 =2000 = 0,05 0 05 =250 2,5% 2000 z z 1, 96 1. 2 0 z 2. Z 2 ; X n x 0 =0,05 z n 2 2010 2000 0, 4 250 100 |0,4| < 1,96 2 5% 2,5% 2 Rifiuto H0 se: x 2010 X 2049 2 5% 2,5% X ~N n =100 2,5% 1951 Cristina Davino Non rifiuto H0 Valori critici non standardizzati: d d 1951 2010 2049 0 1, 1 96 n 1951, 0 L azienda Package utilizza un procedimento tecnologico per L'azienda l'inscatolamento di uno dei suoi prodotti tarato per ottenere scatole con peso medio di 10Kg e uno s.q.m. pari a 0,3Kg. Durante il controllo periodico del funzionamento del meccanismo di inscatolamento risulta che il peso medio del prodotto inscatolato in un campione di 10 scatole estratte a caso dalla catena di montaggio è pari a 10,19 Kg. a) Sulla base dei risultati campionari, il responsabile della produzione sospetta che il meccanismo sia guasto e produca scatole con peso medio diverso da quello previsto. Supponendo che il peso del prodotto inscatolato dall'azienda si distribuisca normalmente, sulla base dei p , si p può ritenere che ci sia effettivamente un g guasto nel risultati campionari, sistema di inscatolamento? Effettuare il test sia ad un livello di significatività del 5% che dell'1%. 2049, 0 Non rifiuto H0 Università di Macerata – Dipartimento di Scienze Politiche, della Comunicazione e delle Relaz. Internazionali Università di Macerata – Dipartimento di Scienze Politiche, della Comunicazione e delle Relaz. Internazionali a.a. 2014 2014--2015 La verifica delle ipotesi a.a. 2014 2014--2015 La verifica delle ipotesi Cristina Davino L verifica La ifi delle d ll ipotesi i t i sulla ll media di b) Sulla base dei risultati campionari, campionari il responsabile della produzione sospetta che il meccanismo sia guasto e produca scatole con peso medio maggiore di quello previsto. Supponendo che il peso del prodotto inscatolato dall dall'azienda azienda si distribuisca normalmente, normalmente sulla base dei risultati campionari si può ritenere che ci sia effettivamente un guasto nel sistema di inscatolamento? Effettuare il test sia ad un livello di significatività i ifi ti ità del d l 5% che h dell'1%. d ll'1% Cristina Davino Ri il Riepilogo sulla ll v.c. media di campionaria i i n >30? SI c) Risolvere i punti a) e b) nel caso in cui lo s.q.m. del peso delle scatole prodotte dall’azienda non sia noto ma si conosca lo s.q.m. del peso delle scatole presenti nel campione di 10 scatole estratte (s=0.35Kg). NO X N? ? SI noto? X N ; n NO SI NO X- tn 1 s n Università di Macerata – Dipartimento di Scienze Politiche, della Comunicazione e delle Relaz. Internazionali Università di Macerata – Dipartimento di Scienze Politiche, della Comunicazione e delle Relaz. Internazionali a.a. 2014 2014--2015 La verifica delle ipotesi a.a. 2014 2014--2015 La verifica delle ipotesi Cristina Davino L fasi Le f i della d ll verifica ifi d delle ll ipotesi i t i Cristina Davino L verifica La ifi delle d ll ipotesi i t i su una proporzione i In una scommessa con un amico, lanciando 100 volte una moneta si sono ottenute 54 teste. Abbiamo il sospetto che l’amico ci abbia ingannati utilizzando una moneta truccata. Si verifichi questa ipotesi ad un livello di significatività =0,1. 1 Definire l’ipotesi H0 2 Definire l’ipotesi H1 3 Specificare il livello di significatività H0: = 0,5 , H1: > 0,5 4 Determinare la dimensione n del campione 5 Determinare la statistica test n=100 6 Fissare il valore (test unidirezionale) o i valori critici (test p~N = 0,10 Rifiuto H0 se: p 0 0 1 0 10% n 7 Calcolare il valore campionario della statistica 0,50 8 Confrontare il valore campionario della statistica con il/i valori critici p pc z n z 1,28 p =0,54 bidirezionale) che dividono le regioni di rifiuto e di accettazione p 0 0 1 0 0,80 < 1,28 0 54 0,50 0,54 0 50 0,50 1 0,50 100 0, 80 Non rifiuto H0 10% 9 Prendere una decisione 0 z p 1 n Università di Macerata – Dipartimento di Scienze Politiche, della Comunicazione e delle Relaz. Internazionali Università di Macerata – Dipartimento di Scienze Politiche, della Comunicazione e delle Relaz. Internazionali a.a. 2014 2014--2015 La verifica delle ipotesi a.a. 2014 2014--2015 La verifica delle ipotesi Cristina Davino Dove e come studiare • S. S B Borra, A. A Di Ci Ciaccio i (2004) – Statistica St ti ti – Metodologie M t d l i per le l scienze i economiche e sociali – McGraw-HillCap. 13 (escluso paragrafi 13.7, 13.8), Cap. 14 (escluso paragrafi 14.4, 14.5, 14.6). • D. Piccolo (2004) – Statistica per le decisioni – Il Mulino. Cap. 14 (escluso paragrafi 14.5, 14.8, 14.9, 14.10,14.11, 14.12). • F. Parpinel, C. Provasi (2004) – Elementi di probabilità e statistica per le Scienze Economiche – Giappichelli editore. Cap. 7 (escluso pagine p g 7.3,, 7.5,, 7.6). ) 345-347,, escluso paragrafi File “esercizi verifica delle ipotesi.pdf” Riepilogo La verifica delle ipotesi p • Le ipotesi • Le regioni di accettazione e di rifiuto • La regola di decisione e gli errori • Le fasi di una verifica delle ipotesi • L verifica Le ifi d delle ll iipotesi t i sulla ll media di d della ll popolazione l i • La verifica delle ipotesi sulla proporzione Cristina Davino