Università di Macerata – Dipartimento di Scienze Politiche, della Comunicazione e delle Relaz. Internazionali a.a. 2015-2016 La stima Cristina Davino Parametri e statistiche Popolazione Parametri Campione Statistiche o Stimatori Valori fissi, spesso non noti Variabili casuali, le cui determinazioni dipendono dalle particolari osservazioni scelte Università di Macerata – Dipartimento di Scienze Politiche, della Comunicazione e delle Relaz. Internazionali Università di Macerata – Dipartimento di Scienze Politiche, della Comunicazione e delle Relaz. Internazionali a.a. 2015-2016 La stima a.a. 2015-2016 La stima Cristina Davino Parametri e statistiche Cristina Davino Distribuzioni campionarie Parametri: valori caratteristici della popolazione Statistiche o v.c. campionarie o stimatori o Le conclusioni inferenziali, basate sull’unico campione statistiche test: funzioni delle osservazioni campionarie osservato, devono essere giudicate sulla base della Statistica calcolata o stima: numero ottenuto distribuzione di probabilità dei possibili campioni che applicando la statistica al campione osservato potevano essere generati e dei quali quello osservato Distribuzione campionaria: valori che la statistica assume al variare del campione nell’universo campionario costituisce una realizzazione particolare. Università di Macerata – Dipartimento di Scienze Politiche, della Comunicazione e delle Relaz. Internazionali Università di Macerata – Dipartimento di Scienze Politiche, della Comunicazione e delle Relaz. Internazionali a.a. 2015-2016 La stima a.a. 2015-2016 La stima Cristina Davino La stima Cristina Davino La stima • Si suppone che la popolazione, seppur incognita, si distribuisca secondo una legge di probabilità completamente caratterizzata sa un parametro θ o da un insieme di parametri. La stima puntuale Per stimare uno stesso parametro si possono usare più statistiche (più stimatori) ognuno delle quali fornisce valori potenziali per il parametro. • Sulla base di un campione casuale X1, X2, …, Xn si vuole trovare un valore o un insieme di valori per θ che siano la migliore La stima per intervalli Si cerca un intervallo che ha una particolare confidenza o probabilità di approssimazione possibile del valore incognito della popolazione. includere il parametro della popolazione Livello di confidenza Università di Macerata – Dipartimento di Scienze Politiche, della Comunicazione e delle Relaz. Internazionali Università di Macerata – Dipartimento di Scienze Politiche, della Comunicazione e delle Relaz. Internazionali a.a. 2015-2016 La stima a.a. 2015-2016 La stima Cristina Davino La stima puntuale Cristina Davino La stima puntuale: la correttezza Uno stimatore t è uno stimatore corretto del parametro θ se: Occorre definire delle regole in base alle quali si possa discriminare tra stimatori alternativi: 1. Proporre stimatori “naturali” 2. Determinare la probabilità con cui uno stimatore tende a produrre è uno stimatore corretto di µ stime diverse da θ è uno stimatore distorto di σ2 Proprietà degli stimatori è uno stimatore corretto di σ2 Università di Macerata – Dipartimento di Scienze Politiche, della Comunicazione e delle Relaz. Internazionali Università di Macerata – Dipartimento di Scienze Politiche, della Comunicazione e delle Relaz. Internazionali a.a. 2015-2016 La stima a.a. 2015-2016 La stima Cristina Davino Cristina Davino L’intervallo di confidenza per la media della popolazione La stima puntuale • Anche se lo stimatore presenta proprietà ottimali, una volta ottenuto il campione le stime difficilmente coincideranno con il parametro incognito • A parità di stimatore, campioni diversi conducono a stime diverse • Il valore numerico della singola stima non fornisce informazioni sul probabile campo di variazione delle stime del parametro t1 µ t2 Stima per intervalli -Zα/2 0 Zα/2 Università di Macerata – Dipartimento di Scienze Politiche, della Comunicazione e delle Relaz. Internazionali Università di Macerata – Dipartimento di Scienze Politiche, della Comunicazione e delle Relaz. Internazionali a.a. 2015-2016 La stima a.a. 2015-2016 La stima Cristina Davino L’intervallo di confidenza per la media della popolazione Cristina Davino L’intervallo di confidenza per la media della popolazione Una macchina produce bulloni il cui peso ha distribuzione Normale con media µ=63 grammi e varianza σ2=0,8. Scegliendo a caso 8 bulloni, qual è l’intervallo che con probabilità 0,95 comprenderà la loro media? Una macchina produce bulloni il cui peso ha distribuzione Normale con media µ=incognita e varianza σ2=0,8. Scelti a caso 8 bulloni, il loro peso medio è risultato pari a 62,6 grammi. Qual è l’intervallo che, con probabilità 0,95, contiene il parametro incognito µ? Università di Macerata – Dipartimento di Scienze Politiche, della Comunicazione e delle Relaz. Internazionali Università di Macerata – Dipartimento di Scienze Politiche, della Comunicazione e delle Relaz. Internazionali a.a. 2015-2016 La stima a.a. 2015-2016 La stima Cristina Davino L’intervallo di confidenza per la media della popolazione Cristina Davino L’intervallo di confidenza per la media della popolazione Quando il parametro µ della popolazione è incognito, il miglior modo per stimarlo è utilizzare la media campionaria. Quando la numerosità campionaria n è sufficientemente elevata si ha: E’ quindi possibile dire che, con probabilità 1-α, l’intervallo: Per 1-α = 68% Per 1-α = 95% Per 1-α = 99% contiene il parametro incognito µ. Università di Macerata – Dipartimento di Scienze Politiche, della Comunicazione e delle Relaz. Internazionali Università di Macerata – Dipartimento di Scienze Politiche, della Comunicazione e delle Relaz. Internazionali a.a. 2015-2016 La stima a.a. 2015-2016 La stima Cristina Davino L’intervallo di confidenza per la media della popolazione Cristina Davino L’intervallo di confidenza per la media della popolazione Università di Macerata – Dipartimento di Scienze Politiche, della Comunicazione e delle Relaz. Internazionali Università di Macerata – Dipartimento di Scienze Politiche, della Comunicazione e delle Relaz. Internazionali a.a. 2015-2016 La stima a.a. 2015-2016 La stima Cristina Davino Esercizio Cristina Davino Esercizio L’altezza delle matricole universitarie di sesso maschile può essere considerata una variabile con distribuzione Normale, con media incognita e varianza pari a 10,66. Per stimare l’altezza media si estrae un campione casuale di 58 matricole e si misura l’altezza media, che risulta pari a 175,4 cm. Si definisca l’intervallo che, ad un livello di fiducia del 90, del 95 e del 99 per cento contenga il parametro incognito della popolazione. L’altezza delle matricole universitarie di sesso maschile può essere considerata una variabile con distribuzione Normale, con media incognita e varianza pari a 10,66. Per stimare l’altezza media si estrae un campione casuale di 58 matricole e si misura l’altezza media, che risulta pari a 175,4 cm. Si definisca l’intervallo che, ad un livello di fiducia del 90, del 95 e del 99 per cento contenga il parametro incognito della popolazione. Università di Macerata – Dipartimento di Scienze Politiche, della Comunicazione e delle Relaz. Internazionali Università di Macerata – Dipartimento di Scienze Politiche, della Comunicazione e delle Relaz. Internazionali a.a. 2015-2016 La stima a.a. 2015-2016 La stima Cristina Davino La stima per intervalli n> 30? SI NO Cristina Davino La stima per intervalli X ∼ N? NO La stima della media con distribuzione nota e varianza incognita ? SI σ noto? SI NO La distribuzione t di Student • La funzione di densità della v.c. di Student è sempre simmetrica, con valore medio pari a 0, ed assume una forma molto simile a quello della Normale standardizzata alla quale tende assai velocemente al crescere dei gradi di libertà. • Per valori di n piccoli o moderati, la v.c. di Student si caratterizza per una curtosi leggermente più elevata e per code più “pesanti” della v.c. Normale. Università di Macerata – Dipartimento di Scienze Politiche, della Comunicazione e delle Relaz. Internazionali Università di Macerata – Dipartimento di Scienze Politiche, della Comunicazione e delle Relaz. Internazionali a.a. 2015-2016 La stima a.a. 2015-2016 La stima Cristina Davino Cristina Davino Esercizio La stima per intervalli La stima della media con distribuzione nota e varianza incognita Esempio L’altezza delle matricole universitarie di sesso maschile può essere considerata una variabile con distribuzione Normale, con media e varianza incognite. Per stimare l’altezza media si estrae un campione casuale di 18 matricole e si misura l’altezza media, che risulta pari a 175,4 cm, con sqm campionario corretto pari a 4,4 cm. Si definisca l’intervallo che, ad un livello di fiducia del 95% contenga il parametro incognito della popolazione. Un'azienda che imbottiglia una bibita gassata vuole indagare sulla forza della pressione interna della bibita presente in una lattina. Supponendo che la forza della pressione sia una v.c. con s.q.m. 28psi, si consideri un campione casuale di 20 lattine con pressione media pari a 235psi. Si determini un intervallo di confidenza al 95% per la pressione media delle lattine prodotte dall'azienda nel caso in cui il valore della pressione possa essere considerato distribuito normalmente. 173,2 177,6 Università di Macerata – Dipartimento di Scienze Politiche, della Comunicazione e delle Relaz. Internazionali Università di Macerata – Dipartimento di Scienze Politiche, della Comunicazione e delle Relaz. Internazionali a.a. 2015-2016 La stima a.a. 2015-2016 La stima Cristina Davino Esercizio X~ N(?; 28) Cristina Davino La stima per intervalli σ=28 • Si cerca un intervallo che ha una particolare confidenza o probabilità di includere il parametro della popolazione n=20 1-α=0,95 Livello di confidenza ldf=90% ldf=95% ldf=99% z=1,64 z=1,96 z=2,33 Università di Macerata – Dipartimento di Scienze Politiche, della Comunicazione e delle Relaz. Internazionali Università di Macerata – Dipartimento di Scienze Politiche, della Comunicazione e delle Relaz. Internazionali a.a. 2015-2016 La stima a.a. 2015-2016 La stima Cristina Davino V.C. Proporzione campionaria Cristina Davino La stima per intervalli • : numero di successi in n prove • : proporzione di successi in n prove π proporzione di successi nella popolazione p proporzione di successi in un campione di ampiezza n La proporzione di successi nella popolazione P: v.c proporzione campionaria Università di Macerata – Dipartimento di Scienze Politiche, della Comunicazione e delle Relaz. Internazionali Università di Macerata – Dipartimento di Scienze Politiche, della Comunicazione e delle Relaz. Internazionali a.a. 2015-2016 La stima a.a. 2015-2016 La stima La stima per intervalli La proporzione di successi nella popolazione Cristina Davino Cristina Davino La stima per intervalli La proporzione di successi nella popolazione Quando il parametro π della popolazione è incognito, il miglior modo per stimarlo è utilizzare la proporzione campionaria. Quando la numerosità campionaria n è sufficientemente elevata si ha: E’ quindi possibile dire che, con probabilità 1-α, l’intervallo: contiene il parametro incognito π. Università di Macerata – Dipartimento di Scienze Politiche, della Comunicazione e delle Relaz. Internazionali Università di Macerata – Dipartimento di Scienze Politiche, della Comunicazione e delle Relaz. Internazionali a.a. 2015-2016 La stima a.a. 2015-2016 La stima Cristina Davino Esercizio Cristina Davino Esercizio La stima di una proporzione La stima di una proporzione Da un’indagine condotta su un campione casuale di 280 matricole universitarie è risultato che il 36% si dichiara insoddisfatto della nuova Riforma. Qual è l’intervallo che, ad un livello di fiducia del 95%, comprende il parametro incognito della popolazione? Da un’indagine condotta su un campione casuale di 280 matricole universitarie è risultato che il 36% si dichiara insoddisfatto della nuova Riforma. Qual è l’intervallo che, ad un livello di fiducia del 95%, comprende il parametro incognito della popolazione? π Parametro: (Proporzione nella popolazione) ; Stimatore: p (Proporzione campionaria) Per campioni grandi n=280 p=0,36 1-α = 0,95 Università di Macerata – Dipartimento di Scienze Politiche, della Comunicazione e delle Relaz. Internazionali Università di Macerata – Dipartimento di Scienze Politiche, della Comunicazione e delle Relaz. Internazionali a.a. 2015-2016 La stima a.a. 2015-2016 La stima Cristina Davino Esercizio Un rivenditore di automobili vorrebbe stimare la proporzione di clienti che posseggono ancora l'automobile acquistata cinque anni prima. Dai registri del rivenditore si seleziona un campione casuale di 200 clienti, di cui 82 posseggono ancora l'automobile acquistata cinque anni prima. Si definisca una stima per intervalli per la proporzione nella popolazione ad un livello di confidenza del 95%. Cristina Davino Esercizio n=200 1-α=0,95 Università di Macerata – Dipartimento di Scienze Politiche, della Comunicazione e delle Relaz. Internazionali Università di Macerata – Dipartimento di Scienze Politiche, della Comunicazione e delle Relaz. Internazionali a.a. 2015-2016 La stima a.a. 2015-2016 La stima Cristina Davino Dove e come studiare • S. Borra, A. Di Ciaccio (2004) – Statistica – Metodologie per le scienze economiche e sociali – McGraw-Hill. Cap. 11 (escluso paragrafi 11.4, 11.5, 11.9), Cap. 12 (escluso paragrafo 12.6). • D. Piccolo (2004) – Statistica per le decisioni – Il Mulino. Cap. 13 (escluso paragrafi 13.3, 13.4,13.5, 13.6, 13.7, 13.8), Cap. 15 (escluso paragrafi 15.4, 15.5, 15.6). • F. Parpinel, C. Provasi (2004) – Elementi di probabilità e statistica per le Scienze Economiche – Giappichelli editore. Cap. 6 (escluso paragrafi 6.1.1, 6.1.2, 6.2.4). File “esercizi intervalli di confidenza.pdf” Riepilogo Popolazione e campione La stima La stima puntuale Le proprietà degli stimatori Intervallo di confidenza per la media Intervallo di confidenza per la proporzione Cristina Davino