Metodi statistici per l’economia (Prof. Capitanio) Slide n. 8 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 STIMA PER INTERVALLO L’obiettivo è determinare due statistiche campionarie tali che a) e (sono variabili casuali) per ogni possibile campione b) l’intervallo contiene il parametro con probabilità , ovvero 2 Indichiamo con il valore tale che Es.: Il valore che cerchiamo corrisponde al valore per il quale la funzione di ripartizione normale vale . Dalla tavola della Normale otteniamo 3 Cerchiamo tale che Basta cercare il valore . tale che . Sulla tavola della ripartizione Normale cerchiamo il valore z per il quale 4 Es.: Cerchiamo tale che . , e quindi . , corrisponde ad una probabilità pari a 1-0.025 = 0.975. Si ottiene . 5 INTERVALLO DI CONFIDENZA PER LA MEDIA (popolazione normale, varianza nota) La v.c. modella il carattere. Consideriamo un campionamento casuale di n unità dalla popolazione: indipendenti e distribuite come X. Supponiamo che la varianza di popolazione sia nota. e quindi Per ogni compreso fra 0 e 1 vale la relazione che è equivalente alle seguenti: 6 Una volta estratto il campione si ottiene l’intervallo di confidenza stimato. Come si interpreta? Con probabilità , estraendo un campione casuale, otterremo un intervallo stimato che contiene il valore “vero” della media di popolazione . Quindi non siamo certi che sia compreso nell’intervallo. In altre parole: se consideriamo tutti i possibili campioni potenzialmente osservabili (universo dei campioni), l’ di questi conterrà il valore del parametro . Quindi “confidiamo”, con un livello di confidenza pari a contenga . In genere si fissano valori di , che l’intervallo pari a 0,99; 0,95; 0,90 7 Esempio. n=10, . Una volta estratto il campione la stima della media di popolazione ottenuta attraverso la media campionaria risulta pari a . Calcoliamo l’intervallo di confidenza al 99% per la media di popolazione . da cui e Cerchiamo , che corrisponde al valore 0.995 della funzione di ripartizione Normale. Si ottiene . = = 8 INTERVALLO DI CONFIDENZA PER LA MEDIA (popolazione normale, varianza non nota) Per costruire l’intervallo di confidenza per la media siamo partiti da: arrivando all’espressione Se la varianza di popolazione non è nota, non riusciamo a stimare gli estremi dell’intervallo. Una scelta “naturale” potrebbe consistere nel sostituire a la sua stima ottenuta con lo stimatore Varianza Corretta . La distribuzione della v.c. è nota: si tratta di una variabile aleatoria t di Student con n-1 gradi di libertà 9 Distribuzione t di Student con m gradi di libertà ( ) Proprietà d t m ⎯⎯ → N (0,1) (t converge in distribuzion a una v.c. N(0, 1)) m Ovvero, al crescere dei gradi di libertà la distribuzione di una v.c. sempre più a quella di una Normale standardizzata. si avvicina 10 Partendo dalla relazione: si ottiene: 11 INTERVALLO DI CONFIDENZA PER LA MEDIA (popolazione non Normale) Quando non è nota la distribuzione di X ma il campione ha una dimensione sufficientemente grande approssimazione attraverso un intervallo di confidenza ASINTOTICO di livello 12 INTERVALLO DI CONFIDENZA ASINTOTICO PER UNA PROPORZIONE Il carattere X è di tipo dicotomico, e possiamo modellarlo con una v.c. di Bernoulli. , La media campionaria corrisponde alla frequenza dei “successi” . L’espressione dell’intervallo di confidenza asintotico è: Esempio (dal libro di testo). Si vuole ottenere una stima intervallare della proporzione di fumatori presenti in una certa regione. A tal fine viene osservato un campione casuale di 120 persone, di cui 78 sono fumatori. La stima puntuale della proporzione è data da: Quindi l’intervallo di confidenza al livello è: 13