Slide n. 8

Metodi statistici per l’economia (Prof. Capitanio)
Slide n. 8
Materiale di supporto per le lezioni. Non sostituisce il libro di testo
1
STIMA PER INTERVALLO
L’obiettivo è determinare due statistiche campionarie
tali che
a)
e
(sono variabili casuali)
per ogni possibile campione
b)
l’intervallo
contiene il parametro
con probabilità
, ovvero
2
Indichiamo con
il valore tale che
Es.:
Il valore
che cerchiamo corrisponde al valore per il quale la funzione di
ripartizione normale vale
. Dalla tavola della Normale otteniamo
3
Cerchiamo
tale che
Basta cercare il valore
.
tale che
.
Sulla tavola della ripartizione Normale cerchiamo il valore z per il quale
4
Es.: Cerchiamo
tale che
.
, e quindi
.
, corrisponde ad una probabilità pari a 1-0.025 = 0.975.
Si ottiene
.
5
INTERVALLO DI CONFIDENZA PER LA MEDIA (popolazione normale, varianza nota)
La v.c.
modella il carattere. Consideriamo un campionamento casuale di
n unità dalla popolazione:
indipendenti e distribuite come X.
Supponiamo che la varianza di popolazione sia nota.
e quindi
Per ogni
compreso fra 0 e 1 vale la relazione
che è equivalente alle seguenti:
6
Una volta estratto il campione si ottiene l’intervallo di confidenza stimato.
Come si interpreta?
Con probabilità
, estraendo un campione casuale, otterremo un intervallo stimato
che contiene il valore “vero” della media di popolazione . Quindi non siamo certi che
sia compreso nell’intervallo.
In altre parole:
se consideriamo tutti i possibili campioni potenzialmente osservabili (universo dei
campioni), l’
di questi conterrà il valore del parametro .
Quindi “confidiamo”, con un livello di confidenza pari a
contenga .
In genere si fissano valori di
, che
l’intervallo
pari a 0,99; 0,95; 0,90
7
Esempio.
n=10,
. Una volta estratto il campione la stima della media di popolazione
ottenuta attraverso la media campionaria risulta pari a
.
Calcoliamo l’intervallo di confidenza al 99% per la media di popolazione .
da cui
e
Cerchiamo
, che corrisponde al valore 0.995 della funzione di ripartizione
Normale. Si ottiene
.
=
=
8
INTERVALLO DI CONFIDENZA PER LA MEDIA (popolazione normale, varianza non
nota)
Per costruire l’intervallo di confidenza per la media siamo partiti da:
arrivando all’espressione
Se la varianza di popolazione non è nota, non riusciamo a stimare gli estremi
dell’intervallo. Una scelta “naturale” potrebbe consistere nel sostituire a
la sua
stima ottenuta con lo stimatore Varianza Corretta
.
La distribuzione della v.c.
è nota: si tratta di una variabile aleatoria t di Student con n-1 gradi di libertà
9
Distribuzione t di Student con m gradi di libertà (
)
Proprietà
d
t m ⎯⎯
→ N (0,1) (t converge in distribuzion a una v.c. N(0, 1))
m
Ovvero, al crescere dei gradi di libertà la distribuzione di una v.c.
sempre più a quella di una Normale standardizzata.
si avvicina
10
Partendo dalla relazione:
si ottiene:
11
INTERVALLO DI CONFIDENZA PER LA MEDIA (popolazione non Normale)
Quando non è nota la distribuzione di X
ma il campione ha una dimensione sufficientemente grande
approssimazione attraverso un
intervallo di confidenza ASINTOTICO di livello
12
INTERVALLO DI CONFIDENZA ASINTOTICO PER UNA PROPORZIONE
Il carattere X è di tipo dicotomico, e possiamo modellarlo con una v.c. di Bernoulli.
,
La media campionaria
corrisponde alla frequenza dei “successi”
.
L’espressione dell’intervallo di confidenza asintotico è:
Esempio (dal libro di testo). Si vuole ottenere una stima intervallare della
proporzione di fumatori presenti in una certa regione. A tal fine viene osservato un
campione casuale di 120 persone, di cui 78 sono fumatori.
La stima puntuale della proporzione è data da:
Quindi l’intervallo di confidenza al livello
è:
13