RIP6_stima intervallare

Corso di
Analisi Statistica per le Imprese
RICHIAMI DI INFERENZA:
INTERVALLI DI CONFIDENZA
Prof. L. Neri
a.a. 2015-2016
1
Stima puntuale e stima
intervallare
Esistono due tipi fondamentali di stimatori:
• Stimatore puntuale
• Stimatore intervallare
Stimatore puntuale: singola statistica che viene
usata per stimare il vero valore di un parametro
della popolazione. Ad esempio la media
campionaria è uno stimatore puntuale della
media della popolazione , la varianza
campionaria è uno stimatore puntuale della
varianza della popolazione 2.
2
Stima puntuale e stima
intervallare
Stimatore intervallare: intervallo di valori che ha
una certa probabilità
o confidenza
di
comprendere il vero valore del parametro della
popolazione.
In generale il livello di confidenza è indicato con
(1-)% dove  è la probabilità che si trova nelle
code della distribuzione, al di fuori dell’intervallo
di confidenza (la probabilità della coda sinistra e
della coda destra coincidono e sono pari a /2).
3
Intervallo di confidenza
per la media
noto il valore dello scarto quadratico medio
La statistica per costruire intervalli di confidenza
per la media è
Z
X 

 N (0,1)
n
ovvero una distribuzione Normale standardizzata,
“indipendentemente” dalla distribuzione originale
della variabile X (per campioni sufficientemente
grandi). Da tale distribuzione scaturiscono gli
estremi dell’intervallo di confidenza per la media.
4
Intervallo di confidenza per la media
noto il valore dello scarto quadratico medio della popolazione
5
Intervalli di confidenza
Curva normale per
determinare il valore
di Z necessario per
un
livello
di confidenza del
95%
Curva normale per
determinare il valore
di Z necessario per
un
livello
di confidenza del
99%
6
Intervalli di confidenza
Intervalli di confidenza per cinque diversi campioni di ampiezza
n=25, estratti da una popolazione normale con μ = 368 e σ = 15
7
Esempio intervallo di confidenza
•Una partita di bulloni presenta un diametro medio incognito, la
varianza del diametro invece è pari a 0.01. Si estrae un campione di
n=1000 bulloni sui quali si osserva un diametro medio di 1.2 cm. Si
determini un intervallo di confidenza al 99% (fissato un livello di
confidenza del 99%).
•Soluzione:
•1-α=0.99→ α=0.01 → α/2=0.005 →1-α/2=0.995
•Dalle tavole della distribuzione Normale (vedi
Tavole_Statistiche.pdf) si ha che Z(0.995) è circa =2.576 per cui
l’intervallo al 99% è

0.01
0.01 
;1.2  2.576
1.2  2.576
  1.1918;1.2081
1000
1000 

Intervalli di confidenza per la media
Con scarto quadratico medio della popolazione incognito
La statistica per costruire intervalli di confidenza
per la media è
X 
t
S
n
dove S è lo stimatore di 
t ha una distribuzione t di Student con n-1 gradi di libertà.
Il significato dei gradi di libertà è legato al fatto che per
calcolare S è necessario conoscere la media
campionaria. In tal caso solo n-1 valori campionari sono
liberi di variare perché l’n-esimo sarà determinato
automaticamente per differenza.
9
Intervalli di confidenza per la media
Con scarto quadratico medio della popolazione incognito
All’aumentare dei gradi di libertà, la distribuzione t si avvicina
progressivamente alla distribuzione normale fino a che le due distribuzioni
risultano virtualmente identiche.
10
Intervalli di confidenza per la media
Con scarto quadratico medio della popolazione incognito
Le tavole della distribuzione t di Student forniscono la probabilità (l’area
sottesa) a destra del valore indicato.
11
Intervalli di confidenza per la media
Con scarto quadratico medio della popolazione incognito
L’intervallo di confidenza di livello (1-)% per la media con  ignoto è definito
come segue:
12
Intervallo di confidenza per una
proporzione
Per ricavare l’intervallo di confidenza per la
proporzione della popolazione p, che ha una
certa caratteristica, si utilizza la proporzione
campionaria ps.
Se il prodotto np e anche n(1-p) sono uguali
almeno a 5, la distribuzione di ps può essere
approssimata alla distribuzione Normale.
L’errore standard della proporzione è dato da
p 
p
(
1
p
)
n
13
Intervallo di confidenza per una
proporzione
Fissato il livello di confidenza (1-α)%.
Esempio
Un’azienda produttrice di lamette commissiona
un’indagine campionaria su una popolazione di
uomini. Si seleziona un campione di numerosità
n=100. Su tale campione si stima che il 40%
degli uomini preferisce le lamette prodotte
dall’azienda in questione. Si determini
un’intervallo di confidenza al 95% per la stima
della proporzione nella popolazione.
15
Esempio
N .B. pˆ  ps

ˆ
ˆ
ˆ
ˆ


p
1

p
p
1

p
ˆ
ˆ
P
(
p

z

p

p

z
)

1

n
n
2
2




0
.
4
1

0
.
4
0
.
4
1

0
.
4
P
(
0
.
40

1
.
96

p

0
.
40

1
.
96
)

0
.
9
100100
ovvero l'intervallo di confidenza per p è
0.40±0.098=[0.302,0.498]