Intervallidiconfidenza
Probabilità e Statistica I - a.a. 04/05 - Intervalli di confidenza
1
⇒ Calcolata la stima puntuale di un parametro incognito, è possibile
associare a tale stima una valutazione dell’errore commesso?
⇒ Esiste un intervallo che contiene il vero valore del parametro
incognito con alta probabilità?
Esempio: se 520 votanti su 1000 hanno risposto sì ad un quesito referendario,
è possibile dire, con elevata probabilità, che la percentuale dei votanti che ha
risposto sì al quesito referendario è 52% ± 2%?
L’intervallo (50%, 54%), o 52% ± 2% è detto intervallo di confidenza.
Il livello di confidenza (in genere denotato con 1 - α) è la probabilità che
il valore vero del parametro della popolazione cada nell’intervallo.
In genere α corrisponde al 10%, 5% o 1% pertanto i livelli di confidenza
usati sono 90%, 95% o 99%.
Probabilità e Statistica I - a.a. 04/05 - Intervalli di confidenza
2
Esempio :
Un responsabile di ricerche di mercato vuole stimare il numero medio di anni di
scuola frequentati dai residenti di una certa città. Seleziona pertanto 90 unità
a caso e trova che una stima puntuale di tale numero medio è 8.4 anni. Sapendo
che la deviazione campionaria (ossia la precisione della stima) è 1.8 determinare
un intervallo di confidenza al 95%.
X −µ
S
n


X −µ
⇒ P − 1.96 ≤
≤ 1.96  = 0.95


S n


≈ N (0,1)
⇓


σ 
σ  
P  X − 1.96
 ≤ µ ≤  X + 1.96
 = 0.95


n
n





 

⇒ 8.4 ± 1.96
1.8
90
= 8.4 ± 0.372 = (8.028, 8.772 )
Probabilità e Statistica I - a.a. 04/05 - Intervalli di confidenza
3
Media campionar ia: var ianz a nota
Se X è la media campionari a di un campione casuale di taglia n estratto da una
popolazion e con varian za nota σ 2 , un intervallo di confidenza di coefficien te
(1 − α ) per la media della popolazion e è dato da :
σ
σ
X − zα / 2
≤ µ ≤ X + zα / 2
n
n
α
dove zα / 2 è tale che P (Z < zα / 2 ) = 1 −
con Z ≈ N (0,1).
2
Esercizio: Si vuole stabilire se il coefficiente di combustione di un propellente solido
usato per potenziare un sistema di fuga per un equipaggio aereo è 50 cm al secondo.
La deviazione standard di tale coefficiente di combustione è pari a 2 cm/s. E’ stato
selezionato un campione casuale di taglia 25 e si è trovato che la media campionaria
è 51.3 cm/s. Costruire un intervallo di confidenza del 95% per la media della popolazione ipotizzando che la popolazione sia gaussiana.
Esercizio: Nell’esercizio precedente stabilire la taglia del campione casuale da estrarre se si desidera che la media campionaria differisca dalla media della popolazione
per meno di 1.5 cm/s con un coefficiente di confidenza del 95%.
Probabilità e Statistica I - a.a. 04/05 - Intervalli di confidenza
4
Media campionar ia: var ianz a incognita
Se X è la media campionaria di un campione casuale di taglia n estratto da una popolazione
normale con varianza incognita σ 2 , un intervallo di confidenza di coefficien te (1 − α ) per la
media della popolazione è dato da :
S
S
X − tα / 2,n−1
≤ µ ≤ X + tα / 2,n−1
n
n
dove S è la deviazione standard campionaria, tα / 2 ,n−1 è tale che P (T < tα / 2,n−1 ) = 1 −
con T ≈ T − student con gradi di libertà n-1.
α
2
Esercizio : Un articolo nel giornale Materials Engineering (1989) descrive i risultati
di un test di adesione su 20 campioni di una certa lega. I coefficienti di fallimento dei 20
campioni sono :
19,8 18,5 17,6 16,7 15,8 14,1 13,6 11,9 11,4 11,4
8,8 7,5 15,4 15,4 19,5 12,7 11,9 11,4 10,1 7,9
Si assuma che i campioni provengano da una popolazione normale. Determinare un
intervallo di confidenza al 95% per la media della popolazione.
Probabilità e Statistica I - a.a. 04/05 - Intervalli di confidenza
16,7
15,8
15,4
14,1
13,6
11,9
11,4
11,4
8,8
7,5
15,4
19,5
12,7
11,9
11,4
10,1
7,9
10,1
11,4
11,4
11,4
11,9
11,9
12,7
13,6
14,1
15,4
15,4
15,8
16,7
17,6
18,5
19,5
19,8
Analisi dei
dati con Excel
8
7
6
Media
Errore standard
Mediana
Moda
Deviazione standard
Varianza campionaria
Curtosi
Asimmetria
Intervallo
Minimo
Massimo
Somma
Conteggio
Più grande(7)
Più piccolo(7)
Livello di confidenza(95,0%)
5
13,57
0,828
13,15
11,4
3,702929
13,71168
-0,8968
0,10699
12,3
7,5
19,8
271,4
20
15,4
11,4
1,733025
5
4
3
2
1
0
7,5
10,575
13,65
16,725
Altro
Probabilità e Statistica I - a.a. 04/05 - Intervalli di confidenza
6
Var ianz a campionar ia: pop. gaussiana
Se S 2 è la varianza campionaria di un campione casuale di taglia n estratto da una
popolazione normale con varianza incognita σ 2 , un intervallo di confidenza di
coefficiente (1 − α ) per la varianza della popolazione è dato da :
(n-1 )S 2
2
≤
2
≤
(n-1 )S 2
2 ,n −1
2
1−
2 ,n−1
α
dove χα2 / 2 ,n−1 è tale che P (χ 2 < χα2 / 2 ,n−1 ) = 1 − e χ12−α / 2,n−1 è tale che
2
α
P (χ 2 < χ12−α / 2 ,n−1 ) = con χ 2 ≈ chi − quadro con gradi di libertà n-1.
2
Esercizio: Si supponga che lo spessore del filamento di una lampadina sia una caratteristica critica. Per controllare il processo di realizzazione vengono periodicamente
esaminati lotti di 20 filamenti appena realizzati e per ciascun lotto vengono misurati
gli spessori dei filamenti. Si assuma osservata la seguente realizzazione:
1,05 1,07 1,12 0,92 0,98 1,07 1,11 1,02 0,98 0,99 1,02 1,12 1,05 0,99 0,94
1,05 0,99 1,11 0,97 1,12
relativa ad un campione casuale normale. Si determini un intervallo fiduciario di
coefficiente 0,95 per la media e la deviazione standard del campione.
Probabilità e Statistica I - a.a. 04/05 - Intervalli di confidenza
1,12
0,92
0,98
1,07
1,11
1,02
0,98
0,99
1,02
1,12
1,05
0,99
0,94
1,05
0,99
1,11
0,97
1,12
0,97
0,98
0,98
0,99
0,99
0,99
1,02
1,02
1,05
1,05
1,05
1,07
1,07
1,11
1,11
1,12
1,12
1,12
Analisi dei
dati con Excel
8
Media
Errore standard
Mediana
Moda
Deviazione standard
Varianza campionaria
Curtosi
Asimmetria
Intervallo
Minimo
Massimo
Somma
Conteggio
Livello di confidenza(95,0%)
7
1,0335
0,014054
1,035
1,05
0,062851
0,00395
-1,10392
-0,03437
0,2
0,92
1,12
20,67
20
0,029415
7
6
5
4
3
2
1
0
7,5
10,575
13,65
16,725
Altro
Probabilità e Statistica I - a.a. 04/05 - Intervalli di confidenza
8
Per centuale campionar ia
Se pˆ è la proporzion e di osservazio ni in un campione casuale di taglia n estratto
da una popolazion e di un certo tipo, un intervallo di confidenza di coefficien te
(1 − α ) per la proporzion e vera è dato da :
pˆ (1 − pˆ )
pˆ (1 − pˆ )
≤ p ≤ pˆ + zα / 2
n
n
α
è tale che P (Z < zα / 2 ) = 1 − con Z ≈ N (0,1).
2
pˆ − zα / 2
dove zα / 2
Esercizio: In un campione casuale di 85 alberi motori di automobili, 10 hanno la
superficie in uscita più ruvida delle specifiche richieste. Si costruisca un intervallo
di confidenza al 95% per la percentuale dei motori difettosi. Quanto deve essere
largo il campione se si desidera che la percentuale stimata differisca da quella vera
per meno di 0.05 con un coefficiente di confidenza pari al 95%?
Probabilità e Statistica I - a.a. 04/05 - Intervalli di confidenza
9
Due campioni casuali
Assun zioni
1. Sia X 11 , X 12 ,Κ , X 1n1 un campione casuale estratto dalla popolazion e 1 con distri buzione simile alla variabile aleatoria X 1 ≈ N( µ1 , σ 12 )
2. Sia X 21 , X 22 , Κ , X 2 n2 un campione casuale estratto dalla popolazion e 2 con distri buzione simile alla variabile aleatoria X 2 ≈ N( µ 2 , σ 22 ).
3. Le variabili X 1 e X 2 sono indipenden ti.
4. Sia X 1 la media campionaria del campione di taglia n1 e X 2 la media campionaria
del campione di taglia n 2 .
Poichè E ( X 1 − X 2 ) = µ1 − µ 2 e V ( X 1 − X 2 ) =
Z=
X 1 − X 2 − µ1 − µ 2
σ 12 σ 22
+
n1
n2
σ 12 σ 22
+
, la quantità
n1
n2
≈ N (0,1)
(teorema del limite centrale)
Probabilità e Statistica I - a.a. 04/05 - Intervalli di confidenza
10
Differ enz e medie campionar ie: var ianz e note
Sia X 11 , X 12 , Κ , X 1n un campione casuale estratto dalla popolazion e 1 con distri 1
buzione simile alla variabile aleatoria X 1 ≈ N( µ1 , σ 12 ) e sia X 21 , X 22 , Κ , X 2 n un
2
campione casuale estratto dalla popolazion e 2 con distribuzi one simile alla variabile
aleatoria X 2 ≈ N( µ 2 , σ 22 ). Si assuma X 1 indipenden te da X 2 e che le varianze σ 12
e σ 22 siano note. Sia X 1 la media campionari a del campione di taglia n1 e X 2 la
media campionari a del campione di taglia n2 .Un intervallo di confidenza di coeffi -
ciente (1 − α ) per la differenza delle medie µ1 − µ 2 risulta
X 1 − X 2 − zα / 2
σ 12 σ 22
σ 12 σ 22
+
≤ µ1 − µ 2 ≤ X 1 − X 2 + zα / 2
+
n1
n2
n1
n2
dove zα / 2 è tale che P (Z < zα / 2 ) = 1 −
α
con Z ≈ N (0,1).
2
Esercizio: Una ditta produce due differenti tipi di lampadine che vengono sottoposte a
un test. Un campione di 35 lampadine della I specie ha funzionato per 408 ore in media
mentre un campione di 45 lampadine della II specie ha funzionato per 396 ore in media.
Si costruisca un intervallo di confidenza al 95% per la differenza delle medie sapendo
che le rispettive varianze delle due popolazioni (normali) sono 25 e 20 ore.
Probabilità e Statistica I - a.a. 04/05 - Intervalli di confidenza
11
Assun zioni
1. Sia X 11 , X 12 , Κ , X 1n1 un campione casuale estratto dalla popolazion e 1 con distribuzi one simile
alla variabile aleatoria X 1 ≈ N( µ 1 , σ 12 ) , σ 12 = σ 2 incognita.
2. Sia X 21 , X 22 , Κ , X 2 n2 un campione casuale estratto dalla popolazion e 2 con distribuzi one simile
alla variabile aleatoria X 2 ≈ N( µ 2 , σ 22 ) , σ 22 = σ 2 incognita.
3. Le variabili X 1 e X 2 sono indipenden ti.
4. Sia X 1 la media campionari a del campione di taglia n1 e X 2 la media campionaria del campio ne di taglia n 2 .
1
1
Poichè E ( X 1 − X 2 ) = µ1 − µ 2 e V ( X 1 − X 2 ) = σ 2  +
 n1 n 2
X − X 2 − ( µ1 − µ 2 )
≈ N (0,1)
Z= 1
1
1
+
σ
n1 n2

, la quantità

Se si combinano le varianze campionarie S12 e S 22 , si ottiene uno stimatore di σ 2
S p2 =
e la variabile aleatoria T =
(n1 − 1) S12 + (n 2 − 1) S 22
n1 + n 2 − 2
X 1 − X 2 − (µ1 − µ 2 )
Sp
1
1
+
n1 n 2
ha distribuzi one T - Student con gradi di libertà n1 + n 2 − 2
Probabilità e Statistica I - a.a. 04/05 - Intervalli di confidenza
12
Differ enz e medie campionar ie: var ianz e incognite e uguali
Sia X 11 , X 12 , Κ , X 1n un campione casuale estratto dalla popolazione 1 con distribuzio 1
ne simile alla variabile aleatoria X 1 ≈ N( µ1 , σ 2 ) e sia X 21 , X 22 , Κ , X 2 n un campione
2
casuale estratto dalla popolazione 2 con distribuzione simile alla variabile aleatoria X 2
≈ N( µ 2 , σ 2 ). Si assuma X 1 indipendente da X 2 e che la varianzaσ 2sia incognita. Sia no X 1 e S12 rispettivamente la media e la varianza campionaria del campione di taglia n1
e X 2 e S 22 rispettivamente la media e la varianza campionaria del campione di taglia
n2 .Un intervallo di confidenza di coefficiente (1 − α ) per la differenza delle medie
µ1 − µ 2 risulta
X 1 − X 2 − tα / 2 ,n + n − 2 S p
1
2
1 1
1 1
+
≤ µ1 − µ 2 ≤ X 1 − X 2 + tα / 2 ,n + n −2 S p
+
n1 n2
n1 n2
1
(
)
dove tα / 2 ,n + n −2 è tale che P T < tα / 2 ,n + n −2 = 1 −
1
2
1
2
student con n1 + n2 − 2 gradi di libertà e
Sp =
α
, con T variabile aleatoria di T 2
[(n − 1)S + (n
1
− 1)S 22
n1 + n2 − 2
2
1
2
2
]
Probabilità e Statistica I - a.a. 04/05 - Intervalli di confidenza
13
Esercizio: Si stanno analizzando due catalizzatori per determinare come influenzano
il prodotto medio di un processo chimico. Il primo catalizzatore è quello in uso, ma
anche il secondo potrebbe essere impiegato, soprattutto perché è più economico, specialmente se non modifica il prodotto medio del processo in esame. Viene effettuato
un test e i risultati sono
I cataliz.
II cataliz.
91,5
89,19
94,18
90,95
91,18
90.46.00
95,39
93,21
91,79
97,19
89,07
97,04
94,72
91,07
89,21
92,75
C’è una differenza significativa?
I catalizzatore
II Catalizzatore
Media
Errore standard
Mediana
Moda
Deviazione standard
Varianza campionaria
Curtosi
Asimmetria
Intervallo
Minimo
Massimo
Somma
Conteggio
Livello di confidenza(95,0%)
92,13
0,854016
91,645
#N/D
2,415521
5,834743
-1,50642
0,080259
6,32
89,07
95,39
737,04
8
2,019425
Media
Errore standard
Mediana
Moda
Deviazione standard
Varianza campionaria
Curtosi
Asimmetria
Intervallo
Minimo
Massimo
Somma
Conteggio
Livello di confidenza(95,0%)
Probabilità e Statistica I - a.a. 04/05 - Intervalli di confidenza
81,89774
11,20444
91,91
#N/D
31,69094
1004,315
7,809321
-2,7828
93,40806
3,781944
97,19
655,1819
8
26,49427
14
Rappor ti tr a var ianz e campionar ie
DISTRIBUZIONE DI FISHER
Definizione
SianoW e Y due variabilialeatorieindipendenti con distribuzione chi - quadrodi gradi di libertà
W/w
w e u. Allorail rapporto F =
ha funzionedensità della seguenteforma :
Y/u
w+u
Γ
2 
f F (x ) = 
 w u 
Γ  Γ  
 2  2
w/ 2
 w
(w )−
  x /2 1
u
 
,x >0
( u+w) / 2
w

 u x + 1


e si dice che la variabilealeatoria F ha distribuzione di
Fischer con gradi di libertà w e u.
f1−α ,w,u =
1
f α ,u , w
, dove fα ,u ,w è tale che P( F > fα ,u ,w ) = α
Probabilità e Statistica I - a.a. 04/05 - Intervalli di confidenza
15
Assun zioni
1. Sia X 11 , X 12 , Κ , X 1n1 un campione casuale estratto dalla popolazion e 1 con distribuzi one simile
alla variabile aleatoria X 1 ≈ N( µ 1 , σ 12 ) , σ 12 incognita.
2. Sia X 21 , X 22 , Κ , X 2 n2 un campione casuale estratto dalla popolazion e 2 con distribuzi one simile
alla variabile aleatoria X 2 ≈ N( µ 2 , σ 22 ) , σ 22 incognita
3. Le variabili X 1 e X 2 sono indipenden ti.
4. Sia X 1 la media campionaria del campione di taglia n1 e X 2 la media campionari a del campio ne di taglia n 2 .
Poichè la variabile aleatoria
(n1 − 1) S12
è chi - quadro con gradi di libertà (n1 − 1) e la variabile aleatoria
σ 12
(n 2 − 1) S 22
è chi - quadro con gradi di libertà ( n2 − 1), allora la variabile aleatoria
σ 22
(n1 − 1) S12
/ (n1 − 1)
σ 12
=
F≈
(n2 − 1)S 22 / (n − 1)
2
σ 22
S12
σ 12 S12 σ 22
= 2 2
S 22
S2 σ1
σ 22
ha distribuzi one F - Fisher con gradi di libertà n1 − 1, n 2 − 1.
Probabilità e Statistica I - a.a. 04/05 - Intervalli di confidenza
16
Rappor ti tr a var ianz e campionar ie
Sia X 11 , X 12 , Κ , X 1n un campione casuale estratto dalla popolazion e 1 con distri 1
buzione simile alla variabile aleatoria X 1 ≈ N( µ1 , σ 12 ) e sia X 21 , X 22 , Κ , X 2 n un
2
campione casuale estratto dalla popolazion e 2 con distribuzi one simile alla variabile
aleatoria X 2 ≈ N( µ 2 , σ 22 ). Si assuma X 1 indipenden te da X 2 e che le varianze σ 12
e σ 22 siano incognite. Sia S12 la varianza campionari a del campione di taglia n1 e
S 22 la varianza campionari a del campione di taglia n2 .Un intervallo di confidenza
di coefficien te (1 − α ) per il rapporto tra le varianze σ 12 / σ 22 risulta
σ 2 S2
S12
f1−α / 2 ,n −1,n −1 ≤ 12 ≤ 12 f α / 2 ,n −1,n −1
2
σ 2 S2
S2
2
(
1
2
)
dove f1−α / 2 ,n −1,n −1 è tale che P F < f1−α / 2 ,n −1,n −1 =
2
(
1
)
P F < f α / 2 ,n −1,n −1 = 1 −
2
1
n2 − 1 e n1 − 1.
2
1
1
α
e fα / 2 ,n −1,n −1 è tale che
2
2
1
α
e F ha distribuzi one di Fischer con gradi di libertà
2
Probabilità e Statistica I - a.a. 04/05 - Intervalli di confidenza
17
Esercizio: Sono state condotte delle analisi sulla quantità di calcio presente in un ce-
mento standard e in un cemento drogato con piombo. I risultati hanno mostrato che
livelli ridotti di calcio indicano una diminuzione del meccanismo di idratazione nel
cemento. In tal caso bisognerebbe intervenire con iniezioni di acqua in vari punti
della struttura di cemento. In 10 campioni di cemento standard si è registrata una
percentuale media di calcio pari al 90%, con deviazione standard stimata del 5%,
mentre in 15 campioni di cemento trattato con piombo la percentuale media di calcio è stata stimata pari al 87.0% con una deviazione standard stimata del 4.0%.
Assumendo che la distribuzione di calcio nel cemento standard e in quello drogato
sia normale con stessa deviazione standard, costruire un intervallo di confidenza
del 95% per la differenza delle medie delle due popolazioni.
Esercizio: Una compagnia produce motori per turbine. Una delle operazioni consiste
nella smerigliatura di una particolare superficie che termina su un componente in lega al titanio. Possono essere impiegate due differenti procedure per la smerigliatura
e in media esse producono lo stesso coefficiente di rugosità delle superfici. L’ingegnere responsabile del progetto vuole selezionare la procedura che produce meno
variabilità nella rugosità delle superfici trattate. Per questo motivo valuta per 11
campioni ottenuti dal primo processo la deviazione standard del coefficiente di
rugosità (5.1 mm) e fa lo stesso per 16 campioni ottenuti dal secondo processo
(4.7mm). Cosa può dedurre l’ingegnere?
Probabilità e Statistica I - a.a. 04/05 - Intervalli di confidenza
18