Lezione 14 - Statistica

annuncio pubblicitario
Lezione 14
A. Iodice
disuguaglianza
di Markov
Lezione 14
disuguaglianza
di Chebyshev
Statistica
Esempio 1
Stimatori
puntuali
Alfonso Iodice D’Enza
[email protected]
Statistiche
campionarie
media
campionaria
Esempio 2
Esempio 3
Università degli studi di Cassino
varianza
campionaria
A. Iodice ()
Lezione 14
Statistica
1 / 29
Outline
Lezione 14
A. Iodice
1
disuguaglianza di Markov
disuguaglianza
di Markov
2
disuguaglianza di Chebyshev
Esempio 1
3
Stimatori puntuali
Statistiche
campionarie
4
Statistiche campionarie
media
campionaria
5
media campionaria
Esempio 2
Esempio 3
6
varianza campionaria
disuguaglianza
di Chebyshev
Esempio 1
Stimatori
puntuali
Esempio 2
Esempio 3
varianza
campionaria
A. Iodice ()
Lezione 14
Statistica
2 / 29
Importanti disuguaglianze
Lezione 14
A. Iodice
disuguaglianza
di Markov
disuguaglianza
di Chebyshev
Variabili casuali con distribuzioni non note
Le disuguaglianze di Markov e Chebyshev sono due risultati importanti perchè
consentono di porre una ’soglia’ superiore alle probabilità di eventi rari che
riguardano variabili casuale di cui non si conosce la distribuzione, ma solo valore
atteso oppure valore atteso e varianza.
Esempio 1
Stimatori
puntuali
Statistiche
campionarie
media
campionaria
Esempio 2
Esempio 3
disuguaglianza di Chebyshev
disuguaglianza di Markov
Sia X una variabile casuale mai
negativa, allora per qualunque valore
a>0
P (X ≥ a) ≤
varianza
campionaria
A. Iodice ()
E [X]
a
Sia X una variabile casuale di cui si
conoscono solo la media µ e varianza
σ 2 , allora dato un qualunque valore
k > 0, vale la seguente relazione
P (| X − µ |≥ k) ≤
Lezione 14
σ2
k2
Statistica
3 / 29
Importanti disuguaglianze
Lezione 14
A. Iodice
disuguaglianza di Markov
Sia X una variabile casuale mai negativa, allora per qualunque valore a > 0
disuguaglianza
di Markov
P (X ≥ a) ≤
E [X]
a
disuguaglianza
di Chebyshev
Esempio 1
Stimatori
puntuali
dimostrazione
Si supponga che la v.c. X si distribuisca secondo una funzione di densità incognita f
Statistiche
campionarie
Z ∞
E [X] =
media
campionaria
Z ∞
Z a
xf (x)dx =
xf (x)dx ≥
xf (x)dx +
0
0
|
a
{z
}
|
{z
≥0
Esempio 2
Esempio 3
Z ∞
≥
varianza
campionaria
Z ∞
xf (x)dx ≥
a
|
}
≥0
Z ∞
f (x)dx = a P (X ≥ a)
af (x)dx = a
a
{z
perchè x∈[a,∞] quindi x≥a
a
}
|
{z
}
a è una costante
dunque
E [X] ≥ aP (X ≥ a) → P (X ≥ a) ≤
A. Iodice ()
Lezione 14
E [X]
a
Statistica
4 / 29
Importanti disuguaglianze
Lezione 14
A. Iodice
disuguaglianza
di Markov
disuguaglianza
di Chebyshev
Esempio 1
Stimatori
puntuali
disuguaglianza di Chebyshev
Sia X una variabile casuale di cui si conoscono solo la media µ e varianza σ 2 , allora dato un qualunque
2
valore k > 0, vale la seguente relazione P (| X − µ |≥ k) ≤ σ2
k
dimostrazione
Si consideri l’evento per cui vale | X − µ |≥ k: i valori di X, µ e k per cui vale la disuguaglianza sono gli
stessi per cui vale la disuguaglianza (X − µ)2 ≥ k2 . La probabilità che si verifichi una delle disuguaglianze
precedenti è dunque la stessa. Inoltre la variabile casuale (X − µ)2 è non negativa (essendo un quadrato),
dunque si può applicare la disuguaglianza di Markov, con a = k2 , quindi
Statistiche
campionarie
notare che = σ 2
z
media
campionaria
2
P (| X − µ |≥ k) = P ((X − µ)
Esempio 2
Esempio 3
varianza
campionaria
2
}|
{
h
i
2
E (X − µ)
≥k )≤
|
{z
k2
}
disuguaglianza di Markov
che verifica la disuguaglianza di Chebyshev
P (| X − µ |≥ k) ≤
A. Iodice ()
Lezione 14
σ2
k2
Statistica
5 / 29
Esempio
Lezione 14
A. Iodice
Il numero di automobili prodotte da una fabbrica in una settimana si distribuisce secondo una variabile
casuale X con media pari a 50.
Qual’è la probabilità che la produzione superi occasionalmente le 75 auto?
Qual’è la probabilità che la produzione sia compresa tra 40 e 60 pezzi, sapendo che la varianza della
distribuzione è pari a 25?
disuguaglianza
di Markov
disuguaglianza
di Chebyshev
svolgimento
Esempio 1
Poichè l’unica conoscenza della distribuzione di X è che E [X] = 50, per calcolare P (X ≥ 50) si
ricorre alla disuguaglianza di Markov.
Stimatori
puntuali
Statistiche
campionarie
P (X ≥ a) ≤
media
campionaria
E [X]
a
→ P (X ≥ 75) ≤
50
75
= 0.67
In questo caso, oltre alla media µ = 50, è nota anche la varianza σ 2 = 25. Si vuole la probabilità
che 40 ≤ X ≥ 60, quindi | 60 − 50 |=| 40 − 50 |= 10 = k, dunque P (| X − 50 |≥ 10)
rappresenta la probabilità che la produzione si discosti di più di 10 unità dalla media.
Esempio 2
Esempio 3
varianza
campionaria
P (| X − 50 |≥ 10) ≤
25
102
= 0.25
dunque la probabilità che la produzione si discosti di meno di 10 unità dalla media è
P (40 ≤ X ≥ 60) = 1 − P (| X − 50 |≥ 10) ≥ 1 − 0.25.
P (40 ≤ X ≥ 60) ≥ 0.75
A. Iodice ()
Lezione 14
Statistica
6 / 29
Distribuzione delle statistiche campionarie
Lezione 14
A. Iodice
disuguaglianza
di Markov
Popolazione e campione
La popolazione è un insieme molto grande di oggetti a cui sono associate delle
quantità misurabili. Il campione è un sottoinsieme ridotto della popolazione.
L’obiettivo dell’approccio statistico è analizzare il campione per trarre da esso
informazioni circa la popolazione.
disuguaglianza
di Chebyshev
Esempio 1
Stimatori
puntuali
Statistiche
campionarie
media
campionaria
Esempio 2
Esempio 3
varianza
campionaria
campione casuale
Per effettuare inferenze sulla popolazione in base al campione, si assume che vi
sia la popolazione segua una distribuzione di probabilità F . Estraendo
casualmente degli oggetti dalla popolazione per formare il campione, si assume
che ciascun valore ad essi associato sia una variabile casuale caratterizzata dalla
distribuzione F della popolazione.
definizione
Un insieme di X1 , X2 , . . . , Xn di variabili aleatorie indipendenti e distribuite
secondo una distribuzione F , si definisce campione casuale della distribuzione F .
A. Iodice ()
Lezione 14
Statistica
7 / 29
Distribuzione delle statistiche campionarie
Lezione 14
A. Iodice
disuguaglianza
di Markov
disuguaglianza
di Chebyshev
Esempio 1
Stimatori
puntuali
Statistiche
campionarie
media
campionaria
Esempio 2
Esempio 3
varianza
campionaria
Inferenza parametrica e non parametrica
La distribuzione F della popolazione è non nota. In alcuni casi è tuttavia possibile
che si conosca la famiglia di distribuzioni di variabili casuali a cui F appartiene, e
dunque si utilizza il campione per fare inferenza sui parametri che identificano F :
è il caso dell’inferenza parametrica. In altri casi non si ha alcuna informazione su
F : in questi casi si fa ricorso a tecniche di inferenza non parametrica.
La statistica
Uno stimatore è una funzione dei dati campionari. Poichè le osservazioni
campionarie sono v.c., e poichè una funzione di v.c. è a sua volta una v.c., allora
lo stimatore è una v.c. funzione dei dati campionari. Una statistica è uno
stimatore che utilizza i dati campionari per ottenere la stima di un parametro
della distribuzione F .
A. Iodice ()
Lezione 14
Statistica
8 / 29
Stimatori puntuali
Lezione 14
A. Iodice
disuguaglianza
di Markov
Definizione di stimatore puntuale
disuguaglianza
di Chebyshev
Sia X sia una v.c. di cui si conosce la famiglia di distribuzione (Normale,
Binomiale, Esponenziale, ...), ma di cui non si conosce il parametro θ che
caratterizza la distribuzione.
Esempio 1
Stimatori
puntuali
L’obiettivo è identificare il parametro θ, con la quale individuare la
distribuzione specifica della popolazione.
Statistiche
campionarie
Si ricorre ad un campione casuale X1 , X2 , . . . , Xn e ad una funzione nota
T (.) che riceve in input il campione casuale e, in base a questo, fornisce un
valore per il parametro incognito θ.
media
campionaria
Esempio 2
Esempio 3
varianza
campionaria
A. Iodice ()
Lezione 14
Statistica
9 / 29
Stimatori puntuali
Lezione 14
A. Iodice
disuguaglianza
di Markov
Definizione di stimatore puntuale
Prima di aver osservato il campione, X1 , X2 , . . . , Xn è una v.c., e
T (X1 , X2 , . . . , Xn ) = Tn è a sua volta una v.c. e si definisce stimatore del
parametro θ
disuguaglianza
di Chebyshev
Esempio 1
Dopo aver osservato il campione, si hanno le osservazioni x1 , x2 , . . . , xn
che, date in input a T (.), producono la stima (θ̂) del parametro incognito
Stimatori
puntuali
Statistiche
campionarie
T (x1 , x2 , . . . , xn ) = θ̂
media
campionaria
a seconda del campione estratto, si avrà una stima (valore θ̂) diversa,
dunque T (X1 , X2 , . . . , Xn ) = Tn avrà una propria distribuzione
campionaria.
Esempio 2
Esempio 3
varianza
campionaria
A. Iodice ()
Lezione 14
Statistica
10 / 29
Stimatori puntuali
Lezione 14
A. Iodice
disuguaglianza
di Markov
disuguaglianza
di Chebyshev
Esempio 1
Stimatori
puntuali
Statistiche
campionarie
media
campionaria
Esempio 2
Esempio 3
varianza
campionaria
A. Iodice ()
Lezione 14
Statistica
11 / 29
Stimatori puntuali
Lezione 14
A. Iodice
disuguaglianza
di Markov
disuguaglianza
di Chebyshev
Esempio 1
Stimatori
puntuali
Statistiche
campionarie
media
campionaria
Esempio 2
Esempio 3
varianza
campionaria
A. Iodice ()
Lezione 14
Statistica
12 / 29
Stimatori puntuali
Lezione 14
A. Iodice
disuguaglianza
di Markov
disuguaglianza
di Chebyshev
Esempio 1
Stimatori
puntuali
Statistiche
campionarie
media
campionaria
Esempio 2
Esempio 3
varianza
campionaria
A. Iodice ()
Lezione 14
Statistica
13 / 29
Stimatori puntuali
Lezione 14
A. Iodice
disuguaglianza
di Markov
disuguaglianza
di Chebyshev
Esempio 1
Stimatori
puntuali
Statistiche
campionarie
media
campionaria
Esempio 2
Esempio 3
varianza
campionaria
A. Iodice ()
Lezione 14
Statistica
14 / 29
Stimatori puntuali
Lezione 14
A. Iodice
Caratteristiche degli stimatori
disuguaglianza
di Markov
E’ necessario definire quali sono le caratteristiche desiderabili di uno stimatore Tn
di un parametro θ
disuguaglianza
di Chebyshev
la sufficienza di uno stimatore: questa caratteristica si riferisce alla capacità
dello stimatore Tn di un parametro θ di catturare tutta l’informazione
riguardante θ che è presente nel campione X1 , X2 , . . . , Xn ;
Esempio 1
Stimatori
puntuali
Statistiche
campionarie
- Formalemente, se X1 , X2 , . . . , Xn è un campione generato dalla v.c. X
con distribuzione f (x; θ) e Tn è uno stimatore di θ, allora
media
campionaria
Tn è sufficiente se φX x1 , x2 , . . . , xn | Tn = θ̂ NON DIPENDE DA θ
Esempio 2
Esempio 3
in altre parole, una volta ottenuta la stima θ̂, l’informazione su θ
inizialmente contenuta nel campione, viene interamente catturata dallo
stimatore Tn .
varianza
campionaria
A. Iodice ()
Lezione 14
Statistica
15 / 29
Stimatori puntuali
Lezione 14
A. Iodice
disuguaglianza
di Markov
Proprietà degli stimatori: non distorsione (unbiased estimators)
disuguaglianza
di Chebyshev
Uno stimatore Tn è non distorto se la media delle stime che produce (il valore
atteso della v.c. Tn ) coincide col parametro oggetto di stima. Formalmente:
Esempio 1
Stimatori
puntuali
Statistiche
campionarie
E(Tn ) = θ
la distorsione, o bias = b(Tn ), dello stimatore Tn , rappresenta dunque la
differenza tra il valore atteso di Tn e il parametro θ.
media
campionaria
b(Tn ) = E(Tn ) − θ
Esempio 2
Esempio 3
varianza
campionaria
uno stimatore non distorto è tale che b(Tn ) = 0.
A. Iodice ()
Lezione 14
Statistica
16 / 29
Stimatori puntuali
Lezione 14
A. Iodice
Proprietà degli stimatori: efficienza
disuguaglianza
di Markov
disuguaglianza
di Chebyshev
Esempio 1
Stimatori
puntuali
Statistiche
campionarie
media
campionaria
L’efficienza di uno stimatore corrisponde al grado di dispersione della
distribuzione di Tn rispetto al parametro θ oggetto di stima.
Se lo stimatore Tn è non distorto allora il grado di dispersione/efficienza delle
stime dipende dalla sua varianza V ar(Tn ).
Quando invece lo stimatore è distorto, bisogna tenerne conto, nella misura della
sua efficienza, anche del bias b(Tn ) e si ricorre al mean squared error (MSE)
M SE(Tn ) = E(Tn − θ)2 = V ar(Tn ) + [b(Tn )]2
Esempio 2
Esempio 3
varianza
campionaria
l’MSE, in caso di stimatori non distorti, coinciderà con la varianza di Tn perché
b(Tn ) = 0.
A. Iodice ()
Lezione 14
Statistica
17 / 29
Stimatori puntuali
Lezione 14
A. Iodice
disuguaglianza
di Markov
disuguaglianza
di Chebyshev
Proprietà degli stimatori: efficienza (2)
Dati due stimatori T1,n e T2,n si sceglierà il più efficiente, vale a dire, se
M SE(T2n ) > M SE(T1n ), allora per stimare il parametro θ si sceglierà T2n ;
Esempio 1
Stimatori
puntuali
Statistiche
campionarie
media
campionaria
Ricorrendo all’MSE si può stabilire, tra due stimatori, quale sia migliore perché
più efficiente, tuttavia non si può dire che lo stimatore scelto sia il più efficiente in
assoluto.
la disuguaglianza di Cramer e Rao indica la varianza minima che uno stimatore
non distorto può raggiungere:
Esempio 2
Esempio 3
quindi, se la varianza di uno stimatore Tn , non distorto, raggiunge il limite
indicato dalla disuguaglianza di Cramer e Rao, allora Tn risulta lo stimatore
di θ più efficiente in assoluto.
varianza
campionaria
A. Iodice ()
Lezione 14
Statistica
18 / 29
Distribuzione della media campionaria
Lezione 14
A. Iodice
Distribuzione della media campionaria
disuguaglianza
di Markov
disuguaglianza
di Chebyshev
Esempio 1
Stimatori
puntuali
Si consideri ad esempio una popolazione - ad esempio i lavoratori dipendenti - su
cui sia misurata una quantità numerica - ad esempio il reddito annuo percepito -;
il campione casuale estratto da tale popolazione è X1 , X2 , . . . , Xn , i valori
associati agli elementi del campione sono v.c. indipendenti e identicamente
distribuite (i.i.d.), tutte caratterizzate dalla stessa distribuzione F i cui parametri
sono µ e σ 2 (media e varianza).
Statistiche
campionarie
media
campionaria
La statistica media campionaria
X̄ :=
Esempio 2
Esempio 3
varianza
campionaria
X1 + X2 + . . . + Xn
n
funzione delle v.c. X1 , X2 , . . . , Xn del campione: si tratta di una variabile
casuale.
A. Iodice ()
Lezione 14
Statistica
19 / 29
Distribuzione della media campionaria
Lezione 14
A. Iodice
La statistica media campionaria
X̄ :=
disuguaglianza
di Markov
disuguaglianza
di Chebyshev
X1 + X2 + . . . + Xn
n
funzione delle v.c. X1 , X2 , . . . , Xn del campione: si tratta di una variabile casuale.
Esempio 1
Stimatori
puntuali
Statistiche
campionarie
media
campionaria
Esempio 2
Esempio 3
varianza di X̄
valore atteso di X̄
E X̄ = E
=
=
X1 + X2 + . . . + Xn
=
n
E [X1 ] + E [X2 ] + . . . + E [Xn ]
n
µ + µ + ... + µ
varianza
campionaria
n
=
nµ
n
=µ
var X̄ = var
=
= var
=
σ2
n2
X1
n
+
σ2
n2
X1 + X2 + . . . + Xn
+ var
+ ... +
X2
n
σ2
n2
n
=
=
+ . . . + var
nσ 2
n
=
Xn
n
=
σ2
n
nota
La distribuzione di X̄ risulta quindi centrata su µ, mentre la sua varianza diminuisce all’aumentare di n.
A. Iodice ()
Lezione 14
Statistica
20 / 29
Teorema del limite centrale
Lezione 14
A. Iodice
disuguaglianza
di Markov
disuguaglianza
di Chebyshev
Esempio 1
Stimatori
puntuali
Statistiche
campionarie
media
campionaria
Teorema del limite centrale (TLC)
Tale teorema è un risultato molto importante della teoria della probabilità: esso afferma che la somma di un
numero elevato di v.c. indipendenti si distribuisce approssimativamente secondo una normale.
TLC:
Se si considerano le v.c. X1 , X2 , . . . , Xn indipendenti e identicamente distribuite, tutte con media µ e
varianza σ 2 , allora
X1 + X2 + . . . + Xn
∼
2
N (nµ, nσ )
Se
in questione si sottrae la media nµ e si divide per lo scarto quadratico medio
√ alla somma
√
nσ 2 = σ n si ottiene la relazione precedente in versione standardizzata
X1 + X2 + . . . + Xn − nµ
√
σ n
Esempio 2
Esempio 3
∼
N (0, 1)
varianza
campionaria
A. Iodice ()
Lezione 14
Statistica
21 / 29
Esempio 2
Lezione 14
A. Iodice
disuguaglianza
di Markov
disuguaglianza
di Chebyshev
Esempio 1
Stimatori
puntuali
Statistiche
campionarie
Una compagnia di assicurazione ha 25000 polizze attive. Ciascun assicurato percepisce un risarcimento
annuo che rappresenta una v.c. che si distribuisce con media pari a 320 euro e scarto quadratico medio pari a
540 euro. Qual’è la probabilità che la compagnia paghi complessivamente 8300000 euro?
Svolgimento
Il risarcimento di ciascun cliente è Xi con i =
. . . , n ed n = 25000. La richiesta complessiva di
P1,
n
risarcimento da parte di tutti i clienti è X =
i=1 Xi . Poichè X è la somma delle v.c. Xi che sono
i.i.d., per il teorema del limite centrale risulta che X si distribuisce
√ come una normale con media
nµ = 25000 × 320 = 8000000. e scarto quadratico medio σ 25000 = 85381. Si vuole dunque
P (X > 8300000). In unità standard, il valore in questione è
media
campionaria
Z =
Esempio 2
Esempio 3
varianza
campionaria
X − nµ
8300000 − 8000000
=
= 3.51
√
σ n
85381
dunque
P (X > 8300000) = P (Z > 3.51) ≈ 0.
A. Iodice ()
Lezione 14
Statistica
22 / 29
Esempio 3
Lezione 14
A. Iodice
Il numero ideale di studenti di un corso del primo anno di università è 150. Il management didattico
dell’università sa che, in base agli anni precedenti, solo il 30% degli iscritti frequenta effettivamente i corsi,
dunque decide di accettare fino a 450 nuove iscrizioni. Qual’è la probabilità che il numero di studenti
frequentanti sia superiore a 150?
disuguaglianza
di Markov
Svolgimento
disuguaglianza
di Chebyshev
Esempio 1
Stimatori
puntuali
Statistiche
campionarie
Si definisca la v.c. X come il numero di studenti che frequentano, ciascuno studente iscritto corrisponde ad
una prova Bernulliana il cui esito può essere frequenta o non frequenta. X si distribuisce pertanto secondo
una distribuzione binomiale di parametri n = 450 e la probabilità di successo (lo studente iscritto frequenta)
è p = 0.3.
Per il teorema del limite centrale, poichè X è la somma di n v.c. Bernoulliane Xi , ciascuna con media
E [Xi ] = p e varianza pari a var (Xi ) = p(1 − p), allora X si distribuisce approssimativamente come
una normale con media µ = np e varianza pari a σ 2 = np(1 − p). (Si tratta dell’approssimazione della
binomiale alla normale).
media
campionaria
Esempio 2
Esempio 3
varianza
campionaria
La probabilità cercata è dunque P (X > 150.5) (lo ’+0.5’ in aggiunta è dovuto alla correzione di
continuità). Standardizzando il problema si ha
Z = p
X − np
np(1 − p)
=
150.5 − 450 × 0.3
150.5 − 135
=
= 1.59
√
450 × .3 × .7
9.72
da cui
P (X > 150.5) = P (Z > 1.59) ≈ 0.06.
A. Iodice ()
Lezione 14
Statistica
23 / 29
Varianza campionaria
Lezione 14
A. Iodice
Varianza campionaria
Dato un campione casuale X1 , X2 , . . . , Xn proveniente da una distribuzione con media µ e varianza σ 2 .
Sia X̄ la media campionaria. La statistica varianza campionaria è
disuguaglianza
di Markov
S
disuguaglianza
di Chebyshev
2
=
n
X
1
Xi − X̄
n − 1 i=1
2
Esempio 1
Stimatori
puntuali
Statistiche
campionarie
media
campionaria
valore atteso della varianza campionaria
Pn
Pn
Pn
2
2
2
Ricordando la relazione per la quale
i=1 (xi − x̄) =
i=1 xi − nx̄ , dove x̄ =
i=1 xi /n
dunque
!
n
n
X
X 2
1
1
2
2
2
da cui
S =
Xi − X̄
=
Xi − nX̄
n − 1 i=1
n − 1 i=1
Esempio 2
Esempio 3
(n − 1)S
varianza
campionaria
2
=
n
X
2
Xi − nX̄
2
i=1
andando ad effettuare il valore atteso di entrambi i lati dell’equazione si ha
h i
2
(n − 1)E S
=E
" n
X
#
2
Xi
h
i
2
− nE X̄
i=1
A. Iodice ()
Lezione 14
Statistica
24 / 29
Varianza campionaria
Lezione 14
valore atteso della varianza campionaria (seconda parte)
A. Iodice
disuguaglianza
di Markov
h i
2
(n − 1)E S
=E
" n
X
#
2
Xi
h
i
h
i
h
i
2
2
2
− nE X̄
= nE X1 − nE X̄
i=1
disuguaglianza
di Chebyshev
Esempio 1
Stimatori
puntuali
Statistiche
campionarie
media
campionaria
Esempio 2
Esempio 3
varianza
campionaria
h
i
poichè per qualunque v.c. Y vale la relazione E Y 2 = var(Y ) + E [Y ]2 allora
h i
h
i
h
i
2 2
2
2
2
(n − 1)E S
= nE X1 − nE X̄
= n var(X1 ) + E [X1 ]
− n var(X̄) + E X̄
|
{z
} |
{z
}
h
i
2
n E X1
h
i
nE X̄ 2
2
poichè sappiamo che E [X1 ] = µ, var(X1 ) = σ 2 , E X̄ = µ, var(X̄) = σn , quindi
h i
h i
σ2
2
2
2
2
2
2
2
2
2
(n − 1)E S
= nσ + nµ − n
− nµ = nσ − σ = σ (n − 1) ⇒ E S
=σ
n
il valore atteso della varianza campionaria è uguale alla varianza della popolazione
(nota: ecco perchè il denominatore di S 2 è (n − 1) e non n...)
A. Iodice ()
Lezione 14
Statistica
25 / 29
Varianza campionaria
Lezione 14
valore atteso della varianza campionaria (seconda parte)
A. Iodice
disuguaglianza
di Markov
h i
2
(n − 1)E S
=E
" n
X
#
2
Xi
h
i
h
i
h
i
2
2
2
− nE X̄
= nE X1 − nE X̄
i=1
disuguaglianza
di Chebyshev
Esempio 1
Stimatori
puntuali
Statistiche
campionarie
media
campionaria
Esempio 2
Esempio 3
varianza
campionaria
h
i
poichè per qualunque v.c. Y vale la relazione E Y 2 = var(Y ) + E [Y ]2 allora
h i
h
i
h
i
2 2
2
2
2
(n − 1)E S
= nE X1 − nE X̄
= n var(X1 ) + E [X1 ] − n var(X̄) + E X̄
|
{z
} |
{z
}
h
i
2
nE X1
h
i
nE X̄ 2
2
poichè sappiamo che E [X1 ] = µ, var(X1 ) = σ 2 , E X̄ = µ, var(X̄) = σn , quindi
h i
h i
σ2
2
2
2
2
2
2
2
2
2
(n − 1)E S
= nσ + nµ − n
− nµ = nσ − σ = σ (n − 1) ⇒ E S
=σ
n
il valore atteso della varianza campionaria è uguale alla varianza della popolazione
(nota: ecco perchè il denominatore di S 2 è (n − 1) e non n...)
A. Iodice ()
Lezione 14
Statistica
26 / 29
Distribuzione della varianza campionaria
Lezione 14
A. Iodice
disuguaglianza
di Markov
La v.c. chi-quadrato
La somma di n v.c. normali standard Z ∼ N (0, 1) al quadrato
P
n
2
2
i=1 Zi si distribuisce come una v.c. chi-quadro χ (n) con n gradi di libertà.
disuguaglianza
di Chebyshev
Esempio 1
Stimatori
puntuali
Statistiche
campionarie
media
campionaria
Esempio 2
Esempio 3
varianza
campionaria
A. Iodice ()
Lezione 14
Statistica
27 / 29
Distribuzione della varianza campionaria
Lezione 14
A. Iodice
disuguaglianza
di Markov
disuguaglianza
di Chebyshev
Esempio 1
Stimatori
puntuali
Statistiche
campionarie
Il valore atteso della v.c. chi-quadrato
Data una singola variabile normale standard Z, si consideri la varianza
var(Z) = E[Z 2 ]−(E[Z])2 poichè E[Z] = 0 allora var(Z) = E[Z 2 ]−(0)2 = E[Z 2 ]
poiché Z ∼ N (0, 1) segue che var(Z) = 1 = E[Z 2 ].
E’ dunque possibile dimostrare che il valore atteso della v.c. chi-quadrato è
uguale ai suoi gradi di libertà:
media
campionaria
"
Esempio 2
Esempio 3
E
n
X
i=1
varianza
campionaria
A. Iodice ()
#
Zi2 =
n
X
i=1
Lezione 14
n
X
E Zi2 =
1=n
i=1
Statistica
28 / 29
Distribuzione della varianza campionaria
Lezione 14
Ricordando che
A. Iodice
S2 =
disuguaglianza
di Markov
disuguaglianza
di Chebyshev
Esempio 1
Importante relazione
Vale la seguente relazione
Stimatori
puntuali
(n − 1)S 2
=
σ2
Statistiche
campionarie
media
campionaria
Esempio 2
Esempio 3
varianza
campionaria
n
2
1 X
Xi − X̄
n − 1 i=1
Pn
i=1
Xi − X̄
σ2
(X−µ)2
X−µ
∼ Z(0, 1), allora
∼ [Z(0, 1)]2
σ
σ2
2
P
2
i=1 (X−µ)
∼ n
i=1 [Z(0, 1)] ovvero si distribuisce
σ2
perché se
2
dunque
Pn
secondo una v.c.
chi-quadro con n gradi di libertà; se si sostituisce il parametro µ con il suo
stimatore
X̄, si perde un grado di libertà, dunque
P
n
i=1
(X−X̄)2
σ2
libertà.
A. Iodice ()
e
(n−1)S 2
σ2
si distribuiscono come un chi-quadro con n − 1 gradi di
Lezione 14
Statistica
29 / 29
Scarica