Inferenza statistica

Inferenza statistica
Stefano Tonellato
Dipartimento di Statistica
Università Ca’ Foscari Venezia
Anno Accademico 2007-2008
Informazioni
Parte I
Informazioni preliminari
Informazioni
Informazioni sul docente
Nome: Stefano Tonellato
e-mail: [email protected] (= [email protected])
Orario di ricevimento:
Lunedı̀ dalle ore 13:30 alle ore 16:30;
Dipartimento di Statistica, primo piano, studio n. 19
Telefono: vietato, a meno di casi di straordinaria gravità
(pericolo di morte, guerra, invasione di marziani o apparizione
di fantasmi)
Informazioni
Modalità d’esame
1 Prova scritta (esercizi)
2
Prova orale (discussione della prova scritta, accertamento
della comprensione dei concetti fondamentali)
Informazioni
Prerequisiti
Statistica I e Statistica II (propedeutici)
Matematica I e Matematica II (contenuti dati per noti)
Informazioni
Programma del corso
1
Concetti fondamentali di calcolo delle probabilità. Richiami
sulle variabili casuali e considerazione di alcune particolari
distribuzioni di probabilità
2
Stima dei parametri di un modello statistico e misure di
qualità degli stimatori. Definizione di modello statistico e di
stimatore; proprietà degli stimatori (molto dovrebbe essere
noto dai corsi di Statistica I e Statistica II).
3
Principio di verosimiglianza e stima di massima
verosimiglianza.
4
Ipotesi statistiche, test e funzione di potenza.
5
Test basati sul rapporto di verosimiglianza.
Informazioni
Riferimenti bibliografici
Testo di riferimento
D. Piccolo, Statistica, II ed., Il Mulino, pp. 969, Bologna, 2000.
(Capp. 12-19, 22, 24)
Letture integrative
A. M. Mood, F. A. Graybill, D. C. Boes, Introduzione alla
Statistica, McGraw-Hill, pp. 564, Milano, 1991.
A. Azzalini, Inferenza statistica. Una presentazione basata sul
concetto di verosimiglianza, Springer, pp. 367, Milano, 2001.
Introduzione al corso
Parte II
Introduzione
Introduzione al corso
Scopi del corso
Riprendere ed approfondire alcuni concetti chiave
dell’inferenza statistica. Vogliamo rispondere alle seguenti
domande
Stima dei parametri: che cos’è?
Verifica di ipotesi: che cos’è?
Fornire un metodo che permetta di attuare delle procedure
inferenziali. Vogliamo rispondere alle seguenti domande:
Stima dei parametri: come si potrebbe fare?
Verifica di ipotesi: come si potrebbe fare?
Non esiste un unico modo di procedere, ovvero non esiste un
unico metodo: per questo usiamo il condizionale.
Introduzione al corso
Esempio (statistica descrittiva)
Un’urna (popolazione di riferimento) contiene 5000 palline. Ne
esaminiamo completamente il contenuto e scopriamo che essa si
compone di:
2000 rosse
1700 bianche
1300 nere
La statistica descrittiva fornisce una sintesi di ciò che si è osservato
Introduzione al corso
Esempio (calcolo delle probabilità)
Si estrae a caso una pallina dall’urna considerata nell’esempio
precedente:
la probabilità che essa sia rossa è uguale a
la probabilità che essa sia bianca è uguale
la probabilità che essa sia nera è uguale a
2000
5000
1700
a 5000
1300
5000
Il calcolo delle probabilità quantifica l’aleatorietà dell’esito di un
esperimento casuale.
Introduzione al corso
Esempio (inferenza statistica)
Supponiamo di sapere soltanto che l’urna che stiamo considerando
contiene un numero ignoto di palline che possono essere rosse,
bianche oppure nere. Nulla sappiamo circa la percentuale dei
diversi tipi di palline presenti nell’urna
Si estraggono a caso e con reinserimento quattro palline dall’urna
con il seguente risultato: due palline rosse, una pallina bianca una
pallina nera
Sulla base di queste estrazioni e basandoci sulle frequenze relative
dei risultati osservati, stimiamo che, in seguito ad un’estrazione
casuale dall’urna, le probabilità di osservare rispettivamente una
pallina rossa, bianca o nera siano rispettivamente pari a 12 , 41 , 41
Introduzione al corso
Abbiamo estratto un campione casuale(4 palline) dalla
popolazione di riferimento (l’urna)
Abbiamo stimato le probabilità ignote di tre eventi utilizzando
le frequenze relative delle realizzazioni campionarie ad essi
corrispondenti (intutitivamente sembra logico agire cosı̀)
Abbiamo di fatto esteso all’intera popolazione l’informazione
fornitaci dal campione osservato (inferenza statistica, in
particolare stima di parametri ignoti)
Le stime ottenute non corrispondono alle probabilità dei tre
eventi
Introduzione al corso
Obiettivo fondamentale
Dobbiamo definire un metodo che ci consenta di costruire in modo
coerente delle procedure che permettano di:
estendere le informazioni che abbiamo acquisito dal campione
a tutta la popolazione;
limitare, nei limiti del possibile, i danni indotti da tali
procedure.
Variabili casuali
Parte III
Concetti fondamentali di calcolo delle probabilità
Variabili casuali
Ruolo delle variabili casuali
In prima battuta possiamo affermare che le variabili casuali
costituiscono dei possibili modelli adatti a rappresentare il
comportamento aleatorio dei fenomeni che ci interessano.
Vedremo nel seguito che esse avranno un’importanza
fondamentale nella valutazione dell’informazione che possiamo
trarre dalle osservazioni di cui disponiamo relativamente ai
fenomeni che ci interessano.
Variabili casuali
Spazio degli eventi
Sia Ω l’insieme (di numerosità non necessariamente finita) di tutti i
possibili risultati di un esperimento il cui esito sia incerto.
Evento elementare
Lo indicheremo con ω e rappresenterà un generico elemento di Ω
Evento
È un generico sottoinsieme di Ω: E ⊆ Ω.
Variabili casuali
Esempio (Lancio di un dado)
Nel lancio di un dado con le facce numerate da 1 a 6,
Ω = {1, 2, 3, 4, 5, 6}.
Gli eventi elementari sono:
ωi = {i},
i = 1, 2, . . . , 6
Un esempio di evento è:
E
= {Esce un numero pari e maggiore di 2}
= {4, 6} ⊆ Ω.
Variabili casuali
σ-algebra
F è una famiglia di eventi, cioè di sottoinsiemi di Ω. Deve godere
di alcune proprietà fondamentali. Qui ci interessa ricordare che F
rappresenta una lista di eventi dei quali ci interessa misurare il
grado di incertezza.
Variabili casuali
Se disponiamo di una coppia (Ω, F), possiamo costruire una
misura di probabilità:
Misura di probabilità
Una misura di probabilità, che chiameremo P, è una funzione
definita sugli eventi della “lista” F tale che:
1
P(E ) ≥ 0, ∀E ∈ F
2
P(Ω) = 1
3
Sia {Ei }, i = 1, 2, . . . , una successione
P∞di eventi tale che
∞
Ei ∩ Ej = ∅ ∀i 6= j, P(∪i=1 Ei ) = i=1 P(Ei )
Variabili casuali
Spazio di probabilità
La terna
(Ω, F, P)
rappresenta uno spazio di probabilità.
Variabili casuali
Definizione
Sia (Ω, F, P) uno spazio di probabilità assegnato e sia X (ω)
un’applicazione tale che:
a) ∀ ω ∈ Ω, X (ω) = x ∈ R;
b) ∀ x ∈ R, {ω ∈ Ω : X (ω) ≤ x} ∈ F.
L’applicazione X (ω) si dice variabile casuale.
Variabili casuali
Conseguenza della definizione:
per la variabile casuale X (ω) (che d’ora in poi chiameremo
semplicemente X ), una volta fissati due numeri reali arbitrari, a e
b, con a ≤ b, saremo sempre in grado di calcolare
P(X ∈ [a, b])
P(X ∈ (a, b))
P(X ∈ [a, b))
P(X ∈ (a, b])
P(X = a) (P(X 6= a))
P(X ≤ a) (P(X < a))
P(X ≥ a) (P(X > a))
Variabili casuali
Definizione
Una v.c. X che assume valori in un insieme finito,
IX = {x1 , x2 , . . . , xk },
o infinitamente numerabile,
IX = {x1 , x2 , . . . },
di valori, si dice discreta.
Variabili casuali
Definizione
La funzione
f (x) =
P(X = x) se x ∈ IX
0
altrimenti
si dice funzione di probabilità di X .
Proprietà di f (x)
0 ≤ f (x) ≤ 1
P
x∈IX f (x) = 1
Variabili casuali
Definizione
La funzione
F (x) = P(X ≤ x)
si dice funzione di ripartizione di X .
Proprietà di F (x)
limx→−∞ F (x) = 0, limx→∞ F (x) = 1
F (x) è non decrescente
F (x) è continua a destra e i suoi punti di discontinuità
coincidono con gli elementi di IX .
Variabili casuali
Definizione
Una v.c. X che assume valori in un insieme infinito e non
numerabile,
IX = [a, b] ⊆ R,
si dice assolutamente continua se esiste la funzione
F (x) = P(X ≤ x)
dotata delle seguenti proprietà:
limx→−∞ F (x) = 0, limx→∞ F (x) = 1
F (x) è non decrescente
F (x) è continua
Variabili casuali
Definizione (Funzione di densità di probabilità)
Se F (x) è una funzione derivabile,
f (x) =
dF (x)
dx
si dice funzione di densità di probabilità ed ha le seguenti proprietà:
f (x) ≥ 0;
R∞
−∞ f (x)dx = 1;
∀c, d ∈ R, c ≤ d,
Z
P(c ≤ X ≤ d) =
d
f (x)dx.
c
Variabili casuali
Definizione
La media di una variabile casuale X è definita come
 P

x∈I (X ) xf (x) se X è discreta
E (X ) =
 R
se X è continua
I (X ) xf (x)dx
Definizione
La varianza di una variabile casuale X è definita come
 P
2

x∈I (X ) (x − E (X )) f (x) se X è discreta


Var (X ) =
R

se X è assolutamente

 I (X ) (x − E (X ))2 f (x)dx
continua
Variabili casuali
Definizione
Sia X una variabile casuale. Il momento dall’origine di ordine
r , r = 1, 2, . . . , è definito come
µr = E (X r ).
Il momento centrato di ordine r , r = 1, 2, . . . , è definito come
µ̄r = E [(X − E (X ))r ].
Variabili casuali
Definizione
Sia p ∈ R, 0 ≤ p ≤ 1, e sia X una variabile casuale. Il quantile di
ordine p di X è definito come
xp ∈ R : F (xp ) ≥ p e 1 − F (xp ) ≤ 1 − p.
Se X è discreta, allora
xp = inf {x ∈ R : F (x) ≥ p}.
Se X è assolutamente continua, allora
xp = F −1 (p).
Variabili casuali
Definizione (Variabili casuali stocasticamente indipendenti)
Siano Xi , i = 1, . . . , n, n variabili casuali. Esse saranno
stocasticamente indipendenti se e solo se la loro funzione di
probabilità (densità di probabilità) congiunta sarà uguale al
prodotto delle funzioni di probabilità (densità di probabilità)
marginali delle singole variabili, ovvero:
fX1 ,...,Xn (x1 , . . . , xn ) =
n
Y
i=1
fXi (xi ) ∀(x1 , . . . , xn ) ∈ Rn .
Variabili casuali
Media e varianza di combinazioni lineari di variabili casuali
Siano Xi , i = 1, . . . , n, n variabili
P casuali con E (Xi ) = µi ∈ R e
Var (Xi ) = σi2 ∈ R+ e sia Y = ni=1 ai Xi , ai ∈ R. La media di Y
è data da
n
X
ai µi .
E (Y ) =
i=1
Inoltre,
Var (Y ) =
n
X
ai2 σi2 + 2
j
n X
X
i=1
ai aj Cov (Xi , Xj ).
j=1 i=1
Se Cov (Xi , Xj ) = 0 ∀i 6= j, allora
Var (Y ) =
n
X
i=1
ai2 σi2 .
Variabili casuali
Convergenza in probabilità
Una successione di variabili casuali Yn , n = 1, 2, . . . , converge in
probabilità alla variabile casuale Y se
lim P(|Yn − Y | < ε) = 1 ∀ ε > 0
n→∞
Si usa la simbologia
P
Yn −→ Y .
P
In particolare, se c ∈ R, Yn −→ c significa che
lim P(|Yn − c| < ε) = 1 ∀ ε > 0
n→∞
Variabili casuali
Legge debole dei grandi numeri, Khincine
Si consideri una successione di variabili casuali Yi , i = 1, 2, . . . ,
indipendenti,
identicamente distribuite con E (Yi ) = µ, e sia
P
Sn = ni=1 (Yi ). Allora
Ȳn =
Sn P
−→ µ
n
Variabili casuali
Convergenza quasi certa
Una successione di variabili casuali Yn , n = 1, 2, . . . , converge
quasi certamente alla variabile casuale Y se
P( lim |Yn − Y | = 0) = 1
n→∞
Si usa la simbologia
q.c.
Yn −→ Y .
q.c.
In particolare, se c ∈ R, Yn −→ c significa che
P( lim |Yn − c| = 0) = 1.
n→∞
Variabili casuali
Legge forte dei grandi numeri, Kolmogorov
Si consideri una successione di variabili casuali Yi , i = 1, 2, . . . ,
indipendenti, identicamente
P distribuite con E (Yi ) = µ e
E (|Yi |) < ∞, e sia Sn = ni=1 (Yi ). Allora
Ȳn =
Sn q.c.
−→ µ
n
Variabili casuali
Convergenza in distribuzione
Una successione di variabili casuali Yn , n = 1, 2, . . . , converge in
distribuzione alla variabile casuale Y se
lim n → ∞FYn (y ) = FY (y )
per ogni Y ∈ R in cui FY (y ) è continua.
Si usa la simbologia
D
Yn −→ Y .
Variabili casuali
Teorema centrale del limite, Lindeberg e Lévy
Si consideri una successione di variabili casuali Yi , i = 1, 2, . . . ,
indipendenti, identicamente
Pdistribuite con E (Yi ) = µ e
Var (Yi ) = σ 2 , e sia Sn = ni=1 (Yi ). Allora
Zn =
Sn /n − µ D
√
−→ N(0, 1)
σ/ n