Statistica Inferenziale Riepilogo lezione 5

Statistica Inferenziale
Prof. Raffaella Folgieri
Email:
[email protected]
aa 2009/2010
Prof.R.Folgieri,aa 2009-10-email [email protected]
Riepilogo lezione 5
Abbiamo visto:
z Modelli probabilistici nel continuo
z Distribuzione uniforme continua
z Distribuzione esponenziale
z Distribuzione normale
z Distribuzione normale standardizzata
z Distribuzione T-Student
z Distribuzione Chi-quadrato
1
Prof.R.Folgieri,aa 2009-10-email [email protected]
Popolazione
z
Popolazione: totalità dei casi (unità statistiche) sede
del fenomeno oggetto di studio.
z
Rilevazione censuaria e campionaria: data una
popolazione finita un campione casuale di ampiezza
n si ottiene estraendo a sorte con reimmissione n
unità della popolazione
z
Popolazione finita e infinita (astrazione utile a fini
didattici)
F(x) = modello descrittivo della popolazione
Prof.R.Folgieri,aa 2009-10-email [email protected]
Campione
z
Campione casuale di ampiezza n: variabile
aleatoria multipla (X1, X2, …, Xn) le componenti sono
indipendenti e identicamente distribuite con
distribuzione f(x), dove f(x) denota il modello
descrittivo della popolazione. Indichiamo con
(x1,x2,…,xn) il campione effettivamente osservato: un
punto nello spazio euclideo ad n dimensioni
2
Prof.R.Folgieri,aa 2009-10-email [email protected]
Spazio campionario (Ω)
z
Spazio campionario (Ω): insieme di tutti i possibili
campioni estraibili dalla popolazione.
z
Spazio campionario discreto o continuo a seconda
se X è discreta o continua.
Prof.R.Folgieri,aa 2009-10-email [email protected]
Distribuzione del campione
z
Distribuzione del campione:
f(x1,x2,…,xn) = f(x1)f(x2)…f(xn)
Questa è una funzione di probabilità (caso discreto) o
di densità (caso continuo) a seconda della natura di
f(x) (o, equivalentemente, di X)
z
INDIPENDENZA delle osservazioni campionarie
3
Esempio
Prof.R.Folgieri,aa 2009-10-email [email protected]
…continua alla slide successiva
z
Siamo interessati a studiare la composizione delle famiglie
di una certa collettività.
Per semplicità, immaginiamo che vi siano solo 8 famiglie,
che etichettiamo con 1, 2, … 8 e che il numero di
componenti per ciascuna di esse sia dato da
z
Il numero di componenti nella popolazione è descritto da
z
Esempio
Prof.R.Folgieri,aa 2009-10-email [email protected]
…continua alla slide successiva
Il numero medio di componenti nella popolazione è
E(X) = 3.625 e la varianza nella popolazione è V(X) = 0.734.
z
z
Supponiamo ora di estrarre un campione casuale (cioè con
reimmissione) di ampiezza 2 dalla popolazione descritta.
z
Lo spazio dei possibili dati campionari, ossia di tutte le
coppie di valori del carattere “numero di componenti” che
potremmo rilevare (spazio campionario) è rappresentato
nella tabella (slide successiva), dove indichiamo in ogni
casella sia le possibili coppie di famiglie che potremmo
estrarre, sia (in grassetto) il corrispondente numero di
componenti.
4
Esempio
Prof.R.Folgieri,aa 2009-10-email [email protected]
…continua alla slide successiva
z
Tabella
Esempio
Prof.R.Folgieri,aa 2009-10-email [email protected]
…continua alla slide successiva
z
La distribuzione congiunta del campione (X1, X2) può
essere ottenuta facilmente dalla tabella precedente, ed è
descritta nella seguente
tabella a doppia entrata,
in cui, in ciascuna casella
riportamo anche, in
grassetto, il corrispondente
valore della media
campionaria:
5
Esempio
Prof.R.Folgieri,aa 2009-10-email [email protected]
…continua alla slide successiva
z
Notiamo che X1 e X2 sono indipendenti e
identicamente distribuiti con la stessa distribuzione
della popolazione X.
z
La definizione della media campionaria
si ottiene dalla tabella precedente, e risulta:
Prof.R.Folgieri,aa 2009-10-email [email protected]
Esempio
6
Prof.R.Folgieri,aa 2009-10-email [email protected]
Inferenza statistica
z
z
z
Parametro = ω = costante caratteristica della popolazione.
Nell’esempio precedente il parametro di interesse è il numero
di componenti della famiglia.
Parametri scalari e vettoriali. Per esempio:
–
–
z
z
Popolazione Bernoulliana: il parametro è p (scalare)
Popolazione Normale: il parametro è ω = (μ,σ2) (vettoriale)
Spazio dei parametri = Ω = insieme di tutti i valori plausibili per
il parametro. Per esempio: Popolazione Normale: Ω = (ℜ,ℜ+)
Inferenza statistica: risalire dai dati di un campione alle
caratteristiche rilevanti della popolazione, o meglio di un
parametro della popolazione (assunto un modello teorico per
la popolazione stessa
Prof.R.Folgieri,aa 2009-10-email [email protected]
Inferenza statistica: concetti
z
Stima dei parametri (puntiale o per intervallo): sulla
base del campione assegno al parametro di interesse
un valore o un insieme di valori
z
Verifica delle ipotesi: faccio una congettura sul
parametro e verifico, sulla base del campione, se essa
è accettabile (non vera!)
7
Prof.R.Folgieri,aa 2009-10-email [email protected]
Diversi approcci all’inferenza
z
Classico (Fisher, Neyman, Pearson): concezione
frequentista della probabilità; fa uso unicamente delle
informazioni contenute nel campione.
z
Bayesiano (Lindley, Savage, de Finetti): concezione
soggettivista della probabilità; fa uso anche di
informazioni a priori sui parametri espresse tramite
distribuzioi di probabilità.
z
Teoria delle decisioni (Wald): tiene contro delle
conseguenze di decisioni alternative espresse tramite
funzioni di perdita; può fare uso anche di informazioni
a priori.
Prof.R.Folgieri,aa 2009-10-email [email protected]
Statistiche campionarie
z
Statistica campionaria: una qualsiasi funzione
g(X1, X2, … , Xn)
del campione.
z
Poiché il campione è casuale, la statistica campionaria è una
variabile casuale.
8
Prof.R.Folgieri,aa 2009-10-email [email protected]
Prof.R.Folgieri,aa 2009-10-email [email protected]
Statistiche campionarie più comuni
…continua alla slide successiva
Statistiche campionarie più comuni
9
Prof.R.Folgieri,aa 2009-10-email [email protected]
Distribuzioni campionarie
z
Per una statistica campionaria
Y= g(X1,X2, …, Xn)
Si ha
dove
Distribuzione della media campionaria
Prof.R.Folgieri,aa 2009-10-email [email protected]
…continua alla slide successiva
z
In generale, indipendentemente dalla distribuzione della
popolazione, se la media della popolazione è μ e la
varianza della popolazione è σ2 abbiamo che:
10
Prof.R.Folgieri,aa 2009-10-email [email protected]
Distribuzione della media campionaria
z
Nota: la varianza della distribuzione della media
campionaria è tanto minore quanto maggiore è la
dimensione del campione. Inoltre la varianza è tanto
maggiore quanto maggiore è la varianza della popolazione
(nel caso limite in cui la popolazione ha varianza nulla,
anche la varianza della media campionaria è nulla).
Prof.R.Folgieri,aa 2009-10-email [email protected]
Popolazione Bernoulliana
11
Popolazione Normale
Prof.R.Folgieri,aa 2009-10-email [email protected]
…continua alla slide successiva
Prof.R.Folgieri,aa 2009-10-email [email protected]
Popolazione Normale
z
In altre parole la media campionaria, opportunamente
standardizzata, si distribuisce asintoticamente come una
Normale con media zero e varianza uno. Questo è il teorema
del limite centrale che enunciato in altri termini dice che la
media campionaria si distribuisce, asintoticamente (al crecere
del campione), come una normale con media uguale alla
media della popolazione e varianza pari alla varianza della
popolazione divisa per m (ampiezza campionaria):
12
Prof.R.Folgieri,aa 2009-10-email [email protected]
Nota bene
Prof.R.Folgieri,aa 2009-10-email [email protected]
Distribuzione della varianza
campionaria
z
In generale, indipendentemente dalla distribuzione della
popolazione, abbiamo che:
13
Prof.R.Folgieri,aa 2009-10-email [email protected]
Distribuzione della differenza tra due
medie campionarie
z
Da due diverse popolazioni provengono i campioni
(X1, X2, …, Xn) e (Y1, Y2, … , Yn)
Prof.R.Folgieri,aa 2009-10-email [email protected]
Distribuzione della differenza tra due
medie campionarie – casi particolari
14
Distribuzione di rapporti che
coinvolgono medie e varianze
campionarie
Prof.R.Folgieri,aa 2009-10-email [email protected]
…continua alla slide successiva
Prof.R.Folgieri,aa 2009-10-email [email protected]
Distribuzione di rapporti che coinvolgono
medie e varianze campionarie
15
Prof.R.Folgieri,aa 2009-10-email [email protected]
Riepilogo
Abbiamo visto:
z Definizione di popolazione, di campione e di spazio
campionario
z Distribuzione del campione
z Inferenza statistica – definizioni e approcci all’inferenza
z Statistiche campionarie
z Distribuzione della media campionaria
z Popolazione Bernoulliana e popolazione Normale
z Distribuzione della varianza campionaria
z Distribuzione della differenza tra due medie campionarie e
casi particolari
z Distribuzione di rapporti che coinvolgono medie e varianze
campionarie
16