Distribuzioni campionarie

annuncio pubblicitario
Introduzione
Statistiche campionarie
Distribuzioni campionarie
Antonello Maruotti
.
A. Maruotti
.
.
.
.
.
Outline
1 Introduzione
2 Statistiche campionarie
.
.
.
.
.
.
Introduzione
Statistiche campionarie
Concetti base
Si riprendano le considerazioni fatte nella parte di statistica
descrittiva.
Si vuole studiare una popolazione con riferimento a particolari
caratteristiche di interesse.
La popolazione viene esaminata in modo parziale,
considerando un campione di unità statistiche, cioè un
aggregato di unità, appartenenti alla popolazione di
riferimento, selezionate mediante lesperimento di
campionamento.
La statistica inferenziale fornisce strumenti e metodi per
ricavare dai dati campionari informazioni sulla popolazione.
L’inferenza statistica studia l’analisi dei dati che costituiscono
un campione casuale, cioè selezionato mediante un
esperimento casuale (aleatorio).
.
A. Maruotti
.
.
.
.
.
Introduzione
Statistiche campionarie
Il campione
Se l’obiettivo è quello di ottenere informazioni sulla
popolazione utilizzando un suo sottoinsieme, il campione,
allora si pone il problema di come estrarre le unità statistiche
che entrano a far parte del campione medesimo.
Il campione deve essere rappresentativo.
La dimensione campionaria viene indicata con n.
Regola di selezione di tipo probabilistico ⇒ campione casuale
semplice.
.
A. Maruotti
.
.
.
.
.
Introduzione
Statistiche campionarie
Il campionamento casuale semplice
E’ necessario disporre di una lista di campionamento che
contiene tutte le unità statistiche della popolazione.
Alle unità della lista viene associato un numero (etichetta).
Dall’insieme dei numeri che identificano le unità statistiche ne
vengono estratti casualmente n.
.
A. Maruotti
.
.
.
.
.
Introduzione
Statistiche campionarie
Il campione casuale semplice
Le n unità sono estratte in modo tale che:
ogni unità della popolazione ha la stessa probabilità di essere
estratta
le n estrazioni sono effettuate ognuna indipendentemente
dall’altra
Esistono ovviamente altri metodi di campionamento.
E’ semplice dimostrare che l’operazione di estrazione di un
campione casuale semplice dalla popolazione X dà luogo ad una
n-pla (X1 , X2 , . . . , Xn ) a componenti indipendenti ed identicamente
distribuite a X .
.
A. Maruotti
.
.
.
.
.
Introduzione
Statistiche campionarie
Esempio
Consideriamo una popolazione di 4 individui di età: 18,20,22,24.
Quali sono i possibilie campioni di numerosità 2?
.
A. Maruotti
.
.
.
.
.
Introduzione
Statistiche campionarie
Statistiche campionarie
Una volta estratto il campione, calcoliamo su questo una o più
statistiche (media campionaria, somma campionaria, varianza
campionaria, etc.) utili per fare inferenza.
Osservazioni
Le statistiche assumono valori diversi su campioni diversi
La probabilità che una statistica assuma un determinato
valore dipende dalla probabilità di avere un campione con
determinate caratteristiche
Ogni statistica è una variabile aleatoria.
La loro distribuzione è detta campionaria in quanto è generata
considerando l’universo di tutti i possibili campioni
.
A. Maruotti
.
.
.
.
.
Introduzione
Statistiche campionarie
Media campionaria
Riprendiamo l’esempio precedente della popolazione
{18, 20, 22, 24}. Osserviamo che µ = 21 e σ 2 = 5. Calcoliamo ora
la distribuzione campionaria della media per n uguale a 1 e 2.
.
A. Maruotti
.
.
.
.
.
Introduzione
Statistiche campionarie
Media campionaria
.
A. Maruotti
.
.
.
.
.
Introduzione
Statistiche campionarie
Media campionaria: valore atteso e varianza
Si dimostra che in generale la media e la varianza della media
campionaria sono legate ai corrispondenti valori della popolazione
nel modo seguente
E (X̄ ) = µ
V (X̄ ) =
σ2
n
.
A. Maruotti
.
.
.
.
.
Introduzione
Statistiche campionarie
Campionamento da popolazione normale
Se la distribuzione della popolazione è di tipo normale allore è
possibile dimostrare che anche la media campionaria ha una
distribuzione di tipo normale.
.
A. Maruotti
.
.
.
.
.
Introduzione
Statistiche campionarie
Teorema del limite centrale
Per numerosità sufficientemente elevate la distribuzione della
media campionaria è ben approssimata da una normale.
.
A. Maruotti
.
.
.
.
.
Introduzione
Statistiche campionarie
Distribuzione campionaria
La variabile X assume due soli valori, 1 e 0, con frequenza relativa,
rispettivamente, p e 1 − p. E’ semplice verificare che in questo
modo per la popolazione risulta
µ = p,
σ 2 = p(1 − p)
mentre per il campione abbiamo
p̂ = x̄
La particolare codifica adottata ci permette di calcolare la
proporzione campionaria come la media del campione e quindi di
sfruttare le proprietà che conosciamo della media campionaria.
.
A. Maruotti
.
.
.
.
.
Introduzione
Statistiche campionarie
Distribuzione campionaria: proprietà
La media della proporzione campionaria è uguale alla
proporzione nella popolazione
µp̂ = µx̄ = µ = p
La deviazione standard è
√
σ
σp̂ = σx̄ = √ =
n
p(1 − p)
n
La forma della distribuzione: per il teorema del limite centrale
sappiamo che per n sufficientemente grande possiamo
assumere
p(1 − p)
p̂ ∼ N(p,
)
p
.
A. Maruotti
.
.
.
.
.
Scarica