Distribuzioni di campionamento

annuncio pubblicitario
OD
DISTRIBUZIONI
DI CAMPIONAMENTO
12
OD
DISTRIBUZIONE DI
CAMPIONAMENTO DELLA MEDIA
Situazione reale
Della popolazione di tutti i laureati in odontoiatria negli
ultimi 10 anni, in tutte le Università d’Italia, si vuole
calcolare l’età (in anni compiuti) al momento del
conseguimento della laurea.
Lavorare sull’intera popolazione è oneroso.
↓
Si decide di operare su un campione, costituito da
30 laureati di cui si calcola l’età media.
x = 26, 5 anni
↓
Se estraessimo un altro campione (di uguale
numerosità: n=30) e calcolassimo l’età media,
certamente troveremmo un valore diverso.
↓
Se estraessimo 100 campioni (sempre con n=30) e
calcolassimo l’età media, essa varierà da
campione a campione.
13
OD
LA VARIABILITÀ CAMPIONARIA
Campione
1
2
3
4
…
n
Media (anni)
26.5
27
25.8
25.75
29
28.1
DIVERSI CAMPIONI → DIVERSE MEDIE
Questa differenza nella media (e in qualsiasi altra
statistica) tra un campione e l’altro è nota come
VARIABILITÀ CAMPIONARIA.
È conseguenza del campionamento casuale.
14
OD
MEDIA CAMPIONARIA
Riassumendo
Da una popolazione si possono estrarre più campioni.
Su ciascun campione si può calcolare la statistica di
interesse.
Se la statistica di interesse è la media, si parlerà di
media campionaria.
La media campionaria è una variabile, perché può
assumere valori diversi che dipendono dal campione
estratto.
Della media campionaria è possibile costruire una
distribuzione di frequenza, in cui compaiono tutti i
possibili valori ottenuti da campioni diversi, tutti di
uguale dimensione:
la distribuzione di frequenza così ottenuta è detta
distribuzione di campionamento della media.
15
OD
DISTRIBUZIONE DI CAMPIONAMENTO
DELLA MEDIA
È la distribuzione di tutti i possibili valori assunti
dalla media, calcolati su tutti i possibili campioni
della stessa dimensione estratti da una data
popolazione.
x1
µ
xn
Quali caratteristiche avrà la distribuzione di
campionamento di queste medie?
16
OD
CARATTERISTICHE DELLA
DISTRIBUZIONE DI CAMPIONAMENTO
DELLA MEDIA
Se da una qualsiasi popolazione con media µ e deviazione
standard σ si estraggono tutti i possibili campioni di
dimensione n, la distribuzione delle medie campionarie ha
le seguenti caratteristiche:
1. ha media uguale alla media della popolazione:
µx = µ
2. ha varianza uguale alla varianza della popolazione
divisa per la dimensione del campione:
σx =
2
σ2
n
3. è distribuita normalmente
se
il campionamento è fatto da popolazione normale
oppure se
il campionamento è fatto da popolazione di qualsiasi
forma funzionale, purché la numerosità campionaria
n sia ≥ 30 (Teorema del Limite Centrale).
17
OD
ERRORE STANDARD
• La radice quadrata della varianza della media
campionaria è detta errore standard.
σx =
σ2
n
• L’errore standard è una misura della variabilità
della media campionaria.
• Tanto minore è la variabilità, tanto minore sarà
l’errore standard e tanto più attendibile la
statistica.
18
OD
LE DISTRIBUZIONI DI
CAMPIONAMENTO: APPLICAZIONI
La conoscenza delle distribuzioni di
campionamento
1. consente di calcolare la probabilità di ottenere
un campione con una certa media, o con altre
determinate statistiche;
2. fornisce la base teorica dell’inferenza statistica.
19
OD
1. PROBABILITÀ DI UN CAMPIONE
CON DATE STATISTICHE
Esempio
(Daniel pag.119 5.3.2)
Supponiamo che sia noto che, in una certa popolazione
umana, la lunghezza del cranio sia distribuita come una
normale con una media di 185.6 mm ed una deviazione
standard di12.7 mm. Qual è la probabilità che un campione
casuale semplice di dimensione 10, estratto da questa
popolazione, abbia una media maggiore di 190?
Soluzione
P( x >190 mm)=?
n=10
Assunzioni
La distribuzione di campionamento delle medie è
distribuita in modo normale.
Media
Popolazione
Distribuzione di
campionamento delle medie
µ=185.6 mm
µx = 185.6mm
Deviazione
σ=12.7 mm
standard
σ x = 12 . 7
10
= 4 . 0161 mm
20
OD
Standardizziamo la variabile d’interesse
applicando la formula seguente:
z=
x − µx
σ
=
n
x
190 − 185.6
= 1.10
12.7
10
La probabilità richiesta è rappresentata dall’area
sotto la curva della distribuzione di
campionamento a destra di z = 1.10
f (x)
Pr(x>190) =1 –Pr(x<190) = ?
x
0
185.6
190
Lunghezza del cranio (mm)
z
0
1,10
P(x>190) =1-P(x<190)=1–P(z<1,10)=
=1–0,8643=0,1357=13.57%
21
OD
DISTRIBUZIONE DI CAMPIONAMENTO
DI UNA PROPORZIONE:
CARATTERISTICHE
1. La media della distribuzione delle proporzioni
campionarie è uguale al valore vero della proporzione
nella popolazione:
µ p) = p
2.La varianza della distribuzione è data da:
σ
)2
p
p (1 − p )
=
n
3.La distribuzione è distribuita normalmente, se la
dimensione campionaria è grande; più precisamente
se:
np e n(1-p) sono > 5.
22
OD
Esempio
(Daniel pag.127 5.5.1)
Supponiamo di sapere che in una certa popolazione
umana la proporzione di daltonici sia 0.08.
Se, in generale, indichiamo con p una proporzione
nella popolazione, nel nostro esempio sarà p = 0.08
Se scegliamo casualmente 150 individui da questa
popolazione, qual è la probabilità che la proporzione
di daltonici nel campione sia uguale a 0.15?
Soluzione
P(p=0.15)=?
n=150
• La distribuzione di campionamento delle
proporzioni è distribuita in modo normale perché np
e n(1-p) sono entrambi maggiori di 5.
np = 150 • 0.08= 12
n(1-p) =150 • 0.92 = 138
• La media della distribuzione è uguale alla
proporzione nella popolazione: µ p) = p = 0 .08
• La varianza della distribuzione è calcolabile con la
formula seguente:
σ
)2
p
p (1 − p ) 0 .08 ⋅ (1 − 0 .08 )
=
=
= 0 .00049
n
150
23
OD
La probabilità richiesta P(p≥0.15) è l’area sotto la
curva di p̂ a destra di 0.15.
Standardizziamo:
(z = differenza tra statistica di interesse e media /
errore standard)
z=
pˆ − p
0.15 − 0.08
0.07
=
=
= 3.15
p (1 − p )
0.00049 0.0222
n
dalle tavole risulta che l’area a destra di z = 3.15
è 1-0.9992 = 0.0008.
Conclusione
La probabilità che pˆ ≥ 0.15 è 0.0008 = 0.08%.
N.B.
p̂
p
proporzione nel campione
proporzione nella popolazione
24
OD
DISTRIBUZIONE DI CAMPIONAMENTO
DELLA DIFFERENZA TRA DUE MEDIE:
CARATTERISTICHE
Teoria
Daniel pagg.122-126
DISTRIBUZIONE DI CAMPIONAMENTO
DELLA DIFFERENZA TRA DUE
PROPORZIONI:
CARATTERISTICHE
Teoria
Daniel pagg.130-132
25
Scarica