5) IL CAMPIONE CASUALE SEMPLICE CON RIPETIZIONE

annuncio pubblicitario
5) IL CAMPIONE
CASUALE
SEMPLICE CON
RIPETIZIONE
CAMPIONE: sottoinsieme delle unità che
formano la popolazione oggetto di riferimento.
ESEMPIO
P=popolazione formata da N=4 unità (palline)
sulle quali sono presenti le manifestazioni di un
generico fenomeno qualitativo X
(contrassegno). A seguito di una rilevazione si
ottiene:
Variabile
statistica
160 170 180

2
1
 1
Oppure (con la variabile statistica articolata in
frequenze relative):
160 170 180
2
1
 1
 4
4
4
Si vuole ora avere informazioni sullo stesso fenomeno
ma entrandone in possesso solo in via campionaria. Si
effettuano cioè in P n=2 scelte “bernoulliane”:
supponendo le palline assolutamente identiche (a meno
del contrassegno) se ne estrae una; letto il numero, la si
introduce ancora nell’urna (per riprodurre nuovamente la
variabile statistica ), quindi si procede ad una seconda
estrazione. Supponendo che la coppia di numeri estratti
sia (170,160), essa viene chiamata “campione
bernoulliano” articolato in n=2 prove. L’attributo “con
ripetizione” indica che la stessa pallina può essere
estratta in entrambe le prove.
Definizione classica di probabilità:
Numero casi favorevoli
Numero casi possibili
Condizione: i casi possibili devono tutti essere alla
pari
Nel nostro caso le relative probabilità di costituire l’esito
della scelta sono:
per 160 1/4

per 170 2/4
per 180 1/4

Le tre coppie (160,1/4), (170,2/4), (180,1/4), prendono il
nome di variabile casuale  X.
N.B.
C X
Cioè la variabile statistica e la variabile casuale
coincidono essendo le quattro palline identiche e note per
quanto riguarda i rispettivi contrassegni. Ovviamente la
var. statistica tiene conto di ciò che si è osservato, mentre
la var. casuale descrive ciò che potrà accadere.
Ora: con la prima scelta può accadere:
Ciò che può accadere nella prima scelta è descritto dalla
v.c. X1:
X1
160 170 180
2
1
 1
 4
4
4
con la seconda scelta può accadere:
X2
170 180

160
2
1
 1

 4
4
4
Poiché ciascun risultato della seconda scelta può
associarsi a ciascun risultato della prima, le coppie
possibili (una delle quali costituirà l’esito campionario)
sono:
I prova (x1)
160
II prova (x2)
campione (x1, x2)
160
170
180
(160, 160)
(160, 170)
(160, 180)
170
160
170
180
180
160
170
180
:
(170, 160)
(170, 170)
(170, 180)
(180, 160)
(180, 170)
(180, 180)
Le nove coppie (x1, x2) sono le possibili determinazioni
della v.c. bidimensionale (X1, X2).
Si tratta ora di associare ai nove campioni le
corrispondenti probabilità di essere l’esito delle 2 prove.
Essendo le due prove in questione indipendenti, cioè tali
che l’esito di una prova prescinde totalmente dall’esito
dell’altra, la probabilità che la v.c. (X1, X2) valga la coppia
(x1, x2) è data da:
P(X1 = x1, X2 = x2) = P(X1 = x1)·P(X2 = x2)
Le probabilità associate alle nove coppie campionarie si
riassumono nella seguente tabella dove i valori interni
sono proprio queste probabilità, mentre i valori
dell’ultima riga e dell’ultima colonna sono le probabilità
chiamate marginali, che caratterizzano gli eventi della
prima prova e della seconda prova separatamente.
X1  prima prova
X 2  seconda prova
160
170
180
160 170 180
1
16
1
8
1
16
1
4
1
8
1
4
1
8
1
2
1
16
1
8
1
16
1
4
1
4
1
2
1
4
1
In precedenza si è supposto che le due scelte
nell’urna fornissero la coppia (170,160); dalla
tabella emerge ora che un tale evento ha
probabilità di verificarsi pari a 1/8.
In pratica la formazione del campione non
avviene ricorrendo alla scelta con ripetizione in
un’urna dove è riprodotta la popolazione in
esame, ma avviene secondo criteri proposti dalla
teoria delle rilevazioni campionarie.
In generale il campione viene realizzato con una
scelta in blocco di n unità, cioè n unità
contemporaneamente, così che sia esclusa la
possibilità di assumere più di una volta la stessa
informazione.
È possibile provare che, se la numerosità della
popolazione è sufficientemente elevata, i due
campioni con ripetizione o in blocco portano agli
stessi risultati. Per questo motivo si suppone
spesso che il campione sia del tipo con ripetizione
che consente il ricorso a formule più semplici.
Scarica