5) IL CAMPIONE CASUALE SEMPLICE CON RIPETIZIONE CAMPIONE: sottoinsieme delle unità che formano la popolazione oggetto di riferimento. ESEMPIO P=popolazione formata da N=4 unità (palline) sulle quali sono presenti le manifestazioni di un generico fenomeno qualitativo X (contrassegno). A seguito di una rilevazione si ottiene: Variabile statistica 160 170 180 2 1 1 Oppure (con la variabile statistica articolata in frequenze relative): 160 170 180 2 1 1 4 4 4 Si vuole ora avere informazioni sullo stesso fenomeno ma entrandone in possesso solo in via campionaria. Si effettuano cioè in P n=2 scelte “bernoulliane”: supponendo le palline assolutamente identiche (a meno del contrassegno) se ne estrae una; letto il numero, la si introduce ancora nell’urna (per riprodurre nuovamente la variabile statistica ), quindi si procede ad una seconda estrazione. Supponendo che la coppia di numeri estratti sia (170,160), essa viene chiamata “campione bernoulliano” articolato in n=2 prove. L’attributo “con ripetizione” indica che la stessa pallina può essere estratta in entrambe le prove. Definizione classica di probabilità: Numero casi favorevoli Numero casi possibili Condizione: i casi possibili devono tutti essere alla pari Nel nostro caso le relative probabilità di costituire l’esito della scelta sono: per 160 1/4 per 170 2/4 per 180 1/4 Le tre coppie (160,1/4), (170,2/4), (180,1/4), prendono il nome di variabile casuale X. N.B. C X Cioè la variabile statistica e la variabile casuale coincidono essendo le quattro palline identiche e note per quanto riguarda i rispettivi contrassegni. Ovviamente la var. statistica tiene conto di ciò che si è osservato, mentre la var. casuale descrive ciò che potrà accadere. Ora: con la prima scelta può accadere: Ciò che può accadere nella prima scelta è descritto dalla v.c. X1: X1 160 170 180 2 1 1 4 4 4 con la seconda scelta può accadere: X2 170 180 160 2 1 1 4 4 4 Poiché ciascun risultato della seconda scelta può associarsi a ciascun risultato della prima, le coppie possibili (una delle quali costituirà l’esito campionario) sono: I prova (x1) 160 II prova (x2) campione (x1, x2) 160 170 180 (160, 160) (160, 170) (160, 180) 170 160 170 180 180 160 170 180 : (170, 160) (170, 170) (170, 180) (180, 160) (180, 170) (180, 180) Le nove coppie (x1, x2) sono le possibili determinazioni della v.c. bidimensionale (X1, X2). Si tratta ora di associare ai nove campioni le corrispondenti probabilità di essere l’esito delle 2 prove. Essendo le due prove in questione indipendenti, cioè tali che l’esito di una prova prescinde totalmente dall’esito dell’altra, la probabilità che la v.c. (X1, X2) valga la coppia (x1, x2) è data da: P(X1 = x1, X2 = x2) = P(X1 = x1)·P(X2 = x2) Le probabilità associate alle nove coppie campionarie si riassumono nella seguente tabella dove i valori interni sono proprio queste probabilità, mentre i valori dell’ultima riga e dell’ultima colonna sono le probabilità chiamate marginali, che caratterizzano gli eventi della prima prova e della seconda prova separatamente. X1 prima prova X 2 seconda prova 160 170 180 160 170 180 1 16 1 8 1 16 1 4 1 8 1 4 1 8 1 2 1 16 1 8 1 16 1 4 1 4 1 2 1 4 1 In precedenza si è supposto che le due scelte nell’urna fornissero la coppia (170,160); dalla tabella emerge ora che un tale evento ha probabilità di verificarsi pari a 1/8. In pratica la formazione del campione non avviene ricorrendo alla scelta con ripetizione in un’urna dove è riprodotta la popolazione in esame, ma avviene secondo criteri proposti dalla teoria delle rilevazioni campionarie. In generale il campione viene realizzato con una scelta in blocco di n unità, cioè n unità contemporaneamente, così che sia esclusa la possibilità di assumere più di una volta la stessa informazione. È possibile provare che, se la numerosità della popolazione è sufficientemente elevata, i due campioni con ripetizione o in blocco portano agli stessi risultati. Per questo motivo si suppone spesso che il campione sia del tipo con ripetizione che consente il ricorso a formule più semplici.