Campione e campionamento 4 tipi di campionamento • • • • Arbitrario Finalizzato a uno scopo Di convenienza Probabilistico Il campionamento probabilistico • • • • • Sistematico (non casuale) Casuale semplice Casuale stratificato A gruppi (Blocchi – Grappoli) A più stadi Campionamento probabilistico: tutte le unità hanno la stessa probabilità di essere estratte Casuale semplice • La popolazione è omogenea rispetto al problema di interesse • Campionamento casuale semplice Casuale stratificato • Si suddivide la popolazione in sottopopolazioni omogenee rispetto ad una caratteristica (sesso, livello socioeconomico, età…) e da queste so estraggono campioni casuali semplici • Campionamento casuale stratificato (sottoinsiemi caratterizzati da minor dispersione) A gruppi • Cfr. a Blocchi • Campionamento casuale in blocchi (si divide, ad esempio, una città in blocchi di abitazioni, corrispondenti a parti della popolazione da analizzare) A più stadi • Cfr. Campionamento a scelta multipla • Cfr. A grappoli (popolazione naturalmente suddivisa) (dopo aver scelto alcuni blocchi di abitazioni, si estraggono a sorte i soggetti) Operazioni di campionamento 1. Definire e identificare il quadro di riferimento del campione (elementi del campione) 2 Determinare la grandezza desiderata del campione • La media del campione non coincide con la media della popolazione in base all’errore di campionamento Estraendo infiniti campioni dalla stessa popolazione e calcolando le medie Distribuzione campionaria (delle medie) Errore standard della media (DS) Si può stimare l’errore standard della media in base ai dati di un solo campione SM= sx/n La precisione aumenta, a parità di numerosità del campione, se la varianza diminuisce Numerosità del campione (n) Varianza del campione (S‘x)2 SM= s/√n 50 25 .71 100 .50 200 Più piccola è la varianza minore l’errore standard sulla media 50 50 1.00 .35 100 .71 200 .50 50 100 1.42 100 1.00 200 .71 Utilizzo l’errore standard della media SM quando voglio costruire un intervallo di fiducia della media del campione entro il quale con una certe probabilità cadrà la media della popolazione Esempio • Si vuole stimare il reddito medio mensile di una popolazione di 10.000 soggetti. Da due campioni, uno di 100 soggetti e uno di 1.000 soggetti otteniamo la media e la DS n Media DS 100 1.000 1.250.000 1.253.000 308 311 Calcoliamo l’errore di campionamento • • • • Intervallo di fiducia 95% Z= 1.96 100 casi = 60.368 1000 casi = 19.050 Conclusione • Con una probabilità del 95% il reddito medio della popolazione è: • 1.250.000 60.370 • 1.253.000 19.050 Campionamento a gruppi 1. Definire e identificare il quadro di riferimento del campione (elementi del campione) 2 Determinare la grandezza desiderata del campione • 3. Compilare una lista di tutti i membri della popolazione e assegnare a ciascuno un numero da zero a quello stabilito • 4. Selezionare arbitrariamente (ad esempio a occhi chiusi) un numero da una tavola dei numeri random 5. Se il numero scelto è nella lista selezionare il soggetto 6. Iterare la procedura