INDAGINE ESAUSTIVA O CAMPIONARIA? Si ricorre certamente all’indagine per campione quando la rilevazione completa è impossibile e quando la determinazione delle modalità possedute dalle unità in esame ne comporta la distruzione (Es.: lo studio della durata della durata di un nuovo tipo di contenitore sigillante); Si può scegliere l’indagine l’indagine campionaria quando: • • • La popolazione che si studia è numerosa; E’ insediata su un territorio vasto; Deve essere osservata ripetutamente nel tempo. Se si considera l’aspetto economico, la rilevazione parziale conviene rispetto a quella totale quasi sempre (tranne quando siano disponibili dati su supporto magnetico) Le indagini sono da preferirsi quando: • • • Si voglia andare in profondità nella ricerca della informazione; Per la rapidità nel raccogliere e trattare i dati; Per la rapidità nella pubblicazione dei dati . QUINDI NASCE L’ESIGENZA DI EFFETTUARE L’INDAGINE CAMPIONARIA POPOLAZIONE E CAMPIONE POPOLAZIONE, o UNIVERSO è ogni insieme finito o infinito di unità, le quali non sono necessariamente organismi viventi; Data una popolazione composta da N unità statistiche, CAMPIONE è l’insieme delle n unità selezionate tra le N che compongono la popolazione allo scopo di rappresentarla quanto ai caratteri, o variabili, oggetto dello studio; L’aggregato rappresentato dal campione è la POPOLAZIONE DI RIFERIMENTO; Le unità che appartengono al campione sono dette UNITA’ CAMPIONARIE; Il DISEGNO DI CAMPIONAMENTO è l’insieme delle regole seguite per formare un campionamento IL CAMPIONAMENTO ED IL “CASO” La nostra scelta va sulle tecniche di campionamento che hanno in comune la casualità nella determinazione delle unità che entrano a far parte dell’insieme da osservare; La casualità si attribuisce: • • Attribuendo ad ogni unità della popolazione una probabilità positiva di essere selezionata; Utilizzando in modo appropriato le tecniche per la selezione casuale del campione; Al caso è affidato il compito di identificare il codice delle unità che devono essere inserite nel campione. La casualità della selezione si propone essenzialmente come metodo finalizzato all’ottenimento di un campione rappresentativo della popolazione con riguardo ad ogni variabile, nota a priori dopo la selezione; I campioni non probabilistici riflettono nel bene e nel male l’orientamento di colui che li forma; Da rigettare, in linea di principio, sono i campioni formati “a casaccio”, o con adesione volontaria dei rispondenti. IL DISEGNO DI CAMPIONAMENTO E’ l’insieme delle decisioni prese nel formare il campione. Si tratta di rispondere alle seguenti domande: 1) Quale struttura deve avere il campione? 2) Quali probabilità di selezione? 3) Quanto numeroso deve essere il campione? LA STRUTTURA DEL CAMPIONE Semplice, se la lista della popolazione è unica; Complessa, se sono necessarie più liste; PROBABILITA’ DI SELEZIONE Costanti, se sono uguali per tutte le unità di una lista; Variabili, quando ad ogni unità si assegna una probabilità di selezione sua propria ed ammonta ad 1 per il complesso delle unità listate pi probabilit à di selezione, per ogni N della lista 0 pi 1, i 1,..., N LA DIMENSIONE OTTIMA DEL CAMPIONE E’ determinabile in funzione del disegno di campionamento. LA SELEZIONE CASUALE DEL CAMPIONE SELEZIONE CON REINSERIMENTO Per estrarre un campione con probabilità diseguali si assegnano singolarmente alle unità tanti numeri casuali che, rapportati al totale dei numeri assegnati, eguaglino le probabilità di selezione. Una unità si considera selezionata se si estrae uno dei numeri casuali ad essa assegnati. Una unità compare nel campione con ripetizione se viene estratto più di un numero casuale ad essa assegnato N M Se M numero intero, M M , p i i i i i M La probabilità di inclusione nel campione: Il reinserimento ricrea ad ogni estrazione la situazione di partenza, qualunque sia la numerosità del campione. Ad ogni estrazione immutata la probabilità di selezione delle unità. In n estrazioni, la probabilità di includere l’unità i nel campione è npi; Se la probabilità iniziale è costante (1/N), la probabilità totale i : i n 1 n N N Se la probabilità pi è variabile: i npi IL CAMPIONAMENTO CASUALE SEMPLICE Si consideri una popolazione di N unità. SI dice casuale semplice il campione di n unità estratte dalla popolazione con uguale proprietà (1/N) ad ogni passo dell’estrazione. La probabilità che un’unità compaia nel campione è la somma delle probabilità che vi compaia è la somma della probabilità che vi compaia in una qualsiasi delle n prove, e cioè n/N. La costanza delle probabilità ad ogni successiva estrazione equivale alla equiprobabilità di ogni possibile campione con le stesse caratteristiche dimensionali. Un campione casuale si può ottenere con: • Selezione casuale con reinserimento; • Selezione casuale senza reinserimento; • Selezione sistematica (anche detta “pseudo-casuale”) ma solo se le posizioni della lista sono mescolate fino all’ottenimento di un ordinamento assolutamente casuale. Il campionamento casuale semplice si assume nella teoria dell’inferenza statistica quando non è precisato il disegno adottato. Al campionamento casuale semplice si applicano stimatori con i quali si confrontano quelli propri di altri disegni di campionamento. IL CAMPIONAMENTO CASUALE SEMPLICE: la stima Siano Y1,…,Yi,…,YN i valori delle N unità della popolazione e y1,…,yi,…,yN i valori osservati presso le n unità campionarie. n MEDIA CAMPIONARIA: y j n y j Yˆ N La VARIANZA della media campionaria con un campione con reimmissione è Sy2 Var ( y ) n 2 Sy è la VARIANZA “elementare”, o “della popolazione”, della variabile osservata: 2 1 N Yi S N 1 i 2 y da stimare con 2 1 N s y i y n 1 i 2 y IL CAMPIONAMENTO STRATIFICATO “Stratificare” una popolazione significa ripartirla in sottopopolazioni, dette “STRATI”. Perché stratificare: • Evidenziare l’insieme delle unità significative per la ricerca; • Separare dalle altre le sottopopolazioni fisicamente isolate e con caratteristiche speciali; • Individuare certe unità che si vogliono osservare con tecniche particolari; • Introdurre sulla selezione il massimo controllo, pur mantenendola casuale; • Individuare sottopopolazioni al massimo omogenee rispetto alla variabile o alle variabili da rilevare e ricavare così stime più efficienti di quelle ottenibili con un campione casuale semplice. Per stratificare, si devono specificare gli attributi in base ai quali va suddivisa la popolazione e, correlatamente, il numero di strati. Le caratteristiche per la stratificazione devono essere note prima della selezione per ogni unita’ statistica. Ogni unità statistica appartiene ad un solo strato. STRATIFICATO E’ UN CAMPIONE TRATTO DA UNA POPOLAZIONE STRATIFICATA. SICCOME OGNI STRATO E’ UNA POPOLAZIONE IN SENSO PROPRIO, IL CAMPIONE CHE SI SELEZIONA DA UNO STRATO E’ IDONEO A RAPPRESENTARLA. IL CAMPIONE OTTENUTO PER UNIONE DI QUELLI DEI SINGOLI STRATI MIRA A RAPPRESENTARE L’INTERA POPOLAZIONE. IL CAMPIONAMENTO STRATIFICATO: la stima nh La MEDIA CAMPIONARIA y yh La MEDIA dell’intero campione hi i [h 1,..., H] nh H H y Wh y h h h Nh yh N [h 1,..., H] La VARIANZA della MEDIA dell’intero campione S2h Var ( y h ) con reimmissione nh H 2 h Var ( y ) W Var ( y h ) h … che si stima con 2 1 nh ŝ y hj y h nh 1 j 2 h [h 1,..., H] IL CAMPIONAMENTO SU PIU’ STADI (cenni) Un esempio di campionamento su più stadi è quello condotto dall’ISTAT per svolgere l’indagine sulle forze del lavoro in Italia. Il campione di unità da intervistare per questa indagine si forma selezionando alcuni Comuni … ITALIA Comune 1 Comune 2 …. Comune N Comune 2 …poi un insieme di famiglie dalle anagrafi dei Comuni… Famiglia 1 Famiglia 2 …. Famiglia M …. Marco Rossi Famiglia 1 …infine si seleziona il “grappolo” dei componenti delle famiglie individuate. Mario Rossi Anna Bianchi In Rossi L’EFFETTO DEL DISEGNO DI CAMPIONAMENTO In un campione casuale complesso (diverso da quello semplice), l’errore di campionamento può essere espresso in una forma che evidenzia il guadagno o la perdita di precisione delle stime rispetto all’analoga stima ottenibile con un campione casuale semplice di pari numerosità. Siccome un campione stratificato è generalmente più efficiente di un campione casuale semplice , la numerosità campionaria necessaria per ottenere stime di pari efficienza è inferiore con un campionamento stratificato. Il campionamento su più stadi è spesso utilizzato su vasta scala perché la rilevazione dei dati è concentrata sui punti selezionati al 1° stadio. Risultano facilitati l’organizzazione del lavoro in loco e l’esecuzione della rilevazione. Risultano minori i costi E’ più complessa la stima Vi è rischio di inefficienza