I FENOMENI DELICATI: CAMPIONAMENTO A RISPOSTE CASUALIZZATE Esistono dei caratteri particolari, i cosiddetti fenomeni delicati, a fronte dei quali gli individui non sono disposti a collaborare o a dire la verità. Due sono i tentativi, noti in letteratura, per trovare soluzione a tale problema. Metodo di S. Warner Sia P una popolazione costituita da N unità tutte supporto del carattere delicato Y, supposto dicotomo (A, A ). Tra gli N soggetti si supponga che ve ne siano h (ignoto) supporto della modalità A, pertanto la frazione h è anch’essa una quantità ignota. N Al fine di ottenere informazioni su si estrae un campione casuale semplice da P di ampiezza n (i1, i2, …, in), e quindi ogni individuo campionato viene sottoposto ad un esperimento casuale (S), per esempio: 1. estrazione casuale e segreta di una pallina da un’urna contenente m1 palline rosse ( R) e m2 palline verdi (V) tutte equiprobabili; 2. a seconda del risultato dell’esperimento il soggetto i-esimo dovrà rispondere secondo una precisa legge: se la pallina estratta è rossa (evento E) allora risponderà alla domanda diretta (per esempio: “sei drogato?”, “sei clandestino?”), viceversa se la pallina estratta è verde (evento E ) risponderà alla domanda indiretta (per esempio: “non sei drogato?”, “non sei clandestino?”). Entrambe le domande consentono solo risposte: si o no. Osservazioni: a) la composizione dell’urna è fissata ad arbitrio in modo tale da poter conoscere con esattezza la probabilità di estrazione. Proseguendo con l’esempio precedente, la probabilità di ottenere una pallina rossa è pari: p(E) = p(R) = m1 ; m1 m2 b) le domande poste permettono entrambe solo risposte affermative o negative; c) si suppone che con questa procedura il soggetto risponda sinceramente sentendosi tutelato; d) l’intervistatore ignora l’esito dell’esperimento, ma conosce la probabilità . Tenendo conto del carattere delicato e, congiuntamente, dell’esperimento i possibili esiti risultano essere: S E E A si no A no si X Effettuando n prove, cioè campionando n soggetti a cui sottoporre l’esperimento, si definisce x il numero di successi (vale a dire risposte “si”) e (n-x) il numero di insuccessi (risposte “no”), quindi potendo indicare nel modo seguente la probabilità di ottenere una risposta affermativa dal generico soggetto i, è possibile pervenire ad una stima dell’incognita : p(si) = 1 1 2 Infatti, al variare del campione x genera la v.c. X con distribuzione Binomiale (Bi; n, ). Quindi attraverso una stima di massima verosimiglianza per si ottiene la stima di oggetto di studio: Lx, x 1 n x ˆ x n ˆ n1 x n1 2 Osservazioni: a) E’ necessario porre 0.5 altrimenti la stima risulta indeterminata; b) Per tutelare gli intervistati è necessario che 1 e 0 Al variare dei campioni ˆ risulta determinazione di una v.c.: Med , Var 1 n1 2 2 n1 X caratterizzata da: n1 2 1 n La varianza dello stimatore risulta quindi scissa in due componenti: la varianza della v.c. X proporzione campionaria ed una parte che dipende da , dunque dovuta alla casualizzazione. n Ne discende che il campionamento a risposte casualizzate è è sicuramente meno efficiente del campionamento casuale tradizionale. Lo schema di Warner è stato successivamente rielaborato da Simmons che accanto al carattere delicato Y introduce un carattere K del tutto innocuo a cui, quindi, gli individui non hanno nessun problema a rispondere, e tale che Y e K siano incorrelati. Come Y anche K è scelto dicotomo (B, B ) e la quantità k (proporzione relativa al “successo” del carattere K) per semplicità è supposta nota. Inoltre, le risposte al fenomeno K sono ancora solo “si” o “no”. Nello schema di Simmons si effettua in primo luogo un esperimento casuale i cui risultati sono E o E , con pE , pE 1 . A secondo del risultato dell’esperimento casuale l’intervistato risponderà relativamente al carattere delicato Y o a quello innocuo K. Tenendo conto del carattere delicato di quello innocuo e, congiuntamente, dell’esperimento, i possibili esiti risultano essere: S E E AB si si AB no si A B no no AB si no X Effettuando n prove, cioè campionando n soggetti a cui sottoporre l’esperimento, si definisce x il numero di successi (vale a dire risposte “si”) e (n-x) il numero di insuccessi (risposte “no”), quindi potendo indicare nel modo seguente la probabilità di ottenere una risposta affermativa dal generico soggetto i, è possibile pervenire ad una stima dell’incognita : p(si) = k 1 Infatti, al variare del campione x genera la v.c. X con distribuzione Binomiale ( n, ). Quindi attraverso una stima di massima verosimiglianza per si ottiene la stima di oggetto di studio: Lx, x 1 n x ˆ x n ˆ x k n1 n Osservazione: Contrariamente a quanto accade nello schema di Warner in questo caso non vi sono vincoli per tranne i due ovvi ( 0, 1 ) che se non verificati comporterebbero l’eliminazione della casualizzazione. Al variare dei campioni ˆ risulta determinazione di una v.c.: X k n1 caratterizzata n da: Med , Var k 1 k n 1 1 k n