i fenomeni delicati: campionamento a risposte

I FENOMENI DELICATI: CAMPIONAMENTO A RISPOSTE CASUALIZZATE
Esistono dei caratteri particolari, i cosiddetti fenomeni delicati, a fronte dei quali gli individui non
sono disposti a collaborare o a dire la verità. Due sono i tentativi, noti in letteratura, per trovare
soluzione a tale problema.
Metodo di S. Warner
Sia P una popolazione costituita da N unità tutte supporto del carattere delicato Y, supposto
dicotomo (A, A ). Tra gli N soggetti si supponga che ve ne siano h (ignoto) supporto della modalità
A, pertanto la frazione  
h
è anch’essa una quantità ignota.
N
Al fine di ottenere informazioni su  si estrae un campione casuale semplice da P di ampiezza n (i1,
i2, …, in), e quindi ogni individuo campionato viene sottoposto ad un esperimento casuale (S), per
esempio:
1. estrazione casuale e segreta di una pallina da un’urna contenente m1 palline rosse ( R) e m2
palline verdi (V) tutte equiprobabili;
2. a seconda del risultato dell’esperimento il soggetto i-esimo dovrà rispondere secondo una
precisa legge: se la pallina estratta è rossa (evento E) allora risponderà alla domanda
diretta (per esempio: “sei drogato?”, “sei clandestino?”), viceversa se la pallina estratta è
verde (evento E ) risponderà alla domanda indiretta (per esempio: “non sei drogato?”,
“non sei clandestino?”). Entrambe le domande consentono solo risposte: si o no.
Osservazioni:
a) la composizione dell’urna è fissata ad arbitrio in modo tale da poter conoscere con esattezza la
probabilità di estrazione. Proseguendo con l’esempio precedente, la probabilità di ottenere una
pallina rossa è pari:
p(E) = p(R) =
m1
;
m1  m2
b) le domande poste permettono entrambe solo risposte affermative o negative;
c) si suppone che con questa procedura il soggetto risponda sinceramente sentendosi tutelato;
d) l’intervistatore ignora l’esito dell’esperimento, ma conosce la probabilità  .
Tenendo conto del carattere delicato e, congiuntamente, dell’esperimento i possibili esiti risultano
essere:
S
E
E
A
si
no
A
no
si
X
Effettuando n prove, cioè campionando n soggetti a cui sottoporre l’esperimento, si definisce x il
numero di successi (vale a dire risposte “si”) e (n-x) il numero di insuccessi (risposte “no”), quindi
potendo indicare nel modo seguente la probabilità di ottenere una risposta affermativa dal generico
soggetto i, è possibile pervenire ad una stima dell’incognita  :
p(si) = 1      1  2   
Infatti, al variare del campione x genera la v.c. X con distribuzione Binomiale (Bi; n,  ). Quindi
attraverso una stima di massima verosimiglianza per  si ottiene la stima di  oggetto di studio:
Lx,     x 1   n x

ˆ 
x
n
ˆ 

n1     x
n1  2 
Osservazioni:
a) E’ necessario porre   0.5 altrimenti la stima risulta indeterminata;
b) Per tutelare gli intervistati è necessario che   1 e   0
Al variare dei campioni ˆ risulta determinazione di una v.c.:  
Med     ,
Var   
 1   
n1  2 2
n1     X
caratterizzata da:
n1  2 

 1   
n
La varianza dello stimatore risulta quindi scissa in due componenti: la varianza della v.c.
X
proporzione campionaria   ed una parte che dipende da  , dunque dovuta alla casualizzazione.
n
Ne discende che il campionamento a risposte casualizzate è è sicuramente meno efficiente del
campionamento casuale tradizionale.
Lo schema di Warner è stato successivamente rielaborato da Simmons che accanto al carattere
delicato Y introduce un carattere K del tutto innocuo a cui, quindi, gli individui non hanno nessun
problema a rispondere, e tale che Y e K siano incorrelati. Come Y anche K è scelto dicotomo (B, B )
e la quantità  k (proporzione relativa al “successo” del carattere K) per semplicità è supposta nota.
Inoltre, le risposte al fenomeno K sono ancora solo “si” o “no”.
Nello schema di Simmons si effettua in primo luogo un esperimento casuale i cui risultati sono E o
E , con pE    , pE   1   . A secondo del risultato dell’esperimento casuale l’intervistato
risponderà relativamente al carattere delicato Y o a quello innocuo K.
Tenendo conto del carattere delicato di quello innocuo e, congiuntamente, dell’esperimento, i
possibili esiti risultano essere:
S
E
E
AB
si
si
AB
no
si
A B
no
no
AB
si
no
X
Effettuando n prove, cioè campionando n soggetti a cui sottoporre l’esperimento, si definisce x il
numero di successi (vale a dire risposte “si”) e (n-x) il numero di insuccessi (risposte “no”), quindi
potendo indicare nel modo seguente la probabilità di ottenere una risposta affermativa dal generico
soggetto i, è possibile pervenire ad una stima dell’incognita  :
p(si) =    k 1     
Infatti, al variare del campione x genera la v.c. X con distribuzione Binomiale ( n,  ). Quindi
attraverso una stima di massima verosimiglianza per  si ottiene la stima di  oggetto di studio:
Lx,     x 1   n x

ˆ 
x
n

ˆ 
x   k n1   
n
Osservazione:
Contrariamente a quanto accade nello schema di Warner in questo caso non vi sono vincoli per 
tranne i due ovvi (   0,   1 ) che se non verificati comporterebbero l’eliminazione della
casualizzazione.
Al variare dei campioni ˆ risulta determinazione di una v.c.:  
X   k n1   
caratterizzata
n
da:
Med     ,
Var  
 k 1   k 
n

1   1   k 
n