MZ2009_4_SURVEY_ANALISISEC - Dipartimento di Sociologia

“Teoria e metodi della ricerca sociale e organizzativa”
Corso di Laurea in Scienze dell’Organizzazione
Facoltà di Sociologia
Università Milano-Bicocca
2009
Simone Sarti
1
Lezione
L’inchiesta campionaria e l’analisi secondaria
Corbetta, capitolo 5.
1. Cos’è l’inchiesta campionaria
2. La matrice dei dati
3. L’analisi secondaria
2
L’Inchiesta campionaria (o Survey)
La survey è un particolare metodo di raccolta dati
basato su:
- sull’interrogazione di un gruppo di individui
“rappresentativi” di una certa popolazione,
- secondo procedure standardizzate (questionario),
- con l’obiettivo di studiare le relazioni tra le variabili
rilevate sulle proprietà degli individui osservati.
3
La survey ideale
Si raccolgono informazioni su tutta la
popolazione oggetto di studio.
Lo strumento di rilevazione è realmente
oggettivo, tutti gli intervistati interpretano
esattamente cosa viene chiesto loro e
rispondono correttamente.
4
La “rappresentatività”
La “rappresentatività” è determinata dal
campionamento, ossia dalla procedura
attraverso la quale si selezionano le unità
di analisi nella popolazione su cui rilevare il
fenomeno oggetto di studio.
La selezione delle unità è detta CAMPIONE.
5
La “rappresentatività”
In fase di campionamento (o selezione dei casi)
possono commettersi tre errori:
- di copertura
- di campionamento
- di non-risposta
6
La “rappresentatività”
L’errore di copertura
Non è conosciuta la lista della popolazione su cui
effettuare la selezione!
Ad esempio, non è possibile effettuare un campione di
persone senza fissa dimora.
7
La “rappresentatività”
L’errore di non risposta
Parte consistente degli intervistati non viene raggiunta o
si rifiuta di rispondere!
Il rischio è che le non risposte potrebbero essere dovute a
errori sistematici. Ad esempio è noto che nelle indagini in
cui viene chiesto il reddito i lavoratori autonomi hanno
tassi di non risposta molto maggiori dei lavoratori
dipendenti.
I campioni telefonici sono particolarmente esposti a
questo problema.
8
La “rappresentatività”
L’errore di campionamento
E’ la misura di quanto il campione sia simile alla
popolazione.
NB: solo i campionamenti probabilistici (o casuali)
assicurano la possibilità di conoscere la misura
dell’imprecisione che commettiamo nel selezionare
le unità di analisi.
9
La “rappresentatività”
Un campionamento è casuale quando di
ogni unità di analisi è nota la
probabilità di essere estratta.
La statistica ci offre allora gli strumenti
matematici per misurare l’errore di
campionamento.
10
La “rappresentatività”
Campione casuale semplice: quando, per esempio, tutte le unità
hanno la stessa probabilità di essere intervistate l’errore di
campionamento per la media di un campione è:
s
e  z
1 f
n
Dove:
- z è il coefficiente che determina l’intervallo di fiducia,
- s è la deviazione standard,
- n è l’ampiezza del campione ed N della popolazione ,
- f la frazione di campionamento, data da n/N
La stima della media della popolazione è “approssimativamente”
compresa al 95 % tra la media del campione più e meno e.
NB: L’errore dipende più dall’ampiezza del campione
che non da quella della popolazione.
11
Lo strumento di rilevazione: il questionario
Nelle survey le procedure di raccolta delle
informazioni consistono nell’utilizzare uno
strumento di rilevazione standardizzato (il
questionario):
Lo scopo è assicurare, quanto il più possibile,
l’invarianza dello stimolo, ossia lo strumento
deve essere lo stesso per tutti i soggetti
intervistati.
12
Lo strumento di rilevazione: il questionario
Un
questionario
è
caratterizzato
dalla
standardizzazione delle domande e delle
risposte, ossia da un insieme di regole che
assicurino il principio dell’invarianza dello
stimolo.
13
Il Questionario: invarianza dello stimolo
Con invarianza dello stimolo si intende che le
domande debbono essere poste nello stesso
modo ed avere lo stesso significato per tutti i
soggetti intervistati.
Le discrezionalità interpretative delle domande,
dell’intervisto come dell’intervistatore, devono
essere ridotte al minimo.
Idealmente il questionario dovrebbe misurare
l’oggettività della realtà e per questo dovrebbe
possedere
requisiti
di
neutralità
ed
universalità
rispetto
alle
interpretazioni
dell’intervistato e dell’intervistatore.
14
Il Questionario: le domande chiuse
Uno dei principali criteri di standardizzazione è
costituito dall’uso di domande chiuse, ossia
domande la cui gamma di risposte è decisa a
priori dal ricercatore.
15
Il Questionario: le domande chiuse, vantaggi
I vantaggi delle domande chiuse sono:
1) presentano a tutti gli intervistati lo stesso
quadro di riferimento,
2) costituiscono una sorta di promemoria che
aiuta l’intervistato a ricordare,
3) eliminano l’indecisione nella risposta
costringendo l’intervistato ad una scelta precisa.
16
Il Questionario: le domande chiuse, svantaggi
Gli svantaggi delle domande chiuse sono:
1) impossibilità di registrare risposte alternative
a quelle previste,
2) influenza delle opzioni sulle scelte che
possono forzare l’intervistato,
3)
maggiore
rischio
di
discrezionalità
dell’intervistato
nell’interpretazione
della
domanda e della risposta.
17
Il Questionario: formulazione delle domande - 1
LINGUAGGIO:
1.Usare un linguaggio semplice (es: evitare concetti difficili o tecnicismi)
4.Evitare espressioni in gergo
5.Evitare definizioni ambigue (es: “locali nell’abitazione?”)
6.Evitare parole connotate negativamente (es: “Lei è xenofobo?”)
7.Evitare domande sintatticamente complesse (es: doppia negazione)
8.Evitare domande con risposta non univoca (non unire due domande in una)
STRUTTURA:
2.Lunghezza delle domande
3.Numero delle alternative di risposta
21.Sequenza delle domande (seguire un criterio logico)
SENSO:
9.Evitare domande non discriminanti (es: non fare domande scontate)
10.Evitare domande tendenziose (es: aggettivazioni come “i coraggiosi soldati”)
18
Il Questionario: formulazione delle domande - 2
COMPORTAMENTI E ATTEGGIAMENTI:
11.Comportamenti presunti (usare filtri, non dare scontati certi comportamenti)
12.Focalizzazione nel tempo (es:circoscrivere i tempi di un consumo culturale)
13.Concretezza Vs. astrazione (evitare concetti troppo astratti)
14.Comportamenti e atteggiamenti (distinguere i fatti dalle opinioni)
18.Intensità degli atteggiamenti (misurare intensità diverse)
SENSIBILITA’ DELL’INTERVISTATO:
15.Desiderabilità sociale delle risposte (evitare stereotipi)
16.Domande imbarazzanti (spersonalizzare la domanda)
17.Mancanza di opinioni, non so (non forzare le risposte)
19.Acquiescenza o (uniformità nelle risposte – response set)
20.Effetto memoria (nelle interviste telefoniche)
19
20
Questionari on-line
Archivio dati per le Scienze Sociali
www.sociologiadip.unimib.it/sociodata
21
Modalità di raccolta dei dati
Le tecniche di raccolta dei dati tramite questionario si
distinguono secondo le modalità di interfaccia tra
intervistatore e intervistato e secondo il mezzo impiegato:
Assenza dell’intervistatore:
- Questionario postale
- Questionari auto-somministrati, con cartaceo
- Questionari auto-compilati, on-line
Presenza dell’intervistatore:
- Interviste faccia a faccia, con cartaceo (PAPI)*
- Interviste faccia a faccia, con computer (CAPI)**
- Interviste telefoniche (CATI)***
* Paper Assisted Personal Interviewing
** Computer Assisted Personal Interviewing
*** Computer Assisted Telephone Interviewing
La raccolta delle informazioni
L’obiettivo della survey è lo studio delle relazioni tra
le variabili:
il questionario registra gli STATI delle proprietà che
caratterizzano le unità di analisi (gli individui),
con il fine di mettere in relazione le proprietà tra
loro, secondo quelle che sono le ipotesi di ricerca.
23
La raccolta delle informazioni
Alcune proprietà possono essere ad esempio:
-
l’anno di nascita
il genere
il grado del titolo di studio
la condizione occupazionale
24
La raccolta delle informazioni
Gli stati su cui sono registrate le proprietà
rappresentano i possibili modi con cui le proprietà si
manifestano:
- l’anno di nascita (1980, …, 1990)
- il genere (maschio/femmina)
- il titolo di studio (lic.elementare, …, laurea)
- la condizione occupazionale (disoccupato, occupato,
ritirato, …, altro)
25
La raccolta delle informazioni
Gli stati delle proprietà sono registrati in VARIABILI e
prendono il nome di VALORI, MODALITA’ o CATEGORIE
della variabile.
L’anno di nascita avrà un range di valori (var. metrica)
Il genere avrà due modalità (variabile dicotomica)
Il titolo di studio avrà k modalità ordinate (var.ordinale)
La condizione occupazionale avrà k modalità non ordinabili
(variabile categoriale)
NB: anche alle modalità possono essere assegnati dei valori!
26
La matrice dei dati
La survey raccoglie informazioni in una MATRICE DATI
organizzata nella forma CASI X VARIABILI,
dove a ogni riga corrisponde un caso (o UNITA’ di ANALISI),
e ad ogni colonna una variabile.
Le informazioni così organizzate permettono l’analisi dei dati
attraverso l’uso di software statistici.
27
La matrice dei dati – Il data set
La matrice dati in forma software è chiamata
BASE DATI (DATA SET), ed è registrata come
un qualsiasi file dati.
Ad ogni individuo corrisponde un RECORD
(l’insieme delle celle di una riga) che raccoglie
tutte le informazioni che lo riguardano.
28
UN DATA SET (17 individui X 6 variabili)
Età, Sesso, Stato civile, Stato civile precedente, Anno matrimonio, Titolo di studio
29
UN DATA SET (17 individui X 6 variabili)
Sul data set vengono realizzate analisi che:
-sintetizzano le informazioni
ES: Nel campione considerato sono presenti 10 donne e 7 uomini; 3
laureati e 14 non laureati.
- e che permettono di testare delle ipotesi sulle
relazioni tra le variabili
ES: Nel campione considerato gli uomini sono più laureati delle
donne (3/10 rispetto a 0/14).
30
Tipi di Survey
Esistono diversi tipi di survey:
- Cross-sectional o trasversali: ripetute nel tempo su
campioni diversi (es: Eurobarometer)
- Survey trasversale retrospettiva (es:ILFI 1a wave)
- Panel o longitudinali: ripetute nel tempo sugli stessi
individui (ISTAT – Forze Lavoro)
- Panel dinamico (ILFI), il campione può integrare nuovi
casi secondo alcune regole di inclusione
31
L’analisi secondaria
32
Caratteristiche dell’analisi secondaria
L’analisi secondaria utilizza dati già raccolti al
di fuori degli scopi per cui questi dati erano
stati prodotti inizialmente.
I dati “archiviati” acquisiscono per questo un valore
potenziale a prescindere dagli esiti dello studio in cui
furono originati.
L’analisi secondaria RICICLA dunque in modo creativo ed
economico informazioni raccolte nel passato recente o
lontano.
33
L’analisi secondaria



L’analisi secondaria di dati survey
Vantaggi e svantaggi dell’analisi secondaria
Le fonti dati
34
L’Analisi Secondaria di dati survey
“Una ricerca che viene condotta su
dati di inchiesta campionaria già
precedentemente raccolti e disponibili
nella forma della matrice-dati originale”
Corbetta, pag.225
35
Caratteristiche dell’analisi secondaria
Nell’analisi secondaria la raccolta dei dati non è
responsabilità diretta del ricercatore.
Nell’analisi primaria, infatti, il ricercatore è responsabile
del disegno della ricerca, della raccolta dati, delle analisi
e della presentazione dei risultati.
Nell’analisi secondaria egli si occupa solo delle ultime
due fasi.
36
Caratteristiche dell’analisi secondaria
L’analisi secondaria e l’analisi primaria possono
essere utilizzate in modo complementare.
L’analisi secondaria può essere utile nello studio
diacronico di un certo fenomeno sociale. Per il passato
vengono utilizzati dati già esistenti, sulla loro base, per il
presente, vengono raccolti nuovi dati ad hoc.
37
Vantaggi dell’analisi secondaria
1- Superamento dei problemi posti dai costi
economici e di tempo.
38
Vantaggi dell’analisi secondaria
2- Sedimentazione storica dei dati che mette a
disposizione un insieme di risorse informative
sempre più ricco.*
Inoltre una parte di queste risorse ha due qualità
particolari: la rappresentatività dei campioni a livello
nazionale e la standardizzazione dei metodi di
rilevazione. Queste qualità permettono studi comparativi
tra diverse nazioni.
39
Vantaggi dell’analisi secondaria
* A favore della sedimentazione dei dati ha giocato un
ruolo fondamentale lo sviluppo tecnologico, soprattutto
nel campo informatico.
Esso ha infatti agevolato sia la manipolabilità delle
matrici dati sottoforma di files, sia la diffusione e
l’accessibilità a software applicativi dedicati all’analisi
statistica.
40
Vantaggi dell’analisi secondaria
3- Opportunità di comparare dati prodotti nel
passato con dati prodotti in tempi successivi.
Possibilità di effettuare analisi di trend su determinati
fenomeni.
41
Svantaggi dell’analisi secondaria
1- I dati già raccolti sono semplicemente
“vecchi”.
Il loro utilizzo va contestualizzato al momento della
rilevazione. Talvolta, in mancanza di dati aggiornati, si
impiegano per studiare fenomeni che si vorrebbero
attuali, ma la cui osservazione appartiene al passato.
42
Svantaggi dell’analisi secondaria
2- Quasi sempre i dati archiviati sono stati
raccolti con finalità diverse da quelle per cui
vengono riutilizzati nell’analisi secondaria.
I ricercatori originari, perseguendo obiettivi diversi,
potrebbero aver impiegato termini, definizioni,
classificazioni e misurazioni delle variabili adeguati ai
loro scopi, ma non adeguati al contesto in cui vengono
riutilizzati.
43
Svantaggi dell’analisi secondaria
3- Quando si utilizzano dei dati archiviati
occorre verificare e valutare la loro QUALITÀ.
I dati non sono sempre “pronti all’uso” ed in certi casi
possono non essere utilizzabili.
44
La qualità dei dati
Reperebilità e Leggibilità dei files
I files dei dati per l’analisi secondaria:
- devono essere recuperati dalla fonte;
- devono essere in un formato “leggibile”;
- se non sono leggibili devono essere forniti della
documentazione tecnica necessaria (es: tracciato record).
45
La qualità dei dati
Documentazione metodologica
Devono essere sempre noti fonte e disegno della ricerca, ed
in particolare le note metodologiche su:
- date e tempi della rilevazione,
- campionamento,
- tecniche di intervista (CATI, CAPI, ecc.),
- questionario (domande e risposte),
- codebook (codifica della matrice dati),
- missing (distinzione tra NA, DK e mancanti).
46
La qualità dei dati
Integrità dei dati
Occorre verificare l’integrità dei dati in termini di
corrispondenza della matrice-dati originale. A causa di
possibili errori durante il trattamento dei dati le informazioni
potrebbero infatti non corrispondere.
47
Le fonti dati
L’analisi secondaria richiede dunque
disponibilità di dati con un elevato livello di
qualità.
Il ricercatore che vuole fare analisi secondaria si
rivolge così alle fonti di dati.
48
Le fonti dati: una classificazione
Fonti statistiche
pubbliche (ufficiali)
nazionali
Fonti autonome
Fonti internazionali
Archivi dati per le
scienze sociali
Servizi statistici statali nazionali (Istat, IRER,
ecc.) ed enti pubblici preposti alla raccolta di
dati (anagrafi comunali, uffici ministeriali,
ecc.)
Società private (istituti di ricerca, banche,
associazioni, ecc.) ed istituzioni accademiche
o enti pubblici non preposti alla raccolta dei
dati
Servizi statistici sovranazionali (Eurostat, ecc.)
e organizzazioni internazionali (ONU,OCSE,
Fmi, ecc.)
Archivi dati nazionali per le scienze sociali e
network internazionali (ICPSR, UK Data
Archive, ADPSS-Sociodata, ecc.)
49
Le fonti statistiche pubbliche (ufficiali) nazionali
Queste fonti iniziano a svilupparsi tra il ‘700 e l’800, quando
gli stati nazionali necessitano, per motivi di amministrazione
pubblica, di informazioni sulla popolazione raccolte in modo
sistematico.
Un esempio di dati prodotti da queste fonte sono i
Censimenti della Popolazione. Il primo in Italia è quello del
1861.
50
Le fonti autonome
Le fonti autonome costituiscono un insieme eterogeneo di
istituzioni private e pubbliche che non sono preposte in via
naturale all’archiviazione dei dati, ma per esigenze diverse
vengono a costituirsi come vere e proprie fonti di dati.
Un esempio importante è costituito dagli Istituti di Ricerca, i
quali, tra l’altro sono i primi storicamente ad iniziare la
raccolta dei dati attraverso lo strumento dell’indagine
campionaria (negli USA negli anni ’40 per studiare le
preferenze di voto).
51
Le fonti internazionali
Le fonti internazionali producono dati per conto di organismi
sovra-nazionali, e rivestono un ruolo particolarmente
importante nella costruzione di dati comparabili tra diversi
paesi.
Ad esempio una delle funzioni principali dell’Eurostat è lo
sviluppo di un linguaggio statistico condiviso e
standardizzato.
Un esempio di dati di fonte internazionale è la PISA
(Programme for International Student Assessment)
dell’OCSE (Organizzazione per la Cooperazione e lo Sviluppo
Economico).
52
Gli archivi dati (SSDA, Social Science Data Archives)
Gli archivi dati non producono direttamente dati come le
precedenti fonti, tuttavia possono essere paragonati ad esse
per due motivi:
- Spesso divengono distributori esclusivi di importanti survey,
divenendo, pur indirettamente, gli unici depositari e quindi la
fonte a cui richiederne i dati.
- Gli SSDA svolgono in modo continuativo un’attività di
integrazione dei nuovi data sets acquisiti e di aggiornamento
delle vecchie indagini allo scopo di migliorarne la qualità e
quindi l’utilizzabilità per l’analisi secondaria.
53
Gli archivi dati (SSDA, Social Science Data Archives)
La finalità degli archivi dati è quella di rintracciare
ed ordinare l’esistente, svolgendo in pratica una
funzione di data collector, cioè di “collezionisti di
dati”.
Tra i principali archivi dati per le scienze sociali a livello
internazionale vi sono l’ICPSR del Michigan, lo ZA di Colonia,
lo UK data-Archive di Essex.
A livello italiano l’archivio dati più longevo è ADPSSSociodata presso il Dipartimento di Sociologia di MilanoBicocca.
54
Gli Eurobarometer
ESEMPIO DI SURVEY
55
Gli Eurobarometer
Gli Eurobarometer costituiscono uno degli strumenti più
utilizzati per l’analisi secondaria di tipo comparativo tra i
paesi dell’Unione Europea.
Condotti a partire dal 1973 considerano campioni
“rappresentativi” delle popolazioni dei paesi appartenenti
all’UE.
Gli EB sono condotti su incarico della Commissione
Europea, Direzione Generale X, Unità di Ricerche
sull’Opinione Pubblica.
56
Finalità e temi degli Eurobarometer
La finalità generale degli EB è quella di conoscere gli
atteggiamenti e le valutazioni dei cittadini europei su
alcuni temi di ampio interesse generale.
Il tema più affrontato è quello del processo di unificazione
europea, ma vengono affrontati temi (anche più d uno alla
volta) anche molto differenti tra loro come:
- le elezioni europee,
- la condizione e i valori dei giovani,
- gli atteggiamenti verso gli immigrati,
- la diffusione delle nuove tecnologie,
- eccetera.
57
Campionamento e pesi di riporto
Gli EB, iniziati a partire dal 1973, si rivolgono ad
un campione “rappresentativo” della popolazione
con almeno 15 anni di tutti i paesi europei.
A parte lievi differenze tecniche i soggetti
intervistati vengono selezionati in base ad un
campionamento casuale multi-stage (multistadio) simile in tutti i paesi considerati.
58
Campionamento multi-stadio
Al primo stadio vengono selezionate casualmente le PSU
(primary sampling units), punti di campionamento primari,
costituiti dalle unità amministrative locali, proporzionali a
livello nazionale rispetto a: popolazione nazionale, regione
d’appartenenza, dimensione demografica, densità di
popolazione e tipo d’area (metropolitana, urbana o rurale).
Al secondo stadio da ogni PSU vengono estratti una serie
di indirizzi. Infine all’interno delle famiglie viene
selezionato casualmente un solo individuo, secondo la
tecnica dell’“ultimo compleanno” che sarà intervistato
personalmente (intervista “faccia a faccia”).
59
Campionamento: numerosità
La procedura di campionamento è ripetuta exnovo per ogni indagine realizzata.
I campioni nazionali vengono monitorati
simultaneamente due volte l’anno (primavera ed
autunno) intervistando direttamente nel proprio
domicilio circa 1000 persone per paese (i paesi
più piccoli sono sottocampionati).
60
61
Campionamento: pesi campionari
Gli EB vengono distribuiti provvisti di pesi
campionari necessari a correggere le distorsioni
del campione ed a garantire la distribuzione
proporzionale della numerosità del campione
rispetto alle popolazioni europee.
I pesi campionari rappresentano una correzione
a posteriori del campione.
62
Campionamento: pesi campionari
WSAMPLE: è il peso base compreso in tutti gli altri pesi
fattoriali utilizzati. Aggiusta la distribuzione sociodemografica del
campione a quella dell’universo. Le variabili considerate sono:
età, sesso, grandezza del nucleo familiare, regione di
appartenenza, ampiezza demografica del comune (o della
relativa area amministrativa).
WNATION: è identico al peso base, a meno della ponderazione
di alcuni paesi: Germania e Regno Unito. Il campione viene
aggiustato proporzionalmente alle popolazioni di ex-Repubblica
Federale Tedesca ed ex-Repubblica Democratica Tedesca, e di
Gran Bretagna e Nord Irlanda.
WEURO: riporta tutti i campioni nazionali alle proporzioni reali
della popolazione dell’Unione Europea. Ogni gruppo nazionale
pesa proporzionalmente alla numerosità della sua popolazione.
Es: i casi del Lussemburgo vengono quasi completamente
annullati.
63
Frequenza casi osservati
COUNTRY COUNTRIES / PAYS
Validi
Frequenza
1 BELGIQUE
1063
2 DANMARK
1000
3 DEUTSCHLAND WEST
1015
4 ELLAS
1004
5 ITALIA
1000
6 ESPANA
1000
7 FRANCE
1002
8 IRELAND
1000
9 NORTHERN IRELAND
300
10 LUXEMBOURG
600
11 NEDERLAND
975
12 PORTUGAL
1000
13 GREAT BRITAIN
1070
14 DEUTSCHLAND OST
1034
16 SUOMEN
1010
17 SVERIGE
1000
18 OESTERREICH
1005
Totale
16078
Percentuale
6,6
6,2
6,3
6,2
6,2
6,2
6,2
6,2
1,9
3,7
6,1
6,2
6,7
6,4
6,3
6,2
6,3
100,0
Percentuale
valida
6,6
6,2
6,3
6,2
6,2
6,2
6,2
6,2
1,9
3,7
6,1
6,2
6,7
6,4
6,3
6,2
6,3
100,0
Percentuale
cumulata
6,6
12,8
19,1
25,4
31,6
37,8
44,1
50,3
52,1
55,9
61,9
68,2
74,8
81,2
87,5
93,7
100,0
D10 D.10. - Sex D.10. - Sexe du r0pondant
Validi
1 Male
2 Female
Totale
Frequenza
7654
8424
16078
Percentuale
47,6
52,4
100,0
Percentuale
valida
47,6
52,4
100,0
Percentuale
cumulata
47,6
100,0
64
Frequenza casi pesati con WSAMPLE
COUNTRY COUNTRIES / PAYS
Validi
Frequenza
1 BELGIQUE
1063
2 DANMARK
1000
3 DEUTSCHLAND WEST
1015
4 ELLAS
1004
5 ITALIA
1000
6 ESPANA
1000
7 FRANCE
1002
8 IRELAND
1000
9 NORTHERN IRELAND
300
10 LUXEMBOURG
600
11 NEDERLAND
975
12 PORTUGAL
1000
13 GREAT BRITAIN
1070
14 DEUTSCHLAND OST
1034
16 SUOMEN
1010
17 SVERIGE
1000
18 OESTERREICH
1005
Totale
16078
Percentuale
6,6
6,2
6,3
6,2
6,2
6,2
6,2
6,2
1,9
3,7
6,1
6,2
6,7
6,4
6,3
6,2
6,3
100,0
Percentuale
valida
6,6
6,2
6,3
6,2
6,2
6,2
6,2
6,2
1,9
3,7
6,1
6,2
6,7
6,4
6,3
6,2
6,3
100,0
Percentuale
cumulata
6,6
12,8
19,1
25,4
31,6
37,8
44,1
50,3
52,1
55,9
61,9
68,2
74,8
81,2
87,5
93,7
100,0
D10 D.10. - Sex D.10. - Sexe du r0pondant
Validi
1 Male
2 Female
Totale
Frequenza
7772
8306
16078
Percentuale
48,3
51,7
100,0
Percentuale
valida
48,3
51,7
100,0
Percentuale
cumulata
48,3
100,0
65
Frequenza casi pesati con WNATION
COUNTRY COUNTRIES / PAYS
Validi
Frequenza
1 BELGIQUE
1000
2 DANMARK
1000
3 DEUTSCHLAND WEST
1583
4 ELLAS
1000
5 ITALIA
1000
6 ESPANA
1000
7 FRANCE
1000
8 IRELAND
1000
9 NORTHERN IRELAND
32
10 LUXEMBOURG
600
11 NEDERLAND
1000
12 PORTUGAL
1000
13 GREAT BRITAIN
1268
14 DEUTSCHLAND OST
417
16 SUOMEN
1000
17 SVERIGE
1000
18 OESTERREICH
1000
Totale
15900
Percentuale
6,3
6,3
10,0
6,3
6,3
6,3
6,3
6,3
,2
3,8
6,3
6,3
8,0
2,6
6,3
6,3
6,3
100,0
Percentuale
valida
6,3
6,3
10,0
6,3
6,3
6,3
6,3
6,3
,2
3,8
6,3
6,3
8,0
2,6
6,3
6,3
6,3
100,0
Percentuale
cumulata
6,3
12,6
22,5
28,8
35,1
41,4
47,7
54,0
54,2
58,0
64,3
70,5
78,5
81,1
87,4
93,7
100,0
66
Frequenza casi pesati con WEURO
COUNTRY COUNTRIES / PAYS
Validi
Frequenza
1 BELGIQUE
429
2 DANMARK
223
3 DEUTSCHLAND WEST
2871
4 ELLAS
453
5 ITALIA
2523
6 ESPANA
1700
7 FRANCE
2416
8 IRELAND
153
9 NORTHERN IRELAND
66
10 LUXEMBOURG
19
11 NEDERLAND
654
12 PORTUGAL
423
13 GREAT BRITAIN
2372
14 DEUTSCHLAND OST
671
16 SUOMEN
214
17 SVERIGE
370
18 OESTERREICH
343
Totale
15900
Percentuale
2,7
1,4
18,1
2,8
15,9
10,7
15,2
1,0
,4
,1
4,1
2,7
14,9
4,2
1,3
2,3
2,2
100,0
Percentuale
valida
2,7
1,4
18,1
2,8
15,9
10,7
15,2
1,0
,4
,1
4,1
2,7
14,9
4,2
1,3
2,3
2,2
100,0
Percentuale
cumulata
2,7
4,1
22,2
25,0
40,9
51,6
66,8
67,7
68,1
68,3
72,4
75,0
89,9
94,2
95,5
97,8
100,0
67
Il Questionario
Gli EB utilizzano come strumento di rilevazione
un questionario, quasi sempre di tipo strutturato.
Un questionario strutturato è caratterizzato dalla
standardizzazione delle domande e delle
risposte, ossia da un insieme di regole che
assicurino il principio dell’invarianza dello
stimolo.
68
Il Questionario negli EB
I questionari negli Eurobarometer sono di tipo
strutturato e vengono tradotti nelle lingue dei
paesi dell’UE.
In ogni paese esistono Istituti di Ricerca,
coordinati dall’INRA, incaricati di tradurli e di
portare a compimento la raccolta dei dati.
Per l’Italia se ne occupa InraDemoskopea.
69
Il Questionario negli EB: struttura
I questionari degli EB hanno mantenuto nel corso degli
anni una struttura simile.
Generalmente vengono prima le domande relative alla
partecipazione politica ed al processo di unificazione
europea, successivamente le domande che riguardano gli
argomenti topici di ogni EB. Infine le domande che
rilevano le caratteristiche socio-demografiche degli
intervistati (sesso, età , occupazione, ecc.).
70
71
Il Questionario negli EB: struttura
Dopo la lettura della domanda l’intervistatore
registra la risposta, e secondo le indicazioni
previste procede nell’intervista. A volte sono
presenti dei filtri nel questionario.
Le risposte date dall’intervistato vengono
registrate successivamente nella matrice-dati
che raccoglie le interviste provenienti da tutti i
paesi UE.
72
La matrice dati
Gli EB sono distribuiti in formati manipolabili con SPSS,
completi di etichette e codici.
Ogni riga corrisponde ad un soggetto intervistato, ogni
colonna una variabile che registra la proprietà di un
concetto.
73
74
75
La matrice dati: frequenza di una variabile
76
Trend
Negli EB, fin dalla loro nascita, è stata presente
l’intenzione di creare uno strumento di rilevazione
diacronico, ossia raffrontabile nel tempo. Uno strumento
capace di “monitorare” nel tempo i cambiamenti
nell’opinione pubblica europea.
In questo senso gli EB non sono solo fotografie istantanee
della realtà sociale, ma una sorta di filmato delle
dinamiche di cambiamento.
A questo scopo negli EB sono previste alcune domande
particolari che vengono ripetute nel tempo (anche se
spesso in modo saltuario).
L’insieme di queste domande è stato utilizzato per formare
l ‘EUROBAROMETRO CUMULATIVO
77
Trend: un esempio
78
Trend: embargo provisions
Negli EB, fin dalla loro nascita, un problema esistente nella
costruzione di trend aggiornati è la presenza di embargo
provisions.
In pratica alcuni temi di particolare interesse (come le
intenzioni di voto) vengono temporaneamente omessi al
momento dell’uscita dell’EB.
Il data set completo viene rilasciato solo dopo alcuni mesi
di ritardo, successivamente alla pubblicazione da parte
della Commissione Europea di un rapporto esclusivo su
quei temi.
79
Problemi tecnici nella preparazione di un data set per
un’analisi di trend




Variazione nella formulazione delle domande
Variazione delle modalità di risposta
Problemi di collocazione dei missing
Variazioni dei campioni (Germania Ovest-Est)
80
Variazioni nella formulazione delle domande
Domanda sulle aspettative per il futuro:
EB 53.0 e seguenti:
“Nel corso dei prossimi cinque anni, si aspetta
che la sua situazione personale migliorerà,
rimarrà la stessa o peggiorerà?”
Fino all’EB 52.1:
“Per quanto la riguarda, lei pensa che il 1985
sarà migliore, peggiore o simile al 1984?”
81
Variazioni nei codici delle modalità di risposta
Domanda sulla condizione occupazionale, opzioni di risposta:
82
Variazioni nei codici delle risposte
Codici della variabile Nazione in EB 35.0 ed in EB 54.0
83
Collocazione dei missing
A volte può succedere che la codifica dei valori
missing
DK-Don’t Know
NA-Not applicable
crei dei problemi di armonizzazione, infatti per alcuni EB i
valori DK e NA possono essere codificati insieme, mentre
in EB successivi non lo sono.
84
Variazioni dei campioni
Rispetto alle medie europee come considerare il caso della Norvegia?
Rispetto alla Germania come considerare l’unificazione tedesca ?
La regola generale è di tenere le classi delle variabili utilizzate
il più omogenee possibili.
85
86