“Teoria e metodi della ricerca sociale e organizzativa”
Corso di Laurea in Scienze dell’Organizzazione
Facoltà di Sociologia
Università Milano-Bicocca
2009
Simone Sarti
1
Lezione
Causalità
Corbetta, capitolo 3
1. Il disegno della ricerca
2. Concetti, indicatori e variabili
3. Gli errori di rilevazione
2
Il disegno della ricerca
Il disegno della ricerca costituisce un insieme di passaggi
logicamente strutturati che definisce le azioni che lo
studioso deve seguire per indagare un fenomeno.
Il rapporto tra teoria e ricerca è strutturato e composto di
fasi sequenziali, nelle quali secondo un processo
deduttivo, le formulazioni teoriche precedono
l’osservazione del fenomeno che si vuole indagare.
3
Il disegno della ricerca
Negli studi quantitativi il disegno della ricerca
è definito in modo rigoroso, e si ambisce alla
produzione di conoscenza scientifica.
-Cumulatività delle conoscenze
-Controllabilità delle procedure
-Pubblicità delle procedure
4
“Se ho visto più lontano è perché stavo sulle spalle dei giganti”
Newton
“La scienza è pubblica e non privata”
Merton
5
Il disegno della ricerca
TEORIA
Interrogativo di ricerca
IPOTESI
RACCOLTA DEI DATI
ANALISI DEI DATI
RISULTATI
Interpretazione e
ritorno alla teoria
6
TEORIA
Interrogativo di ricerca
Contesto della scoperta.
IPOTESI
RACCOLTA DEI DATI
ANALISI DEI DATI
Dalla rassegna teorica e
dagli interessi del
ricercatore scaturiscono
gli interrogativi di
ricerca.
MOMENTO DEDUTTIVO
RISULTATI
7
TEORIA
Interrogativo di ricerca
IPOTESI
Le ipotesi sono costruite
attraverso i concetti.
Le Hp (e i concetti) devono
essere operativizzabili
(empiricamente traducibili)
RACCOLTA DEI DATI
ANALISI DEI DATI
Controllabilità
empirica delle
ipotesi
RISULTATI
Falsificazionismo K.Popper
8
Ipotesi scientifiche falsificabili
Durkheim, “il suicidio”: comunità cattoliche e protestanti hanno
differenti tassi di suicidio.
PRIN 2005: l’ordinamento del prestigio delle occupazioni è rimasto
lo stesso negli ultimi 20 anni in Italia.
Sampson e Laub: le caratteristiche sociali di base influenzano il
comportamento anti-sociale degli adolescenti non direttamente, ma
attraverso la mediazione di alcune variabili processuali legate al
comportamento dei familiari.
Disuguaglianze intergenerazionali: il titolo di studio dei genitori
condiziona le carriere scolastiche dei figli.
9
Ipotesi non falsificabili, perché indefinibili
empiricamente
In futuro il progresso tecnologico renderà tutti più felici.
Nel settecento le persone vivevano meglio che ai nostri giorni.
Impossibilità di
osservazione (avere dati)
del fenomeno
Concetti ambigui e non
osservabili
10
TEORIA
Interrogativo di ricerca
IPOTESI
RACCOLTA DEI DATI
La raccolta dei dati avviene
attraverso procedure
campionarie standardizzate
che permettono di
conoscere (in parte) l’errore
di misura delle informazioni
rilevate.
ANALISI DEI DATI
RISULTATI
11
TEORIA
Interrogativo di ricerca
IPOTESI
RACCOLTA DEI DATI
ANALISI DEI DATI
Le analisi permettono di
sintetizzare le informazioni
a scopo descrittivo, e di
realizzare test statistici allo
scopo di sottoporre a
controllo empirico le ipotesi
di ricerca.
Analisi monovariata,
bivariata e multivariata.
RISULTATI
12
TEORIA
Interrogativo di ricerca
I risultati corroborano oppure
falsificano Hp, o possono
modificare gli interrogativi iniziali
allo scopo di re-definire tutto il
disegno della ricerca.
MOMENTO INDUTTIVO
RISULTATI
Interpretazione e
ritorno alla teoria
13
Concetti e indicatori
Un concetto racchiude il significato
di un segno linguistico o di un immagine mentale
I concetti sono necessari per rappresentare il reale.
Essi rispondono alla necessità di
DIFFERENZIARE E RIDURRE LA COMPLESSITA’
14
Concetti
I concetti possono essere disposti lungo un continuum
ideale di concretezza o astrazione:
Concretezza
- Il peso
- Il titolo di studio
- La salute
- La libertà
Astrazione
15
Concetti
Nel ragionamento scientifico
i concetti sono i “mattoni” delle ipotesi,
le quali possono essere sottoposte a vaglio empirico.
Tuttavia i concetti per essere utilizzati in ipotesi
“falsificabili”, devono essere tradotti in proprietà
osservabili (e misurabili) su delle unità di analisi.
16
Concetti
Per testare un’ipotesi, occorre passare dai concetti che la
definiscono, alle proprietà di questi concetti, e all’ –
operativizzazione in variabili di queste proprietà.
CONCETTO
Proprietà
VARIABILE
Operativizzazione
17
Concetti
ESEMPIO:
HP – L’istruzione rende più sani.
Il concetto “istruzione” deve essere tradotto in un concetto più concreto
(che è chiamato INDICATORE), che potrebbe essere quello di titolo di
studio. Il quale viene OSSERVATO attraverso le sue proprietà (ad
esempio la gradazione) che possono assumere STATI differenti.
Gli STATI sono misurati attraverso una definizione operativa, la quale
costituisce un insieme di regole che traducono le proprietà dei concetti
in variabili. Ossia…
“…il complesso di regole che guidano le operazioni con cui lo stato di
ciascun caso sulla proprietà X viene rilevato, assegnato a una delle
categorie stabilite in precedenza .“ Marradi 1980
18
Concetti e indicatori
CONCETTO
ASTRATTO
Concetto
“concreto”
Proprietà
VARIABILE
INDICATORE
Operativizzazione
19
Concetti e indicatori
CONCETTO
ISTRUZIONE
ASTRATTO
Titolo di studio
Gradazione del titolo
Concetto
“concreto”
INDICATORE
dell’istruzione
Proprietà
VARIABILE
Operativizzazione
20
Concetti
Il processo nel quale si applica la definizione operativa è
l’OPERATIVIZZAZIONE.
ES: L’istruzione rende più sani.
ES - Definizione operativa: quando l’unità di analisi (il
soggetto) dichiara di aver terminato gli studi con le
scuole dell’obbligo, segnare la risposta 1, quando il
soggetto dichiara di aver terminato gli studi con il
diploma segnare la risposta 2, eccetera.
21
Procedure di operativizzazione
Classificazione
Ordinamento
Conteggio
Misurazione
22
Concetti tradotti in variabili
CONCETTO
(INDICATORE)
Proprietà
Operativizzazione
REGISTRAZIONE
SULLA
VARIABILE
PESO
Peso di una persona
MISURAZIONE
Pesatura
65 Kg
LIVELLO
SCOLASTICO
Gradazione del titolo di
studio
CLASSIFICAZIONE
Intervista e registrazione
della risposta
3 - Diploma di
maturità
Numero di persone nel
nucleo familiare
CONTEGGIO
Conta delle persone che
appartengono allo stesso
nucleo familiare
4
Numero di anni
compiuti
MISURAZIONE
Lettura dell’anno di nascita
dal documento d’identità,
differenza con l’anno
corrente e registrazione
della risposta
23 anni
GRADIMENTO DI
TRE PARTITI
Gradimento
ORDINAMENTO
L’intervistato indica l’ordine
dei partiti
Partito in 1° posizione
Partito in 2° posizione
Partito in 3° posizione
OCCUPAZIONE
Tipo di condizione
occupazionale
CLASSIFICAZIONE
Intervista e registrazione
della risposta
1 - Occupato
DIMENSIONI DEL
NUCLEO FAMILIARE
ETA’
Lo stesso concetto può essere tradotto diversamente
CONCETTO
(INDICATORE)
ANDARE A TEATRO
ANDARE A TEATRO
ANDARE A TEATRO
Proprietà
Operativizzazione
REGISTRAZIONE
SULLA
VARIABILE
Frequenza
ORDINAMENTO
Registrazione fra tre modalità
riferite all’ultimo mese:
“spesso, qualche volta, mai”
1 - spesso
Frequenza
CONTEGGIO
Registrazione del numero di
volte nell’ultimo mese
2
Gradimento
ORDINAMENTO
Registrazione su scala Likert
della soddisfazione
4 - “Molto soddisfatto”
24
Misurazione degli stati di salute
Variabili su cui è misurata la salute degli individui.
25
Le unità di analisi
Le unità di analisi sono gli oggetti su cui noi
rileviamo gli stati delle proprietà che sono si
nostro interesse.
26
Le unità di analisi
Proprietà
Unità di analisi
Individui
Aggregati di individui
Gruppi-organizzazioni
Eventi
Prodotti culturali
27
Le unità di analisi: gli individui
La maggior parte della ricerca sociale avviene
considerando come unità di analisi l’individuo.
Le proprietà rilevate sono inerenti a:
-caratteristiche socio-demografiche
-comportamenti
-atteggiamenti o opinioni
-valori
-possesso di beni
-eccetera
28
Le unità di analisi: aggregati di individui
Le proprietà riguardano degli attributi individuali nel loro
insieme (generalmente a livello ecologico/territoriale)
Le proprietà rilevate fanno riferimento ad indicatori ecologici
che “sintetizzano” un’informazione
AD ESEMPIO:
PIL pro-capite dei comuni italiani
% di disoccupati negli stati europei
Tassi di mortalità nelle regioni italiane
AGGREGATI
TERRITORIALI
Num. medio di sigarette fumate al giorno per persona nelle diverse province
29
Le unità di analisi: gruppi/organizzazioni
Le proprietà riguardano in questo caso le caratteristiche
dei gruppi e non degli individui che ne fanno parte
AD ESEMPIO:
-Fatturato delle prime 100 aziende della provincia
-Numero degli studenti delle scuole lombarde
-Numero di parlamentari nei paesi europei
-Seggi attribuiti ai partiti
30
Le unità di analisi: eventi
Talvolta oggetto di studio sono eventi, e le proprietà
vengono registrate su di essi.
AD ESEMPIO:
-Caratteristiche dei conflitti in Africa dal Dopoguerra
-Durata degli episodi lavorativi (primo lavoro)
-Durata degli scioperi alla FIAT negli anni ‘80
-Adesione alle manifestazioni di piazza
31
Le unità di analisi: prodotti culturali
Raramente l’attenzione della ricerca è rivolta a precise
rappresentazioni simboliche o prodotti culturali. Le proprietà
rimandano all’Analisi del contenuto che focalizza l’attenzione sullo
studio della comunicazione.
AD ESEMPIO:
-Ricorrenza di certi temi negli articoli in prima pagina di un giornale
-Caratteristiche di un certo tipo di spot
-Caratteristiche dei telegiornali
-Meta-analisi degli articoli scientifici
32
Variabili
Possono applicarsi diverse tipologie di variabili.
Le principali sono definite in base a:
- alla scala di misurazione
- alle relazioni che intercorrono tra loro
- all’osservabilità
NB: se una variabile registra sempre lo stesso stato
rispetto alla proprietà osservata è detta COSTANTE.
33
Variabili: la scala di misurazione
Si distinguono tre principali livelli di misurazione delle
variabili: nominale, ordinale e cardinale.
A seconda della scala di misurazione cambiano le
procedure di rilevazione (operativizzazione delle
proprietà in casi) e le analisi applicabili.
34
Variabili NOMINALI
Quando le modalità non sono ordinabili e possiedono un alto grado di
autonomia semantica (le modalità hanno senso di per sé,
indipendentemente dalle altre).
La fede religiosa
L’essere d’accordo o no (si/no) con una certa affermazione
La condizione occupazionale
Il colore dei capelli
Il genere
Non è possibile nessuna operazione aritmetica sulle modalità. Tuttavia
alle modalità è possibile attribuire dei valori a cui corrispondono delle
etichette.
Ad esempio per il genere (variabile nominale): 1=femmina; 2=maschio
35
Variabili ORDINALI
Quando le modalità sono ordinabili e possiedono un basso
grado di autonomia semantica.
La frequenza di un certo luogo (spesso, qualche volta, mai) …teatro u.m.
L’ordinamento in preferenze di alcuni colori (rosso, giallo, verde)
L’essere molto, abbastanza, poco o per niente d’accordo …
Il livello d’istruzione in gradi scolastici.
È possibile applicare sulle modalità operazione di confronto
(<>=). Alle modalità è possibile attribuire dei valori a cui
corrispondono delle etichette.
Ad esempio per il titolo di studio: 4=Laurea; 3=Diploma;
2=Licenza Media; 1=Licenza Elementare
36
Variabili CARDINALI (e quasi-cardinali)
Quando le modalità costituiscono numeri derivati da misurazioni
discrete (conteggi) o continue, e non possiedono nessun grado
di autonomia semantica (le modalità non hanno senso di per sé,
se non in relazione alle altre).
L’altezza in centimetri
L’età in anni
Il reddito
Grado di accordo tra 0 e 100 su una certa affermazione*
È possibile applicare sulle modalità tutte le operazione di confronto
(-+*/). Le modalità corrispondono ai valori, e non vengono
attribuite etichette.
37
Variabili dipendenti e indipendenti
Quando è possibile considerare che due variabili sono in
relazione di causa-effetto (o ipotizzate come tali) è
possibile distinguerle :
Le variabili indipendenti sono le variabili “causa”, che
realizzano un “effetto” sulle variabili DIPENDENTI.
Generalmente si indicano le var.dipendenti con la Y, e le
variabili indipendenti con la X.
Y =f(X)
EXPLICANDUM
EXPLICANS
38
Variabili dipendenti e indipendenti
Le variabili indipendenti sono di tipo ascrittivo quando
riguardano caratteri anagrafici, altrimenti sono
considerate come tali in base a considerazioni
squisitamente teoriche.
Ad esempio, ponendo in relazione titolo di studio e genere,
solo la seconda può assumere la condizione di
indipendente.
Oppure, tra valori e comportamenti, teoricamente si è
orientati a considerare i secondi come effetto del sistema
valoriale incorporato dalle identità individuali.
39
Variabili osservate e latenti
Le variabili sono distinte tra latenti ed osservate quando
… in un qualche modello statistico sono impiegate le variabili
(normalmente presenti in un data set), direttamente
derivate dalle operativizzazioni delle proprietà osservate,
… ed a queste si aggiungono delle variabili che non sono
osservate direttamente, ma “sussunte” da altre variabili
osservate (con un certo errore misurabile).
40
ESEMPI DI FATTORI LATENTI
DEPRIVAZIONE
ECONOMICA
+ 0.83
CATTIVA
SALUTE
+ 0.59
+ 0.90
+ 0.78
+ 0.87
Situazione
economica
Risorse
econ.fam.
Soddisfazione
economica
Salute
percepita
Soddisfazione
salute
Indicatori
Come abbiamo visto quando si ha a che fare con concetti
astratti, occorre scendere lungo la scala di astrazione ed
utilizzare concetti più concreti le cui proprietà sono
operativizzabili in variabili.
ESEMPIO:
HP – L’istruzione rende più sani.
Il concetto “livello scolastico” è INDICATORE
del concetto più astratto “istruzione”.
42
Indicatori e indici
Per alcuni concetti particolarmente complessi
possono essere utilizzati più indicatori.
In fase di raccolta dati, vengono registrati gli
indicatori-concetti concreti.
In fase analitica tali indicatori sono sintetizzati (allo
scopo di ricostruire idealmente il concetto più
astratto e complesso) in un INDICE COMPOSITO.
43
44
ESEMPIO:
Il concetto complesso INDICE di XENOFOBIA,
deve essere declinato in concetti più semplici e concreti.
1) Quando incontri persone che parlano un’altra lingua ti senti disturbato?
Da 1 a 7 dove 1 è per niente e 7 molto.
2) Quando incontri persone di un’altra etnia ti senti disturbato?
Da 1 a 7 dove 1 è per niente e 7 molto.
3) Quando incontri persone di un’altra religione ti senti disturbato?
Da 1 a 7 dove 1 è per niente e 7 molto.
I tre indicatori, una volta rilevati sul campione, vengono
ricomposti in un’unica variabile-indice di xenofobia.
45
Errore di rilevazione
Nel passaggio dai concetti alle variabili è possibile
incorrere in diversi tipi di errore.
Valore osservato = Valore vero + Errore
Errore= Errore sistematico + Errore accidentale
46
Errore sistematico *
E’ un errore costante che si presenta in tutte le rilevazioni. Il
suo valore medio è diverso da zero, ossia il “valore
osservato” sbaglia sistematicamente nello stimare il
“valore vero”.
Ad esempio se chiediamo in una serie di interviste
telefoniche il reddito dell’ultimo mese sappiamo che
tendenzialmente registreremo in media un valore che è
una sottostima di quello vero.
47
Errore accidentale *
E’ un errore variabile che cambia a seconda della rilevazione.
E cambierebbe anche se ripetessimo la rilevazione sullo
stesso individuo.
Su tutti i possibili campioni il suo valore medio atteso è zero.
Gli intervistati sulla collocazione politica (1 sinistra-10
destra) possono comprendere male la domanda
(individualmente), ma in media gli errori tenderanno ad
annullarsi.
48
Il centro è il valore vero!
Errore
accidentale
E(t)=0
Errore accidentale +
Errore sistematico
E(t)=a
49
FASE TEORICA
CONCETTO
FASE EMPIRICA
Indicatore
Errore di indicazione *
proprietà
VARIABILE
Errore di operativizzazione **
(validità dell’indicatore)
SELEZIONE
(nelle survey)
Copertura
Campionamento
Non risposta
OSSERVAZIONE
Intervistatore
Intervistato
Strumento
Modo
Trattamento
dati
Errore di operativizzazione **
ERRORE DI SELEZIONE
(nelle survey)
Copertura: le unità di
analisi non sono
raggiungibili
Campionamento: i dati
sono relativi solo a una
parte della popolazine
(inferenza)
Non risposta: unità che
si rifiutano di rispondere
ERRORE DI
OSSERVAZIONE
Intervistatore
Intervistato
Strumento: domande
sbagliate
Modo: metodo di
rilevazione del dato
ERRORE nel
Trattamento dei
dati
Errori di
inputazione, di
codifica, o in
generale nella
manipolazione dei
dati
ESEMPI
Errore di operativizzazione **
ERRORE DI SELEZIONE
(nelle survey)
Copertura: le unità di
analisi non sono
raggiungibili
Campionamento: i dati
sono relativi solo a una
parte della popolazione
(inferenza)
Non risposta: unità che
si rifiutano di rispondere
Indagini web, auto-selezione
Errore di campionamento
Interviste telefoniche a fissi
ERRORE DI
OSSERVAZIONE
Intervistatore
Intervistato
Strumento: domande
sbagliate
Modo: metodo di
rilevazione del dato
ERRORE nel
Trattamento dei
dati
Errori di
inputazione, di
codifica, o in
generale nella
manipolazione dei
dati
Intervista telefonica troppo lunga
Domande tendenziose (scala asimmetrica)
Errata comprensione della domanda
Registrazione errata delle risposte
Attendibilità e validità
La validità è il grado con il quale una certa procedura di
traduzione di un concetto in variabile effettivamente
rileva il concetto che si intende rilevare. Legata
all’errore sistematico, difficilmente individuabile
L’attendibilità è il grado con il quale una certa procedura
di traduzione di un concetto in una variabile produce
gli stessi risultati (in più misurazioni con lo stesso
strumento o con più strumenti). Legata all’errore
accidentale. Più domande nella stessa batteria sullo
stesso argomento.
53
Un modo di misurare l’attendibilità
è l’alfa di Cronbach
Vengono fatte una serie di domande diverse sullo stesso
argomento (o concetto).
Se le risposte risultano tra loro “correlate” allora le
variabili ad esse associate costituiscono indicatori
affidabili del concetto.
Esempio a pagina 249 del Corbetta.
54