3_Dispensa - Lezione FG 2_Il linguaggio delle variabili_031007

Università degli Studi di Milano – Bicocca
Facoltà di Sociologia
Corso di Laurea in Scienze del Turismo e comunità locale
A.A. 2007-2008
LA SOCIETA’ MODERNA
Prof. Guido Martinotti
Metodi quantitativi e linguaggio della variabili1
1. Le variabili
Uno degli obiettivi della ricerca sociale consiste nell'acquisizione di dati e informazioni, attraverso
condizioni sperimentali o attraverso indagini empiriche dirette. Tale processo comporta almeno due
operazioni:la classificazione e la misurazione.
I dati vengono normalmente colti e analizzati in termini di variabili: variabile è un concetto che
presuppone due o più livelli o valori. Il concetto "sesso" costituisce, nel linguaggio metodologico,
una variabile: essa può assumere due valori, o livelli, o modalità, cioè "maschio" o "femmina". L'età
è una variabile, i cui valori possono essere diversi (anni di età, oppure "giovane" o "vecchio" ecc.).
1.1 Classificazione delle variabili
È possibile identificare tipologie diverse di variabili:
- Per usare una prima, importante categorizzazione, si possono distinguere le variabili
quantitative e le variabili qualitative. Si dicono qualitative le variabili i cui valori o modalità sono
delle "qualità", delle categorie, degli attributi non quantificabili. Ad esempio, "sesso" è una
variabile qualitativa, nel senso che "maschio" e "femmina" sono categorie non quantificabili, non
misurabili, cioè, in termini di "grandezze misurabili". Si dicono quantitative le variabili che sono
espresse in grandezze misurabili. Lo stipendio mensile di un impiegato rappresenta una variabile
quantitativa, in quanto è esprimibile secondo una grandezza misurabile; un altro esempio può essere
dato dagli addetti di un'azienda, o dalla produzione annuale di automobili, o dal numero di iscritti al
sindacato.
- Una seconda distinzione riguarda le variabili discrete e le variabili continue: le prime
prevedono frazioni, le seconde prevedono che vi sia teoricamente un continuum di valori, anche
infinitesimamente piccoli, tra gli elementi misurati, e si presume che vi siano moltissimi potenziali
valori intermedi. Variabili discrete sono, ad esempio, il numero di impiegati di un'azienda, il
numero dei componenti di una famiglia, il numero di ospedali di una Regione ecc.; le variabili
continue si hanno invece nei casi in cui è possibile avere dei decimali e sono il peso, l’età, la
percentuale dei votanti di un determinato partito politico.
1
Testo adattato da Sciarra E., Paradigmi e metodi di ricerca sulla socializzazione autorganizzante, MEDIA Editrice,
Mosciano-Teramo, 1999.
1
- Una terza distinzione riguarda le variabili naturali e variabili artificiali: le prime sono
immediatamente percepibili, non dipendono da particolari operazioni di trattamento dei dati;
variabili "naturali" sono la zona di residenza, le ore di ascolto della musica classica, il sesso,
l'altezza, il reddito mensile. Le variabili artificiali sono invece il risultato di una qualche operazione
su dati e osservazioni specifiche: si può prendere come esempio la percentuale di famiglie che
dispongono di due televisori, o vari "indici" demografici ed economici.
- Inoltre, è possibile distinguere variabili indipendenti e variabili dipendenti. Si chiamano
indipendenti quelle variabili che, in un contesto di ricerca dato e secondo un certo "schema
concettuale operativo", "non" sono "causate", cioè "non" dipendono da altre variabili. L'attribuzione
del carattere dipendente o indipendente è convenzionale, nel senso che deriva dal contesto della
ricerca, dall'oggetto, dalle ipotesi, dalla loro articolazione operazionale (schema concettuale
operativo).
1.2 Costruzione e misurazione delle variabili
Per svolgere una ricerca di tipo esplorativo o per dimostrare e confermare l'ipotesi di partenza, ci si
troverà sempre di fronte al problema della costruzione delle variabili, ossia il problema della
"traduzione dei concetti e delle nozioni in operazioni di ricerca ben definite"2. E' quindi necessario
rilevare e registrare gli stati (le variazioni) dei casi su quella proprietà, assegnando loro un valore o
un'etichetta, attraverso un insieme di istruzioni e regole; in altre parole costruire la definizione
operativa della proprietà che si vuole rilevare e "tradurla" in variabile.
La definizione operativa è indispensabile per la ricerca scientifica per garantire l'intersoggettività
dei risultati raggiunti e diminuire l'ambiguità dei concetti, oltre a rendere possibile un controllo dei
risultati della ricerca ad altri ricercatori.
PROPRIETA'
(di un concetto)
DEFINIZIONE OPERATIVA
- Testo della domanda
- Codifica
- Eventuali procedure di controllo
VARIABILE
Le variabili hanno diversi livelli di misurazione. Le operazioni che permettono di passare dalle
proprietà alle relative variabili sono: la classificazione, la misurazione e il conteggio
1) CLASSIFICAZIONE: ( = ; ≠ )
La relazione tra le modalità della variabile e di uguale/diverso. (es. femmina/maschio)
La classificazione una procedura che rileva la proprietà sulla base di una scala nominale.
2) MISURAZIONE: ( < ; > ) ; ( = ; ≠ )
Le relazioni tra le modalità della variabile sono minore-uguale-maggiore. (es. livello di istruzione)
La misurazione è una procedura di confronto rispetto ad un'unità di misura convenzionale sulla base
della quale è costruita una scala ordinale di misurazione.
3) CONTEGGIO ( + ; - ; x ; / ) ; ( < ; > ) ; ( = ; ≠ )
Le relazioni tra le modalità della variabile sono di rapporto. (es. reddito)
Il conteggio è una procedura di confronto sulla base di una sequenza di numeri naturali interi che
permette di definire l'esatta distanza fra le modalità di una determinata variabile, sulla base di una
scala a intervalli e a rapporti.
2
Boudon, Lazarsfeld, L'analisi empirica nelle scienze sociali, il Mulino, Bologna, 1969, pag. 17
2
2. Relazione tra variabili
“La spiegazione sociologica consiste esclusivamente nello stabilire rapporti di causalità” – dice
Durkheim -; ovvero affonda le sue radici di ricerca nella spiegazione della realtà sociale attraverso
schemi di spiegazione causale elaborate per importanti impianti teorici. Per spiegare i fenomeni
sociali bisogna quindi elaborare e controllare una serie di modelli casuali. Tuttavia “è sempre
Durkheim - ricorda Boudon - a capire che una relazione statistica non può essere interpretata come
una relazione causale che con grandi precauzioni”3.
Un volta costruite le variabili, occorre analizzare le relazioni che intercorrono tra di loro. Diversi
studi indicano, ad esempio, che il suicidio è più frequente tra i divorziati, l’assenteismo dal lavoro
più comune tra le donne, il livello di aspirazione più basso tra i bambini allevati in famiglie dalla
struttura autoritaria, la probabilità di accedere alle scuole superiori più bassa per i bambini
provenienti da famiglie appartenenti ai ceti inferiori. Correlazioni di questo tipo sono spesso il
punto di partenza dell’analisi sociologica. Tutto il lavoro di Durkheim sul suicidio, ad esempio, è
uno sforzo diretto a spiegare relazioni primarie di questo tipo: tra tassi di divorzio e tassi di suicidio,
tra durata del giorno e tassi di suicidio, e via dicendo.
Le scienze sociali si sono trovate ad affrontare un importante problema nel tentativo di aderire al
modello e alla logica delle scienze fisico-naturali:
-
-
trovare una modalità di formalizzare il linguaggio sociologico. Il problema è stato affrontato
attraverso l'adozione di tecniche di osservazione e misurazione per determinare una regolarità
e uniformità dei fenomeni, la definizione dell'unità di analisi, costruzione delle variabili,
misurazione delle proprietà.
trovare una un'alternativa sociologica all'esperimento controllato. In tal senso risulta
fondamentale l'osservazione della relazione tra le variabili.
Come vedremo più avanti, l'introduzione della terza variabile permette il controllo di una relazione
tra due variabili. Lazersfeld considera tale controllo una generalizzazione dell'esperimento
controllato. Anche il principio di covariazione viene utilizzato come controllo di spiegazioni
elaborate per i problemi di ricerca.
Sono stati elaborati differenti criteri per analizzare, in fase esplorativa, la relazione tra proprietà
rilevanti all’interno della ricerca o per controllare a posteriori le spiegazioni elaborate per i problemi
della ricerca.
Si possono stabilire alcune gerarchie di influenza tra le diverse proprietà in relazione a:
-
principio di priorità (es. uno stato l'antecedente può influenzare stati successivi)
-
principio di alterabilità (es. una caratteristica contestuale può influenzare un atteggiamento)
-
esperimento controllato (nelle scienze fisico-naturali)
-
“variazioni concomitanti”, detto anche “delle covariazioni” (J. S. Mill osserva come “qualsiasi
fenomeno che varia in un modo, quando anche un altro fenomeno varia in un modo
particolare, è la causa o l'effetto di quel secondo fenomeno, o è ad esso connesso attraverso
qualche fattore casuale”). La causa della variazione è interna alla relazione tra i due fenomeni.
3
Raymond Boudon, metodologia della ricerca sociologica, il Mulino, Bologna, 1970, pag. 68.
3
Nella realtà sono possibili tre tipi di relazione fra due proprietà:
1) Unidirezionale: la proprietà A influenza la proprietà B ma non è da questa influenzata.
La variabile A è detta indipendente e quella B dipendente, la relazione è di tipo diretto.
A
B
2) Bidirezionale asimmetrica: la proprietà B esercita un’influenza maggiore sulla proprietà
A più di quanto A eserciti su B
A
B
3) Bidirezionale simmetrica: le due proprietà, A e B, esercitano influenze reciproche della
stesa identità l’una sull’altra
A
B
Ogni volta in cui il metodo sperimentale non è applicabile ricorriamo al metodo delle “variazioni
concomitanti” che costituisce il fondamento logico delle tecniche di accertamento delle relazioni fra
variabili. Tuttavia con il metodo delle covariazioni non è accertabile la direzione della relazione tra
le proprietà, possiamo solo sapere se fra le variabili esista una relazione, se sia forte o debole,
positiva o negativa.
3. Variabili di controllo, l'introduzione della terza variabile
Le relazioni (e la covariazione) tra variabili sopra indicato non esclude il fatto che le variabili A e B
siano influenzate da un terzo fenomeno o più. Esaminiamo quindi quali possono essere le diverse
situazioni che si presentano all'introduzione di una terza variabile nella relazione originaria esistente
tra due.
Relazione spuria
C
A
B
In questo caso la relazione tra una variabile A e una variabile B, che ad una prima analisi può
apparire di tipo diretto ma anche nullo, è l'effetto di una terza variabile. Entrambe le variabili sono
influenzate da C: la relazione è detta spuria.
Riprendiamo un esempio classico di Lazarsfeld per meglio comprendere questo tipo di relazione.
Nei dati pubblicati dal comune di Chicago Lazersfeld notò che esisteva una relazione positiva tra
numero di autobotti inviato a spegnere un incendio e i danni provocati dall'incendio stesso (più
4
autobotti, più danni): la correlazione era dovuta a una terza variabile, la dimensione dell'incendio.
Quest'ultima variabile permette di controllare come si modifica la forza della relazione tra A e B;
ripetendo l'operazione con tutte le variabili che potenzialmente possono influire sul fenomeno, si
verifica se la relazione tra A e B sia realmente casuale o se dipenda da variabili altre.
Relazione indiretta
A
C
B
Per controllare la relazione tra A e B può essere utile anche introdurre una terza variabile C che
influenza la variabile dipendente B ed è influenzata dalla variabile indipendente A. La variabile C è
detta interveniente se la relazione tra A e B va scomparendo, ovvero se la loro relazione è indiretta.
4. Effetti di interazione
Esempio 1:
Prendiamo l’esempio dell’analisi che Durkheim fa del rapporto tra suicidio e temperatura..
G, F, M, A, M, G, L, A, S, O, N, D = mesi dell’anno
Ad una prima osservazione possiamo dire che il tasso di suicidi aumenta all’aumentare della
temperatura. La relazione tra le due variabili sarebbe rappresentabile graficamente come riportato
nello schema sottostante.
5
Relazione apparente (spuria)
TEMPERATURA
SUICIDIO
La relazione tra temperatura e tasso di suicidio viene invece spiegata dalla duplice influenza dei
fenomeni cosmici (ore di luce) sulla temperatura e sul ritmo della vita sociale. Tale spiegazione
dimostra al tempo stesso che la temperatura non esercita alcuna influenza sui tassi di suicidio. In
diversi punti del celebre lavoro sul suicidio, Durkheim mostra che una relazione statistica tra due
variabili può essere interpretata in maniera generale solo se viene inserita in un modello causale in
cui vengono introdotte delle variabili supplementari.
Relazione effettiva
Lunghezza
del giorno
Intensità della
vita sociale
Suicidio
Temperatura
6
Esempio 2:
Prendiamo ora come riferimento l'esempio utilizzato da Boudon relativo all'ascolto di programmi di
musica classica da parte di persone anziane e giovani. Come osserviamo dalla tabella sotto riportata,
la relazione tra l'ascolto della musica classica e l'età dei soggetti è praticamente nulla. Non
essendoci differenza tra le due modalità relative all'età è possibile affermare che l'età non influenza
l'ascolto della musica classica.
Percentuale di soggetti che ascoltano musica classica secondo età
Giovani
Vecchi
30%
29%
Passiamo ora ad osservare la tabella in cui sono riportati i dati relativi alla terza variabile “grado di
istruzione”. Ora la relazione tra ascolto di musica classica e età dei soggetti diventa positiva per chi
possiede istruzione superiore e negativa per i coloro che possiedono istruzione inferiore.
Osserviamo infatti tra le persone con istruzione superiore il 52% dei “vecchi” e il 32% dei
“giovani” ascolta musica classica mentre tra le persone con istruzione inferiore la percentuale
diminuisce al 19% tra i “vecchi” e 28% tra i giovani. Questa operazione permette di portare alla
luce fenomeni più complessi. Rispetto all'assenza originaria di una relazione tra le due variabili,
l'introduzione della terza variabile mette in evidenza l'influenza della variabile età sull'ascolto della
musica classica ma soprattutto permette di verificare che le due variabili iniziali interagiscono
reciprocamente.
Ascolto musica classica per età e grado di istruzione
Istruzione superiore
Istruzione inferiore
Giovani
Vecchi
Giovani
Vecchi
32%
52%
28%
19%
7
Dopo aver analizzato i dati riportati sopra in tabelle, possiamo costruire i modelli causali relativi al
caso preso in esame. Le strutture causali rendono visibili gli effetti di interazione tra età e livello di
istruzione in modo da riprodurre graficamente l'effetto di ciascuna delle due variabili sull'interesse
per la musica dipende dell'altra variabile. Tali effetti sono detti effetti di interazione.
Età
Livello di istruzione
Livello di istruzione
Interesse
per la musica classica
Età
Interesse
per la musica classica
o anche ……
Età
Livello di istruzione
Interesse
per la musica classica
Riflettendo su questo esempio, emerge l’importanza della conoscenza del contesto, che permette di
inserire nel modello le variabili adatte ed ottenere una rappresentazione sufficientemente corretta
del fenomeno che ci interessa. Le strutture causali composte da tre variabili ci inducono a pensare
all’opportunità di introdurre nuove variabili di carattere intermedio ed estendere il modello ad una
logica multivariata.
Nell'ambito della ricerca è quindi importante essere sempre consapevoli di quali variabili si
considerano, fra quali variabili considerate si stabiliscono relazioni e quali relazioni intendiamo
considerare unidirezionali (una variabile che esercita l’influenza - indipendente - e una che la riceve
– dipendente). Come abbiamo osservato in precedenza è possibile che una variabile sia
interveniente poiché considerata indipendente in una relazione e dipendente in un’altra.
Bibliografia
Bailey K. D., 1995, Metodi della ricerca sociale, Il Mulino, Bologna
Corbetta P., 1999, Metodologia e tecniche della ricerca sociale, il Mulino, Bologna
Guala C., 1991, I sentieri della ricerca sociale, La Nuova Itali Scientifica, Roma
Sciarra E., 1999, Paradigmi e metodi di ricerca sulla socializzazione, MEDIA Editrice, Teramo
8