Analisi della relazione fra due variabili qualitative

Università degli Studi di Milano Bicocca – Facoltà di Sociologia
Tecniche quantitative di analisi dei dati
Analisi della relazione fra due variabili qualitative
Esercizi svolti
ESERCIZIO 1
La seguente tabella a doppia entrata illustra la relazione fra la situazione sentimentale attuale
(assunta come variabile indipendente) e la tipologia di atteggiamento nei confronti di alcuni
comportamenti riguardanti la sfera della sessualità (assunta come variabile dipendente) osservata
nella nostra classe:
Tipologia di atteggiamento verso la sessualità
Attualmente ha un
compagno/una
compagna stabile?
Rigoroso Monogamo Postmoderno
Cogli
l’attimo
Totale
No
Sì
4
13
9
11
7
20
20
26
40
70
Totale
17
20
27
46
110
Sulla base delle informazioni contenute in questa tabella:
(a) calcola le appropriate distribuzioni marginali e condizionate di probabilità;
(b) descrivi la forma e l’intensità della relazione osservata, utilizzando a tal fine differenze di
probabilità e odds ratio opportunamente calcolati;
(c) formula un’ipotesi plausibile sui meccanismi causali che potrebbero avere prodotto la relazione
osservata a livello bivariato.
Università degli Studi di Milano Bicocca – Facoltà di Sociologia
Tecniche quantitative di analisi dei dati
SVOLGIMENTO DETTAGLIATO DELL’ESERCIZIO 1
(a) Poiché la variabile indipendente è posta in riga e la variabile dipendente è posta in colonna, le
distribuzioni di probabilità di interesse vanno calcolate per riga. Le distribuzioni di probabilità da
calcolare sono tre:
1) La distribuzione marginale (cioè complessiva) della variabile dipendente. In termini di
frequenze assolute, questa distribuzione è formata dai valori 17, 20, 27 e 46. Dividendo ognuno di
questi valori per il loro totale (17+20+27+46=110) otteniamo le seguenti probabilità (arrotondate
alla seconda cifra dopo la virgola): 17/110=0,15 ; 20/110=0,18 ; 27/110=0,25 ; 46/110=0,42. Le
quattro probabilità così calcolate rappresentano la distribuzione di probabilità marginale della
variabile dipendente.
2) La distribuzione condizionata della variabile dipendente dato che la variabile indipendente
assume valore 1=No. In termini di frequenze assolute, questa distribuzione è formata dai valori 4,
9, 7 e 20. Dividendo ognuno di questi valori per il loro totale (4+9+7+20=40) otteniamo le seguenti
probabilità (arrotondate alla seconda cifra dopo la virgola): 4/40=0,10 ; 9/40=0,23 ; 7/40=0,18 ;
20/40=0,50. Le quattro probabilità così calcolate rappresentano la distribuzione di probabilità
condizionata della variabile dipendente dato che X=1.
3) La distribuzione condizionata della variabile dipendente dato che la variabile indipendente
assume valore 2=Sì. In termini di frequenze assolute, questa distribuzione è formata dai valori 13,
11, 20 e 26. Dividendo ognuno di questi valori per il loro totale (13+11+20+26=70) otteniamo le
seguenti probabilità (arrotondate alla seconda cifra dopo la virgola): 13/70=0,19 ; 11/70=0,16 ;
20/70=0,29 ; 26/70=0,37. Le quattro probabilità così calcolate rappresentano la distribuzione di
probabilità condizionata della variabile dipendente dato che X=2.
Complessivamente, le tre distribuzioni di probabilità appena calcolate possono essere rappresentate
in forma tabulare come segue:
Tipologia di atteggiamento verso la sessualità
Attualmente ha un
compagno/una
compagna stabile?
Rigoroso Monogamo Postmoderno
Cogli
l’attimo
Totale
No
Sì
0,10
0,19
0,23
0,16
0,18
0,29
0,50
0,37
1,01
1,01
Totale
0,15
0,18
0,25
0,42
1,00
Nota: le distribuzioni di probabilità possono non sommare esattamente a 1 a causa dell’arrotondamento
(b) Poiché in questo caso R=2 e K=4, l’intensità della relazione fra le variabili X e y può essere
rappresentata mediante (2(2-1)/2)(4)=4 differenze di probabilità e (2(2-1)/2)(4(4-1)/2)=(1)(6)=6
odds ratio.
La prima differenza di probabilità calcolabile è quella che pone a confronto gli accompagnati (X=2)
e i single (X=1) in termini di propensione assoluta a “cogliere l’attimo” (y=4):
Università degli Studi di Milano Bicocca – Facoltà di Sociologia
Tecniche quantitative di analisi dei dati
La seconda differenza di probabilità calcolabile è quella che pone a confronto gli accompagnati
(X=2) e i single (X=1) in termini di propensione assoluta a essere “postmoderni” (y=3):
La terza differenza di probabilità calcolabile è quella che pone a confronto gli accompagnati (X=2)
e i single (X=1) in termini di propensione assoluta a essere “monogami” (y=2):
La quarta e ultima differenza di probabilità calcolabile è quella che pone a confronto gli
accompagnati (X=2) e i single (X=1) in termini di propensione assoluta a essere “rigorosi” (y=1):
La prima di queste quattro differenze di probabilità (
) ci dice che la propensione
assoluta a “cogliere l’attimo” è minore fra coloro che hanno un compagno che fra coloro che non lo
hanno (-13 punti percentuali). Al contrario, la differenza di probabilità
ci dice che la
propensione assoluta a essere “rigorosi” è maggiore fra coloro che hanno un compagno che fra
coloro che non lo hanno (+9 punti percentuali). Insieme, queste due differenze di probabilità
suggeriscono che il coinvolgimento in una relazione sentimentale stabile è associato in misura
sostanzialmente significativa a una diminuzione dell’accettabilità di due forme di comportamento
(il tradimento sessuale del partner e il sesso occasionale) che, in effetti, sono antitetiche rispetto al
concetto stesso di relazione sentimentale stabile.
Le altre due differenze di probabilità, invece, ci dicono che – rispetto ai single – gli accompagnati
sono più propensi a essere “postmoderni” (+11 punti percentuali) e meno propensi a essere
“monogami” (-7 punti percentuali).
Come è lecito aspettarsi, i sei possibili odds ratio raccontano una storia del tutto simile a quella
raccontata dalle differenze di probabilità. Il primo odds ratio è calcolato come segue:
Questo odds ratio può essere interpretato così: fra gli accompagnati, la propensione relativa a
“cogliere l’attimo” anziché essere “postmoderni” è circa la metà (46%) dell’analoga propensione
osservata fra i single.
Il secondo odds ratio è calcolato come segue:
Questo odds ratio può essere interpretato così: fra gli accompagnati, la propensione relativa a
“cogliere l’attimo” anziché essere “monogami” è sostanzialmente uguale all’analoga propensione
osservata fra i single.
Il terzo odds ratio è calcolato come segue:
Questo odds ratio può essere interpretato così: fra gli accompagnati, la propensione relativa a
“cogliere l’attimo” anziché essere “rigorosi” è meno della metà (39%) dell’analoga propensione
osservata fra i single.
Il quarto odds ratio è calcolato come segue:
Università degli Studi di Milano Bicocca – Facoltà di Sociologia
Tecniche quantitative di analisi dei dati
Questo odds ratio può essere interpretato così: fra gli accompagnati, la propensione relativa a essere
“postmoderni” anziché “monogami” è più del doppio (2,32 volte) dell’analoga propensione
osservata fra i single.
Il quinto odds ratio è calcolato come segue:
Questo odds ratio può essere interpretato così: fra gli accompagnati, la propensione relativa a essere
“postmoderni” anziché “rigorosi” è l’85% dell’analoga propensione osservata fra i single.
Infine, il sesto odds ratio è calcolato come segue:
Questo odds ratio può essere interpretato così: fra gli accompagnati, la propensione relativa a essere
“monogami” anziché “rigorosi” è circa un terzo (37%) dell’analoga propensione osservata fra i
single.
(c) Le differenze di probabilità e gli odds ratio calcolati sopra mostrano chiaramente che i soggetti
coinvolti in una relazione sentimentale stabile sono molto meno propensi ad accettare il tradimento
sessuale del partner e il sesso occasionale di quanto lo siano i single. In termini causali questa
differenza potrebbe essere interpretata come segue: da un lato, il coinvolgimento in una relazione
sentimentale stabile aumenta il “costo relativo” del tradimento e, quindi, lo rende meno
desiderabile; dall’altro lato, il coinvolgimento in una relazione sentimentale stabile gratificante può
rendere meno interessante e desiderabile il sesso occasionale.
Università degli Studi di Milano Bicocca – Facoltà di Sociologia
Tecniche quantitative di analisi dei dati
ESERCIZIO 2
La seguente tabella a doppia entrata illustra la relazione fra il titolo di studio (assunto come
variabile indipendente) e l’orientamento religioso (assunto come variabile dipendente) osservata nel
1998 all’interno di un campione di cittadini italiani di età uguale o superiore a 18 anni:
Orientamento religioso
Titolo di studio
Cattolico Cattolico
senza con riserve
riserve
Fino licenza elementare
Licenza media
Diploma
Laurea
1.768
1.754
1.413
266
415
989
1.214
193
34
61
42
8
Totale
5.201
2.811
145
Altra
religione
Ateo
Totale
114
282
393
110
79
152
179
63
2.410
3.238
3.241
640
899
473
9.529
Credente
senza
appartenenza
Sulla base delle informazioni contenute in questa tabella:
(a) calcola le appropriate distribuzioni marginali e condizionate di probabilità;
(b) descrivi la forma e l’intensità della relazione osservata, utilizzando a tal fine differenze di
probabilità e odds ratio opportunamente calcolati;
(c) formula un’ipotesi plausibile sui meccanismi causali che potrebbero avere prodotto la relazione
osservata a livello bivariato.
Università degli Studi di Milano Bicocca – Facoltà di Sociologia
Tecniche quantitative di analisi dei dati
SVOLGIMENTO BREVE DELL’ESERCIZIO 2
(a) Calcolo delle distribuzioni marginali e condizionate di probabilità:
Orientamento religioso
Titolo di studio
Cattolico Cattolico
senza con riserve
riserve
Altra
religione
Credente
senza
appartenenza
Ateo
Totale
Fino licenza elementare
Licenza media
Diploma
Laurea
0,73
0,54
0,44
0,42
0,17
0,31
0,37
0,30
0,01
0,02
0,01
0,01
0,05
0,09
0,12
0,17
0,03
0,05
0,06
0,10
1,00
1,00
1,00
1,00
Totale
0,55
0,29
0,02
0,09
0,05
1,00
Nota: le distribuzioni di probabilità possono non sommare esattamente a 1 a causa dell’arrotondamento
(b) Osservando le distribuzioni di probabilità condizionate calcolate sopra si nota che esiste una
relazione sostanzialmente significativa fra il titolo di studio e l’orientamento religioso. In generale i
dati mostrano che all’aumentare del titolo di studio diminuisce il senso di appartenenza senza
riserve alla Chiesa cattolica, mentre tendono ad aumentare l’adesione critica alla religione cattolica,
la propensione alla “credenza senza appartenenza” e la propensione all’ateismo.
A titolo di esempio, si considerino le due estremità del livello di istruzione: le persone che hanno
conseguito al massimo la licenza elementare e quelle che, invece, si sono laureate. La propensione
di queste ultime ad aderire senza riserve alla Chiesa cattolica è inferiore di ben 31 punti percentuali
all’analoga propensione esibita dalle persone poco istruite; formalmente:
A questa forte differenza corrisponde la maggiore propensione dei laureati – rispetto alle persone
poco istruite – ad aderire criticamente alla religione cattolica (+13 punti percentuali:
), a “credere senza appartenere” (+12 punti percentuali:
) e a dichiararsi atei (+7 punti percentuali:
).
Anche gli odds ratio ci aiutano a mettere in luce la forte relazione esistente fra titolo di studio e
orientamento religioso. Limitandoci ancora una volta a confrontare le persone più istruite con quelle
meno istruite, possiamo osservare che, fra i laureati, la propensione relativa ad aderire alla Chiesa
cattolica con riserve anziché senza riserve è circa 3 volte l’analoga propensione osservata fra le
persone che hanno conseguito al più la licenza elementare; formalmente:
Ancora più forte è lo squilibrio fra laureati e persone poco istruite in termini di propensione relativa
a “credere senza appartenere” anziché aderire senza riserve alla Chiesa cattolica:
Università degli Studi di Milano Bicocca – Facoltà di Sociologia
Tecniche quantitative di analisi dei dati
Altrettanto ampia è la distanza fra laureati e persone poco istruite in termini di propensione relativa
a essere ateo anziché aderire senza riserve alla Chiesa cattolica:
(c) L’esistenza della relazione bivariata fra titolo di studio e orientamento religioso discussa sopra
può essere interpretata in diversi modi. Se assumiamo che tale relazione deriva da un genuino
rapporto di causa-effetto fra le due variabili, possiamo ipotizzare il seguente meccanismo
generativo: maggiore è il livello di istruzione posseduto, maggiori sono le opportunità di valutare
criticamente il proprio retroterra culturale – ivi compresi i valori religiosi – e, eventualmente, di
prenderne le distanze. Un livello di istruzione elevato è anche (spesso) un indicatore di stile di vita
più aperto e cosmopolita della media; tale cosmopolitismo, a sua volta, può portare a conoscere e
sperimentare forme di espressione della religiosità individuale diverse da quelle tradizionali.