METODOLOGIA E STATISTICA DELLA RICERCA SOCIALE (EP

8829 - METODOLOGIA DELLA RICERCA SOCIALE
Prof. Piergiorgio Corbetta
Conoscenze e abilità da conseguire
Allo studente verranno presentate le principali tecniche di ricerca sociale;
nella parte conclusiva del corso si dedicherà un certo spazio anche
all’analisi dei dati. La finalità del corso è quella di fornire le conoscenze
specifiche necessarie per a) effettuare una ricerca empirica elementare e b)
saper valutare criticamente un rapporto di ricerca.
Programma/Contenuti
Argomenti del corso:
1 - La traduzione empirica della teoria
2 - L'inchiesta campionaria
3 - Le fonti statistiche ufficiali
4 - L'analisi dei dati: analisi ad una variabile
5 - L'analisi dei dati: analisi a due variabili
Testi/Bibliografia
Piergiorgio Corbetta, La ricerca sociale: metodologia e tecniche,
Bologna, Il Mulino
Vol II. Le tecniche quantitative: Cap. I: par. da 1 a 6. Cap. III: par. da 1 a
8. Cap. V: tutto
Vol IV. L'analisi dei dati: Cap. II: par. 1, 2, 3, 8, 12, 13. Cap. III: par. 1,
2 (con esclusione di 2.5, 2.6), par. 7.1 (solo questo sotto-paragrafo del
par. 7)
Alternativamente:
Piergiorgio Corbetta, Metodologia e tecniche della ricerca sociale,
Bologna, Il Mulino
Cap. III: par. da 1 a 6. Cap. V: par. da 1 a 7. Cap. VII: tutto. Cap. XII:
par. 1, 2, 3, 8, 12, 13. Cap. XIII: par. 1, 2 (con esclusione di 2.5 e 2.6),
par. 7.1 (solo questo sotto-paragrafo del par. 7).
Nota: i due programmi sono identici. Si tratta dello stesso volume
pubblicato sia in modo frazionato in quattro volumi (di questi il primo e
il terzo non servono per questo esame) sia in forma di unico volume.
Modalità di verifica dell'apprendimento
Esame scritto: test a risposte multiple.
1
Orario di ricevimento
Mercoledì ore 10-11 presso il Dipartimento di scienze dell'educazione, Via
Filippo Re 6
Calendario Corso
N
Argomento
Lez
1
Introduzione con presentazione ricerche in educazione
2
Ricerca quantitativa e ricerca qualitativa
3
Struttura della ricerca, teoria, ipotesi
4
5
6
L’operativizzazione dei concetti
Le variabili
“
7
8
9
L’inchiesta campionaria
“
“
10
11
12
Le fonti statistiche ufficiali
“
La matrice dei dati
13
14
15
Analisi monovariata
Distribuzioni di frequenza; rappresentazioni tabellari e grafiche
Dati aggregati e rapporti statistici
Serie temporali e territoriali; numeri indice
16
17
18
Analisi bivariata: Tabelle a doppia entrata
“
Esercizi di analisi dati
19
20
21
Analisi bivariata: diagrammi di dispersione
“
Esercizi di analisi dati
2
LUCIDI UTILIZZATI ALLE LEZIONI
Precisazione importante: questi lucidi sono pensati per gli studenti che seguono le lezioni, come
promemoria di quanto fatto a lezione. Non sono assolutamente sufficienti per superare l’esame, né per chi ha
frequentato, né per chi non ha frequentato. Le domande del test d’esame, infatti, fanno riferimento agli
argomenti trattati nel libro adottato, molti dei quali, per la limitatezza del tempo a disposizione delle lezioni,
non sono stati in queste trattati e quindi non compaiono sui lucidi che seguono.
Delle dispense che seguono, le Lezioni n. 1 e n. 2 servono per illustrare i vari tipi di ricerca sociale; gli
esempi ed i temi in esse trattati, tuttavia, non entrano nelle domande del test d’esame.
La numerazione delle lezioni che seguono non corrisponde all’indice delle lezioni sopra riportato: alcuni
degli argomenti delle lezioni che seguono vengono trattati in due lezioni
LEZIONE N 1
ALCUNI ESEMPI DI RICERCHE EMPIRICHE IN CAMPO
EDUCATIVO
Xin Ma, Bullying and Being Bullied: to What Extent Are Bullies also
Victims?, in “American Educational Research Journal”, 2001, pp. 351-370.
Introduzione (rassegna della letteratura)
- Bullismo: una forma di aggressione attraverso la quale uno studente o un
gruppo di studenti ripetutamente disturba una vittima verbalmente o
fisicamente senza essere provocato (es. p. 452)
- Effetti devastanti del bullismo, che spesso arrivando a conseguenza
violante e disastrose sia per le vittime che per gli aggressori
Caratteristiche salienti degli aggressori:
- famiglie con genitori autoritari, ostili, che rifiutano i figli
- precedenti di comportamenti aggressivi
- non c’è relazione con caratteristiche socio-economiche
- genere: più maschi che femmine (3/1)
Caratteristiche salienti delle vittime:
- studenti senza amici nella scuola e eccessivamente protetti dai genitori
- non incidono caratteristiche fisiche (sovrappeso, occhiali, razza, o altre
diversità es. nel vestire, nel dialetto...)
- scarse capacità relazionali, capacità di difendersi o di vendicarsi
- bassa autostima, alta ansietà sociale, paura delle valutazioni negative dei
pari
Caratteristiche del contesto (scuola)
La scuola può far molto per ridurre il bullismo, in quanto gli atti relativi si
compiono in genere negli edifici scolastici:
3
- disciplina, intensa supervisione, assistenza psicologica per studenti,
formazione per gli insegnanti
Metodo
Questionario fatto i due scuole del 6° grado (N=6800) e dell’8° grado
(N=6800), indagando attraverso le domande del questionario se gli
studenti fossero mai stati oggetto di prepotenze o se essi avessero mai
compiuto atti di “bullismo” [Questionario p. 358]
C. Goldenberg, R. Gallimore, L. Reese and H. Garnier, Cause or Effect? A
Longitudinal Study of Immigrant Latino Parents’ Aspirations and
Expectations, and Their Children’s School Performance, in “American
Educational Research Journal”, 2001, pp. 547-582
Studio longitudinale, durato sei anni (dal kindergarten al 6° grado) su 81
bambini latino americani dell’area di Los Angeles, e sui loro genitori. Sul
tema della profezia che si autoadempie: se le aspettative di genitori ed
insegnati sul rendimento scolastico di un bambino sono elevate, il suo
rendimento sarà pure elevato. In particolare pare che il basso successo dei
bambini latino-americani nelle scuole americane sia dovuto al basso livello
di aspettative dei loro genitori.
Strumenti
a. Aspirazioni e attese dei genitori
Ogni anno è stata fatta un’intervista in autunno ai genitori. Domande su
loro aspirazioni e previsioni
a1. Aspirazione: Quanto lei vorrebbe che suo/a figlio/a proseguisse negli
studi?
a2. Attesa (previsione): Fino a quanto lei pensa che suo/a figlio/a prosegua
negli studi?
Per entrambe: finire le elementari / le medie / le superiori / frequentare il
college / frequentare l’università / laurearsi.
b. Risultati scolastici
Basati sulla valutazione degli insegnanti su 4 temi: andamento generale dei
voti nell’anno, andamento nella capacità di lettura, interesse-motivazione,
capacità di apprendimento
4
Fra i risultati emerge non solo, come è noto, che le aspettative dei genitori
influenzano il rendimento scolastico dei figli; ma anche l’interessante fatto
che le aspirazioni dei genitori sono a loro volta influenzate dal rendimento
scolastico dei figli
5
K. J. Quirk, T.Z. Keith e J.T.Quirk, Employment During High School and
Student Achievement: Longitudinal Analysis of National Data, in “The
Journal of Educational Research”, Sept-Oct, 2001, 4-10.
Il fatto che lo studente lavori, che effetto ha sul rendimento scolastico
(studenti delle superiori)?
Incertezze della ricerca sul problema. Effetti sia positivi che negativi.
Alcuni ricercatori hanno trovato effetti leggermente positivi se il lavoro
non supera le 15-20 ore settimanali; negativi se le supera. Nessuno studio
longitudinale.
La ricerca
Campione nazionale di 15.552 studenti dal’8° al 12° grado. Studio
longitudinale (intervistati ogni due anni).
Risultato: influenza curvilinea dell’esperienza di lavoro sul rendimento
scolastico: chi ha lavorato fino a 12 ore alla settimana va meglio di chi non
ha lavorato; gli studenti con lavoro oltre le 12 ore alla settimana sono
quelli che vanno peggio a scuola.
Avvertenza dei ricercatori: bisognerebbe differenziare l’analisi a seconda
del lavoro compiuto (lavoro nei campi, in fabbrica, baby sitting...):
6
J. W. Wimer, C.S. Ridenour, K. Thomas e A.W. Place, Higher Order
Teacher Questioning of Boys and Girls in Elementary Mathematics
Classrooms, in “The Journal of Educational Research”, Nov-Dec, 2001,
84-92.
Ricerca sul diverso rendimento in matematica di maschi e femmine (le
Higher Order Questions sono domande fatte agli studenti che non sono
basate sulla memoria di quanto studiato, ma su un ragionamento
applicativo di queste conoscenze). Bambini e bambine mostrano stesso
entusiasmo per la matematica nella scuola elementare (81% bambine e
84% maschi). Nella prima adolescenza le relazione comincia a cambiare
(72% maschi e 61% femmine). Nella high school è di 25% fra i ragazzi e
15% fra le ragazze.
7
L. Alcàzar et. al., Why are teachers absent? probing service delivery in
Peruvian primary schools, in «International Journal of Educational
Research», 45 (2006): 117-136.
1. Introduction
- Importanza in campo educativo della motivazione degli insegnanti.
2. Literature review: what do we know about teacher absence?
- Pochi studi sistematici, men che meno nella nazione studiata (Perù)
3. Study approach and methodology
- Studio finanziato dalla World Bank sull’assenteismo in campo educativo
e sanitario in 6 nazioni: Peru, Bangladesh, Ecuador, India, Indonesia,
Uganda.
- Visite non annunciate in un campione di 100 scuole elementari distribuite
in 7 regioni rappresentative della costa, sierra e giungla. Due visite: una
per rilevare le presenze, una seconda per intervistare gli insegnanti. Oltre
al questionario individuale (agli insegnanti), anche schede per dati sulla
scuola.
4. Absence and incentives: conceptual framework and Peruvian
institutional context
Fattori che intervengono casualmente sul coinvolgimento degli insegnanti
(incentivi): analisi della letteratura:
Institutional context: stabilità del lavoro, benefici contrattuali (ferie,
pensione...)
Modalità di assunzione: concorsi nazionali, clientele locali...
Salare and bonuses
Monitoring and discipline
5.
Descriptive results: what is the extent of absence and who is absent?
% assenza
Bangladesh
16
Ecuador
14
India
25
Indonesia
19
Peru
11
Uganda
27
8
Segue tabella sulle motivazioni dell’assenza addotte dal direttore
6. Why are school teacher absent?
Analisi multivariata
6.1. Caratteristiche della comunità
. povertà (dell’area)
. lontananza (della scuola)
6.2. Caratteristiche demografiche dell’insegnate
. età, genere, stato civile
6.3. Incentivi finanziari
. salario
6.4. Caratteristiche del contratto
6.5. Controllo e disciplina
. controlli dall’alto dalla gerarchia
. controlli dal basso dalle famiglie
. incentivi non economici: . legami comunitari
. condizioni di lavoro (infarastrutture ed
equipaggiamento
. competizione da parte di scuole private
9
D. Filmer, Gender and wealth disparities in schooling: Evidence from 44
countries, in «International Journal of Educational Research», 43 (2005):
351-369.
1. Introduction
Dichiarazione dei diritti dell’uomo delle nazioni unite del 1948: istruzione
primaria fra i diritti umani. Oltre 50 anni dopo l’obiettivo non è ancora
raggiunto.
Ricerca condotta sui dati del Demographic and Health Surveys (DHS) in
oltre 40 nazioni
2. Why would one expect differences in schooling?
Genere
- diverso valore dato dalle famiglie all’istruzione dei maschi o delle
femmine
- effetto se le scuole sono segregate per genere o se il corpo insegnante è
prevalentemente maschile o femminile
- diverso ruolo di M o F nella produzione familiare: es. cura familiare
(sorelle maggiori che devono prendersi cura dei fratelli e sorelle piccoli),
lavoro nei campi, in casa (es tappeti)
Ricchezza-Povertà
Il reddito familiare influenza l’investimento nella scuola.
Genere e reddito
Poco studiato. P. es. in area rurale potrebbe essere più facile trovare lavoro
per i ragazzi non istruiti (lavori nei campi) per cui ai ragazzi non
converrebbe andare a scuola. All’opposto nelle zone dove le ragazze
sostituiscono la madre nella cura domestica, c’è disincentivo ad andare a
scuola per le ragazze.
3.
Data and methodological approach
Base dati per 44 nazioni, solo paesi “in via di sviluppo”, metà della
popolazione mondiale, campioni nazionali di famiglie fra i 2000 e i 87.000
casi!
Istruzione, tre domande:
se sono mai stati a scuola
più alto livello raggiunto
voto finale avuto
Per coloro che avevano fra 6 e 25 anni chiesto anche se stavano
frequentando una scuola
10
Variabili utilizzate:
- frequenza: % di ragazzi fra 6 e 14 anni che frequentano una scuola
- adempimento: % di giovani fra 15 e 19 anni con i 5 anni delle elementari
Ricchezza-povertà: con dati individuali, vantaggio di poter misurare le
differenze entro le nazioni; tuttavia variabile molto difficile da misurare
(non si può fare domanda diretta su reddito). Utilizzati indicatori su
possesso di beni. Esempio (sommati punteggio 0-15):
- 6 beni posseduti (radio, frigo, tv, bicicletta, moto-auto...)
- 3 indicatori su approvvigionamento acqua
- 3 su servizi igienici
- 1 su elettricità
- 1 di persone in stanza
- 1 su materiale del pavimento della casa
Misure delle disuguaglianze nell’istruzione per genere e ricchezza
Disuguaglianze per genere: rapporto fra M/F frequentanti
Disuguaglianze per ricchezza: (% bambini frequentanti nel 50% delle
famiglie più ricche) / (% bambini frequentanti nel 50% delle famiglie più
povere)
4.
The magnitude on gender and wealth inequalities in education
Disuguaglianze per genere: particolarmente alte nell’Africa centrale e
occidentale; poi in Asia meridionale; poi in Nord Africa. In 7 nazioni la
tendenza è opposta, concentrate in America latina (es Brasile...)
Disuguaglianze per reddito: maggiori in Africa centrale e occidentale, Asia
meridionale, Nord Africa (v. tab. 1)
Confronto fra disuguaglianze di genere e di reddito su istruzione (v. fig. 1)
Linea dei 45°: disug di genere e di ricchezza sono eguali
Quasi tutte le nazioni sono sopra questa linea: le diseg. nell’istruzione per
reddito sono maggiori di quelle per genere.
Tre gruppi:
- nazioni lungo l’asse verticale (Nigeria, Tanzania): diseg. dovute al genere
basse, dovute al reddito alte;
- nazioni con entrambe le disug alte (es. Pakistan)
- nazioni con disug entrambe alte, ma assai maggiore quella per reddito
(es. Mali, Marocco)
11
Problemi della ricerca nelle scienze sociali (Robertson, 34):
- Reattività
- Individualità
- Complessità
- Non-manipolabilità
- Appartenenza
12
LEZIONE N 2
METODI QUANTITATIVI E METODI QUALITATIVI
Fasi del dibattito:
anni 1920-30: confronto
1940-60: trionfo quantitativo
fine anni 60: ritorno del dibattito e della valorizzazione del
qualitativo
dalla seconda metà anni 80: forte sviluppo metodi qualitativi
Quantitativo-qualitativo: contrapposizione dalle radici profonde
Presentazione di due "tipi ideali" di ricerca
A. Paradigma neopositivista:
Sociologia nasce in ambito positivistico
- Auguste Comte, Montpellier1789 - Parigi1857; Cours de philosophie
positive, 1835-1842
- Herbert Spencer, Derby 1820 - Brighton 1903; Principi di filosofia
sintetica, 1862 - 1885.
Ingenuo fideismo metodi scienze naturali.
Positivismo: “studiare la realtà utilizzando gli apparati concettuali, i
metodi di osservazione e misurazione, gli strumenti d'analisi matematica, i
procedimenti d’inferenza, delle scienze naturali”.
Crime in the making, di Robert Sampson e John Laub.
Storia della ricerca: ritrovamento materiale originario ricerca longitudinale
1. Ipotesi teoriche:
- necessità di studio longitudinale, non concentrazione solo su
adolescenza:
. studi trasversali (cross-sectional) o sincronici
. studi longitudinali (longitudinal) o diacronici (prospettiva di ciclo di
vita)
- ipotesi 1: tesi della stabilità del comportamento disadattato
(antisocialità che si forma nell'infanzia)
- ipotesi 2: tesi del cambiamento: i bambini antisociali non diventano
necessariamente degli adulti antisociali: teoria del "controllo sociale
informale";
13
Legami informali in: famiglia, scuola, gruppo dei pari, lavoro,
matrimonio
2. Disegno della ricerca
1939: 500 "autori di reato" e 500 ragazzi "normali" fra i 10 e 17 anni
Seguiti sistematicamente fra il 1939 ed il 1948
Interviste successive all'età di 25 e 32 anni (raggiunti quasi 450 per
gruppo)
3. Analisi dei dati e risultati
Variabili dipendenti:
- devianza ufficiale (autori/non-autori di reato)
- devianza non ufficiale: punteggio sulla base di comportamenti anche
di semplice "cattiva condotta" (fumare, bere, scappare di casa,
marinare la scuola, cattiva condotta a scuola...)
Cinque capitoli:
contesto familiare
ruolo della scuola del gruppo dei pari e di fratelli/sorelle
continuità nel tempo
legami sociali adulti e cambiamento
modelli comparativi di crimine e devianza
Cap. 1: Contesto familiare e delinquenza giovanile
a) quadro teorico:
- la probabilità di devianza cresce col peggiorare delle condizioni socioeconomiche di partenza
- variabili di base o strutturali (structural background variables) e
variabili di processo (processual variables), legami informali (v.
schema a due stadi)
14
Variabili strutturali di base
Affollamento abitativo
Disgregazione familiare
Dimensione familiare
Basso status socio-economico
Nascita all'estero
Mobilità residenziale
Occupazione della madre
Devianza paterna
Devianza materna
b)
c)
Variabili processuali
Padre erratico, freddo e minaccioso
Madre erratica, fredda e minacciosa
Mancanza di supervisione materna
Rifiuto, ostilità da parte dei genitori
Rifiuto dei genitori da parte del ragazzo
Reato
misure empiriche
risultati dell'analisi
regressione standard (devianza non-ufficiale) e logistica (devianza
ufficiale)
. esiste relazione fra variabili di base e devianza (1)
. esiste relazione fra variabili processuali e devianza (2)
. se considerate tutte assieme, le relazioni (1) spariscono: "le variabili
strutturali non hanno effetto diretto sul comportamento deviante, ma
mediato dalle variabili processuali": il 73% dell'effetto (1) è mediato
dalle variabili processuali familiari
Tab. 2.1. Influenza delle variabili strutturali e processuali sul comportamento deviante, sulla base di una regressione
logistica (Sampson e Laub 1993).
b
Variabili strutturali
Mobilità residenziale
Dimensione della famiglia
Affollamento familiare
Disgregazione familiare
Occupazione della madre
Status socio-economico della famiglia
Nascita all'estero
Devianza del padre
Devianza della madre
Variabili processuali
Padre erratico/ostile
Madre erratica/ostile
Supervisione materna
Rifiuto dei genitori
Attaccamento ai genitori
rapporto t
0,03
0,15
-0,32
0,36
-0,11
-0,12
0,00
-0,06
0,15
1,19
2,72*
-1,75
1,50
-0,48
-1,68
0,01
-0,44
0,84
0,48
0,45
-1,24
0,65
-0,38
3,47*
3,35*
-8,16*
3,60*
-2,66*
Chi-quadrato di massima verosimiglianza = 491; gl = 14.
* Indica relazione statisticamente significativa al livello dello 0,05 (p < 0,05)
15
d)
ritorno alla teoria ("i processi familiari di controllo...)
4. Conclusioni teoriche
Applicazione di modello simile a ruolo di scuola, gruppo dei pari, fratelli,
lavoro, matrimonio
Arrivano a un "modello teorico dinamico del crimine, la devianza ed il
controllo sociale informale lungo il ciclo di vita"
16
B. Paradigma interpretativo: Islands in the street, di Martin Sanchez
Jankowski
(Sociologia comprendente, sociologia fenomenologica, ermeneutica)
Wilhelm Dilthey (filosofo tedesco: 1833-1911)
Contrapposizione scienze della natura e scienze dello spirito: lo scopo
delle prime è la spiegazione (Erclären) mentre scopo delle seconde è la
comprensione (Verstehen)
Analisi dell’azione come “una scienza interpretativa in cerca di significato,
non una scienza sperimentale in cerca di leggi”.
“Noi spieghiamo la natura, mentre intendiamo la vita psichica” (Dilthey).
Comprensione o Verstehen, .. fenomeni di empatia e simpatia tra
osservatore ed osservato ... sotto i nomi più diversi: intuizione, percezione
dell’altro, stato mentale, ricostruzione immaginativa (Erlebnis = subitanea
intuizione)
Spiegare e comprendere (“Nelle conclusioni del precedente volume...T 50)
1. Disegno della ricerca e raccolta dei dati
Osservazione partecipante: 37 gang, 10 anni. Partecipazione: 1 mese; 10
giorni; 1 settimana
2. Ipotesi teoriche
Non c'è riflessione teorica pre-empirica basata sulla letteratura, nè
elaborazione di ipotesi da validare empiricamente (la teoria dovrà essere
"scoperta" nel corso dell'indagine). Ipotesi iniziali già derivano dalla
ricerca.
-
la gang non nasce da disorganizzazione sociale ma risponde ad
esigenze di organizzazione per accaparrarsi le scarse risorse
(“L’originalità dell’approccio... T 51)
-
Individuo (tipo ideale) dal "carattere individualistico e ribelle"
(defiant inividualistic character)
. senso della competizione che arriva all'aggressione fisica
. sfiducia verso gli altri (individualismo, isolamento sociale, contare
solo su se stessi)
17
. visione darwinistica del mondo: sopravvivono solo i più forti,
istinto di sopravvivenza
-
Gang (tipo ideale):
. sistema sociale quasi-privato (non aperta a tutti)
. quasi-segreto
. struttura di leadership con ruoli definiti dove l'autorità è passata
attraverso meccanismo di legittimazione
. persegue suoi obiettivi senza preoccuparsi che siano legali o meno
. priva di burocrazia
3. Interpretazione materiale empirico
Tre parti:
- l'individuo ed il suo rapporto con la gang
- la gang come organizzazione
- la gang e la comunità
Cap. 1: Gang involvement. Chi entra in una gang e perché
Risposte date dalla letteratura:
- famiglie disgregate dove padre assente e ricerca di identificazione con
figura d'autorità maschile
- gang come sostituto della famiglia
- espulsi dal sistema scolastico impreparati per poter aspirare a lavoro
- giovanissimi che seguono l'esempio dei più grandi
Secondo Jankonwski tutte risposte sbagliate: si entra nella gang per calcolo
di convenienza razionale. Sei motivazioni incontrate:
- Incentivi materiali
- Divertimento
- Rifugio e nascondiglio
- Protezione fisica
- Luogo di resistenza
- Impegno comunitario
Obiettivo conclusivo: non individuazione di nessi causali ma esperienza
vissuta (capire le manifestazioni nella loro individualità)
18
LEZIONE N 3
STRUTTURA DELLA RICERCA, TEORIA, IPOTESI
1.
LA STRUTTURA “TIPO” DELLA RICERCA QUANTITATIVA
La ricerca scientifica è:
a) un processo creativo di scoperta
b) che si sviluppa secondo un itinerario prefissato e secondo procedure
prestabilite
c) che si sono consolidate all’interno della comunità scientifica
a) Contesto della giustificazione e della scoperta (Let 1)
b) Scienza = accumulazione sistematica di conoscenza (Let 2)
c) La scienza è pubblica e non privata (pubblicità e ripetibilità = controllo)
(Let 3)
Lo scienziato non può fare “di testa sua”
19
La struttura “tipo” del processo di ricerca quantitativa
FASI
PROCESSI
Teoria
Deduzione
Ipotesi
Operativizzazione
(disegno della ricerca)
Rilevazione
Organizzazione dei dati
(matrice-dati)
Analisi dati
Interpretazione
Risultati
Induzione
20
2.
DALLA TEORIA ALLE IPOTESI
Operativizzazione = il processo di traduzione di un’affermazione teorica in
operazioni empiriche
Teoria = insieme di proposizioni organicamente connesse, che si pongono
ad un elevato livello di astrazione e generalizzazione rispetto alla realtà
empirica, le quali sono derivate da regolarità empiriche e dalle quali
possono essere derivate delle previsioni empiriche
Esempio da Durkheim: “più elevato è il tasso di individualismo in un
determinato gruppo sociale, maggiore sarà il tasso di suicidi in quel
gruppo”. Connessione causale con i caratteri di:
- astrazione
- generalizzazione
- derivata da regolarità empiriche
- dà luogo a previsioni
La proposizione teorica si articola in ipotesi specifiche
Ipotesi = interconnessioni fra concetti (in genere un nesso causale, ma non
necessariamente), che si colloca su un livello inferiore di astrazione e di
generalità rispetto alla teoria e che permette una traduzione della teoria in
termini empiricamente controllabili
Rispetto a teoria:
- minor astrazione
- provvisorietà (ipoteticità)
“Empiricamente controllabili”: NON “verificabili”. Verificare =
dimostrare vero; opposto di falsificare (dimostrare falso). Non possiamo
“verificare”, ma solo “non falsificare”. Es “tutti i cigni sono bianchi”
Sequenza teoria-ricerca
Teoria ---> ipotesi specifiche
Revisione della teoria a partire dai risultati (es. astensionismo e
pressioni incrociate, esperimenti Hawthorne)
Sequenza con rilevazione che viene prima della teoria (es. Gambetta;
Sampson e Laub)
21
LETTURE LEZIONE N 3
LET 1
«L'atto della scoperta sfugge all'analisi logica; non vi sono regole logiche
in termini delle quali si possa costruire una "macchina scopritrice" che
assolva la funzione creativa del genio» [Reichenbach 1951, trad. it. 1961,
227
LET 2
Cumulatività:
«Se ho visto più lontano è perché stavo sulle spalle di Giganti» [Isaac
Newton]
Scienza = «accumulazione sistematica di conoscenza»
LET 3
Controllo:
«La scienza è pubblica e non privata»
«I concetti e i procedimenti adoperati anche dal più intuitivo dei sociologi,
devono essere standardizzati, e i risultati delle loro intuizioni debbono
poter essere verificati anche da altri» [Merton 1968, trad. it. 1971, vol. 1,
119].
Pubblicità, Controllabilità, Ripetibilità = «l'unica possibile oggettività della
conoscenza sociologica» [Statera 1984, 250]
LET 4
Revisione della teoria a partire dai risultati.
Modifica della teoria
Astensionismo elettorale, due ipotesi:
a) apatia: strati marginali della società non raggiunti dai partiti:
genere, età, ruralità, nord-sud (massimo: donne anziane paesi meridionali)
b) protesta: categorie centrali della società più esposte a flussi di nuove
idee: giovani, maschi, aree urbane, nord
Risultati: max astensionismo nelle donne dei capoluoghi di provincia
Approfondimento sui dati: sono donne ex democristiane
Nuova teoria: pressioni incrociate (T 90):
"Quando un individuo è sottoposto contemporaneamente a stimoli e
sollecitazioni aventi la stessa intensità ma direzione opposta, è probabile
che si sottragga al conflitto connesso con la scelta, astenendosi dalla
scelta"
22
L'affievolirsi del richiamo religioso in una società secolarizzata e
l'incalzare di un nuovo sistema di valori che entrano in conflitto con la
scelta elettorale tradizionale delle donne per la Dc
Nuova teoria
Esperimenti negli stabilimenti Hawthorne su effetto dell'illuminazione
sulla produzione
23
LEZIONE N 4
OPERATIVIZZAZIONE DEI CONCETTI
1.
DAI CONCETTI ALLE VARIABILI
Ipotesi = interconnessione fra concetti (proposizione che implica una
relazione fra due o più concetti)
Definizione di concetto (Let 1)
Operativizzazione della teoria = operativizzazione dei concetti
Fasi:
1. Far diventare i concetti proprietà di oggetti (unità d’analisi) (es.
partecipazione elettorale e marginalità sociale)
2. Stabilire le regole per la traduzione delle proprietà (degli oggetti) in
operazioni empiriche (“definizione operativa”) (Let 2)
3. Applicare queste regole ai concreti casi studiati (“operativizzazione”
vera e propria)
concetto -----------> proprietà ---------------------> variabile
operativizzazione
(classificazione
ordinamento
misurazione
conteggio)
Definizioni:
proprietà (stati)
variabili (modalità)
24
2.
UNITA’ D’ANALISI
Unità d’analisi = l’oggetto sociale al quale afferiscono le proprietà studiate
(Let3)
Possibili unità d’analisi:
- individuo
(Runciman 1962, 1400 intervistati)
- aggregato di individui
(Tocqueville, regioni francesi)
- gruppo-organizzazione-istituzione (ist. scolast., famiglie, gang, governi)
- evento
(Gurr episodi ribellione, elezioni)
- prodotto culturale
(analisi del contenuto)
Unità d’analisi (singolare, astratta) e casi (plurali, concreti)
25
LETTURE LEZIONE N 4
LET 1
Definizione di concetto
Concetto (cum capio = prendere assieme): contenuto semantico (=
significato) dei segni linguistici e delle immagini mentali
«Il termine “concetto” ha un significato generalissimo, e può includere
ogni specie di segno o procedura semantica, quale che sia l’oggetto cui si
riferisce, astratto o concreto, vicino o lontano, universale o individuale,
ecc. Si può avere un concetto del tavolo come del numero 3, dell’uomo
come di Dio. del genere e della specie... di un periodo storico come di una
istituzione storica (il Rinascimento o il Feudalesimo)» [Abbagnano 1971,
146]. E ancora possiamo dire che i concetti possono far riferimento a
costruzioni mentali astratte che è impossibile osservare direttamente, come
il potere o la felicità o la classe sociale, oppure riferirsi ad entità concrete
ed immediatamente osservabili, come il fiore o l’operaio.
LET 2
La definizione operativa:
Criterio di scientificità: «la necessità di definire operativamente le
proprietà che si studiano è un aspetto caratteristico dell'attività scientifica,
al punto da costituire probabilmente la discriminante più sicura fra essa ed
altri generi di attività, ad esempio la speculazione filosofica» [Marradi
1980, 25].
Criterio di oggettività: «solamente dopo che si è stabilita una catena
di operazioni attraverso le quali lo stato di una serie di soggetti sulle
proprietà X, Y e Z viene rilevato, classificato e registrato, abbiamo
compiuto un passo per ridurre l'opinabilità delle nostre affermazioni»
[ibidem]. La definizione operativa dà infatti le direttive affinché la stessa
rilevazione possa essere replicata da altri ricercatori. In questo modo
riduce la soggettività delle affermazioni del ricercatore. Esse non sono più
opinioni, ma affermazioni dotate di un sostegno empirico.
LET 3
Runciman, W.G.
1966 Relative Deprivation and Social Justice, London, Routledge &
Kegan, trad. it. Ineguaglianza e coscienza sociale, Torino, Einaudi, 1972.
26
Raramente gli atteggiamenti delle persone nei confronti delle ineguaglianze sociali
sono rigorosamente correlati coi fatti che caratterizzano la loro posizione. Si potrebbe
pensare che i sentimenti di una persona verso la struttura della società in cui vive
varino con la sua collocazione; quale che sia il sistema di stratificazione, non è forse
ragionevole aspettarsi che chi sta in alto lo approvi e chi sta in basso ne sia
insoddisfatto? Ma le cose non stanno in questo modo. L’insoddisfazione per il
sistema di privilegi e di compensi di una data società non viene mai provata in
proporzione al grado di ineguaglianza cui sono soggetti i suoi diversi membri. Molti
che stanno in basso hanno meno risentimenti verso il sistema di quanto non sembri
giustificato dalla loro effettiva posizione, e molti più vicini al vertice ne hanno di più.
Il contadino reazionario, il radicale benestante, il povero rispettoso, si ritrovano nella
storia di molti luoghi e di molte epoche: in tutti questi casi c’è una discrepanza tra la
posizione di ineguaglianza e la sua accettazione o il suo rifiuto” [p. 9].
Le nozioni collegate di “privazione relativa” e di “gruppi di riferimento” derivano
entrambe da una banale verifica: gli atteggiamenti, le aspirazioni, le lamentele della
gente, dipendono largamente dallo schema di riferimento all’interno del quale sono
concepite. ... Le soddisfazioni di una persona... sono condizionate dalle sue
aspettative... e per renderci conto dei nostri vantaggi confrontiamo la nostra
situazione con chi sta peggio di noi... Da una parte, una persona che è stata indotta ad
aspettarsi, per esempio, una promozione sul lavoro, si sentirà più offesa dal mancato
ottenimento di quella le cui ambizioni non state ugualmente alimentate. Dall’altra,
una persona condotta all’ospedale dopo un piccolo infortunio si compiangerà molto
meno se posta nel letto accanto a quello di chi è uscito permanentemente invalido da
un grave incidente.
La stessa cosa accade al livello delle classi o anche delle nazioni. E’ diventato un
luogo comune, benché possa apparire a prima vista come un paradosso, che la
povertà costante rappresenta la miglior garanzia della conservazione: se la gente non
ha ragione di aspettarsi o di sperare più di quel che può ottenere, sarà meno scontenta
di quel che possiede, o addirittura sarà grata di riuscire a conservarlo. Se però, d’altro
canto, è stata indotta a scorgere come meta possibile la relativa prosperità di qualche
comunità più fortunata con cui può facilmente confrontarsi, rimarrà scontenta della
sua posizione finché non sarà riuscita a migliorarla. E’ questa naturale reazione che
sta alla base della cosiddetta “rivoluzione delle aspettative crescenti” (17-18)
Per cui «l'aperto malcontento è relativamente raro in periodi di costanti privazioni,
mentre tende a crescere... quando si intravede una possibilità di miglioramento... [ed]
è probabile che le rivoluzioni avvengano in periodi di benessere crescente» [ibidem,
31].
27
LEZIONE N 5
LE VARIABILI
1.
DEFINIZIONE DI VARIABILE
Variabile = concetto operativizzato (più esattamente: proprietà
operativizzata di un concetto)
Fig. 3.2 Dai concetti alle variabili
Peso
Kg 0,7
Operativizzazione
Concetto
Proprietà
Variabile
(peso di un libro)
Peso ---------> Peso di un oggetto------> Peso misurato con bilancia
(concetto)
(proprietà)
(variabile)
Un concetto può essere operativizzato in modi diversi
- può essere associato (come proprietà) a differenti unità d’analisi
es. potere:
. individuo
. ruolo (aziendale, politico)
. istituzione (banca, azienda)
- in quanto proprietà può dar luogo a diverse variabili
es. livello culturale:
. titolo di studio
. numero libri letti
. consumi culturali
. test di cultura generale
28
Variabile = che può variare
Costante
Variazione nel tempo (studio longitudinale, diacronico; es. reazione di un
paziente ad un farmaco)
Variazione fra i casi (studio trasversale, sincronico; es. relazione fra fumo
e cancro al polmone )
Tipi di variabili
- Manipolabilità: variabili manipolabili e non manipolabili
- Causa-effetto: variabili indipendenti e dipendenti
Causa
Effetto
Var indipendente
Var dipendente
Stimolo (trattamento)
Risposta (reazione)
- Osservabilità: variabili latenti ed osservate
- Unità d’analisi: variabili individuali e collettive
Collettive: aggregate e globali
Definizione operativa di una variabile (es. postmaterialismo di Inglehart)
2.
VARIABILI NOMINALI, ORDINALI, CARDINALI
Tipi di variabili
Stati della
Procedura di
Tipo di
proprietà
operativizzazione variabile
Discreti non classificazione
ordinabili
Discreti
ordinamento
ordinabili
nominale
Discreti
enumerabili
Continui
cardinale
conteggio
misurazione
ordinale
“
Caratteristiche Operazioni
dei valori
effettuabili
sui valori
mere etichette = ≠
numeri con
caratteristiche
solo ordinali
numeri con
caratteristiche
cardinali
= ≠ ><
= ≠ ><
+–
29
LEZIONE N 6
L’INCHIESTA CAMPIONARIA
1.
L’INCHIESTA CAMPIONARIA NELLA RICERCA SOCIALE
Conoscere la realtà = osservare, domandare, leggere
Inchiesta campionaria: rilevare informazioni
a) interrogando
b) gli stessi individui oggetto della ricerca
c) appartenenti ad un campione rappresentativo
d) mediante una procedura standardizzata di interrogazione
e) allo scopo di individuare e studiare le relazioni esistenti tra le variabili
Sondaggio (d'opinione): indagine puramente esplorativa volta ad accertare
l'esistenza e la consistenza di un fenomeno.
Inchiesta campionaria si differenzia da sondaggio per:
- problematica teorica (non solo esistenza e consistenza dei fenomeni)
- ampiezza temi toccati
- tipo di analisi sui dati (non solo descrittiva ma anche esplicativa)
Standardizzazione:
DOMANDE
- domanda
- risposta ---> matrice-dati
RISPOSTE
Standardizzate
Libere
Standardiz Questionario
Intervista strutturata
zate
(Inchiesta campionaria survey)
Libere
Intervista libera
ricerca quantitativa
ricerca qualitativa
30
Storia survey
Marx e Weber
L'introduzione del campione rappresentativo (anni 30, Neyman)
Sviluppi tecnologici: computer e telefono
2. LA STANDARDIZZAZIONE OVVERO L’INVARIANZA DELLO
STIMOLO
1.
Approccio oggettivista versus approccio costruttivista
Approccio “oggettivista”: la realtà sociale esiste all’esterno dello studioso
e è da questi oggettivamente conoscibile
Approccio “costruttivista”: l’atto stesso del conoscere produce
un’alterazione della realtà, per cui la realtà conoscibile è solo quella
generata dal processo interattivo fra studiante e studiato
Conseguenze: rapporto intervistato-intervistratore
Lettura: T 175-6
2.
Approccio uniformista versus approccio individualista
Approccio uniformista: esistono se non delle leggi, almeno delle
uniformità empiriche, delle regolarità nei fenomeni sociali e umani
Approccio individualista: irriducibilità dell’individuo umano a qualsiasi
forma di generalizzazione e standardizzazione; comprensione solo
attraverso rapporto empatico; ogni azione sociale è un evento unico
Conseguenze: standardizzazione dello strumento di rilevazione
Lettura: T 176-7
3.
L’obiettivo del minimo comun denominatore
L’obiettivo minimo: il ricercatore che ha scelto l’inchiesta campionaria fa
una scelta di campo: privilegia la ricerca di uniformità rispetto
all’inseguimento dell’individualità; ricerca ciò che accomuna gli individui
piuttosto di ciò che li distingue. Sceglie di lavorare in superficie sui grandi
numeri invece che in profondità sui piccoli
31
3.
L’AFFIDABILITA’ DEL COMPORTAMENTO VERBALE
Lettura: T 179-80 (Williams)
1.
Desiderabilità sociale (delle risposte)
La valutazione socialmente condivisa che in una certa cultura è data ad un
certo atteggiamento o comportamento
2.
Mancanza di opinioni
Gli effetti della “pressione a rispondere” (facilitata anche dalla
formulazione della “domanda chiusa”)
3.3. Intensità
La domanda standardizzata rileva l’opinione, ma non la sua intensità o
radicamento
32
4.
SOSTANZA E FORMA DELLE DOMANDE
Costruire questionario
- esperienza ricercatore (surrogabile con consultazione questionari
precedenti)
- conoscenza popolazione
- chiarezza delle ipotesi
1.
Dati sociografici, atteggiamenti e comportamenti
- Domande relative a proprietà sociografiche di base (descrizione delle
caratteristiche sociali)
- Domande relative a atteggiamenti
- Domande relative a comportamenti: inequivoci (esiste una risposta
esatta), osservabili (esternamente controllabili)
(domande fattuali o motivazionali)
2.
Domande aperte e domande chiuse
Domanda aperta:
- libertà di espressione, ma va comunque codificata per matrice dati; precodifica / post-codifica
Limiti:
- vaghezza delle espressioni
- mancanza di omogeneità negli interventi degli intervistatori
- difficoltà in fase di interpretazione e di codifica
Domanda chiusa:
Vantaggi:
- offre a tutti stesso quadro di riferimento
- facilita il ricordo
- stimola l'analisi e la riflessione
33
Limiti:
- lascia fuori tutte le alternative di risposta che il ricercatore non ha
previsto
- le alternative influenzano le persone (pseudo-opinioni)
- le risposte offerte non hanno lo stesso significato per tutti (e mascherano
l'incomprensione grossolana)
Non è praticabile se:
- le alternative di risposta non sono perfettamente conosciute
- argomenti troppo complessi
- intervistati livello culturale basso
- argomenti delicati
Sintesi:
- sui grandi numeri non c'è alternativa alla domanda chiusa e quindi al
questionario standardizzato
Condizioni per la domanda chiusa:
- tutte le possibili alternative devono essere previste (studio esplorativo)
- non è applicabile:
. quando tutte le possibili alternative di risposta non sono note
. quando sono troppo numerose o complesse
. livello culturale troppo basso degli intervistati
. argomenti delicati
34
5.
FORMULAZIONE DELLE DOMANDE
Esempi formulazione: frati, proibire/non permettere, invasione comunista
1. Semplicità di linguaggio
2. Lunghezza delle domande
3. Numero delle alternative di risposta
4. Espressioni in gergo
5. Definizioni ambigue
6. Parole dal forte connotato negativo
7. Domande sintatticamente contorte
8. Domande con risposta non univoca
9. Domande non discriminanti
10. Domande tendenziose
11. Comportamenti presunti
12. Focalizzazione nel tempo
13. Concretezza-astrazione
14. Comportamenti e atteggiamenti
15. Desiderabilità sociale delle risposte
. formulare le domande legandole a fatti concreti
. rendere accettabile anche la risposta meno desiderabile
. considerare normale e diffuso anche il comportamento negativo
. equilibrare la desiderabilità delle risposte
. attribuire all’intervistato il comportamento negativo
. formulare la domanda in terza persona
16. Domande imbarazzanti
17. Mancanza d’opinione e non so (il non so è legittimo e a volte va
incoraggiato)
18. Intensità degli atteggiamenti
19. Acquiescenza (tendenza a dare risposte affermative e response set)
20. Effetto memoria (stabilire limiti temporali; presentare liste, es. vie
seguite per cercare lavoro; se si può evitare di basarsi sul ricordo,
evitarlo, es. uso diari per i consumi; rischio di attribuire al passato
l’atteggiamento corrente, e band wagon effect)
21. Sequenza delle domande
. dinamica del rapporto intervistato-intervistatore (all’inizio domande
rassicuranti, alla fine imbarazzanti)
. interesse e stanchezza
. sequenzialità dell’intervista (domande a imbuto)
. effetto contaminazione
35
Concludendo:
- effetto della formulazione della domanda soprattutto nell'analisi ad una
variabile, minore sulle loro relazioni
- cautela nei confronti fra domande formulate diversamente (es. nel tempo
o fra nazioni)
- sempre riportare l'esatta formulazione della domanda
36
6.
BATTERIE DI DOMANDE
Domande formulate tutte nello stesso modo (stessa domanda, stesse
alternative di risposta, cambia solo l’oggetto). Finalità:
- risparmiare spazio (sul questionario)
- facilitare la comprensione del meccanismo di risposta
- migliorare la validità delle risposte
- facilitare costruzione di indici
Tecnica delle scale (scaling)
Buon esempio di operativizzazione: domanda su prossimità alla droga da
Quetionario Iard 2000
37
7.
MODALITA' DI RILEVAZIONE
1.
Interviste faccia-a-faccia
Centralità dell’intervistatore
L’intervistatore deve inibirsi qualsiasi comportamento che può influenzare
l'intervistato
Intervistatori:
- Caratteristiche
- Aspettative
- Preparazione
- Motivazione
2.
Interviste telefoniche
Vantaggi:
- rapidità
- costi (telefonata sopra i 60 km costo indifferenziato)
- raggiunge anche i lontani
- minori resistenze alla concessione dell’intervista
- facilita preparazione, coordinamento e supervisione intervistatori
- consente di utilizzare il computer in fase di rilevazione (CATI)
Svantaggi:
- intervistato meno coinvolto (manca contatto personale)
- il rapporto si logora prima (20’ invece che 40-60’)
- impossibile usare materiale visivo
- l'intervistatore non può raccogliere dati osservativi (abitazione, ecc.)
- impossibile per chi non ha telefono (ceti sociali inferiori); difficile per
uso segreterie telefoniche (ceti sociali superiori); molti hanno solo
telefonino (giovani)
- anziani e persone con basso titolo di studio sottorappresentati (malgrado
le istruzioni, es. chi compie per primo gli anni)
- la limitatezza del tempo costringe a semplificazione della domanda e
della risposta
Difetti più gravi: primo e ultimo
38
3.
Questionari autocompilati
Vantaggio:
Limiti:
costi
mancanza di controlli sulla compilazione
autoselezione
Per eliminare gli svantaggi:
- rilevazione di gruppo
- rilevazione individuale con restituzione vincolata (es. censimento)
4.
Questionario postale
Vantaggi:
- risparmi altissimi nei costi
- può essere compilato dall'intervistato quando vuole
- maggiore garanzia di anonimato
- assenza di effetto dell'intervistatore
- accessibilità anche a zone lontane
Svantaggi:
- bassa percentuale di risposte
- distorsione del campione dovuta all'autoselezione
- il livello di istruzione della popolazione: deve essere medio-alto
- mancanza di controllo sulla compilazione (può compilarlo un familiare o
la segretaria)
- impossibilità di questionari complessi (es. evitare le domande
condizionate)
- lunghezza del questionario: deve essere ridotta.
Escludere domande aperte
Problema principale: i "ritorni" (50% buono)
Solleciti: invio con lettera; sollecito (anche cartolina); seconda lettera di
sollecito con nuova copia; telefonata.
5.
Interviste computerizzate (elettroniche)
Cati, Capi, Teleinterviste
39
8.
ORGANIZZAZIONE DELLA RILEVAZIONE
- Studio esplorativo
- Pre-test
- Preparazione e la supervisione degli intervistatori
- Contatto iniziale
- Forma grafica del questionario
40
LEZIONE N 7
LE FONTI STATISTICHE UFFICIALI
ESEMPI: le tabelle sul suicidio di Durkheim (Durkheim_Sucidio.doc)
Statistica: da Stato
Scienza che descrive gli stati
All’inizio ricerca sociale solo con questo tipo di dati. Poi dominio survey
(inchiesta campionaria)
Due significati del termine “statistica” (Devoto-Oli):
- scienza che studia con metodi matematici fondati sul calcolo delle
probabilità fenomeni collettivi (statistica come “scienza”)
(scienza del collettivo: analisi quantitativa dei fenomeni collettivi)
- raccolta di dati che si proponga di dare una visione d’insieme a
determinati fatti (statistica come “dato”)
Utilizzeremo la seconda accezione
Classificazione Istat:
statistiche demografiche
sociali
economiche
ambientali
ESEMPI: Esempi Istat.doc
1.
LA PRODUZIONE
Rilevazione diretta
Censimenti: antichissimi. Sumeri (IV-II millennio a.C), Assiri, Babilonesi,
antico Egitto, impero cinese, Grecia e Roma antiche.
Rilevazione indiretta:
Atti amministrativi: statistiche demografiche, giudiziarie, del commercio
con l’estero, sanitarie, previdenziali ed assistenziali, sul risparmio
Oggi nuovi tipi di rilevazioni dirette: indagini campionarie ad hoc
41
Rilevazione esaustiva (o totale)
Rilevazione campionaria (o parziale)
riduzione dei tempi
riduzione dei costi
riduzione del carico organizzativo
possibilità di approfondimento
2.
LE UNITÀ D’ANALISI
Unità di analisi rappresentata dal territorio (aggregati versus individui)
anche se dati raccolti a livello individuale
. unità di rilevamento
. unità d’analisi
Comuni
Province
Regioni
Sezioni di censimento, sezioni elettorali
Aree metropolitane (attorno ai comuni >250.000 ab): Rm, Mi, Na, To, Pa,
Ge, Bo, Fi, Ba, Ct, Ve
5 ripartizioni geografiche: Italia nord-occidentale
nord-orientale
centrale
meridionale
insulare
Analisi:
variazioni territoriali (nello stesso tempo)
variazioni nel tempo (sullo stesso territorio)
3.
CONTENUTO INFORMATIVO
Solo “comportamenti”
Informazioni generali: Annuario statistico italiano
Aree:
- Popolazione
- Sanità, assistenza e previdenza
42
- Giustizia
- Istruzione e cultura
- lavoro
- Consumi, reddito e benessere
- Elezioni
- Indagini multiscopo sulle famiglie
ESEMPI:
Questionario:
Istat_Quest sicurezza.doc
Istat_Quest condiz salute.doc
Multiscopo: www.istat.it / cerca / multiscopo / la vita quotidiana nel 2006
Ricchissimo di informazioni, molto utile
4. CONCLUSIONI SU USO DELLE FONTI STATISTICHE
UFFICIALI
Indispensabilità
1. Per lo studio della struttura della società. Struttura demografica,
fenomeni migratori, voto politico, occupazione e mercato del lavoro,
struttura di classe, mobilità sociale, organizzazione aziendale e delle
imprese (in generale tutti i fenomeni economici), struttura della famiglia
(figli convivenze, anziani), devianza (reati e attività giudiziaria),
Marginalità sociale, assistenza e previdenza
2. Per lo studio delle ripartizioni territoriali del paese. Differenze fra nord
e sud, regioni, aree metropolitane e non: impossibile da farsi si campioni
della popolazione, a meno che siano di enorme dimensioni (e comunque
non si riesce ad andare al di sotto del dato per regione)
3. Per gli studi comparati fra nazioni. Sempre più importanti (vedi Unione
Europea)
4. Per gli studi nel tempo (longitudinali o diacronici). Analisi delle serie
temporali; studio delle società che hanno preceduto quelle attuali
Limiti
43
1. La natura dei dati può non corrispondere alle esigenze del ricercatore.
Dati già esistenti e raccolti con finalità diverse. Il problema degli
indicatori.
2. Limitati a variabili fattuali. Mancano le motivazioni
3. Non adatti per l'analisi dei comportamenti individuali. Il rischio della
"fallacia ecologica"
44
LEZIONE N 8
LA MATRICE DEI DATI
pagine corrispondenti
- sul testo La ricerca sociale: metodologia e tecniche, Bologna, Il Mulino Vol IV. L'analisi dei dati:
Cap. II: par. 1, 2
- oppure sul testo Metodologia e tecniche della ricerca sociale, Bologna, Il Mulino - Cap. XII: par. 1, 2
QUESTIONARIO (estratto)
Fondazione di ricerca Istituto
Carlo Cattaneo
Via Santo Stefano 11 — 40125 Bologna
RENDIMENTO SCOLASTICO, SENSO CIVICO, IDENTITÀ ITALIANA
E IDENTITÀ EUROPEA TRA I GIOVANI ITALIANI
QUESTIONARIO
Scrivi le risposte nell’apposito spazio oppure indica la tua risposta facendo un cerchietto intorno al
numero corrispondente.
Sigla della provincia in cui si svolge la prova
Tipo di scuola:
Istituto tecnico industriale
Istituto tecnico commerciale
Liceo scientifico
Liceo classico
[1]
[2]
[3]
[4]
Sezione
Cognome e nome (o codice sostitutivo)
Mese e anno di nascita
mese
anno
In quale comune risiedeva la tua famiglia quando sei nato?
Indica anche la sigla della provincia.
In quale comune risiedi? Indica anche la sigla della provincia.
45
Sesso
Maschio
Femmina
[1]
[2]
46
I tuoi genitori lavorano attualmente? Indica una risposta sia per tuo padre sia per tua madre.
Padre
Madre
[1]
[2]
[3]
[4]
[5]
[1]
[2]
[3]
[4]
[5]
Sì, lavora
No, è in pensione
No, è deceduto/a
No, è disoccupato/a
No, è casalingo/a
Che lavoro svolgono tuo padre e tua madre? Se sono in pensione o deceduti o disoccupati, indica l’ultimo
lavoro che hanno svolto.
Padre
[01]
[02]
[03]
[04]
Bracciante, salariato agricolo
Lavorante a domicilio
Affittuario coltivatore, mezzadro
Coltivatore diretto (proprietario)
Madre
[01]
[02]
[03]
[04]
-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Operaio
Artigiano senza dipendenti (o coadiuvante in az. familiare artigianale)
Artigiano con dipendenti
[05]
[06]
[07]
[05]
[06]
[07]
-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Commerciante senza dipendenti
(o coadiuvante in azienda familiare commerciale)
Commerciante con dipendenti
Impiegato
Insegnante, maestro, docente universitario
[08]
[09]
[10]
[11]
[08]
[09]
[10]
[11]
-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Dirigente
Libero professionista
Imprenditore (anche agricolo)
Quali sono i titoli di studio conseguiti dai tuoi genitori?
Indica il titolo sia di tuo padre che di tua madre.
[12]
[13]
[14]
[12]
[13]
[14]
Padre
Madre
[1]
[2]
[3]
[4]
[5]
[1]
[2]
[3]
[4]
[5]
Nessun titolo di studio
Licenza elementare
Licenza di scuola media o avviamento professionale
Diploma di scuola secondaria superiore o di scuola professionale
Laurea universitaria
Con quale giudizio hai conseguito
la licenza di scuola media inferiore?
Sufficiente
Buono
Distinto
Ottimo
[1]
[2]
[3]
[4]
Nel corso della tua frequenza della scuola media superiore, quante volte
sei stato bocciato e hai dovuto ripetere un anno di corso?
Se non sei stato mai bocciato, scrivere «0».
Nel corso della tua frequenza della scuola media superiore, quante volte (cioè in
quanti anni diversi) hai dovuto sostenere esami di riparazione a settembre, oppure
hai dovuto seguire corsi di sostegno e recupero, oppure sei stato promosso con
un «debito formativo»? Se nessuna di queste cose ti è mai successa, scrivere «0».
47
26.
Valuta la gravità di ciascuno dei seguenti comportamenti, indicando un punteggio, dove 5
corrisponde alla massima gravità e 1 corrisponde al minimo di gravità: cerchia il punteggio
corrispondente alla risposta scelta.
Nessuna
Massima
gravità
gravità
Cercare di ottenere dallo Stato benefici cui
non si ha diritto (pensioni di invalidità,
assegni familiari, ecc.)
[1]
[2]
[3]
[4]
[5]
Non pagare il biglietto sui mezzi di trasporto
[1]
[2]
[3]
[4]
[5]
Non pagare le tasse (o pagarle meno del dovuto) [1]
[2]
[3]
[4]
[5]
Comperare qualcosa sapendo che
proviene da un furto (fatto da altri)
[1]
[2]
[3]
[4]
[5]
Prendere e guidare un’auto di
sconosciuti per divertimento
[1]
[2]
[3]
[4]
[5]
Tenersi il denaro trovato
[1]
[2]
[3]
[4]
[5]
Dire il falso nel proprio interesse
[1]
[2]
[3]
[4]
[5]
Accettare denaro non dovuto (una bustarella)
nell’adempimento del proprio dovere
[1]
[2]
[3]
[4]
[5]
Non segnalare il danno fatto senza volerlo
a un veicolo in sosta
[1]
[2]
[3]
[4]
[5]
Gettare rifiuti in un luogo pubblico
[1]
[2]
[3]
[4]
[5]
Passare con il rosso a un semaforo
[1]
[2]
[3]
[4]
[5]
Procurarsi illegalmente il testo di un tema
di esame a un concorso pubblico
[1]
[2]
[3]
[4]
[5]
Dare una somma di denaro a un vigile
per non prendere una pesante multa
[1]
[2]
[3]
[4]
[5]
27.
Negli ultimi tre mesi, con quale frequenza hai partecipato attivamente all’attività dei seguenti
tipi di organizzazioni?
Solo
Almeno
Mai
una volta
2 volte
Organizzazione politica
[1]
[2]
[3]
Organizzazione religiosa o parrocchiale
[1]
[2]
[3]
Organizzazione sportiva (di praticanti)
[1]
[2]
[3]
Organizzazione sportiva (di tifosi)
[1]
[2]
[3]
Organizzazione culturale (teatrale, dibattiti, ecc.)
[1]
[2]
[3]
Organizzazione ricreativa, turistica
[1]
[2]
[3]
Organizzazione per la difesa della natura
[1]
[2]
[3]
Organizzazione di impegno sociale e assistenziale
[1]
[2]
[3]
Collettivi, gruppi di base, centri sociali
[1]
[2]
[3]
Organizzazione studentesca
[1]
[2]
[3]
Organizzazione della gioventù (scout, ecc.)
[1]
[2]
[3]
Organizzazione di tutela dei diritti dell’uomo
[1]
[2]
[3]
48
LIBRO-CODICE (estratto)
Etichetta
colonna
IDENT
PROV
TIPOSKL
ANNONASC
SESSO
CONLAVPA
Codici
Sigla provincia
1 Iti
2 Itc
3 Ls
4 Lc
anno e decennio (99= manca o n.r.)
1 maschi
2 femmine
1
2
3
4
5
9
CONLAVMA
OCC_PAD
1
2
3
4
5
6
7
8
9
10
11
12
13
14
99
OCC_MAD
TITPAD
TITMAD
GIUDMED
BOCC
RIPA
TRASF
TIPOTRAS
occupato
pensionato
deceduto
disoccupato
casalingo
Non risponde/mancante/non deve
Come CONLAVPA
Bracciante
Lav. a domicilio
Affittuario
Coltivatore diretto
Operaio
Artigiano senza dipendenti
Artigiano con dipendenti
Commerciante senza dipendenti
Commerciante con dipendenti
Impiegato
Insegnante
Dirigente
Libero professionista
Imprenditore
Non risponde/mancante/non deve
Come OCC_PAD
1
2
3
4
5
9
Nessuno
Elementare
Scuola media o avv. prof.
Scuola media superiore o prof.
Laurea
Non risponde/mancante/non deve
Come TITPAD
1 sufficiente
2 buono
3 distinto
4 ottimo
9 Non risponde/mancante/non deve
Numero bocciature
(9= Non risponde/mancante/non deve)
Numero riparazioni
(9= Non risponde/mancante/non deve)
1
2
9
1
2
3
9
Unica scuola
Trasferito
Non risponde/mancante/non deve
Ha cambiato tipo di scuola
Non ha cambiato tipo
Non trasferito
Non risponde/mancante/non deve
Corrispondenza con le domande del questionario
(Numero identificazione questionario)
Sigla della provincia in cui ha sede la scuola
Tipo di scuola
Anno di nascita
Sesso
I tuoi genitori lavorano attualmente? Indica una risposta sia per tuo padre
sia per tua madre.
Padre
Madre
Che lavoro svolgono tuo padre e tua madre? Se sono in pensione o deceduti
o disoccupati, indica l’ultimo lavoro che hanno svolto.
Padre
Madre
Quali sono i titoli di studio conseguiti dai tuoi genitori?
Padre
Madre
Con quale giudizio hai conseguito la licenza di scuola media inferiore?
Nel corso della tua frequenza della scuola media superiore, quante volte sei
stato bocciato e hai dovuto ripetere un anno di corso?
Nel corso della tua frequenza della scuola media superiore, quante volte
(cioè in quanti anni diversi) hai dovuto sostenere esami di riparazione a
settembre, oppure hai dovuto seguire corsi di sostegno e recupero, oppure
sei stato promosso con un «debito formativo»?
Questa scuola è l’unica scuola media superiore che hai frequentato oppure ti
sei trasferito da un’altra scuola media superiore?
Hai cambiato tipo di scuola (ad esempio, da liceo classico a liceo scientifico,
da istituto tecnico industriale e istituto tecnico commerciale, e così via)
oppure sei rimasto nello stesso tipo di scuola?
49
NOTA: distribuire un estratto da un questionario (IARD 2000), farlo compilare e codificare
50
Forma della matrice dei dati (casi x variabili: CxV)
codifica
(tracciato record e codice)
Informazioni
-----------------------------------> Matrice dei dati
Casi
1
2
3
n
Matrice dei dati
Variabili
X1
X2
X3
X11
X12
X13
X21
X22
X23
X31
X32
X33
...
...
...
...
...
...
Xn1
Xn2
Xn3
...
...
...
...
...
...
Xp
X1p
X2p
X3p
...
...
...
Xnp
51
Glossario
● l’unità d’analisi (o anche semplicemente unità) è l’oggetto sociale studiato; nella
situazione più frequente l’unità d’analisi è costituita dall’individuo (ma può anche essere la
classe scolastica, la famiglia, il comune, la nazione, l’evento, l’articolo di giornale, ecc.);
● localizzando nel tempo e nello spazio l’unità d’analisi si viene a definire la popolazione
di riferimento (o semplicemente popolazione) della ricerca (per esempio, gli elettori italiani
alle elezioni del 1976; gli episodi di protesta politica avvenuti in Italia fra il 1966 ed il
1973);
● i casi sono gli esemplari dell’unità d’analisi inclusi nella ricerca (per esempio i soggetti
intervistati);
● l’insieme dei casi costituisce il campione studiato;
● le caratteristiche delle unità studiate sono dette proprietà; ogni proprietà può assumere
degli stati diversi (per esempio, la proprietà “pratica religiosa” assume gli stati di
praticante, saltuario, non praticante);
● la variabile è la proprietà operativizzata, cioè rilevata sui casi attraverso una certa
procedura detta “definizione operativa”; per esempio possiamo operativizzare la proprietà
“pratica religiosa” attraverso la domanda “Nell’ultimo anno lei è andato in chiesa?”;
● le modalità sono gli stati della variabile e valori i simboli assegnati alle modalità; i valori
in genere, anche se non necessariamente, sono numeri. Per esempio, la variabile “pratica
religiosa” operativizzata nel modo sopra riportato, ha le seguenti modalità: “mai”, “due-tre
volte l’anno”, “una volta al mese”, “due-tre volte al mese”, “una o più volte la settimana”; i
cui rispettivi valori sono: 1, 2, 3, 4, 5. Se la variabile è nominale gli stati della proprietà
vengono anche chiamati “categorie”;
● variabili dicotomiche (dicotomìe) sono le variabili con due modalità; variabili
politomiche quelle a più di due modalità;
● la matrice dei dati contiene le informazioni raccolte durante un'indagine in forma
numerica e organizzate in forma di rettangolo diviso in righe e colonne, dove ciascuna riga
rappresenta un caso (contiene tutti i dati relativi alle proprietà/variabili di quel caso) e
ciascuna colonna rappresenta una delle proprietà/variabili misurate (contiene i dati di tutti
i casi per quella variabile). Solitamente la matrice dati è contenuta in un file.
● l’analisi monovariata consiste nell’analizzare le variabili singolarmente prese, cioè ad
una ad una senza metterle in relazione fra di loro. In altri termini, si individua la colonna
della matrice-dati corrispondente alla variabile e si conta con che frequenza appaiono i
diversi valori contenuti nella colonna.
● l’analisi bivariata è lo studio delle relazioni fra due variabili. In pratica, si individuano
le due colonne corrispondenti alle due variabili da mettere in relazione e si contano tutte le
diverse coppie di valori presenti nella coppia di colonne. I risultati vengono riportati in
tabelle a doppia entrata.
● l’analisi multivariata è lo studio delle relazioni intercorrenti fra più di due variabili.
52
LEZIONE N 9
L’ANALISI MONOVARIATA
pagine corrispondenti
- sul testo La ricerca sociale: metodologia e tecniche, Bologna, Il Mulino Vol IV. L'analisi dei dati:
Cap. II: par. 3, 8
- oppure sul testo Metodologia e tecniche della ricerca sociale, Bologna, Il Mulino - Cap. XII: par. 3, 8
1.
LE DISTRIBUZIONI DI FREQUENZA: RAPPRESENTAZIONI
TABELLARI
Con il termine "Distribuzione di frequenza di una variabile" si intende la
rappresentazione sintetica (in forma tabellare o grafica), consistente nell’associare ad
ogni modalità (o categoria) della variabile il numero di casi che appartengono a
quella modalità.
Una distribuzione di frequenza può contenere uno o più dei seguenti tipi di
frequenze (vedi tab. 1) :
- Frequenze assolute: cioè il numero di casi per ciascuna categoria della variabile.
- Frequenze relative - proporzioni: posto uguale a 1 il totale dei casi del campione,
per ogni categoria viene riportata la proporzione dei casi che appartengono a quella
categoria (rispetto al totale pari a 1)
- Frequenze relative - percentuali: posto uguale a 100 il totale dei casi del
campione, per ogni categoria viene riportata la percentuale dei casi che
appartengono a quella categoria (rispetto al totale pari a 100)
- Frequenze cumulate percentuali: per ogni categoria viene riportata la percentuale
di casi che appartiene a quella categoria e a quelle di grado inferiore. La frequenza
dell'ultima categoria e sempre 100% (questo tipo di frequenze può essere usato
soltanto con variabili ordinali e cardinali, in quanto richiede che le modalità siano
ordinabili).
Tab. 1 Distribuzione di frequenza della variabile «titolo di studio».
Frequenze
Frequenze
relative
assolutea
Proporzioni
Percentuali
Senza titolo
30
0,025
2,5
Licenza elementare
509
0,424
42,4
Licenza media
342
0,285
28,5
Diploma
264
0,220
22,0
Laurea
55
0,046
4,6
Totale
1200
a dette anche valori assoluti (v.a.)
1,000
Frequenze
cumulate
2,5
44,7
73,4
95,4
100,0
100,0
Come si calcolano le percentuali
30 : 1200 = X : 100
X 
30  100
 2,5
1200
53
Come si presenta una tabella di distribuzione di frequenza?
- Di solito si usano soltanto le frequenze percentuali; non occorrono segni di
percentuali, perché il tipo di numero è chiaramente indicato nel titolo.
- Inserire nella tavola una riga che riporta il totale 100 (indirizza la lettura)
- Inserire il totale dei casi sui quali le percentuali sono state calcolate (“base” delle
percentuali, vedi la riga intestata con (N)); in questo modo ci si può rendere conto
della significatività della percentuale e inoltre è possibile ricalcolare le frequenze
assolute della distribuzione
- Utilizzare un solo decimale (anche usare numeri interi, senza decimali, va bene); se
il decimale è zero, va riportato (si veda sotto 22,0)
- A volte, si possono ritenere interessanti anche le frequenze assolute, in tal caso si
presentano i dati come in tab. 3.
Quadratura: a causa degli arrotondamenti può succedere che la somma delle
percentuali faccia 99,9 oppure 100,1. In questi casi alterare una cifra per far tornare il
100,0: agendo o sul secondo decimale alterando quello più prossimo a 5 (es. 42,34
diventa 42,4), oppure agendo sulla percentuale più elevata (sulla quale questa
forzatura ha un impatto relativo minore)
Tab. 2 Istruzione degli intervistati. Valori percentuali
Titolo di studio
Senza titolo
2,5
Licenza elementare
42,4
Licenza media
28,5
Diploma
22,0
Laurea
4,6
Totale
100,0
(N)
(1200)
Tab. 3 Distribuzioni di frequenza assolute e relative della variabile
«Partito votato alle elezioni per la Camera del 1996, parte proporzionale»
in Lombardia e in Emilia Romagna (variabile nominale)
Valori assoluti
Valori percentuali
(in migliaia)
Lombardia
Emilia R.
Lombardia Emilia R.
Forza Italia
1510
451
23,6
15,1
Alleanza nazionale
575
344
9,0
11,5
Ccd-Cdu
298
144
4,6
4,8
Lega Nord
1636
216
25,5
7,2
Pds
965
1065
15,1
35,7
Lista Dini
267
116
4,2
3,9
Ppi
398
238
6,2
8,0
Verdi
152
75
2,4
2,5
Rifond. com.
437
249
6,8
8,3
Altri
168
90
2,6
3,0
Totale
6406
2988
100,0
100,0
54
Arrotondamenti
16,751
7
16,7
16,75
16,76
16,8
7
7
7
7
55
Variabili cardinali
Le variabili cardinali come l'età mal si prestano ad essere rappresentate in tabella a
causa dell'elevato numero di categorie. Per cui nella distribuzione di frequenza si
raggruppano i dati in categorie
Tab. 2.4 Distribuzione di frequenza di una
variabile cardinale (distribuzione per età
degli operai di uno stabilimento): valori
singoli e raggruppati in classi.
età
v.a.
classi d'età v.a
15
1
16
2
17
3
15-20
32
18
7
19
7
20
12
21
10
22
12
23
12
21-25
72
24
17
25
21
26
...
26-30
96
...
31-35
112
...
36-40
130
41-45
138
46-50
159
51-55
142
56-60
107
61-65
83
Dati mancanti
Tab. 12.6 Distribuzione di frequenza della variabile nominale «Nell'ultimo anno lei è andato in
chiesa? (se sì) Ogni quanto?».
a) tabella di lavoro
No, mai
2-3 volte l'anno
1 volta al mese
2-3 volte al mese
1 v. la settimana
Più v. la settimana
Altra religione
NR
Totale
1
2
3
4
5
6
7
8
9
b) tabella di presentazione dati
v.a.
132
416
167
233
415
35
11
5
86
1500
No, mai
2-3 volte l'anno
1 volta al mese
2-3 volte al mese
1v. la settimana
Più v. la settimana
Altra religione
Non risponde
Totale
(N)
valori mancanti: 5
%
8,8
27,9
11,2
15,6
27,8
2,3
0,7
5,7
100
(1495)
c) tabella di presentazione
dati
%
No, mai
9,4
2-3 volte l'anno
29,5
1 volta al mese
11,8
2-3 volte al mese
16,5
1v. la settimana
29,5
Più v. la settimana
2,5
Altra religione
0,8
Totale
100
(N)
(1409)
valori mancanti: 91
56
2. LE DISTRIBUZIONI DI FREQUENZA:
RAPPRESENTAZIONI GRAFICHE
Diagrammi a barre (voto per la Camera nel 1996; sui dati di tab. 12.5) Lunghezze della barre proporzionali alle frequenze (ortogrammi)
a) diagramma a barre (a colonne)
Lombardia
30
25
20
15
10
5
0
Forza
Italia
All.
naz.
CcdCdu
Lega
Nord
Pds
Lista
Dini
Ppi
Verdi Rifond.
com.
Altri
b) diagramma a barre (a nastri)
Lombardia
Forza Italia
All. naz.
Ccd-Cdu
Lega Nord
Pds
Lista Dini
Ppi
Verdi
Rif ond. com.
Altri
0
5
10
15
20
25
30
57
c) diagramma a barre appaiate
40
35
30
25
Lombardia
Emilia R.
20
15
10
5
0
Forza
Italia
All.
naz.
CcdCdu
Lega
Nord
Pds
Lista
Dini
Ppi
Verdi Rifond.
com.
Altri
d) diagramma a barre contrapposte
Altri
Rifond. com.
Verdi
Ppi
Lista Dini
Lombardia
Emilia R.
Pds
Lega Nord
Ccd-Cdu
All. naz.
Forza Italia
-40
-20
0
20
40
58
Fig. 12.11 Diagrammi di composizione - Aree proporzionali alle frequenze
(areogrammi)
a) diagramma a barra suddivisa
100%
90%
80%
70%
Boghesia
60%
Classi medie urbane
Coltivatori diretti
50%
Salariati agricoli
40%
Operai ind. e terz.
30%
20%
10%
0%
1881
1983
Classi sociali in Italia nel 1891 e 1993 [Sylos Labini 1986,20]
b) diagramma a settori circolari
Lombardia
7%
3%
2%
24%
Forza Italia
6%
All. naz.
Ccd-Cdu
Lega Nord
4%
Pds
Lista Dini
Ppi
9%
15%
Verdi
Rifond. com.
Altri
5%
25%
Voto nel 1996 in Lombardia (sui dati di tab. prec)
59
LEZIONE N 10
DATI AGGREGATI
pagine corrispondenti
- sul testo La ricerca sociale: metodologia e tecniche, Bologna, Il Mulino Vol IV. L'analisi dei dati:
Cap. II: par. 12, 13
- oppure sul testo Metodologia e tecniche della ricerca sociale, Bologna, Il Mulino - Cap. XII: par.
12, 13
1.
Dati individuali e dati aggregati
Dati individuali: unità d’analisi è l’individuo
Dati aggregati: l’unità d’analisi è un aggregato di individui (es. comune,
regione, nazione...)
Problema dei dati aggregati: diversa dimensione dell’aggregato, per cui i
dati vanno relativizzati alla dimensione dell’aggregato
Fra le seguenti regioni, qual è quella che presenta un maggior tasso di
divorziati ? (Istat, censimento 1991; dati in migliaia)
Piemonte
Lombardia
Emilia R.
Campania
Sicilia
Piemonte
Lombardia
Emilia R.
Campania
Sicilia
Celibi e Coniugati
nubili
1604
2215
3559
4424
1424
2049
2679
2597
2214
2404
Separati
legalmente
57
91
42
24
23
% Divorziati
Totale
(N)
1,02
0,82
0,97
0,36
0,38
4303
8857
3908
5630
4966
Divorziati Vedovi
44
73
38
20
19
383
710
355
310
306
60
Quale di queste città ha il maggior indice di vecchiaia?
Bologna
Napoli
Palermo
Roma
Torino
Venezia
0-14
32.764
196.165
139.435
345.119
99.291
28.954
15-29
62.542
247.757
157.531
521.082
177.544
55.456
30-44
82.548
215.473
146.364
608.546
200.495
63.610
45-64
65 e oltre
Totale
108.094
99.188 385.136
236.136 150.343 1.045.874
154.905
89.620 687.855
723.006 447.569 2.645.322
261.489 180.793 919.612
84.658
63.744 296.422
Due possibilità:
- % di anziani su tutti
- rapporto: popolazione sopra i 65 anni / popolazione sotto i 15
% 65 anni e oltre 65 anni e oltre /
sulla
sotto i 15 anni
popolazione
Bologna
Napoli
Palermo
Roma
Torino
Venezia
25,8
14,4
13,0
16,9
19,7
21,5
3,03
0,77
0,64
1,30
1,82
2,20
61
2.
Rapporti statistici
Rapporti di composizione: parte al tutto (* 100 = percentuali). Esempi:
- Proporzione di spesa per affitto = spesa della famiglia per affitto /
spesa totale della famiglia
- Proporzione di maschi = maschi / (maschi + femmine).
Esempio
Distribuzione dei consumi delle famiglie
2007
Generi
Alimentari
Tabacchi
Abbigliamento
Abitazione
Combustibili
Mobili
Igiene
Trasporti
Istruzione
Altre spese
Totale
Valori
assoluti (in
euro/anno)
3922
212
1447
1818
942
1270
245
2298
912
1800
14866
Valori
percentuali
26,4
1,4
9,7
12,2
6,3
8,5
1,6
15,5
6,1
12,1
100,0
Altro esempio: distribuzione degli studenti dell'università di Bologna per
facoltà
Rapporti di coesistenza: rapporto fra due parti, cioè il rapporto fra la
frequenza di una modalità e la frequenza di un’altra. Esempi:
- Rapporto (o quoziente) di mascolinità = maschi / femmine
- Rapporto di matrimoniabilità per sesso = coniugati / non coniugati
- Occupati nell’industria manifatturiera / occupati in agricoltura.
- Indice di vecchiaia = popolazione sopra i 65 anni / popolazione sotto i
15 anni.
Rapporti di derivazione: rapporto fra la misura di un fenomeno e quella di
un altro che può essere considerato un suo presupposto necessario
- Quoziente di natalità = nati / popolazione x 1.000.
Rientrano in questa categoria molti “quozienti demografici” che hanno
62
alla loro base l’ammontare della popolazione (quoziente di nuzialità, di
mortalità, di immigrazione, di abortività, ecc.). Altri esempi di rapporti di
derivazione sono:
- Laureati / iscritti all’università;
- Pensioni / popolazione;
- Operai cassaintegrati / totale operai;
- Suicidi / popolazione;
- Reati / popolazione.
Rapporti medi: sono diffusissimi e si hanno tutte le volte che il fenomeno
posto al numeratore si può associare mediamente ad ogni unità posta al
denominatore. Per esempio:
- rendimento medio per ettaro = tonnellate di grano prodotto / ettari
coltivati;
- densità della popolazione = n. abitanti / superficie del territorio
(interpretabile come numero medio di abitanti per kmq);
- indice di affollamento = n. componenti la famiglia / n. stanze
dell’abitazione (interpretabile come n. medio di persone per stanza);
- n. posti letto in ospedali / popolazione;
- n. ore di sciopero / n. occupati.
Regione
N posti letto
Valle d'Aosta
Piemonte
Lombardia
Veneto
Liguria
621
35339
63975
47889
17789
N abitanti in
migliaia
112
4479
8892
4345
1808
N posti letto x
1000 abitanti
5,6
7,9
7,2
11,0
9,8
Fare attenzione: rapporto = numeratore / denominatore; massima
attenzione quando gli è concessa libertà di scelta per il denominatore (il
problema non si pone per altri tipi di rapporti, come il rapporto di
composizione).
Tab. 12.20 Rapporti medi. Tassi di fatalità per mezzo di trasporto (Gran Bretagna,
1992).
Incidenti mortali per 100.000 passeggeri
Tipo di trasporto
per viaggio
per ora di viaggio per km percorso
Motocicletta
100
300
9,7
63
Aereo
55
Navigazione
25
Bicicletta
12
A piedi
5,1
Auto
4,5
Furgone
2,7
Treno
2,7
Autobus
0,3
Fonte: «The Economist», 11.1.1997
3.
15
12
60
20
15
6,6
4,8
0,1
0,03
0,6
4,3
5,3
0,4
0,2
0,1
0,04
Serie temporali e serie territoriali
Serie temporale (o serie storica) la sequenza dei valori assunti da una
variabile nello stesso aggregato territoriale in tempi diversi
Serie territoriale la sequenza dei valori assunti da una variabile nello
stesso momento in diversi aggregati territoriali
64
Serie temporale
Tab. 12.21 Andamento dei morti per droga (in valore assoluto) in Italia dal 1985 al
1996
Anno
Morti per Incremento N. indice N. indice
droga (v.a.) percentuale
a base
(1985=100) mobile
1985
242
100
1986
292
20,7
121
121
1987
543
86,0
224
186
1988
809
49,0
334
149
1989
974
20,4
402
120
1990
1161
19,2
480
119
1991
1383
19,1
571
119
1992
1217
-12,0
503
88
1993
888
-27,0
367
73
1994
867
-2,4
358
98
1995
1195
37,8
494
138
1996
1551
29,8
641
130
media
927
dev.stand.
393
Fonte: Ministero dell'Interno
Fig. 12.23 Serie temporale: morti per droga in Italia dal 1985 al 1996
1800
1600
1400
1200
1000
800
600
400
200
0
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
65
Serie territoriale
Tab. 12.22 Suicidi (per 1 milione di abitanti) in Italia nel 1974-83 per regione
Regione
Suicidi
135,41
N. indice
(Italia=100)
288
Valle
d'Aosta
Friuli V.G.
Emilia R.
Umbria
Trentino
A.A.
Piemonte
Liguria
Molise
Toscana
Marche
Abruzzo
Fonte: Istat
Suicidi
Basilicata
49,46
N. indice
(Italia=100)
105
97,27
88,95
82,11
80,43
207
189
175
171
Veneto
Sicilia
Sardegna
Lombardia
43,67
38,15
37,77
37,27
93
81
80
79
70,43
69,95
61,70
60,97
57,70
50,31
150
149
131
130
123
107
Puglia
Lazio
Calabria
Campania
28,14
24,75
24,68
21,08
60
53
53
45
Italia
46,94
100
Italia
Campania
Calabria
Lazio
Puglia
Lombardia
Sardegna
Sicilia
Veneto
Basilicata
Abruzzi
Marche
Toscana
Molise
Liguria
Piemonte
Trentino A.A.
Umbria
Emilia R.
Friuli V.G.
Valle d'Aosta
0
20
40
60
80
100
120
140
160
66
Differenza assoluta e differenza relativa
a = numero morti per droga nel 1985 = 242
b = numero morti per droga nel 1986 = 292
Variazione del numero di morti per droga fra 1985 e 1986
Variazione assoluta: b – a = 292 – 242 = +50
Variazione relativa:
(b - a) : a = X : 100
b–a
a
 100=
50
242
 100= 20, 7
Nel periodo considerato i casi di morte per droga sono cresciuti del
20,7%.
Numeri indice
“Se ponessimo eguale a 100 i morti per droga nel 1985, a quanto essi
ammonterebbero nel 1986?”
242 : 100 = 292 : X
X=
292
 100= 120, 7
242
Quindi il numero di morti per droga fra il 1985 ed il 1986 è passato
da 100 a 120,7
67
Secondo esempio
Generi
Alimentari
Tabacchi
Abbigliamento
Abitazione
Combustibili
Mobili
Igiene
Trasporti
Istruzione
Altre spese
Totale
2007
Valori
assoluti (in
euro/anno)
3922
212
1447
1818
942
1270
245
2298
912
1800
14866
2000
Valori
assoluti (in
euro/anno)
3876
241
1334
1491
923
1278
241
2172
894
1746
14196
N indice
2007
(2000=100)
101
88
108
122
102
99
102
106
102
103
105
68
Numeri indici territoriali
Si pone a 100 il tasso nazionale. Se il tasso di suicidi della Valle d’Aosta è
135,41 e quello nazionale di 46,94, se poniamo il secondo = 100 il primo
diventerà:
46,9 : 100 = 135,41 : X
X=
135, 41
 100= 288
46,94
69
I numeri indice:
- non sono mai negativi (quando il valore è inferiore a quello di
riferimento assumono valori inferiori a 100)
- non dipendono dall’unità di misura in cui sono espressi (permettono
confronti fra unità di misura diverse)
Esempio andamento nel tempo di medici ed abitanti in Italia (dati fittizi)
a) valori assoluti
anno medici
abitanti
1881
20.000 30.000.000
1911
30.000 35.000.000
1941
50.000 50.000.000
2001
100.000 60.000.000
70.000.000
60.000.000
50.000.000
40.000.000
medici
abitanti
30.000.000
20.000.000
10.000.000
0
1881
1911
1941
2001
70
b) Numeri indice
medici
1881
1911
1941
2001
abitanti
100
150
250
500
100
117
167
200
600
500
400
medici
300
abitanti
200
100
0
1881
1911
1941
2001
Ancora sul fatto che i numeri indice sono dei “numeri puri”, cioè sono
indipendenti dall’unità di misura dei dati
Variazione dei costi nell’edilizia (dati fittizi)
2000 2007 2000
Materiali
Cemento (alla tonnellata)
Calce (alla tonnellata)
Ferro tondini (al metro)
Legname (per metro cubo)
Mattoni (per confezione di 1000)
Manodopera (paga oraria)
Aree al mq)
215
123
54
18
75
15
215
217
118
75
22
80
25
418
100
100
100
100
100
100
100
2007
101
96
139
122
107
167
194
71
Variazioni nella produzione (valori fittizi)
1970
1980
1990
N automob.
235.000
T. di patate
1.556.000
N televisori
425.200
N laureati
55.213
Posti letto osp
7.245
278.000
1.580.214
1.560.000
84.218
8.213
312.000
1.178.214
2.121.415
115.219
8.432
2000 N. indice
2000
(1970=100)
375.000
1.432.212
1.512.271
218.425
8.546
160
92
356
396
118
Esemplificazione: relazione della Commissione didattica della facoltà
72
LEZIONE 11
ANALISI BIVARIATA: TABELLE A DOPPIA ENTRATA
pagine corrispondenti
- sul testo La ricerca sociale: metodologia e tecniche, Bologna, Il Mulino Vol IV. L'analisi dei dati Cap. III: par. 1, 2 (con esclusione di 2.5, 2.6, 2.7)
- oppure sul testo Metodologia e tecniche della ricerca sociale, Bologna, Il Mulino - Cap. XIII: par.
1, 2 (con esclusione di 2.5, 2.6).
Le tecniche di analisi bivariata
Variabile dipendente
nominale
cardinale
Variabile indipendente
nominale
cardinale
Tavole di
contingenza
Analisi della Regressione
varianza
e correlazione
Le variabili ordinali, a seconda dei casi, possono essere trattate come se fossero
nominali oppure cardinali
1. Che cos'è una tabella a doppia entrata (o tavola di contingenza)
Tab. 2.7 Pratica religiosa per età. (Valori assoluti)
18-34
35-54
Oltre 54
Praticanti
223
313
182
Saltuari
266
317
88
Non praticanti
425
504
168
Totale
718
671
1097
Totale
914
1134
438
2486
Domanda: «Mi può dire con quale frequenza si è recato in chiesa nel corso
dell'ultimo anno?».
Risposte: «Una o più volte la settimana» = Praticanti; «2-3 volte al mese» + «1 volta
al mese» = Saltuari; «2-3 volte all'anno» + «Mai» = Non praticanti. (Fonte: Itanes
[1996]).
- Una tabella a doppia entrata (detta anche "tavola di contingenza" o
"incrocio") è una distribuzione di frequenza a due variabili (di ogni
intervistato considera contemporaneamente la posizione su due variabili,
nell'esempio, pratica religiosa ed età).
73
- Le due variabili sono collocate sulle righe e sulle colonne della tabella;
all'incrocio tra una riga e una colonna troviamo una casella o cella della
tabella. Il numero all’interno è la frequenza con la quale si presentano
congiuntamente le corrispondenti modalità di riga e di colonna (es: 223 =
numero di praticanti fra i 18 e i 34 anni)
- La colonna e la riga 'Totale' si chiamano (frequenze) marginali della
tabella. Sono le distribuzioni semplici di frequenze rispettivamente dell'età
e della pratica. Sono distribuzioni semplici perché si riferiscono a tutto il
campione.
2. A cosa serve una tabella a doppia entrata
- Serve a studiare la relazione tra due variabili.
- Si dice che c'è relazione tra due variabili (età e pratica nell'esempio) se
dividendo il campione in sottocampioni secondo una variabile (l'età:
giovani, adulti, anziani) la distribuzione semplice della seconda variabile
(la pratica religiosa) è diversa nei differenti sottocampioni di età.
Viceversa, se le distribuzioni sono identiche si dice che non c'è relazione.
- La variabile usata per dividere il campione in sottocampioni è detta
variabile indipendente, la variabile di cui si studia la distribuzione nei
sottocampioni è detta variabile dipendente.
- Da un punto di vista statistico sia l'età che la pratica religiosa possono
assumere il ruolo di variabile indipendente. Dal punto di vista sociologico,
tuttavia, non ha molto significato chiedersi se la distribuzione delle età
varia al variare della pratica religiosa, come se la pratica di un soggetto
potesse influire sulla sua età.
- Nella tabella 2.7 compaiono frequenze assolute: è difficile dire a colpo
d'occhio se la proporzione di praticanti tra i giovani è maggiore, minore,
uguale a quella dei praticanti tra gli anziani. Per questo è necessario
passare al calcolo percentuale (percentualizzare significa porre uguale a
100 il totale; in tal modo si rendono uguali i totali dei gruppi da
confrontare che così diventano confrontabili)
74
3. Direzione delle percentuali nelle tabelle a doppia entrata
Tab. 2.7 Pratica religiosa per età. (Valori assoluti)
18-34
35-54
Oltre 54
Praticanti
223
313
182
Saltuari
266
317
88
Non praticanti
425
504
168
Totale
914
1134
438
Totale
718
671
1097
2486
Tab. 2.8 Pratica religiosa per età. (Valori percentuali per riga)
18-34
35-54
Oltre 54
Totale
Praticanti
31,1
43,6
25,3
100,0
Saltuari
39,6
47,2
13,1
100,0
Non praticanti
38,7
45,9
15,3
100,0
Tab. 2.9 Pratica religiosa per età. (Valori percentuali per colonna)
18-34
35-54
Oltre 54
Praticanti
24,4
27,6
41,6
Saltuari
29,1
28,0
20,1
Non praticanti
46,5
44,4
38,4
Totale
100,0
100,0
100,0
Tab. 2.10 Pratica religiosa per età. (Valori percentuali sul totale)
18-34
35-54
Oltre 54
Totale
Praticanti
9,0
12,6
7,3
28,9
Saltuari
10,7
12,8
3,5
27,0
Non praticanti
17,1
20,3
6,8
44,1
Totale
36,8
45,6
17,6
100,0
75
1. La percentualizzazione per riga (tab. 2.8) risponde a questa domanda:
il gruppo dei praticanti è mediamente più giovane o più anziano
rispetto ai non praticanti e ai saltuari? Non è una domanda 'esplicativa',
non intendiamo che essere praticante o meno abbia effetti sull'età
dell'intervistato, il nostro scopo è meramente descrittivo.
2. La percentualizzazione per colonna (tab. 2.9) risponde a questa
domanda: "l'età degli intervistati influenza il loro grado di pratica
religiosa?". Come si vede si tratta di una domanda esplicativa: "l'età è
la causa della pratica religiosa?".
3. La percentualizzazione sul totale (tab. 2.10) risponde a questa
semplice domanda: "qual è la consistenza di ciascun sottogruppo
(praticanti giovani, praticanti adulti ecc..) nel campione?". Ha scopi
puramente descrittivi. In generale si usa per confrontare un campione
con la popolazione da cui è estratto.
76
Scelta della direzione di percentualizzazione.
Di solito siamo interessati ad analizzare relazioni esplicative, da cui una
semplice regoletta:
a. si individua la variabile indipendente (la causa)
b. si usa la variabile indipendente come variabile di colonna.
c. si percentualizza per colonna.
Detto diversamente:
Si definisce qual è la variabile indipendente, e si percentualizza all'interno
delle sue modalità.
- si sceglie la percentuale per colonna quando si vuole analizzare
l'influenza che la variabile posta in colonna ha sulla variabile posta in riga;
- si sceglie le percentuale per riga quando si vuole analizzare l'influenza
che la variabile posta in riga ha sulla variabile posta in colonna.
Questa regoletta di solito funziona, ma ha delle eccezioni: a) non sempre la
domanda cui siamo interessati è esplicativa e b) non sempre è facile
individuare a colpo d'occhio la variabile indipendente (causa). E' pertanto
più opportuno partire dall'interrogativo cui vogliamo rispondere. In genere
l'interrogativo contiene già l'indicazione della direzione corretta.
Prendiamo l'esempio dell'età e della pratica religiosa: ci chiediamo se l'età
influenza la pratica religiosa. Posta in altri termini, la domanda è se i
giovani sono più o meno praticanti degli anziani. Cosa vogliamo
confrontare? Il campione dei giovani con quello degli anziani. Quindi
dobbiamo calcolare la percentuale di praticanti giovani (anziani) sul totale
dei giovani (anziani), cioè per colonna.
77
Altri esempi di percentualizzazioni di tabella a doppia entrata
Sulla base della seguente tabella a doppia entrata, stabilire se c’è una
relazione fra soddisfazione / insoddisfazione della propria situazione
economica e zona di residenza
"Secondo lei, negli ultimi 12 mesi, la situazione della sua famiglia è
migliorata, rimasta la stessa o peggiorata?”
Migliorata
Nord-ovest
Nord-est
Centro
Sud
Totale
45
17
27
56
145
Migliorata
Nord-ovest
Nord-est
Centro
Sud
Totale
31,0
11,7
18,6
38,6
100
Migliorata
Nord-ovest
Nord-est
Centro
Sud
6,5
6,0
5,7
5,4
Rimasta
uguale
445
188
308
579
1520
Peggiorata
Totale
203
78
142
408
831
693
283
477
1043
2496
Rimasta
uguale
29,3
12,4
20,3
38,1
100
Peggiorata
Rimasta
uguale
64,2
66,4
64,6
55,5
Peggiorata
Totale
29,3
27,6
29,8
39,1
100
100
100
100
24,4
9,4
17,1
49,1
100
78
A partire dalla seguente tabella a doppia entrata, effettuare gli opportuni
calcoli per poter rispondere alla domanda se esiste una relazione fra classe
sociale e fiducia nel governo
Classe operaia
Piccola borghesia
autonoma
Ceto medio impiegatizio
Ceti superiori
Totale
Per
nulla
241
166
Poco
Non so
Abbast
Molto
Totale
300
227
15
21
118
85
25
13
699
512
237
165
809
332
234
1093
22
18
76
119
77
399
14
10
62
724
504
2439
Domanda: “Quanta fiducia lei ha nell’operato del governo?”
Classe operaia
Piccola borghesia
autonoma
Ceto medio impiegatizio
Ceti superiori
Totale
Per
nulla
29,8
Poco
Non so
Abbast
Molto
27,4
19,7
29,6
40,3
20,5
29,3
20,4
100
20,8
30,4
21,4
100
27,6
28,9
23,7
100
21,3
29,8
19,3
100
21,0
22,6
16,1
100
Per
nulla
34,5
Poco
Non so
Abbast
Molto
Totale
42,9
2,1
16,9
3,6
100
44,3
45,9
46,4
4,1
3,0
3,6
16,6
16,4
15,3
2,5
1,9
2,0
100
100
100
Classe operaia
Piccola borghesia
autonoma
32,4
Ceto medio impiegatizio 32,7
Ceti superiori
32,7
79
Casi (rari) in cui non si segue il criterio sopra enunciato per la direzione
delle percentuali
Tab. 13.3 Confronti fra i profili degli abbonati
italiana nel 1991
Residenza Abbonati Popolazio Titolo di
ne
studio
Nord
27,9
26,3
Lic. Elem.
ovest
Nord est 18,9
18,3
Lic. Media
Centro
19,8
19,2
Diploma
Sud
33,4
36,2
Laurea
Totale
100
100
al telefono e dell'intera popolazione
Abbonati
Popolazione
24,2
38,0
27,7
37,4
11,7
100
35,8
21,7
4,5
100
Tab. Relazione fra pratica religiosa e comportamento di voto nel 2008 (dati fittizi)
a) Voto a seconda della pratica religiosa (come votano le persone classificate secondo
la loro religiosità)
Sinistra arc.
Pd
Udc
Pdl
Lega
Totale
(N)
Non pratic
17,4
42,9
3,5
33,1
3,0
100,0
(1132)
Saltuari
11,4
39,2
7,4
37,9
4,1
100,0
(704)
Praticanti
6,9
35,6
12,6
40,8
4,0
100,0
(522)
Totale
13,3
40,2
6,7
36,3
3,6
100,0
2358
Commento: si vede che i praticanti scelgono in maggioranza il Pdl, e i non praticanti
il Pd
b) Pratica religiosa a seconda del voto (come sono religiosamente connotati gli
elettori dei vari partiti)
Sinistra arc.
Pd
Udc
Pdl
Lega
Non pratic
62,9
51,3
25,3
43,9
40,5
Saltuari
25,6
29,1
32,9
31,2
34,5
Praticanti Totale
11,5
100,0
19,6
100,0
41,8
100,0
24,9
100,0
25,0
100,0
(N)
(313)
(948)
(158)
(855)
(84)
Commento: si vede che il partito che fra i suoi elettori la maggior presenza di cattolici
è l’Udc
80
La tabella a) risponde alla seguente domanda: "L'orientamento religioso
influenza l'orientamento di voto?" (dom. esplicativa)
La tabella b) risponde alla seguente domanda: "Sono più religiosi gli
elettori del Polo o dell'Ulivo?" (dom. descrittiva)
81
Quando si commette un grave errore
Supponiamo di essere interessati alla composizione degli elettori dell'Ulivo
secondo l'orientamento religioso a fini di propaganda elettorale. Se
usassimo la tabella a) e sostenessimo che tra gli elettori dell'Ulivo ben il
54,7% è rappresentato da Cristiani non cattolici commetteremmo un
errore. In questa tabella la percentuale di 54,7 rappresenta la quota di
cristiani che votano Ulivo, non la quota di elettori dell'Ulivo di
orientamento cristiano. L'errore consiste nel porsi un interrogativo che
richiede percentuali per riga, calcolando le percentuali per colonna (o
viceversa).
4. Analisi bivariata: presentazione delle tavole
a) prima forma di presentazione consigliata
Tab. 2.12. Grado di pratica religiosa per età. (Valori percentuali)
18-34
35-54
Oltre 54
Praticanti
24,4
27,6
41,6
Saltuari
29,1
28,0
20,1
Non praticanti
46,5
44,4
38,4
Totale
(N)
100,0
(914)
100,0
(1134)
100,0
(438)
b) seconda forma di presentazione consigliata (con il
marginale della variabile dipendente)
Tab. 2.13. Grado di pratica religiosa per età. (Valori percentuali)
18-34
35-54
Oltre 54
Totale
Praticanti
24,4
27,6
41,6
28,9
Saltuari
29,1
28,0
20,1
27,0
Non praticanti
46,5
44,4
38,4
44,1
Totale
(N)
100,0
(914)
100,0
(1134)
100,0
(438)
100,0
(2486)
82
5. Criteri guida per la presentazione delle tavole:
1. Parsimonia. La tabella deve contenere solo i dati significativi per
valutare la relazione. In genere si escludono i valori assoluti, salvo che
non si ritengano necessari. I titoli come negli esempi devono essere
sintetici, ma contenere l'indicazione delle variabili coinvolte.
2. La tabella deve contenere sempre la riga (o colonna ) totale
contenente i valori 100. Serve ad indicare in che direzione sono state
calcolate le percentuali.
3. La tabella deve contenere sempre una riga (o colonna) in cui sono
indicate le basi delle percentuali, cioè i valori assoluti corrispondenti al
100,0%. Il lettore deve sapere se i dati percentuali riguardano molti o
pochi casi.
4. I dati percentuali devono essere arrotondati alla prima cifra decimale,
come negli esempi, o arrotondati alla prima cifra intera (cioè senza
decimali). La seconda cifra decimale non si userebbe mai nei
commenti e quindi non è significativa. Le singole percentuali devono
essere arrotondate: se si usa una cifra decimale, i calcoli vanno fatti
fino alla seconda che verrà usata per gli arrotondamenti (da 0 a 4, per
difetto, da 5 a 9 per eccesso). Dopo gli arrotondamenti occorre
controllare che il totale dia effettivamente 100,0 (non 99,9 o 100,1). Se
non accade correggere il valore più alto (quadratura).
5. Se il decimale è pari a zero, va riportato ugualmente.
6. La forma della tabella 2.13 è da preferire, soprattutto se non è stata
precedentemente presentata la distribuzione di frequenza della
variabile dipendente (orientamento al voto - la colonna totale infatti
presenta tale distribuzione). Questa colonna è utile perché permette il
raffronto tra le singole colonne e il dato medio del campione.
Avvertenze: Se le percentuali sono calcolate per colonna, possono essere
sommate solo entro la colonna stessa, ma non fra le colonne. Se si
decide di accorpare due colonne bisogna sommare i valori assoluti e
solo dopo calcolare le percentuali.
83
6. Cosa fare se si vogliono ricavare i valori assoluti da una tabella che
contiene solo percentuali
L'esempio che segue mostra come si può ricavare la colonna 'Totale' in una
tabella in cui era stata omessa. Mostra indirettamente perché è importante
indicare le basi assolute delle percentuali.
Tab. 2.15 Composizione sociale degli iscritti alla facoltà di
Lettere
Maschi
Femmine
Ceti superiori
12,2
20,2
Ceti medi autonomi (art. comm.) 27,5
30,2
Ceti medi dipendenti (impiegati) 23,2
23,4
Operai
37,1
26,2
Totale
(N)
(1178)
100,0
100,0
(237)
Se si vuole ricavare la percentuale complessiva di maschi e di femmine
che proviene dai ceti superiori, occorre passare attraverso i valori assoluti:
- ricavare quanti sono i maschi dei ceti superiori
12,2 : 100 = X : 237
X = 12,2*237/100 = 29
- quante sono le femmine dei ceti superiori: (1178*20,2/100 = 238)
- sommare i due valori assoluti così ottenuti: (29+238 = 267)
- percentualizzare sul totale dei casi:
[267/(237+1178)*100 = 18,7].
84
7. Interpretazione delle tavole
Tab. 13.7. Risposte alla domanda «Lei è soddisfatto dell'operato del governo?» per
ampiezza del comune di residenza
a) valori assoluti
>250.000 100250.000
Per nulla 97
26
Poco
168
71
Non so
89
36
Abbastanza 159
66
Molto
3
2
Totale
516
201
50100.000
29
99
49
92
2
271
1050.000
23
249
118
246
8
643
1-10.000
<1.000 Totale
62
253
153
326
14
808
10
8
1
5
1
25
246
848
446
894
30
2464
Semplificazione della tabella (non si possono fare % su N < 50)
b) percentuali per colonna
>250.000 100250.000
Per nulla 18,8
12,8
Poco
32,5
35,3
Non so
17,3
18,0
Abbastanza 30,8
32,9
Molto
0,6
1,0
Totale
100
100
(N)
(516)
(201)
Idp
-17,9
-14,2
50100.000
10,8
36,5
18,0
34,0
0,7
100
(271)
-12,6
1050.000
3,5
38,8
18,3
38,2
1,2
100
(643)
-2,9
<10.000
Nulla+poco 51,3
Abb+molto 31,4
47,3
34,7
42,5
39,4
39,9
41,6
48,1
33,9
8,6
31,3
18,5
39,8
1,8
100
(833)
+1,7
Interpretazione: Si prende una modalità significativa della variabile
dipendente, e si vede come essa varia al variare della variabile
indipendente.
Commenti inutili e commenti sbagliati
Idp: Indice di differenza percentuale = soddisfatti - insoddisfatti
85
8. Forma della relazione
Tab. 13.8 Risposte alla domanda «Con che frequenza si vede con amici o
amiche, al di fuori dell'orario scolastico o di lavoro?», per età
dell'intervistato.
19-25 anni
26-35 anni
36-45 anni
46-55 anni
56-65 anni
0ltre 65
Tutti i Almeno
giorni una volta
a
settimana
41,4 52,9
15,0 67,1
8,3
66,2
4,9
54,0
10,5 43,7
23,1 35,5
Almeno
una
volta
al mese
5,7
12,1
15,2
27,6
29,3
18,8
Non ha
amici
Totale (N)
0,1
5,7
10,3
13,5
16,5
22,6
100
100
100
100
100
100
(87)
(173)
(145)
(163)
(133)
(208)
9. Presentazione compatta di tavole
Tab. 3.8 Giudizio sulla partecipazione a scioperi spontanei per età.(Valori
percentuali)
Approva
Non approva
Totale
(N)
15-19
45,2
54,8
100.0
(55)
20-29
42,1
57,9
100.0
(132)
30-29
32,8
67,2
100.0
(212)
40-49
17,7
82,3
100.0
(75)
50-59
13,1
86,9
100.0
(53)
60-69
11,8
88,2
100.0
(83)
70 e più
11,2
88,8
100.0
(62)
Tab. 3.7 - Percentuale di persone che approvano le diverse forme di azione politica
non istituzionalizzata per età.
15-19
Partecipare a scioperi spontanei 45,2
Bloccare il traffico
11,1
Fare l'autoriduz dell'affitto
18,3
Fare l'autoriduz delle bollette
19,1
Occupare case sfitte
32,2
Occupare fabbriche
33,7
Scrivere slogan sui muri
9,1
20-29
42,1
19,0
22,3
20,0
38,9
44,8
7,2
30-39
32,8
13,3
15,8
18,7
27,4
48,7
4,8
40-49
17,7
11,4
12,0
15,4
24,2
35,6
2,1
50-59
13,1
9,8
14,3
21,7
27,6
36,8
3,3
60-69 70 e più
11,8
11,2
7,9
2,2
13,9
15,8
16,3
17,7
29,2
12,1
31,9
22,7
1,0
2,3
(N)
(55) (132) (212)
(75)
(53)
(83)
Domanda: «Ora le leggerò alcune azioni che la gente talvolta fa per protestare o per
influire sul governo. Per ciascuna di queste lei mi dovrebbe dire se la approva o la
disapprova».
(62)
86
Tab. 3.9 - Il ritratto dell'elettorato italiano (percentuali di voto per diverse
variabili indipendenti; elezioni politiche del 1996).
Polo
Totale
40
Lega Ulivo Altri Totale
10
Dimensione del comune
< 10.000 ab 38 15
10-100.000
41
9
100-250.000 39
6
>250.000 ab 44
4
Genere
Maschio
39 11
Femmina
41
8
Anno di nascita
Fino al 1945 42
7
1948-1965
38
9
Dopo 1965
43 13
Classe sociale
Borghesia
57
7
Picc. borghesia41 12
Dirigenti-quadri44 6
Insegnanti
31
4
Imp. concetto 39
9
Impieg. esec. 45
9
Operai
34 14
46
4 100 (1962)
44
44
50
49
3
6
5
3
100
100
100
100
46
46
4 100 (1079)
5 100 (883)
48
48
40
3 100 (431)
5 100 (1016)
4 100 (516)
32
39
45
62
48
45
47
4
8
5
3
4
1
5
100
100
100
100
100
100
100
(654)
(808)
(189)
(313)
(195)
(275)
(170)
(188)
(392)
(240)
(493)
Polo Lega Ulivo Altri Totale
Lettura quotidiani
Lettore quot. 39
9 48
Non legge quot.42 11 43
Esposizione Tv
Alta
43 11 42
Moderata
38
9 48
Momento della decisione di voto
Ultima settim. 34 16 44
Tempo prima 43
7 46
Titolo di studio
Lic. elementare32
Lic. media
39
Diploma
44
Laurea
38
9
15
7
6
51
42
45
52
4 100 (1045)
4 100 (917)
4 100 (797)
5 100 (1148)
6 100 (502)
4 100 (1459)
8
4
4
4
100
100
100
100
(187)
(659)
(416)
(153)
87
10. Rappresentazioni grafiche
Fig. 13.1 Rappresentazioni grafiche di tavole di contingenza: diagramma a barre
a) insoddisfazione nei confronti dell'operato del governo per dimensione della città di
residenza (dati di tab. 13.7b)
Insoddisfatti
39,9
47,3
48,1
100250.000
50
50100.000
60
51,3
42,5
40
30
20
10
>250.000
10-50.000
<10.000
0
b) frequenza con la quale vede gli amici per età (dati di tab. 13.8)
45
Tutti i giorni
40
Non ha amici
35
30
25
20
15
10
5
0
19-25
26-35
36-45
46-55
56-65
0ltre 65
88
Fig. 13.3 Rappresentazioni grafiche di tavole di contingenza: spezzata
a) soddisfazione nei confronti dell'operato del governo per dimensione della città di
residenza
60
50
40
30
Insodd.
20
Sodd.
10
0
<10.000
1050.000
50100.000
100250.000
>250.000
b) frequenza con la quale vede gli amici per età
45
Tutti i giorni
40
Non ha amici
35
30
25
20
15
10
5
0
19-25
26-35
36-45
46-55
56-65
0ltre 65
89
LEZIONE 12
ANALISI BIVARIATA: DIAGRAMMA DI DISPERSIONE
ATTENZIONE: lo studente deve solo capire che cosa è un diagramma di dispersione
e come da una tabella in cui sono riportate i valori per le variabili X e Y si passa alla
rappresentazione grafica. Non è necessario che sappia calcolare i coefficienti a e b
della retta di regressione, né il coefficiente di correlazione r
Pagine di testo corrispondenti
- sul testo La ricerca sociale: metodologia e tecniche, Bologna, Il Mulino - Vol IV. L'analisi dei dati
Cap. III: par. 7.1 (solo questo sotto-paragrafo del par. 7)
- oppure sul testo Metodologia e tecniche della ricerca sociale, Bologna, Il Mulino - Cap. XIII: par.
7.1 (solo questo sotto-paragrafo del par. 7)
Tab. Voti in italiano (X) e in matematica (Y) dei 10 allievi di una classe
Caso n.
1
2
3
4
5
6
7
8
9
10
X
9
4
6
5
5
7
8
4
7
7
Y
7
4
5
5
6
8
6
3
5
6
Relazione fra i voti in italiano e in matematica degli alunni di una classe
9
8
matematica
7
6
5
4
3
2
1
0
0
1
2
3
4
5
6
7
8
9
10
italiano
90
9
8
7; 8
matematica
7
9; 7
6
5; 6
5
5; 5
4
4; 4
3
4; 3
7; 6
6; 5
8; 6
7; 5
2
1
0
0
1
2
3
4
5
6
7
8
9
10
italiano
Fig. 13.4 Diagrammi di dispersioni raffiguranti quattro tipi di relazioni fra due
variabili
a) lineare positiva (o diretta; r = 0,74)
9
8
7
6
5
4
3
2
1
0
0
2
4
6
8
10
91
b) lineare negativa (o indiretta; r = -0,81)
9
8
7
6
5
4
3
2
1
0
0
2
4
6
8
10
e) nessuna relazione (r = 0,03)
9
8
7
6
5
4
3
2
1
0
0
2
4
6
8
10
6
8
10
d) curvilinea (r = 0,06)
9
8
7
6
5
4
3
2
1
0
0
2
4
92
ESEMPIO 1
Interrogativo: nelle regioni italiane c’è una relazione fra la frequenza con la quale la
gente va al cinema e la ricchezza della regione (nelle regioni più ricche si va al
cinema di più?)
X: Ricchezza = prodotto interno lordo per abitante (in euro)
Y: Affluenza al cinema = Persone di 6 anni e più che hanno fruito del cinema per
regione di appartenenza nell’anno 2003 (valori percentuali)
Regioni
Piemonte
Valle d'Aosta
Lombardia
Trentino Alto
Adige
Veneto
Friuli Venezia
Giulia
Liguria
Emilia Romagna
Toscana
Umbria
Marche
Lazio
Abruzzo
Molise
Campania
Puglia
Basilicata
Calabria
Sicilia
Sardegna
Italia
X. Pil per
Y.
abitante (€) Affluenza(%)
25.796,60
29.952,80
28.869,90
30.430,60
48,1
40
48,5
38,7
25.796,60
26.552,50
47,6
45,3
25.511,50
28.182,40
25.137,60
22.117,10
23.080,60
27.126,90
19.109,60
18.207,40
15.642,00
15.494,00
16.077,70
15.161,90
15.854,00
18.054,60
23.114,50
46,5
48,3
50,3
45,3
48,9
52,8
48,9
41,5
52,2
47,2
42,3
35,8
47,9
42,8
48,1
Fonte: Istat, Cultura, socialità e tempo libero. Indagine multiscopo sulle famiglie “Aspetti della vita
quotidiana” Anno 2003
93
Relazione fra affluenza al cinema e prodotto
interno lordo per abitante nelle regioni italiane
55
Affluenza
50
45
40
35
30
10.000,00
15.000,00
20.000,00
25.000,00
30.000,00
35.000,00
Pil
r=0,09.
94
ESEMPIO 2
Relazione fra Pil e tasso di utilizzo del pc a livello regionale. Italia 2003.
Regioni
Piemonte
Valle d'Aosta
Lombardia
Trentino-Alto Adige
Veneto
Friuli-Venezia Giulia
Liguria
Emilia-Romagna
Toscana
Umbria
Marche
Lazio
Abruzzo
Molise
Campania
Puglia
Basilicata
Calabria
Sicilia
Sardegna
Italia
PIL1
122,0
136,1
137,4
139,3
121,5
125,1
119,2
133,7
118,0
103,3
108,2
124,3
90,8
83,4
72,1
71,6
74,9
68,5
73,1
83,4
107,9
Tasso di utilizzo
del pc
39,8
41,8
44,6
45,4
42,7
40,5
40,4
42,8
41,5
36,1
42,5
40,8
39,3
38,0
33,0
33,7
37,2
33,7
31,3
39,4
39,2
I valori dei PIL sono espressi in numeri indice, in cui la base fissa 100 è la media dei PIL dei 25 paesi dell’Unione
Europea nel 2003.
Fonte: ISTAT, Cultura, socialità e tempo libero, Roma, 2005.
Fonte per il PIL: http://www.regioni.it/mhonarc/readsqltop5.aspx
I valori dei PIL sono espressi in numeri indice, in cui la base fissa 100 è la media dei PIL dei 25 paesi dell’Unione
Europea nel 2003.
1
95
Relazione fra uso del pc e pil a livello regionale
48
46
44
Pil
42
40
38
36
34
32
30
60
80
100
120
140
160
Uso pc
r = 0,88
ESEMPIO 3
Tab. Tasso di suicidio e pratica religiosa per regione
X. % Praticanti (1)
Y. Suicidi x
100.000 ab.
Piemonte
43,3
9,3
Valle d’Aosta
26,8
14,1
Lombardia
36,5
6,7
Trentino-Alto Adige
43,0
11,5
Veneto
44,7
8,1
Friuli-Venezia Giulia
28,3
11,7
Liguria
24,6
10,7
Emilia-Romagma
26,6
9,3
Toscana
26,2
7,2
Umbria
29,5
11,3
Marche
40,8
5,9
Lazio
28,6
6,6
Abruzzo
37,4
6,7
Molise
45,5
9,0
Campania
43,2
4,0
Puglia
45,1
4,2
Basilicata
35,5
5,2
Calabria
38,8
4,6
Sicilia
43,2
5,6
Sardegna
21,2
10,3
(1) % di persone che nella regione vanno a messa tutte le settimane
Fonte: per la pratica religiosa -Indagine multiscopo sulle famiglie "aspetti della vita quotidiana"
dicembre 2001- marzo 2002, http://www.istat.it/dati/catalogo/20030708_01/
Fonte: per il suicidio –Annuario statistico 2004, http://www.istat.it/dati/catalogo/20040927_00/
96
Relazione fra pratica religiosa e suicidio per
regione
16
suicidi x 100.000 ab.
14
12
10
8
6
4
2
0
20
25
30
35
40
45
50
% praticanti
Relazione fra pratica religiosa e suicidio per
regione
16
suicidi x 100.000 ab.
14
12
10
8
R2 = 0,2474
6
4
2
0
20
25
30
35
40
45
50
% praticanti
r = – 0,50
97