Alcuni concetti fondamentali - Dipartimento di Sociologia e Ricerca

Fonti di dati - 1
• Come abbiamo già visto in precedenza, spesso non è possibile
rilevare direttamente le informazioni. In questi casi, quindi, è
necessario rivolgersi ad istituzioni, pubbliche e private, che
raccolgono e mettono a disposizione le informazioni (es. ISTAT,
Commissione Europea, Banca d’Italia, Censis, ecc…).
• I dati disponibili, poi, non sono sempre nel formato utile per
procedere con le analisi, ossia inseriti all’interno di una matrice dei
dati. Spesso, infatti, è possibile consultare solo le rappresentazioni
tabulari di distribuzioni di frequenza, limitando necessariamente le
possibilità di analisi.
Dati individuali
L’unità di analisi è il singolo
individuo o gruppo di
individui (famiglia)
Dati aggregati
L’unità di analisi è un
aggregato di dati rilevati a
livello territoriale (es. n.
matrimoni nel Comune X).
Fonti di dati - 2
 Tra le fonti di dati, un grossa “fetta” è occupata dalle statistiche
ufficiali, ossia da dati prodotti dall’amministrazione pubblica.
 Si deve ricordare che la produzione di statistiche da parte della cosa
pubblica ha origini antichissime (ad es. nell’antica civiltà dei Sumeri),
tanto che il termine statistica, coniato nel 1500, stava ad indicare la
disciplina che permetteva la descrizione quantitativa delle caratteristiche
più importanti di una nazione (Corbetta, 1999).
 Per comprendere correttamente cosa produce l’amministrazione
pubblica è necessario considerare i seguenti aspetti:
 la produzione dei dati
 l’unità di analisi
 il contenuto delle rilevazioni
 l’ampiezza della rilevazione
Fonti di dati: la produzione - 1
 Il primo aspetto da prendere in considerazione è sicuramente quello del
perché e del come questi dati sono prodotti.
 Il perché i dati sono raccolti può essere suddiviso in due tipi:
1. I dati sono il frutto del normale lavoro delle amministrazioni
pubbliche (process-produced data). Gli atti amministrativi, se
opportunamente raccolti ed organizzati, producono dati statistici.
Molti dati provengono da atti amministrativi: le statistiche
demografiche, quelle sui reati, sul commercio, quelle sanitarie,
ecc… E’ ovviamente necessario che in tutto il territorio nazionale
la rilevazione delle informazioni sia omogenea: si è cercato di
raggiungere questo scopo con l’istituzione nel 1989 del SISTAN.
RILEVAZIONE INDIRETTA
Fonti di dati: la produzione - 2
2. I dati possono essere raccolti anche per esplicita volontà
dell’amministrazione, al fine di approfondire la conoscenza
verso alcune tematiche ritenute rilevanti. In Italia questo tipo di
raccolta, a livello pubblico, è portata avanti principalmente
dall’ISTAT (ad es. le indagini di vittimizzazione, per tenere conto
dei reati non denunciati, o l’indagine sulle famiglie, per
conteggiare il numero di nuove forme di struttura familiare).
Spesso queste indagini sono campionarie, ossia rilevano le
informazioni solo su parte dell’intera popolazione. Fa eccezione il
censimento, indagine volontaria a rilevazione totale.
RILEVAZIONE DIRETTA
Fonti di dati: le unità di analisi - 1
 L’unità di analisi che generalmente viene proposta nelle statistiche
ufficiali coincide, tradizionalmente, con l’unità amministrativa, ossia
Comune, Provincia o Regione. L’unità di analisi, quindi, non è costituita
dall’individuo (come nel caso delle indagini campionarie), ma dal
territorio.
 Ciò non significa che i dati non siano stati raccolti individualmente.
Come già accennato in precedenza, bisogna distinguere tra l’unità di
rilevazione (i singoli individui) e l’unità di analisi (il territorio comunale,
provinciale o regionale) in cui i dati sono rappresentati
 DATI AGGREGATI
ID
Comune
Sesso
Età
1
Milano
M
22
Comune
Maschi
20-24
25-29
2
Milano
M
24
Milano
586.128
59.066
93.173
3
Desio
F
25
Desio
17.117
2.008
2.639
4
Lodi
M
34
Lodi
19.218
2.004
2.849
5
Pavia
F
40
Pavia
33.188
3.510
5.137
…
…
…
…
…
…
…
…
Fonti di dati: le unità di analisi - 2
 Per quale motivo i dati delle statistiche ufficiali sono distribuiti a livello
aggregato (territoriale)? I motivi possono essere diversi:
1. Riservatezza: il dato potrebbe essere rilevato a livello individuale
ma viene registrato solo a livello aggregato (es. elezioni politiche
– voto segreto)
2. Limitatezza: l’informazione è raccolta a livello individuale per fini
amministrativi, ma riguarda solo il fenomeno in sé, senza alcuna
specificazione sull’individuo stesso (es. matrimoni e in genere
tutte le statistiche demografiche)
3. Complessità: l’informazione è raccolta a livello individuale, ma
per esigenze organizzative viene presentato aggregato (es.
censimento)
4. Già aggregato in origine: l’informazione raccolta si riferisce già
ad unità di analisi aggregata (es. n. di biglietti venduti nelle sale
cinematografiche di un Comune)
Fonti di dati: le unità di analisi - 3
 Se i dati pubblicati dalle statistiche ufficiali sono principalmente dati
aggregati, che tipo di variabili andranno a creare?
 L’operazione di aggregazione non è altro che un’operazione di
conteggio (quanti maschi ci sono nel Comune, quanti individui con età
compresa fra i 20 e i 24 anni, ecc…)
VARIABILI CARDINALI
Queste variabili sono dette anche variabili aggregate, ossia variabili che
derivano da operazioni di aggregazione condotte su variabili individuali.
Esse si distinguono dalle variabili globali, ossia variabili che non
derivano da rilevazioni condotte su individui: ad es., possiamo misurare
la distanza di un comune dal proprio capoluogo di regione e rilevare
così la variabile globale “marginalità-centralità territoriale”.
Fonti di dati: le unità di analisi - 4
 Che tipo di elaborazioni è possibile effettuare con i dati aggregati?
Fondamentalmente si possono ricondurre a due tipi:
1. L’analisi diacronica, ossia l’analisi delle serie temporali di un
gruppo di variabili rilevate in un ambito territoriale definito. E’
l’analisi tipica offerta dalle fonte statistiche ufficiali, anche perché
queste rilevano i dati spesso periodicamente e con continuità
(es. censimento)
2. L’analisi sincronica, ossia l’analisi delle variazioni territoriali: si
analizza uno stesso fenomeno in diverse unità territoriali, nello
stesso periodo temporale.
Fonti di dati: Il contenuto - 1
 Il contenuto delle rilevazioni riflette, ovviamente, il contesto di
produzione. Trattandosi principalmente di atti amministrativi
l’informazione ricavata non è frutto dell’osservazione, ma è
semplicemente la registrazione di uno stato di fatto (una nascita, un
matrimonio, un reato, sono semplicemente registrati e conteggiati).
DATI FATTUALI
 Ciò sta a significare che i dati raccolti nelle statistiche ufficiali non
permetteranno di conoscere le opinioni, gli atteggiamenti e le
motivazioni che spingono gli individui a compiere una determinata
scelta.
 Anche nel caso di rilevazioni dirette (non derivanti da atti
amministrativi – ISTAT) difficilmente ci si preoccupa di rilevare questo
genere di informazioni, pare (Corbetta, 1999) perché le istituzioni
pubbliche preferiscono non invadere la sfera privata dei propri cittadini.
Fonti di dati: ampiezza della rilevazione - 1
 L’ultimo punto riguarda l’ampiezza della rilevazione. Come già detto
nelle prime lezioni, le indagini si possono classificare in due tipi:
1. Rilevazione esaustiva: registrazione delle informazioni su
tutta la popolazione. I dati amministrativi in maggioranza
appartengono a questa classe.
2. Rilevazione campionaria: registrazione compiuta solo su
parte della popolazione. Solitamente il campione è costruito
affinché rappresenti la distribuzione di alcune proprietà (ad es.
sesso, titolo di studio e zona di residenza) nell’intera
popolazione. Anzi, spesso le indagini ISTAT sono condotte su
campioni di ampie dimensioni, affinché possano garantire un
alto livello di rappresentatività (a volte anche a livello
provinciale), una delle funzioni peculiari delle statistiche
ufficiali.
Fonti di dati: I limiti dell’analisi - 1
 L’uso delle statistiche ufficiali ha alcuni limiti, in parte già sottolineati,
ma che indichiamo sistematicamente qui:
1. I dati sono registrati dalle amministrazioni pubbliche con finalità
diverse rispetto a quelle del ricercatore: per questo motivo si
deve accettare il sistema di rilevazione dei dati (e quindi le
definizioni operative degli enti produttori di dati), senza poter
modificare alcunché.
2. Poiché sono dati aggregati, è possibile che siano disponibili
solo alcune tabulazioni incrociate, limitando di fatto l’analisi.
3. Spesso è difficile mettere insieme dati provenienti da diverse
fonti, poiché adottano sistemi di rilevazioni differenti. È
necessario, quindi, essere accorti nel confrontare dati da fonti
diverse.
4. Spesso le unità di analisi sono diverse: solitamente coincidono
con le unità amministrative, ma possono essere anche di altro
genere: le diocesi, le ASL, le circoscrizioni elettorali, ecc…
Fonti di dati: I limiti dell’analisi - 2
5. I dati registrati dalle statistiche ufficiali sono definiti dati
fattuali: è quindi impossibile conoscere le opinioni,
atteggiamenti e motivazioni che spingono gli individui a
compiere una determinata scelta.
6. I dati aggregati non sono adatti per l’analisi dei comportamenti
individuali. Ad es., se in uno stesso ambito territoriale si rileva
un alto numero di voti per i partiti di sinistra e un alto numero di
operai, non posso sostenere che gli operai votano a sinistra
(non so effettivamente quanti degli operai hanno effettivamente
votato a sinistra)
FALLACIA ECOLOGICA
Fonti di dati: dati aggregati - 1
 Si presenteranno ora alcune delle fonti ufficiali dalle quali è possibile
raccogliere alcune informazioni rilevanti. Per i dati aggregati, la maggior
parte dei dati è raccolta dall’Istituto Nazionale di Statistica (ISTAT) e
questi sono pubblicati in siti “paralleli” rispetto a quello ufficiale
dell’Istituto.
 Nelle slides successive si riporteranno solo alcune delle banche dati
dell’ISTAT. Per l’elenco completo consultare la pagina:
 http://www.istat.it/dati/db_siti/
 http://www.istat.it/dati/dataset/
Fonti di dati: dati aggregati - 2
 Censimento generale della popolazione e delle abitazioni
 http://dawinci.istat.it/MD/
 Contenuto: caratteristiche socio-demografiche, lavorative e
abitative della popolazione residente
UA: nazione, ripartizione geografica, regione, provincia, comune
(solo per alcune proprietà)
 Censimento generale dell’industria e dei servizi
 http://dwcis.istat.it/cis/index.htm
 Contenuto: n. di imprese di tipo, n. di unità locali, n. di addetti,
ecc…
 UA: nazione, regione, provincia, comune
Fonti di dati: dati aggregati - 3
 Censimento dell’agricoltura
 http://censagr.istat.it/
 Contenuto: n. di aziende agricole, tipo di struttura, tipo di
coltivazioni/allevamenti, caratteristiche socio-demografiche
degli operatori
 UA: nazione, ripartizione geografica, regione, provincia, comune
 Statistiche demografiche: Demografia in cifre
 http://demo.istat.it/
 Contenuto: popolazione residente italiana e straniera per età,
sesso e stato civile; bilancio demografico per sesso e cittadinanza
 UA: nazione, ripartizione geografica, regione, provincia, comune
Fonti di dati: dati aggregati - 4
 Sistema di Indicatori territoriali
 http://sitis.istat.it/sitis/html/index.htm
 Contenuto: sistema di indicatori diviso in 15 aree – tra le quali
prezzi, Ambiente, Imprese, Abitazioni, Trasporti e turismo, Famiglie
ed aspetti sociali, Giustizia
 UA: nazione, ripartizione geografica, regione, provincia,
capoluogo
 Sistema informativo territoriale sulla Giustizia
 http://giustiziaincifre.istat.it/
 Contenuto: giustizia civile, giustizia amministrativa, attività
notarile, giustizia penale, materia penitenziaria
 UA: nazione, ripartizione geografica, regione, provincia, distretto
di Corte di Appello
Fonti di dati: dati aggregati - 5
 Sistema informativo territoriale su sanità e salute
 http://www.istat.it/sanita/Health/
 Contenuto: sistema di 4.000 indicatori su diverse aree
tematiche – tra cui fecondità, interruzioni volontarie della
gravidanza, aborti spontanei, malattie infettive, speranza di vita,
attività ospedaliera in generale, risorse finanziarie, umane e
tecniche.
 UA: regione, provincia
 Banca dati di indicatori congiunturali
 http://con.istat.it/amerigo/
 Contenuto: prezzi, occupazione, forze di lavoro e conti
economici nazionali trimestrali.
 UA: prevalentemente nazionale
Fonti di dati: dati aggregati - 6
 Ministero della Salute
 http://www.ministerosalute.it/resources/static/servizi.jsp
 Contenuto: i numeri del sistema sanitario nazionale (n. servizi
offerti, n. medici, ecc…); ricoveri ospedalieri.
 UA: ASL
 Ministero della giustizia
 http://www.giustizia.it/statistiche/statistiche-indice.htm
 Contenuto: statistiche sull’amministrazione penitenziaria,
sull’organizzazione giudiziaria, sulla giustizia minorile.
 UA: nazione, regione
 Annuario statistico Regionale della Lombardia
 http://www.ring.lombardia.it/
 Contenuto: generico, con focus su dati relativi a tutti i comuni
della Lombardia
 UA: regione, comune
Fonti di dati: dati individuali - 1
 Presenteremo ora alcune indagini campionarie, commissionate
dall’ISTAT o da altre istituzioni pubbliche, nazionali ed internazionali
 Indagini Multiscopo ISTAT
 http://www.istat.it/dati/catalogo/20060615_00/
 Obiettivo: esplorare alcuni aspetti della società italiana
difficilmente conoscibili con le informazioni raccolte dalla normale
attività amministrativa
 Temi:
1.
2.
3.
Aspetti della vita quotidiana (annuale): famiglia, abitazione e zona
in cui si vive; condizione di salute e stili di vita; cultura e tempo
libero; soddisfazione servizi di pubblica utilità.
Cittadini e tempo libero (quinquennale): uso del tempo libero, in
particolare sport, consumi culturali, hobby, relazioni sociali.
Famiglia e soggetti sociali (quinquennale): struttura familiare e
caratteristiche sociali della famiglia italiana; relazioni sociali e
amicali; vita di coppia e cura dei figli.
Fonti di dati: dati individuali - 2
 Indagini Multiscopo ISTAT
 Temi:
4.
5.
6.
Condizioni di salute e ricorso ai servizi sanitari (quinquennale):
percezione soggettiva del proprio stato di salute; stili di vita
rilevanti per il benessere psico-fisico.
Viaggi e vacanze (trimestrale): stima dei flussi turistici e
caratteristiche; caratteristiche socio-demografiche dei turisti;
motivo della vacanza e spesa sostenuta.
Sicurezza dei cittadini (quinquennale): indagine di vittimizzazione
(stima del numero di reati non denunciati alle Forze dell’Ordine);
percezione della sicurezza nella zona in cui si vive; giudizio sulle
Forze dell’Ordine.
 UA: individui, famiglie
 Rappresentatività: nazione, ripartizione territoriale, regione,
tipologia comunale (area metropolitana, classi di ampiezza
popolazione)
Fonti di dati: dati individuali - 3
 Altri dati individuali:
 Indagine sui bilanci delle famiglie italiane – Banca d’Italia:
•
•
•
http://www.bancaditalia.it/statistiche/indcamp/bilfait
Obiettivi: conoscere i redditi e le proprietà delle famiglie italiane.
UA: individui, famiglie
 European Social Survey:
•
•
•
http://www.europeansocialsurvey.org/
Obiettivi: conoscere gli atteggiamenti e i valori degli europei verso alcuni
aspetti della propria vita.
UA: individui
 Eurobarometer:
•
•
•
http://ec.europa.eu/public_opinion/index_en.htm
Obiettivi: conoscere gli atteggiamenti e i valori degli europei verso le
istituzioni europee; spesso vengono eseguite indagini su temi di rilevanza
internazionale (immigrazione, salute, alimentazione, ecc…).
UA: individui
Fonti di dati: approfondimenti
 Fonti statistiche ufficiali:
AA.VV., Le Ricerche di Petronilla. Una guida alle fonti statistiche per
l’analisi secondaria nelle scienze sociali, Università degli Studi di
Trento
http://www4.soc.unitn.it:8080/dsrs/content/e242/e245/e2392/quad38.pdf
Rapporti statistici - 1
• Spesso le variabili cardinali a disposizione non derivano né da una
misurazione né da conteggio, bensì derivano da trasformazioni di altre variabili
cardinali
• Questo tipo di variabile, non rilevata direttamente, viene detta variabile
derivata, appunto perché essa deriva da una trasformazione di una o più
variabili già presenti.
• Sono variabili derivate, ad esempio, quelle costruite attraverso operazioni di
ricodifica, normalizzazione e standardizzazione.
• E’ possibile costruire variabili derivate anche unendo le informazioni
contenute in due variabili distinte, ad esempio costruendo un rapporto tra le
due variabili. Ciò può essere utile se vogliamo normalizzare l’andamento di un
fenomeno (ad esempio il numero di disoccupati) con la numerosità della
popolazione di riferimento o l’ampiezza del territorio in cui il fenomeno è
rilevato (sempre nel nostro esempio, normalizzare il numero di disoccupati per
la numerosità della popolazione attiva).
RAPPORTO STATISTICO
Rapporti statistici - 2
• Esistono diversi tipi di rapporti statistici. Ne esamineremo quattro:
•Rapporto di composizione: relazione tra una delle possibili
manifestazioni del fenomeno con il fenomeno nella sua interezza.
Es.
 Proporzione di maschi: numero di maschi sul totale di maschi e
femmine
 Proporzione di spesa per affitto: spesa per l’affitto sul totale delle spese
familiari
 Indice di possesso del diploma di scuola media superiore – 19 anni in
su: rapporto tra la popolazione di 19 anni in su con diploma di scuola
media superiore sul totale della popolazione di 19 anni in su (x 100)
 Indice di non conseguimento della scuola dell’obbligo: popolazione con
età tra i 15 e i 52 anni che non ha il diploma di scuola media inferiore
sul totale della popolazione della stessa classe di età (x 100)
 Tasso di disoccupazione [giovanile]: popolazione [di età compresa tra i
15 e i 24 anni] in cerca di lavoro su forza lavoro [della stessa classe di
età] ( (x 100)
Rapporti statistici - 3
2. Rapporto di coesistenza: relazione tra due delle possibili
manifestazioni del fenomeno.
Es.
 Indice di mascolinità: numero di maschi sul numero di femmine (x 100)
 Rapporto di matrimoniabilità: numero di coniugati su numero di non
coniugati (celibi, nubili, vedovi e divorziati) (x 100)
 Indice di dipendenza: numero di individui con età da 0-14 anni e con
età superiore ai 65 anni e oltre diviso il numero di individui con età tra i
15 e i 64 anni (x 100)
 Indice di vecchiaia: numero di individui con età superiore ai 65 anni sul
numero di individui con età inferiore ai 15 anni (x 100)
 Indice di ricambio della popolazione: popolazione con età tra 0 e 14
anni su popolazione con età superiore ai 65 anni (x 100)
 Indice di ricambio della popolazione attiva: popolazione tra 60 e i 64
anni su popolazione tra i 15 e i 19 anni (x 100)
Rapporti statistici - 4
2. Rapporto di derivazione: rapporto fra la misura di un fenomeno e
quella di un altro fenomeno considerato un suo presupposto
necessario. È da considerarsi una forma di normalizzazione.
Es.
 Tasso di natalità (mortalità): numero di nascite (morti) sul totale della
popolazione (x 1.000)
 Quoziente di immigrazione: numero di immigrati sul totale della
popolazione (x 1.000)
 Quoziente di criminalità: numero di reati sul totale della popolazione (x
100.000)
 Tasso di incidentalità: numero di incidenti stradali sul totale della
popolazione (x 100.000)
Rapporti statistici - 5
2. Rapporto medio: rapporto fra due grandezze che riguardano due
fenomeni diversi (categoria residuale).
Es.
 Densità della popolazione: numero di abitanti su superficie del territorio
 Indice di affollamento: numero di componenti della famiglia su numero
di stanze dell’abitazione
 Indice di vivacità sociale: numero di luoghi di interazione sociale
(attività commerciali, associazioni, servizi socio-culturali, sportivi e
ricreativi) sul totale della popolazione residente
Contatti
Domingo Scisci
Università di Milano-Bicocca
Via Bicocca degli Arcimboldi 8 20126 Milano
Edificio U7/II Piano
Stanza 207
Telefono: 02 64487513
Mail: [email protected]
Quest'opera è stata rilasciata sotto la licenza Creative Commons Attribuzione-Non commerciale-Condividi allo stesso
modo 2.5 Italia. Per leggere una copia della licenza visita il sito web http://creativecommons.org/licenses/by-nc-sa/2.5/it/
o spedisci una lettera a Creative Commons, 171 Second Street, Suite 300, San Francisco, California, 94105, USA.