Lucidi 2 - Università degli Studi di Messina

Che cos’è la statistica?
La statistica è una disciplina che si occupa di
fenomeni, riferibili ad individui (unità, elementi) in
quanto appartenenti a fissate popolazioni (insiemi,
aggregati,…) che possono manifestarsi con modalità
diverse da individuo ad individuo e che sono collegati
(o possono essere collegati) a fenomeni oggetti di
specifiche ricerche.
1
Statistica descrittiva
La STATISTICA DESCRITTIVA mira all’organizzazione, all’analisi
tabellare e grafica, al calcolo di grandezze sintetiche di ciò che si è
rinvenuto nella rilevazione
• E’ anche nota come analisi
esplorativa (Exploratory Data
Analisys) proposta soprattutto da J.
W. Tukey nel 1977
• Si configura come una trattazione
preliminare indispensabile per
affrontare uno studio complesso.
• Utilizza tecniche elementari,
soprattutto grafiche, di grande
efficacia nell’aiutare a comprendere
l’esito della rilevazione
2
Le fonti dei dati: fonti statistiche
• Fonti orali: testimonianze, colloqui …
• Fonti scritte o documenti “espressivi”: notizie
ricavabili da archivi storici, lettere personali, biografie …
• Fonti statistiche: fonti che forniscono informazioni sotto
forma di dati statistici;
• Fonti nuove di dati: telerilevamenti via satellite, stazioni
di rilevamento dei livelli di inquinamento
Le fonti statistiche sono le più attendibili poiché forniscono dati
raccolti fissando determinati criteri di classificazione.
Le fonti orali sono, da un punto di vista statistico, le meno attendibili
3
ISTAT: che cos’è?
• L’Istituto nazionale di statistica (ISTAT) è un ente di ricerca
pubblico, presente in Italia dal 1926.
• E’ il principale produttore di statistica ufficiale a supporto
dei cittadini e dei decisori pubblici. Opera in piena
autonomia e in continua interazione con il mondo
accademico e scientifico.
4
ISTAT: che cosa fa?
• Produce e diffonde informazioni affidabili, imparziali, accessibili e
pertinenti, capaci di descrivere le condizioni sociali, economiche e
ambientali del Paese ed i cambiamenti che in esso avvengono, con il
rigoroso rispetto della privacy.
• Realizza i censimenti generali: popolazione e abitazioni, industria e
servizi, agricoltura.
• Esegue la maggior parte delle indagini comprese nel Programma
statistico nazionale, l'insieme di rilevazioni ed elaborazioni
considerate indispensabili per il Paese.
• Dal 1989 svolge un ruolo di indirizzo, coordinamento, assistenza
tecnica e formazione all'interno del Sistema statistico nazionale
(Sistan). Il Sistema è stato istituito per razionalizzare la produzione e
diffusione delle informazioni ed ottimizzare le risorse destinate alla
statistica ufficiale.
5
L’indagine statistica
• Se la trattazione del problema costringe a cercare nuovi dati,
questi devono essere rilevati con uno schema appropriato.
• La rilevazione si articola in una sequenza ordinata di casi o
repliche che hanno tanti elementi in comune da essere
considerati facenti parte di un unico processo: l’indagine
statistica.
• Ogni indagine ha il suo piano di realizzazione legato alle
peculiarità della disciplina in cui il problema è sorto.
6
Nuove rilevazioni
L'acquisizione di nuovi dati è dovuta al fatto che:
 La base informativa di un problema non è soddisfacente
 E' utile e praticabile realizzarne una nuova o integrare quella esistente
La rilevazione dei dati consiste nella annotazione sistematica,
precisa e impersonale della modalità delle variabili riscontrate
sull’unità.
Le rilevazioni possono essere:
• TOTALI: coinvolgono tutti gli elementi di una popolazione
• PARZIALI: la rilevazione è estesa solo ad una parte, comunque
scelta, di popolazione
7
Le rilevazioni totali
Le RILEVAZIONI TOTALI (O CENSIMENTI) sono quelle in cui
sono enumerate o misurate tutte ed indistintamente le unità della
popolazione.
All'interno delle totali si hanno:
RILEVAZIONI GENERALI: riguardano la rilevazione di tutte le
unità rispetto alle variabili di interesse (POPOLAZIONE)
 Esempio: un'indagine sul voto che si rivolga a tutti gli elettori di qualsiasi
sesso e regione di residenza
RILEVAZIONI SPECIALI: riguardano la rilevazione delle sole
unità rispondenti a certe specifiche (SOTTOPOPOLAZIONE)
 Esempio: un'indagine sul voto che si rivolga a tutti, ma i soli iscritti alle
camere di commercio come "artigiani"
8
Le rilevazioni parziali
• Sono limitate solo ad una parte
delle unità della popolazione (o
sottopopolazione) scelta in base
ad opportuni criteri. La parte
esaminata si chiama
CAMPIONE.
• La riduzione delle unità propria
del metodo CAMPIONARIO è
valida solo se permette il
raggiungimento di risultati
molto prossimi di quelli
ottenibili con la TOTALE.
Esperienze consolidate in molti paesi e in molte discipline
dimostrano che si può dare pieno affidamento ai campioni purché
scelti con accuratezza.
9
Perché il campione?
La Rilevazione Totale non è sempre praticabile perché:
 HA UN COSTO ECCESSIVO O RICHIEDE GRANDI ORGANIZZAZIONI
– il censimento generale si realizza ogni 10 anni
 RICHIEDE TROPPO TEMPO
– l'intervista di tutti i lavoratori dipendenti richiederebbe tanti anni che una volta finita la
popolazione attuale sia molto diversa dalla censita
 E' TEORICA: PARTE DELLE SUE UNITA' NON ESISTE ANCORA o NON ESISTE
PIU’
– il controllo della qualità dovrebbe riguardare anche le unità non ancora prodotte.
– le vestigia di antiche civiltà
 E' SUPERFLUA
– per valutare l'inquinamento di un tratto di mare non bisogna esaminarne tutta l'acqua
 E' RISCHIOSA
– prima di somministrare un nuovo vaccino all'intera popolazione è bene sperimentarne su
poche unità la tossicità e l'efficacia
 E' DISTRUTTIVA
per stimare la durata di una batteria di 1.5 volt si deve per forza farla esaurire, ma
se si esauriscono tutte, che cosa si vende
 NON È VELOCE
– per conoscere i risultati delle elezioni non si possono aspettare gli esiti ufficiali. Più
10
immediati e precisi possono essere gli EXIT POLL
Le fasi di un’indagine statistica
1.
2.
3.
4.
5.
Il piano di rilevazione
La raccolta dei dati
La classificazione e lo spoglio dei dati
L’elaborazione dei dati
L’interpretazione dei risultati
11
Il piano di rilevazione
Il piano di rilevazione riguarda la definizione del problema da analizzare in tutti i suoi
aspetti (scientifici, statistici, organizzativi, economici, ecc.).
È una fase preparatoria e preliminare alle fasi successive.
In tale fase, dopo aver definito il fenomeno oggetto di studio, bisogna definire:
1.
La scelta del campo d’indagine, ossia la scelta e la definizione statistica sia delle
unità che dei caratteri.
2.
La scelta del metodo di rilevazione
 Direttamente tramite questionario o da modello da sottoporre alla collettività.
La rilevazione può essere totale o parziale.
 Indirettamente tramite raccolta di dati statistici prodotti da enti.
 Attraverso osservazioni di tipo sperimentale.
3.
La scelta del periodo di rilevazione: quando effettuare la raccolta.
4.
Il personale e l’organizzazione necessaria alla materiale raccolta dei dati.
5.
Strumenti necessari alla rilevazione ed elaborazione dei dati.
6.
Tempi e costi sia di rilevazione dei dati sia di elaborazioni.
7.
Diffusione dei risultati (pubblicazioni convegni, ecc…).
12
La raccolta dei dati
Consiste nella costituzione della documentazione statistica di
partenza ossia nella rilevazione del materiale o
nell’acquisizione dei dati secondo le modalità definite nella
fase preparatoria.
Sebbene si tratta di materiale grezzo ossia in forma non
ancora statisticamente trattabile, la documentazione statistica
di partenza contiene tutte le informazioni relative a tutte le
unità statistiche considerate e quindi rappresenta la base di
partenza per la formazione dei dati statistici necessari alle
successive analisi.
13
Il questionario: che cos’è?
Il questionario è un modello di rilevazione costituito da un certo
numero di domande espresse in modo standardizzato (uguale per
tutti gli interpellati) e strutturato (le cui domande riflettono le
ipotesi e l’oggetto della ricerca).
Il suo scopo è quello di fornire sia una descrizione quantitativa
delle caratteristiche, opinioni, atteggiamenti, comportamenti degli
interpellati sia stabilire l’esistenza di eventuali relazioni casuali o
interrelazioni tra caratteri rilevati e di verificare se esse sono
dovute o meno la caso attraverso l’utilizzo di statistiche di tipo
inferenziale.
14
Il questionario: come si compila?
Il questionario può essere compilato:
1. Direttamente dalla persona da interpellare (Autocompilazione)
2. Tramite la tecnica dell’intervista. È l’intervistatore a porre le
domande del questionario ed è, in tal caso, possibile che ci sia
un intervento dell’intervistatore nel corso dell’intervista.
3. Tramite una combinazione dei due precedenti modi: ad
esempio la tecnica del “giorno dopo”.
15
Il questionario: come si stende?
Alcuni criteri da seguire nella stesura di un questionario sono:
1.
2.
3.
4.
5.
Il linguaggio utilizzato deve essere il più possibile chiaro, preciso nei
riferimenti, semplice ed imparziale.
L’ordine in cui vengono poste le domande. Bisogna tener conto degli
effetti che una domanda ha sulla successiva; domande delicate o
riservate devono essere poste alla fine.
Il numero delle domande deve essere limitato.
La presentazione tipografica della domanda e relative risposte.
Le domande possono essere di vario tipo a seconda del modo in cui
sono previste le possibili risposte.
1. Domande aperte
2. Domande libere
3. Chiuse o strutturate
4. Domande filtro
5. Domande gerarchizzate
6. Domande mutiresponse
16
Tipi di domande
•
Domande aperte: le possibili risposte sono solo in parte
•
Domande libere: danno un’informazione ricca ed estesa;
•
Domande chiuse: sono previste tutte le possibili risposte. Se si
previste lasciandone una libera del tipo: “altro (specificare)”;
riferiscono a caratteri qualitativi si specificano tutte le possibili
risposte; se riguardano caratteri quantitativi si scrive il numero
corrispondente alla risposta; se riguardano variabili divise in
classi si procede come per le qualitative;
•
Domande filtro: selezionano sottogruppi di intervistati
•
Domande gerarchizzate: permettono di dare un ordine di
preferenza le modalità di un fenomeno;
•
Domande multiresponse: si possono dare più domande tra
loro compatibili.
17
Tipi di domande
•
Domande delicate o condizionanti: ad es. domande sull’uso di alcool,
droga, sul reddito, sull’appartenenza a partiti politici ecc …. Per tali
domande, in cui vi può essere reticenza da parte dell’intervistato, si
possono utilizzare diverse tecniche:
–
–
•
Tecnica delle domande proiettive (l’intervistato è sottoposto ad una situazione- stimolo che
apparentemente non lo riguarda personalmente)
Tecnica delle domande indirette (ad es. nelle domande sul reddito chiedendo quanto avrebbe
bisogno al mese una famiglia composta come la sua per vivere in una data città)
Domande sul controllo di qualità: riguardano notizie che il rilevatore
compila alla fine dell’intervista concernenti:
–
–
–
l’andamento dell’intervista stessa
Chi ha risposto alle domande
Numero di volte che si è dovuto contattare l’intervistato
Per le variabili strutturali riguardanti le notizie generali, le caratteristiche socio-demografiche
dell’intervistato, per la comparabilità con altre indagini esistono norme di classificazione
internazionali accettate dall’ISTAT, in cui vengono fornite le modalità da impiegare nella
formulazione delle domande su tali variabili.
18
La classificazione e lo spoglio dei dati
La classificazione riguarda la trasformazione dei dati grezzi in forma
statisticamente trattabile. Ogni unità statistica oggetto
d’indagine viene classificata mediante lo spoglio dei dati
contenuti nella documentazione statistica di partenza in base
alla modalità quantitativa o qualitativa da essa assunta.
Tale fase rappresenta il primo passo per il trattamento statistico dei
dati poiché trasforma il materiale grezzo di partenza in dati e
distribuzioni statistiche.
Tecnicamente si effettua attraverso lo spoglio che può essere di due
tipi:
1. Spoglio manuale
2. Spoglio con mezzi informatici
19
L’elaborazione dei dati
Tale fase riguarda tutte le possibili elaborazioni dalle più elementari
alle più complesse, che possono essere effettuate, secondo gli
scopi della ricerca, a partire dal file dei dati creato nella fase
precedente.
È la fase in cui si applicano i procedimenti propri della metodologia
statistica.
L’interpretazione dei risultati
Tale fase riguarda l’analisi dei risultati ottenuti e l’isolamento dei
risultati significativi emersi dalle analisi effettuate.
È l’aspetto più delicato ma anche il più creativo dell’indagine.
20