Elementi base di statistica
Le fasi di un’indagine statistica
Cos’è la Statistica
La Statistica studia i metodi per raccogliere, elaborare
e interpretare i dati relativi ad un fenomeno collettivo.
Prende il nome dal termine “Stato”.
Era una tecnica collegata al governo dello Stato,
finalizzata a conoscere quanti fossero gli abitanti e
quale fosse il loro censo.
Da qui deriva la parola censimento, che indica una
rilevazione di dati dell’intera popolazione di uno Stato.
Popolazione statistica
Si dice popolazione statistica o collettività
statistica un insieme di elementi che
presentano una o più caratteristiche comuni.
Ogni elemento della popolazione è detto
individuo o unità statistica.
Le fasi dell’indagine statistica
Definizione degli obiettivi
Definizione del problema e modalità di raccolta
delle informazioni
Raccolta delle informazioni
Elaborazione dei dati
Definizione degli obiettivi
Individuare il fenomeno sul quale si deve indagare e le
modalità con le quali esso si presenta.
Per analizzare le caratteristiche della popolazione
studentesca di una scuola, dobbiamo innanzitutto
decidere quale aspetto studiare e poi quali sono le
informazioni sugli studenti che dobbiamo conoscere per
poterlo analizzare. Ogni studente rappresenta un’unità
statistica.
Tipologia di indagine
Indagine totale o completa: è possibile intervistare
tutti gli studenti
Indagine per campione o campionamento: si
considera solo una parte della popolazione
rappresentativa dell’intera collettività.
Il campione deve essere scelto in modo da ben
rappresentare la popolazione, una scelta sbagliata
può inficiare i risultati dell’intera indagine.
Indagine per campione
La scelta di effettuare indagine a campione è legata
principalmente a problemi relativi ai costi e ai tempi:
– una raccolta esaustiva di dati può risultare troppo
dispendiosa in relazione al risultato da raggiungere
– i tempi necessari all’elaborazione dei dati crescono
all’aumentare del numero dei dati stessi; quindi i
tempi di attesa potrebbero diventare eccessivi
Modalità di raccolta delle informazioni
Le modalità con le quali in un’indagine si raccolgono i
dati dipendono dal tipo di problema studiato.
Analisi di un fenomeno fisico
– strumento di indagine: esperimenti di laboratorio.
– dati da elaborare: i parametri in base ai quali l’esperimento è
stato realizzato e i risultati ottenuti.
Analisi di un fenomeno sociale o economico in una
data epoca storica (es. livello di scolarizzazione delle donne
negli anni ‘30)
– ricerca bibliografica dei dati
Modalità di raccolta delle informazioni
Indagine nella quale le unità statistiche sono
soggetti viventi:
– strumenti: intervista diretta di tali unità.
Affinché le risposte siano confrontabili è necessario che
a tutti vengano poste le stesse domande nella
stessa forma e nello stesso numero.
Il questionario
Un questionario è una lista di domande da porre
agli intervistati per ottenere le informazioni utili
per svolgere un’indagine statistica.
I questionari sono essenzialmente di tre tipi:
– aperti
– semistrutturati
– rigidamente strutturati
I questionari aperti
Le domande sono poste in modo tale che sia lo stesso
intervistato a esporre la risposta con parole proprie.
Cosa ne pensi delle poste italiane?
Questionari abbastanza semplici da costruire
Lo spoglio richiede un’interpretazione soggettiva della
risposta, di conseguenza i risultati dell’inchiesta
potrebbero non essere attendibili.
I questionari strutturati
L’intervistato pone una crocetta su una delle risposte
previste.
Sono difficili da costruire in quanto è necessario prevedere
tutte le possibili risposte (ALTRO)
Non richiedono l’interpretazione delle risposte
Garantiscono una maggiore attendibilità dei risultati
dell’indagine. Secondo te, le poste italiane sono :
 molto efficienti
 efficienti  poco efficienti
 inefficienti  molto inefficienti
I questionari semistrutturati
Contengono domande a risposta aperta e
domande a risposta chiusa.
Presentano i difetti dei due tipi precedenti
Sono poco utilizzati.
Caratteristiche fondamentali dei quesiti
La scelta delle domande è strettamente collegata agli
obiettivi dell’indagine.
Criteri:
1. Ridurre al minimo i quesiti, limitandosi soltanto a
quelli che effettivamente potranno dare informazioni
utili ai fini della ricerca
2. Evitare domande che forniscono dati inutili per non
appesantire il lavoro di spoglio dei dati
Caratteristiche fondamentali delle domande
Espresse in un linguaggio tale da garantire l’univocità
di interpretazione del loro significato
Espresse in un linguaggio che sia comprensibile dalla
totalità degli intervistati
Poste in modo da non suggerire la risposta (Non crede
che le poste italiane siano poco efficienti?)
Domande di controllo
Hanno lo scopo di verificare la sincerità delle
risposte.
Inchiesta sul tabagismo: se si chiede quante sigarette
fuma al giorno, si può inserire una domanda di controllo
nella quale si chiede qual è la sua spesa mensile o
settimanale per le sigarette.
Le domande di controllo devono essere ben
distanziate dalle domande da “controllare”.
Domande di controllo
In questionari molto lunghi si ripropone la stessa
domanda, in termini leggermente diversi, più volte nello
stesso questionario.
La necessità di inserire tali domande deriva, non tanto
dal presupposto che l’intervistato dia volutamente delle
risposte non veritiere , quanto dal fatto che spesso si
tende inconsciamente a rifiutare certe realtà personali e
a modificare involontariamente certi dati per adattarli
alla situazione.
Per evitare che le risposte non siano sincere, si usa
spesso la tecnica del questionario anonimo.
L’intervista
Si può procedere in due modi:
– si consegnano i questionari agli intervistati i quali li
compilano da soli e li riconsegnano all’addetto che
provvede al loro ritiro;
– il questionario viene compilato da un intervistatore il
quale propone le domande e si preoccupa di
segnare le risposte dando eventuali chiarimenti.
Autocompilazione
Presenta il vantaggio di una maggior semplicità e
rapidità, ma ha i seguenti svantaggi:
– in caso di domande non chiare l’intervistato da
un’interpretazione
personale
e
può
compromettere l’attendibilità dei risultati;
– qualche questionario può andare perduto e ciò
altera la struttura del campione compromettendo
la validità della ricerca.
Intervista diretta
Non presenta gli svantaggi del primo
E’ lento
Richiede una buona preparazione del personale
addetto alle interviste
Non sempre garantisce l’anonimato
Raccolta delle informazioni
La fase centrale di un’indagine statistica è quella della
rilevazione, classificazione e tabulazione dei dati.
Di ogni individuo soggetto all’indagine interessano, a
seconda degli obiettivi scelti, alcuni caratteri: il sesso,
l’età, il titolo di studio, una particolare opinione….
Ogni carattere si presenta con diverse modalità, che
possono essere quantitative o qualitative.
Modalità dei caratteri
– il carattere “colore degli occhi” è qualitativo e le sue
modalità sono: neri, marroni, verdi, azzurri,…
– il carattere “titolo di studio” è qualitativo, ma, in certa
misura è ordinabile gerarchicamente: 0=nessuno,
1=licenza elementare, 2=adempimento dell’obbligo,
3=diploma di scuola superiore, 4=diploma postsecondario, 5=laurea
– il carattere “metri quadrati di verde pubblico”, relativo
ad un’indagine su una “popolazione” di comuni
europei, è di tipo quantitativo.
Spoglio dei dati
Spoglio:
– si esaminano tutte le schede
– si contano quanti individui presentano l’una o l’altra modalità,
– si contano e classificano le varie risposte date a ciascuna
domanda.
Lo spoglio può avvenire manualmente o immettendo i
dati in un computer e utilizzando un software opportuno
Dopo lo spoglio i dati vengono organizzati in tabelle
che possono essere semplici, a doppia entrata,
composte.
Tabelle di spoglio
Quesito n….
Modalità
A
del carattere
Intensità
/////,///
8
B
/////,/
6
C
///
D
///
3
3
Intensità: numero di volte in cui una
modalità è stata rilevata
totale
20
Tabelle semplici
Carattere
Quesito n. 4: Che tipo di musica ti piace?
Tipo di musica
classica
leggera
rock
altro
totale
Modalità
numero alunni
2
12
8
6
28
Intensità
Tabelle a doppia entrata
Si considerano contemporaneamente due
caratteri associati alla stessa unità statistica
1° colonna: modalità del 1° carattere
Colonne successive: intensità del primo
carattere ripartite a seconda delle modalità del
secondo
La lettura può essere fatta per righe e/o per
colonne
Tabelle a doppia entrata
1° carattere
2° carattere
Quesito n. 5: Dove la ascolti? e n.6 Con chi la ascolti?
n.5
n.6
a casa tua
a casa di amici
in locali pubblici
altro
totale
da solo
6
0
1
0
7
con
parenti
1
0
0
0
1
con amici
altro
totale
6
5
8
1
20
0
0
0
0
0
13
5
9
1
28
Le somme dei due totali parziali devono coincidere
tra loro con il numero totale di schede spogliate
Tabelle composte
• Hanno più colonne, ma la lettura si effettua
solo per righe
•1° colonna: modalità del carattere studiato
•Colonne successive: intensità del carattere
suddivise in rapporto a informazioni
supplementari che non costituivano
un carattere indagato
Tabelle composte
carattere
Quesito n.1 A quanto ammonta la somma, in euro, di cui puoi
disporre settimanalmente?
somma
0-3
3-6
6-9
9-12
12-15
totale
modalità
maschi
0
2
6
3
2
13
femmine
2
5
5
2
1
15
Classi di intensità
Il carattere è quantitativo
le modalità sono state divise in classi
classe: gruppo in cui vengono riuniti
i valori intermedi
intervalli chiusi a sinistra e aperti a
destra
ultimo intervallo è chiuso rispetto ad
entrambi gli estremi
si riducono dimensioni della tabella
somma
0-3
3-6
6-9
9-12
12-15
Organi preposti alla raccolta dei dati
La raccolta dei dati può essere effettuata da
chiunque abbia interesse a fare una ricerca
statistica.
In Italia, l’organo più importante che si occupa
della raccolta dei dati e della loro successiva
elaborazione è l’Istituto Centrale di Statistica
(ISTAT).
Elaborazione dei dati
Per studiare le caratteristiche e la natura di un
fenomeno si devono esaminare i dati
osservando:
– i loro rapporti statistici
– la loro distribuzione
– la loro variabilità.
Distribuzione statistica
Si definisce distribuzione statistica semplice,
l’insieme dei dati relativi alle modalità con cui si
presenta un singolo carattere.
Gli “strumenti” che misurano la distribuzione statistica
sono gli indici centrali: media, moda, mediana.
Esse danno un’informazione parziale dell’effettiva
natura di un fenomeno poiché non tengono conto della
variabilità esistente tra i dati.
Indici di dispersione
Gli indici di dispersione misurano quanto i dati
si discostino dal valore centrale
–
–
–
–
–
intervallo di variazione
scarto assoluto
scarto medio
varianza
scarto quadratico medio (o deviazione standard)