W56
MATERIE UMANISTICHE
il sapere in una settimana
METODOLOGIA
DELLA RICERCA
SOCIALE
Strumentii tecnici e metodologici
per l’analisi
isi quantitativa
va dei fenomeni
e operativa
oggetto della
ella ricerca sociale
E
SIMONE
EDIZIONI
Gruppo Editoriale Simone
I
E S
AR AR
I
UD RM
T
S FO
IN
ER
P
Copyright © 2008 Esselibri S.p.A.
Via F. Russo 33/D
80123 Napoli
Tutti i diritti riservati
È vietata la riproduzione anche parziale
e con qualsiasi mezzo senza l’autorizzazione
scritta dell’editore.
Per citazioni e illustrazioni di competenza altrui, riprodotte in questo libro,
l’editore è a disposizione degli aventi diritto. L’editore provvederà, altresì, alle
opportune correzioni nel caso di errori e/o omissioni a seguito della segnalazione degli interessati.
Prima edizione: settembre 2008
PK34 - Metodologia della ricerca sociale
ISBN 978-88-244-6356-0
Ristampe
8 7 6 5 4 3 2 1
2008
2009
2010
2011
Questo volume è stato stampato presso:
«Officina Grafica Iride» Via Prov. Arzano-Casandrino, VII trav. 24
Arzano (Napoli)
Per informazioni, suggerimenti, proposte: [email protected]
La parte prima è di:
La parte seconda è di:
Luciano D’Abramo
Laura Pagnini
Grafica e copertina:
Gianfranco De Angelis
Impaginazione:
Antonio Nocera
Presentazione
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
Il testo presenta, con un linguaggio agile ed efficace, i concetti chiave
della Metodologia della ricerca sociale, ed è rivolto a tutti gli studenti
che abbiano l’esigenza di testare e migliorare la propria preparazione.
Il volume si compone di due parti; nella prima vengono presentati gli
strumenti tecnici, concettuali e metodologici utilizzati nelle analisi quantitative dei fenomeni oggetto della ricerca sociale; nella seconda, tali
fenomeni vengono trattati sia sul piano qualitativo che su quello quantitativo. Seppure di taglio più tecnico, la prima parte, volta ad illustrare
il metodo della statistica descrittiva, viene presentata riducendo al minimo il ricorso alla strumentazione matematica, senza per questo diminuirne il rigore scientifico.
La disciplina è presentata in modo approfondito ed esaustivo nelle sue
linee fondamentali, e la trattazione semplice e discorsiva agevola l’apprendimento delle metodologie, dei concetti e degli strumenti conoscitivi applicati alle tecniche attuali di ricerca sociale.
Ogni capitolo è corredato di glosse esplicative e si conclude con un
test di verifica con soluzioni e brevi commenti, che consentono di
valutare e fissare il livello di preparazione raggiunto.
PARTE PRIMA
Elementi di statistica
per la ricerca sociale
1. Introduzione al metodo statistico
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
Di cosa parleremo
In questo capitolo descriveremo in generale il metodo statistico, specificandone i maggiori campi di applicazione, gli obiettivi, la prassi metodologica e
la terminologia di base. Saranno poi trattate sia le rappresentazioni tabellari, diffusissime per la presentazione dei risultati di ogni indagine statistica,
che le rappresentazioni grafiche, strumenti descrittivi di elezione nei casi in
cui non è necessaria una precisione elevata nella rappresentazione dei dati
a vantaggio di un’immediata valutazione sintetica della distribuzione dei
dati stessi; infine, verranno introdotti alcuni parametri di sintesi che permettono una valutazione dei risultati, quali le medie di posizione e di calcolo. Le formule descritte, determinanti per l’elaborazione dei dati osservati,
sono state ridotte a quelle più utilizzate e permettono, al lettore con un
minimo bagaglio matematico, di approfondire le tecniche di calcolo maggiormente usate.
Cos’è il metodo statistico. Il metodo statistico è un insieme di
teorie e di metodi che permette di raccogliere, descrivere e presentare insiemi di dati, allo scopo di ricavarne agevolmente informazioni che ne sintetizzino alcune caratteristiche e che forniscano previsioni affidabili su insiemi più grandi rispetto ai dati oggetto di
osservazione.
5
1. Introduzione al metodo statistico
1) Definizione del metodo
Statistica: scienza, strumentale ad altre, concernente la
determinazione dei metodi
scientifici da seguire per raccogliere, elaborare e valutare
i dati riguardanti l’essenza di
particolari fenomeni di massa.
La parola statistica (dal latino status)
deriva dal fatto che il suo utilizzo iniziale
riguardava la raccolta, l’elaborazione e la
diffusione di dati che descrivevano aspetti
quantitativi delle caratteristiche specifiche di
una nazione.
Parte Prima: Elementi di statistica per la ricerca sociale
Obiettivo della statistica. L’obiettivo della statistica, individuabile
dalla definizione, è di duplice natura: sintetizzare e permettere estensioni e generalizzazioni. Sintetizzare significa predisporre i dati raccolti in una forma tale da rappresentarli efficacemente, ovvero con
relativamente pochi numeri e/o indici, in modo da comprendere le
caratteristiche essenziali dei fenomeni analizzati attraverso i dati raccolti. La sintesi viene dunque incontro all’esigenza di semplificazione.
I metodi e le tecniche sviluppati per soddisfare questa finalità appartengono alla statistica descrittiva. A volte, a causa soprattutto della
limitata disposizione di risorse economiche e temporali, si pone l’esigenza di estendere il risultato delle analisi effettuate su gruppi limitati
di unità statistiche (il campione) all’intero insieme di appartenenza
(universo statistico). Le tecniche e i metodi che si usano in questo caso
rappresentano il contenuto della statistica inferenziale.
I campi di applicazione. I campi di applicazione del metodo statistico sono tutti quelli in cui si presentano fenomeni ripetitivi su insiemi
numerabili di elementi in cui occorre prendere decisioni in condizioni
di incertezza (ricerca scientifica, farmacologia, interventi di natura economica e finanziaria ecc.). Anche se non ce ne accorgiamo, siamo
bersagliati quotidianamente da dati di natura statistica (ad esempio i
risultati di sondaggi) e inoltre facciamo uso della statistica frequentemente: ad esempio, quando facciamo previsioni sul tempo di percorrenza di un autobus.
Esempi di applicazioni statistiche:
— valutazione dell’efficacia di un farmaco;
— valutazione della migliore produttività di sementi diverse di cereali;
6
— dati su nascite, matrimoni, morti su un certo territorio;
— dati sull’inflazione, sull’andamento dei prezzi.
2) Il metodo statistico
Affinché le informazioni deducibili dai dati rilevati possano essere
correttamente utilizzate è necessario sapere:
—
—
—
—
—
la terminologia;
come organizzare un’indagine statistica;
come rappresentare e analizzare i dati;
quali sono gli indici che li caratterizzano;
quali conclusioni trarre.
Un aspetto importante dell’indagine statistica è costituito dalle fonti
dei dati, che devono essere scelte con criteri di affidabilità e veridicità
indispensabili per raggiungere gli obiettivi del metodo. Per ottenere i
dati necessari si può:
predisporre ed eseguire esperimenti;
condurre un sondaggio;
effettuare uno studio sul campo;
ricorrere a fonti accreditate di dati, pubbliche o private che hanno
il compito di fornire i dati, reperiti con uno dei metodi precedenti.
Nei casi in cui sia richiesta una tecnica più efficace, alternativa sia
al questionario che all’intervista esterna, si fa ricorso alla cosiddetta
osservazione partecipante che prevede – allo scopo di rendere il più
possibile oggettive le osservazioni – l’inserimento e la parziale integrazione nei gruppi, costituiti ovviamente in questi casi esclusivamente
da persone, da parte di chi deve condurre la raccolta dei dati.
Un posto importantissimo nel panorama dei fornitori di dati occupa in Italia l’ISTAT, Istituto Nazionale di Statistica (sito www.istat.it)
che si occupa, tra l’altro, di organizzare i censimenti della popolazione, dell’industria e commercio e dell’agricoltura. Altre attività di rilevazione dell’ISTAT sono: i movimenti migratori della popolazione, la sa7
1. Introduzione al metodo statistico
—
—
—
—
nità, l’istruzione, la cultura, il clima, il turismo, la pesca e la caccia, i
prezzi, il lavoro, i bilanci familiari ecc.
La terminologia. Si definisce carattere (o variabile) un qualsiasi
aspetto della realtà (ad esempio reddito, titolo di studio ecc.) suscettibile di assumere valori diversi, rilevabili attraverso l’osservazione. I
modi con cui si presentano questi valori si chiamano modalità, mentre i soggetti nei quali sono stati osservati si definiscono unità statistiche, il cui insieme si indica con l’espressione popolazione statistica
o universo statistico.
Le modalità di una variabile vengono definite a priori.
Esempi di carattere statistico:
Parte Prima: Elementi di statistica per la ricerca sociale
— il carattere «sesso» si manifesta con le modalità Maschi e Femmine;
— il carattere «numero di figli» si manifesta con modalità espresse da
numeri interi maggiori o uguali a zero;
— il carattere «titolo di studio» si esprime con modalità espresse da
descrizioni, diverse da Paese a Paese, ma che individuano in maniera univoca il tipo di studi inerenti al titolo connesso; esempi:
licenza elementare, diploma di scuola superiore.
Nel caso in cui si studi un carattere per volta si parlerà di statistica
univariata, mentre nel caso si pongano in relazione tra loro due o più
caratteri statistici sulla stessa popolazione si parlerà rispettivamente di
statistica bivariata o multivariata.
Tipi di caratteri. I caratteri statistici possono essere suddivisibili
sulla base di diversi punti di vista. Secondo la modalità di rappresentazione, i caratteri si distinguono in:
— qualitativi o mutabili: si esprimono attraverso attributi non numerici,
ad esempio colore degli occhi, colore dei capelli ecc.; in tal caso, i dati
statistici rilevati formano delle serie cosiddette sconnesse;
— quantitativi: le cui modalità si esprimono attraverso numeri; ad
esempio numero di figli, reddito annuo; in tal caso i dati statistici
rilevati formano una seriazione.
8
I caratteri quantitativi possono a loro volta essere distinti, osservando l’insieme dei numeri con cui vengono rappresentati, in:
— discreti, quando le modalità sono solo alcuni numeri, in genere i
numeri naturali o loro sottoinsiemi;
— continui, quando le modalità sono i numeri reali o loro sottoinsiemi.
Un’ulteriore classificazione dei caratteri si può effettuare in base
alla scala di misurazione con cui si distinguono tra loro le modalità del
carattere osservato. Secondo questo criterio, le scale di misura si classificano in:
Utilizzo di codici nella rappresentazione dei dati statistici. La raccolta ed elaborazione dei dati viene facilitata mediante l’utilizzo di codici.
In particolare si utilizzano opportuni codici per:
— le modalità delle variabili;
— identificare il/i questionario/i (progressivi);
— identificare la mancata informazione, il rifiuto di rispondere ecc.,
allo scopo di renderne più agevole la valorizzazione nei questionari.
9
1. Introduzione al metodo statistico
— scala nominale; in questo tipo di scala il carattere, che è sempre
qualitativo, si esprime secondo delle griglie di uso comune. Un
esempio è il colore degli occhi: azzurro, marrone, verde, nero ecc.;
— scala ordinale; in questo caso il carattere è qualitativo ma le sue
modalità sono suscettibili di essere poste in ordine (crescente o
decrescente); ad esempio il titolo di studio: licenza elementare,
licenza media, laurea;
— scala ad intervalli; in tal caso il carattere è quantitativo ma consente solo confronti per differenza tra le modalità espresse. Come
esempio si può citare la temperatura. Infatti ha senso parlare solo
di differenze di temperatura ma non, ad esempio, di rapporti tra i
numeri che le esprimono.
— scala di rapporti; il carattere è quantitativo e sono permesse tutte
le operazioni aritmetiche, incluso il rapporto, tra le modalità con
cui viene espresso; ad esempio peso, altezza, reddito ecc.
Il campione. Quando l’universo statistico non può essere studiato
completamente si ricorre ad un campione che sia in grado di fornire
una rappresentazione di un insieme più vasto (sottoinsieme di una
«popolazione» statistica). Per poter effettuare in modo efficiente la selezione dei dati oggetto del campione occorre tener conto di alcune
caratteristiche che esso deve possedere, sia di tipo qualitativo (rappresentatività dell’intera popolazione, località, temporalità ecc.) che quantitativo (numerosità del campione). Infine, la pianificazione della raccolta dei dati deve tener presente fattori economici sia di tempo che di
spesa, che determinano oggettivamente la confidenza delle analisi statistiche effettuate successivamente all’elaborazione dei dati stessi.
Le frequenze. Si definisce frequenza assoluta il numero di volte che
una certa modalità si manifesta nella popolazione di riferimento. La
distribuzione di frequenze nelle varie modalità descrive come il fenomeno in esame si manifesta nella popolazione o nel campione (di
solito indicata con N).
Parte Prima: Elementi di statistica per la ricerca sociale
Altre frequenze usate in statistica sono:
— frequenza relativa, definita come rapporto tra la frequenza assoluta di ciascuna modalità ed il numero di elementi costituenti la
popolazione statistica;
— frequenza percentuale, assoluta o relativa, che esprime in termini percentuali rispettivamente la frequenza assoluta e la frequenza
relativa di ciascuna modalità osservata;
— frequenza cumulata: può essere definita solo per caratteri di
tipo quantitativo oppure per caratteri qualitativi ordinabili;
per ogni modalità del carattere, essa si calcola sommando alla frequenza assoluta della modalità in esame, le frequenze assolute di
tutte le modalità precedenti, già ordinate in senso crescente.
La successione delle frequenze che corrispondono alle modalità di
un carattere qualitativo viene chiamata serie statistica. La distribuzione di caratteri di tipo quantitativo viene invece chiamata seriazione.
Nel caso di caratteri quantitativi continui, le frequenze si riferiscono
non ad una modalità espressa da un numero ma ad intervalli di valo10
ri, ognuno dei quali include l’infinità dei possibili valori corrispondenti
ai numeri reali compresi in ciascun intervallo (almeno virtualmente).
Ad esempio, la variabile «peso di un individuo» estrapolato dalla classe
50-60 kg comprende uno qualsiasi dei numeri reali esistenti tra 50 e
60. In questo caso, si procede ad un raggruppamento in classi corrispondenti agli intervalli di valori prescelti.
Ciascuna classe ha:
— un limite inferiore corrispondente al valore più piccolo che può
effettivamente appartenere alla classe;
— un limite superiore corrispondente al valore più grande che può
effettivamente appartenere alla classe;
— un valore centrale corrispondente al valore che è esattamente al
centro tra il limite superiore e quello inferiore.
Le tecniche di rappresentazione dei dati raccolti fanno uso principalmente di tabelle e di grafici.
Le due tecniche non sono necessariamente alternative; la prima
privilegia l’esposizione numerica in forma sintetica, e la seconda la
prospettazione visiva in forma d’immagine, meno accurata ma più
immediata rispetto alle differenze tra i dati.
Le tabelle più usate sono le cosiddette tabelle di frequenza. Queste
elencano le modalità (eventualmente raggruppate in classi o categorie
di valori) insieme alle frequenze assolute (numerosità degli elementi
per ciascuna modalità) e alle frequenze relative, ricavate dalle frequenze assolute divise per il totale delle osservazioni («N», che costituisce la popolazione statistica). I grafici sono, peraltro, molto utilizzati
nei metodi di ricerca nel campo delle scienze sociali, dove l’effetto
qualitativo visivo fornisce indicazioni efficaci, vista la numerosità delle
osservazioni, evitando spesso il ricorso a rappresentazioni numeriche,
la cui elaborazione è svolta, in generale, da comuni programmi standard per personal computer.
11
1. Introduzione al metodo statistico
3) La rappresentazione dei dati: le tabelle e i grafici
Esempio di tabella statistica semplice
Voto
(modalità)
Allievi
(frequenza)
4
5
6
7
8
3
5
8
5
3
Nella prima colonna si pone la variabile osservata (in questo caso
voto) nelle sue modalità (le righe della tabella), mentre nella seconda
colonna si pone la frequenza assoluta con cui ciascuna modalità è
stata rilevata. Talvolta nella seconda colonna di una tabella statistica
viene riportata direttamente la frequenza relativa o, in taluni casi,
quando queste sono molto piccole e impongono l’uso dei decimali,
si presenta direttamente nella seconda colonna la frequenza relativa
percentuale.
Parte Prima: Elementi di statistica per la ricerca sociale
Esempio di tabella statistica con esposizione di vari tipi di frequenze rilevate
Voti
Allievi
(frequenza)
Frequenza
relativa
Frequenza
relativa %
4
5
6
7
8
2
4
8
5
3
0,09
0,18
0,36
0,23
0,14
9
18
36
23
14
Totale
22
1
100
La somma delle frequenze relative è sempre uguale a 1, mentre la
somma delle frequenze relative percentuali è sempre uguale a 100.
12
Esempio di tabella con raggruppamento in classi della variabile
Variabile statistica
«classi di età»
Frequenza
«numero di operai»
20 - 30
31 - 40
41 - 50
51 - 60
220
185
120
25
Particolarmente efficace risulta la rappresentazione tabellare quando occorre mettere a confronto i risultati di due indagini statistiche
sullo stesso carattere eseguite in tempi o luoghi diversi oppure, come
nell’esempio seguente, su campioni diversi:
Voti
1° A
Allievi
(frequenza)
Frequenza
relativa
Frequenza
relativa %
4
5
6
7
8
2
4
8
5
3
0,09
0,18
0,36
0,23
0,14
9
18
36
23
14
Totale
22
1
100
Voti
1° B
Allievi
(frequenza)
Frequenza
relativa
Frequenza
relativa %
4
5
6
7
8
4
5
9
5
4
0,15
0,19
0,33
0,18
0,15
15
19
33
18
15
Totale
27
1
100
1. Introduzione al metodo statistico
Confronto tra distribuzioni
13
Naturalmente il confronto, nel caso di popolazioni statistiche di
numerosità diverse, è possibile solo attraverso le frequenze relative
(semplici o percentuali).
I grafici o diagrammi. Spesso in ambito statistico si fa uso di grafici
o diagrammi. Questi possono essere di vario tipo e, in generale, offrono una percezione immediata della distribuzione di frequenze rappresentata. Naturalmente essi vengono presentati sempre a partire da una
rappresentazione tabellare, anche se questa, per comodità, talvolta
non viene mostrata.
Rappresenteremo con degli esempi i seguenti tipi di grafici:
—
—
—
—
—
—
a barre orizzontali o verticali;
a torta;
a pile;
a bastoncelli;
istogrammi;
cartogrammi.
I diagrammi a barre sono particolarmente utili quando si devono
esprimere frequenze negative, ottenute per differenze con dati precedenti il cui risultato è appunto negativo, come nell’esempio che segue.
Parte Prima: Elementi di statistica per la ricerca sociale
Esempio di rappresentazione grafica di una tabella mediante un diagramma a barre
Tabella 1
Figura 1
Zona geografica
Italiani
Stranieri
Nord - ovest
1,1
–7,6
Nord - est
–1,0
–1,6
Centro
–2,9
5,9
Italiani
Stranieri
Sud e isole
6,5
–16,1
10
5
Centro
Nord-ovest
0
-5
-10
Zone
Nord-est
Sud
e isole
-15
-20
Percentuali
Arrivi (espressi sotto forma di variazioni percentuali rispetto allo stesso periodo dell’anno precedente)
negli esercizi alberghieri per ripartizione geografica, durante il periodo di ferragosto 2001 (Fonte : ISTAT).
14
Nel caso di distribuzioni di frequenze relative a variabili qualitative
(serie sconnesse o ordinate), si fa spesso ricorso a una rappresentazione grafica con diagrammi distanziati, oppure ad un diagramma circolare, detto anche a torta, nel quale l’ampiezza dell’angolo al centro
relativo a ciascuna frequenza è proporzionale ad essa, come nell’esempio riportato qui sotto:
Tabella 2
Figura 2
Province
Superficie (kmq)
Avellino
2.792
Benevento
2.071
Caserta
2.639
Napoli
1.171
Salerno
4.922
Totale
13.595
2.792
4.922
Avellino
Benevento
Caserta
Napoli
Salerno
2.071
1.171
2.639
Superficie (in kmq) delle province della Campania.
Quando si devono rappresentare seriazioni, ovvero distribuzioni
quantitative di un carattere discreto, si preferisce usare un diagramma
del tipo a bastoncini la cui altezza è proporzionale alla frequenza,
come nell’esempio seguente:
Figura 3
Tabella 3
Redditi annui (in euro)
Operai
15.500
Impiegati
18.000
Quadri
23.500
Dirigenti
26.000
30.000
25.000
1. Introduzione al metodo statistico
Dipendenti
20.000
15.000
10.000
5.000
0
Operai
Impiegati
Quadri
Dirigenti
Distribuzione dei redditi medi annui lordi di 4 categorie di dipendenti di un’azienda.
15
Gli istogrammi sono dei grafici a forma di rettangoli, utilizzati in
molte rappresentazioni di funzioni nelle quali sulle ascisse sono posti
gli intervalli della variabile indipendente mentre i corrispondenti valori
assunti dalla variabile dipendente sono posti sull’asse delle ordinate.
Tuttavia, in statistica, gli istogrammi privilegiano un’interpretazione intuitiva immediata, secondo la quale l’area dei rettangoli del
grafico deve essere proporzionale alla frequenza (assoluta o relativa). Per ottenere ciò, si ricorre alla definizione di una grandezza, chiamata densità di frequenza, priva di significato fisico, ottenuta dividendo ciascuna frequenza assoluta per la relativa ampiezza di classe;
la densità viene normalmente posta sull’asse delle ordinate. Sull’asse
delle ascisse è rappresentata l’ampiezza delle classi. Gli istogrammi
vengono utilizzati, ovviamente, soltanto in presenza di raggruppamenti
in classi di variabili quantitative.
Esempio di un istogramma statistico
Tabella 4
Figura 4
densità
Parte Prima: Elementi di statistica per la ricerca sociale
Tempi
(ore)
Num.
pezzi
Densità=Num .
pezzi/tempi
15-20
6
1,2
20-25
12
2,4
25-30
16
3,2
30-35
10
2
35-45
6
4 3 2 1 -
0,6
15 20 25
30
35
45
Distribuzione dei tempi di funzionamento di 50 pezzi prodotti da una macchina.
16
Tempi (ore)
Infine, per serie di tipo territoriali, cioè per frequenze di una variabile osservata, su territori omogenei, si fa ricorso ai cosiddetti cartogrammi; nel caso seguente, viene presentato il cartogramma relativo
alla distribuzione del numero di italiani (distinti per regione) appartenenti a una data associazione culturale.
Tabella 5
Figura 5
Regioni
Iscritti
Piemonte
16
Lombardia
34
35 - 43
Veneto
43
25 - 34
Emilia Romagna
33
16 - 24
Toscana
42
Marche
32
Puglia
24
Campania
23
Sardegna
35
Altre regioni
0
Numero di iscritti:
0 - 15
1. Introduzione al metodo statistico
Le regioni in bianco sono quelle in cui il numero degli iscritti non supera i 15;
le regioni in nero sono quelle in cui il numero degli iscritti è compreso tra 35 e 43.
17
Test di verifica
1. Nel caso di distribuzioni di variabili qualitative, il grafico più efficace
per rappresentarle è:
❏
❏
❏
❏
❏
a)
b)
c)
d)
e)
Il cartogramma.
Il diagramma a bastoncini.
Il diagramma con rettangoli distanziati.
L’istogramma.
Tutti i grafici sopra indicati.
2. Individuare l’opzione esatta:
❏ a) Il colore degli occhi e l’età sono variabili di tipo qualitativo.
❏ b) Il colore degli occhi è una variabile qualitativa mentre l’età
è quantitativa.
❏ c) Il colore degli occhi è una variabile quantitativa mentre
l’età è qualitativa.
❏ d) Il colore degli occhi e l’età sono entrambe variabili di tipo
quantitativo.
❏ e) Tutte le risposte precedenti sono errate.
Parte Prima: Elementi di statistica per la ricerca sociale
3. Individuare la sequenza corretta delle fasi di un’indagine statistica:
❏
❏
❏
❏
a)
b)
c)
d)
Rilevazione, analisi, spoglio, rappresentazione dei dati.
Spoglio, rilevazione, analisi, rappresentazione dei dati.
Rilevazione dei dati, spoglio, rappresentazione, analisi dei dati.
Analisi dei dati, rappresentazione, spoglio, rilevazione dei
dati.
❏ e) Analisi dei dati, spoglio, rappresentazione, rilevazione dei
dati.
4. In una scala ordinale:
❏ a) Il carattere è sempre qualitativo.
❏ b) Il carattere è sempre quantitativo.
18
❏ c) Il carattere può essere qualitativo oppure quantitativo.
❏ d) Tutte le risposte precedenti sono errate.
❏ e) Tutte le risposte precedenti sono corrette.
5. Gli istogrammi vengono utilizzati:
❏ a) Per rappresentare variabili qualitative.
❏ b) Per rappresentare variabili quantitative a valori discreti.
❏ c) Per rappresentare variabili quantitative raggruppate in classi.
❏ d) Per rappresentare variabili di tipo territoriale.
❏ e) Tutti le risposte fornite sono corrette.
Soluzioni e commenti
1. Risposta corretta c). Il diagramma con rettangoli distanziati, unitamente a quello circolare, permette una visione immediata per serie
di tipo qualitativo. Il cartogramma viene utilizzato per serie di tipo
territoriale, il diagramma a bastoncini è molto utile per variabili
quantitative discrete mentre l’istogramma viene utilizzato per rappresentare variabili quantitative raggruppate in classi.
3. Risposta corretta c). Infatti si parte dalla rilevazione dei dati che
può essere svolta attraverso dei questionari/interviste; successivamente si procede allo spoglio che ne permette una migliore organizzazione da cui si ricava la rappresentazione più efficace per gli
stessi. Infine si procede all’analisi dei dati per ricavarne parametri
utili ad esprimere in modo sintetico le caratteristiche più salienti
della distribuzione analizzata.
19
1. Introduzione al metodo statistico
2. Risposta corretta b). Il colore degli occhi è una variabile qualitativa
poiché viene espresso con una descrizione (blu, neri ecc.) mentre
l’età è quantitativa poiché si esprime con numeri (20,30,40 ecc.).
4. Risposta corretta a). Infatti una scala si dice ordinale quando esprime un carattere qualitativo, le cui modalità possono essere messe
in ordine crescente o decrescente.
Parte Prima: Elementi di statistica per la ricerca sociale
5. Risposta corretta c). L’istogramma infatti fornisce una rappresentazione a forma di rettangoli in cui la base è rappresentata dall’ampiezza delle classi in cui viene suddivisa la variabile, necessariamente di tipo quantitativo.
20
2. La variabilità statistica e gli indici di calcolo
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
○
Di cosa parleremo
In questo capitolo tratteremo alcuni degli indici più utilizzati per sintetizzare efficacemente i risultati dell’indagine statistica; verranno poi descritti i
parametri utilizzati per la misura della variabilità statistica, definita come
l’attitudine di un fenomeno ad assumere le modalità della variabile osservata. In particolare, saranno trattati il significato e le formule connesse con i
più importanti parametri di variabilità utilizzati in statistica: lo scarto quadratico medio e la varianza.
1) Elementi di sintesi delle rilevazioni statistiche: gli indici di posizione, di
variabilità e di forma
In questo modo, sarà possibile confrontare tali risultati con distribuzioni di fenomeni analoghi osservati in condizioni diverse. Si distinguono, in particolare, gli indici di posizione che comprendono in
primo luogo le medie di calcolo, che tengono conto di tutti i valori di
una distribuzione statistica e le medie di posizione, che tengono conto
solo di alcuni valori. Le medie di calcolo sono quattro:
—
—
—
—
la
la
la
la
media
media
media
media
aritmetica;
geometrica;
quadratica;
armonica.
Le medie di posizione sono due e precisamente: la moda e la
mediana.
21
2. La variabilità statistica e gli indici di calcolo
Per poter interpretare in modo efficace i risultati statistici è necessario fornire degli indici sintetici che ne esprimano le caratteristiche
più significative in senso statistico.
La media aritmetica. Si definisce media aritmetica di più numeri quel
valore che, sostituito a ciascuno di essi, lascia invariata la loro somma.
Indicando con x1, x2, x3,….. xn i numeri dati, si ha:
x1 + x2 + x3+ ….. xn = M + M + M + .... M = nM da cui si ricava:
Σi xi
n
M è detta media aritmetica semplice.
M=
Nel caso in cui ciascuna modalità del carattere xi si presenti con
frequenza f i si otterrà la media aritmetica ponderata data da:
x f + x 2 f 2 + .....xn fn
M= 1 1
=
f1 + f 2 + .... fn
∑xf
∑ f
n
i i
i
n
i
i
Le frequenze sono i pesi con cui viene effettuata la media. Sostituendo alla sommatoria al denominatore il valore N (popolazione o
universo statistico), si avrà:
Parte Prima: Elementi di statistica per la ricerca sociale
M=
∑
n
i
xi fi
N
La media aritmetica ha senso solo per variabili quantitative. Nel
caso di frequenze unitarie si utilizzerà la media semplice, nel caso di
frequenze assolute diverse dall’unità, si utilizzerà la media ponderata.
Nel caso di raggruppamenti delle modalità in classi occorre determinare dapprima il valore centrale di ciascuna classe; successivamente si
calcola la media ponderata dalla formula:
∑
M=
n
i
xci fi
N
classe -iesima.
dove xci con si è indicato il valore centrale della
Scarto dalla media. Si definisce scarto di ogni valore xi dalla media,
la differenza tra tale valore e la media aritmetica semplice.
22
In formule:
scarto = Xi - M con i = 1,2,……n
Proprietà della media aritmetica. La media aritmetica semplice e
quella ponderata godono di alcune proprietà delle quali citiamo, senza dimostrazione, le seguenti:
a) la media aritmetica semplice è un valore compreso tra il più piccolo e il più grande dei valori osservati;
b) la somma algebrica di tutti gli scarti (positivi e negativi) è uguale a zero;
c) aggiungendo (o sottraendo) a tutti i valori xi la stessa quantità K, la
media aritmetica è incrementata (o ridotta) di tale quantità.
La media geometrica (ponderata). Viene definita come la radice ennesima del prodotto delle singole modalità elevate alle rispettive frequenze. In formule:
Mg =
n
x1 n 1 × x2 n 2 × x3 n 3 × x 4 n 4 × .....
×
x knk
dove le x sono le modalità della variabile (ovviamente di tipo quantitativo) e le n rappresentano le relative frequenze assolute.
La media geometrica si può anche scrivere in forma sintetica:
n
n
∏x
i
dove il simbolo
∏
indica il prodotto dei termini
i =1
i =1
xi da 1 a n.
La media quadratica (ponderata). La media quadratica viene definita
come radice quadrata della sommatoria dei quadrati delle modalità per le
relative frequenze, divisa per il numero delle osservazioni. In formule:
k
Mq =
∑X
2
i fi
i =1
N
23
2. La variabilità statistica e gli indici di calcolo
Mg = n
La media quadratica semplice si può calcolare nel caso in cui le
frequenze di tutte le modalità siano tutte uguali all’unità.
La media armonica (ponderata). La media armonica è definita come
numero totale delle osservazioni diviso la sommatoria del reciproco
delle singole modalità moltiplicate per le rispettive frequenze. La sua
formula è:
Mh =
N
N
=
f
1
1
1
f +
f + ....
f
Σik=1 i
X1 1 X2 2
Xk k
Xi
La media armonica trova un’utile applicazione quando tra le modalità si riscontra il valore (infinito) , in modo che il reciproco si
annulli. La media armonica semplice si può calcolare nel caso in cui le
frequenze di tutte le modalità siano tutte uguali all’unità.
Per una stessa distribuzione di frequenze si ha:
Mh < = Mg < = M
Parte Prima: Elementi di statistica per la ricerca sociale
2) Medie di posizione
La moda. La moda, detta anche valore normale o valore modale o
norma, è un valore caratteristico di una distribuzione di frequenze
definito come la modalità della variabile osservata a cui corrisponde la
massima frequenza.
Nel caso in cui i dati siano raggruppati in classi, per trovare la
classe modale occorre prima svolgere le seguenti considerazioni:
— se l’ampiezza della classe è uguale per tutte le modalità, si definisce
classe modale quella cui corrisponde la frequenza assoluta maggiore;
— se le classi hanno ampiezza diversa occorre dividere ciascuna frequenza per l’ampiezza della rispettiva classe, trovando la densità
della classe: in questo caso, la classe modale è quella cui corrisponde la densità maggiore.
24