Università degli Studi di Bari
- Dipartimento di Psicologia -
INTRODUZIONE ALLA METODOLOGIA
PER RICERCA IN
PSICOLOGIA DEL TURISMO
A cura della
Dott.ssa Edvige Zatton
MODULO 2
LA CODIFICA DEI DATI
Terminate le fasi di pianificazione/costruzione del
questionario e di somministrazione, il ricercatore
si trova spesso con una mole notevole di
informazioni che deve elaborare per poi poterle
interpretare.
LE FASI DI RICERCA
2
Pianificazione del
disegno di ricerca
1
Individuazione del
problema
5
Interpretazione e
comunicazione dei
risultati
3
Raccolta dei
dati/informazioni
4
Codifica ed analisi
dei dati
Bailey, 1994
LE FASI DI RICERCA
(1)
1) INDIVIDUAZIONE DEL PROBLEMA: scelta dell'oggetto
d'indagine (es.: caratteristiche socio-economiche/culturali dei
turisti che giungono presso un Servizio turistico, soddisfazione
dell'utente di un servizio, ecc...)
2) PIANIFICAZIONE DEL DISEGNO DI RICERCA:
definizione dei tempi, dei luoghi, degli strumenti di misura
da utilizzare, della numerosità del campione, nonché delle
sue caratteristiche.
LE FASI DI RICERCA
(2)
3) RACCOLTA DEI DATI/INFORMAZIONI: è la fase
di somministrazione degli strumenti di misura (quindi
anche del questionario)
4) CODIFICA come vedremo in seguito, è la fase di
sistematizzazione dei dati raccolti (nel caso dei
questionari, i dati sono le risposte agli item)
5) ANALISI DEI DATI è la fase di applicazione delle
procedure di analisi statistica per ricavare interpretazioni
dei dati raccolti
In questo modulo ci occuperemo
della
fase di codifica dei dati
....PERO' PRIMA INTEGRIAMO LA
TERMINOLOGIA TECNICA (1)
Unità di analisi: l’oggetto sociale studiato (es. famiglia,
turista, città, ecc...)
•
Popolazione di riferimento: è definita dalla localizzazione
nel tempo e nello spazio dell’unità di analisi (es. i turisti
che hanno frequentato un Servizio turistico). Il simbolo N
ne indica la numerosità.
•
Casi: gli esemplari dell’unità di analisi inclusi nella
ricerca (es. i soggetti sperimentali, i turisti intervistati)
•
Campione: l’insieme dei casi. Il simbolo n ne indica
la numerosità (o ampiezza).
•
....PERO' PRIMA INTEGRIAMO LA
TERMINOLOGIA TECNICA (2)
Costrutto: la caratteristica, dell'unità, che si intende
studiare (es.: la soddisfazione dell'unità “turista”).
•
Variabile manifesta: è il frutto delle procedure di
“definizione operativa”. Viene rilevata sui casi. Nel
questionario la variabile è l'item.
•
•
Modalità: sono gli stati della variabile.
Valori: i simboli assegnati alle modalità. In genere, ma
non necessariamente, sono numerici (es. maschio = 1;
femmina = 2).
•
Dati: le rilevazioni sulle persone che compongono il
campione (es.: le risposte agli item di un questionario).
•
TIPI DI VARIABILI (ITEM)
(2)
Continue (non limitate a valori o categorie
discrete) e discontinue (rientrano in categorie
discrete)
 Quantitative (variano in grandezza) e
 Qualitative (variano in genere)
– Alcune variabili considerate discontinue e
qualitative nel senso comune, sono continue e
quantitative per lo psicologo (es.
introversione/estroversione; normale/nevrotico;
mascolinità/femminilità)
TIPI DI VARIABILI
(1)
Variabili dicotomiche: le variabili (item) con 2
modalità di risposta.

Variabili politomiche: le variabili (item) con più di
2 modalità (compresi gli item tricotomici, a risp.
Multipla, le scale di atteggiamento).

Fisiche (es.: provenienza, n° figli, ecc...) e non
fisiche (soddisfazione, motivazione, aspettative,
ecc...)

TIPI DI VARIABILI (ITEM)
(2)
•
Nominali, ordinali, a intervalli equivalenti
e di rapporti
scale di misura
Le scale di misura
SCALA NOMINALE
SCALA NOMINALE
Rappresenta il livello più basso di misurazione
• Permette di classificare eventi e oggetti in categorie
• L’assegnazione di un numero alle categorie è
puramente convenzionale: gli oggetti/eventi
dello stesso tipo ottengono lo stesso valore
numerico, quelli di un altro tipo ottengono un
valore numerico differente.
• Operazioni possibili: confronti uguale/diverso tra
categorie
Esempi
La provenienza geografica è una
variabile misurata su...
La lunghezza dei capelli
(in cm) è una variabile
misurata su...
Scala Nominale
Scala Ordinale
Scala a Intervalli
Scala a Rapporti
Scala Nominale
Scala Ordinale
Scala a Intervalli
Scala a Rapporti
Esempi
Il titolo di studio (Licenza
Media, Elementare, ecc.)
è una variabile misurata
su…
Il punteggio totale in un
test, nel quale a ciascuna
risposta esatta si assegna 1
e a ciascuna risposta errata
0, è una variabile misurata
su …
Scala Nominale
Scala Ordinale
Scala a Intervalli
Scala a Rapporti
Scala Nominale
Scala Ordinale
Scala a Intervalli
Scala a Rapporti
Le scale di misura
SCALA ORDINALE
• Dispone oggetti ed eventi in sequenza a
seconda della loro grandezza o della loro
posizione in una graduatoria
• Fornisce solo l’ordine degli oggetti/eventi,
non la differenza fra essi.
• Operazioni ammesse:
– confornto uguale/diverso
– confronto maggiore/minore
Le scale di misura
SCALA DI RAPPORTI
• I rapporti fra i valori numerici hanno
significato
• Lo zero della scala è reale (corrisponde
all’assenza della variabile)
• Operazioni ammesse:
– uguale/diverso
– maggiore/minore
– Addizione, sottrazione, moltiplicazione,
divisione sui valori stessi
Le scale di misura
SCALA AD INTERVALLI EQUIVALENTI
• Le differenze fra i valori numerici hanno significato
(es.: è possibile dire che tra 10°C e 15°C ci sono
5°C di differenza)
• Lo zero della scala è arbitrario (es.: scala Celsius)
• Operazioni ammesse:
– confronto uguale/diverso
– confronto maggiore/minore
LA CODIFICA DEI DATI
È un processo di trasformazione dei dati grezzi
(ad esempio le risposte di un questionario) in una
tabella (matrice di dati) funzionale alla fase successiva
di applicazione di analisi statistiche per l'interpretazione dei dati stessi.
COSA SIGNIFICA CODIFICARE I DATI DI UN QUESTIONARIO?
Assegnare ad ogni soggetto/osservazione
(caso) un numero di identificazione (n.
questionario).
 Assegnare ad ogni soggetto (caso) un
valore(numerico
o
alfanumerico)
per
ciascuna delle n risposte alle n domande: ad
ogni domanda del questionario deve
corrispondere una colonna della matrice e ad
ogni livello della variabile un numero.
LE FASI DELLA PROCEDURA DI CODIFICA
1) Formulazione del tracciato-record
2) Formulazione del codebook
3) Inserimento dei dati raccolti (diversi
sistemi: Spss, Excel,
Access, Word, …)
MATRICE DI DATI
COS'E' UNA MATRICE DI DATI?
Si tratta di un insieme rettangolare di numeri,
dove in riga abbiamo i casi e in colonna le
variabili.
Infatti....
è anche detta matrice Casi per Variabili (CxV).
In ogni cella derivante dall’incrocio fra una riga e
una colonna abbiamo un dato, cioè il valore
assunto da una particolare variabile su un
particolare caso.
LA MATRICE DI DATI
VARIABILI
CASI
X1
X2 X3
X4 X5 ..... Xp
1
X11
X12
X13
X14
X15
.....
2
X21
X22
X23
X24
X25
.......
3
……..
4
5
6
...
n
Xnp
X1p.
IN SOSTANZA ...
Si stratta di uno strumento di organizzazione
dei dati empirici grezzi (raccolti con la
somministrazione dello strumento di misura)
che precede l'analisi statistica dei dati stessi.
NORME DI CODIFICA
 Ogni colonna deve avere un nome (etichetta) diverso
dalle altre
 Dare nomi brevi: es: prov, fam, sodd_amb....
 Costruire e conservare un codice: un
questionario con indicate a fianco delle domande
stringhe usate e i valori numerici.
COME CREARE LA MATRICE DI DATI?
Il processo di codifica vero e proprio consta di due azioni
fondamentali:
 LA FORMULAZIONE DEL TRACCIATO-RECORD
 LA FORMULAZIONE DEL CODEBOOK
COS'E' IL TRACCIATO-RECORD?
Il tracciato-record: specifica la posizione di
ogni variabile nella riga della matrice (es.
variabile Genere nella colonna 4
2)
genere
Titolo di studio
età
n° caso
1
2
3
4
5
6
7
8
9
PREPARAZIONE DEL TRACCIATO-RECORD
La prima posizione del record è occupata sempre dal codice
identificativo del caso (persona)
Solitamente si decide di inserire per primi i dati anagrafici delle
persone che costituiscono il campione
Poi viene deciso l'ordine con il quale inserire le altre variabili
N.B. Su tutti i casi devono essere rilevate le
stesse informazioni (variabili)
Il codice o codebook: contiene le regole
di assegnazione di un valore numerico
(es. maschio = 1; femmina = 2) ad ogni
modalità dell'item.
IN COSA CONSISTE IL CODEBOOK?
 Costruzione dello schema di codifica dei dati (norme
di codifica) esplicito e chiaro (utilizzabile senza
ambiguità), riportarlo per iscritto e conservarne una copia.
 Assegnare un codice molto diverso dagli altri per i dati
mancanti (es: 999, 99).
 Quale schema utilizzare per le domande aperte e per gli
“altro” (codifica e accordo tra giudici)
 Quali item/affermazioni hanno un valore contrario e devono
quindi essere “rovesciati”
 Come assegnare i punteggi (punteggi alti = presenza
dell’attributo in questione)
CODIFICA DELLE DOMANDE APERTE
 Due giudici indipendenti leggono le risposte fornite dai
soggetti che hanno compilato il questionario
 In modo autonomo raggruppano le risposte simili per
argomento e valenza (positivo/negativo)
categorie di codifica per ciascuna domanda aperta
 Le categorie vengono numerate
 Si applicano le categorie per codificare le risposte di
ciascun sogg.
Esempio di codebook
ALCUNE INDICAZIONI
Per predisporre la matrice di dati in modo che sia di facile
gestione al momento dell’applicazione delle analisi statistiche.
Infatti…
È più pratico avere tutte le variabili quantitative in coda
alle variabili.
continua
Esempio questionario soddisfazione utente
Esempio questionario soddisfazione
utente
Record del Questionario La Vostra opinione è importante
1.
Codice
sogg
2.
3.
item 1
Stato prove
famigli nienza
a
item 2
item 3
item 4
….
Item 22
ESEMPIO CODEBOOK del Questionario
La Vostra opinione è importante!
continua
ESEMPIO CODEBOOK
Per la domanda aperta (ultima del questionario)
dovranno essere formulate le classi di risposta,
verranno numerate e verranno inserite nel codebook
LA NUMERAZIONE DEI QUESTIONARI
Il passaggio successivo alla formulazione del tracciatorecord e del codebook è la numerazione progressiva dei
questionari compilati (es. dagli utenti), in modo che ad
ogni persona corrisponda un codice identificativo (01,
02, 03...).
L'INSERIMENTO DEI DATI IN UN
FILE EXCEL
IMPOSTIAMO IL FILE DATI DEL
QUESTIONARIO
“LA VOSTRA OPINIONE E' IMPORTANTE”
COME INSERIRE I DATI? (1)
•
Aprire un file di Excel e lavorare solo sul foglio 1.
Selezionare le colonne in cui inserire i dati e
impostare il formato “Testo”
•
Inserire i nomi delle variabili (item) nella celle
della prima riga. Prendere i nomi dal codebook.
•
Scrivere un nome (item) per ogni cella, seguendo
l'ordine predefinito nel codebook.
•
In definitiva, si avrà una variabile per ogni
colonna del foglio di lavoro.
•
INSERIRE I NOMI DELLE VARIABILI (definite nel codebook)
N.B. Per motivi pratici sono state inserite solo le prime 12 variabili del questionario
COME INSERIRE I DATI? (2)
Inserire nella prima colonna sotto la voce “sogg” i codici
attribuiti ai questionari.
Per facilitare l’operazione di inserimento dei codici è possibile usare
l’opzione “trascinamento” di Excel:
Inserire due numeri progressivi in due celle successive (di una colonna)
Evidenziare le due celle
Posizionarsi con il mouse sull’angolo in basso a destra dell’area selezionata
Quando compare la crocetta “+” all’angolo in basso a destra
“Cliccare” con il mouse e trascinare in basso.
A questo punto tutte le celle successive verranno numerate in ordine
crescente.
INSERIMENTO DEI CODICI
Operazione di trascinamento
COME INSERIRE I DATI? (3)
Inserire i dati raccolti con i questionari.
In ogni colonna verranno riportati i codici relativi
alla risposta fornita da ciascuna persona.
INSERIMENTO DEI DATI RELATIVI ALLE VARIABILI