Università degli Studi di Bari - Dipartimento di Psicologia - INTRODUZIONE ALLA METODOLOGIA PER RICERCA IN PSICOLOGIA DEL TURISMO A cura della Dott.ssa Edvige Zatton MODULO 2 LA CODIFICA DEI DATI Terminate le fasi di pianificazione/costruzione del questionario e di somministrazione, il ricercatore si trova spesso con una mole notevole di informazioni che deve elaborare per poi poterle interpretare. LE FASI DI RICERCA 2 Pianificazione del disegno di ricerca 1 Individuazione del problema 5 Interpretazione e comunicazione dei risultati 3 Raccolta dei dati/informazioni 4 Codifica ed analisi dei dati Bailey, 1994 LE FASI DI RICERCA (1) 1) INDIVIDUAZIONE DEL PROBLEMA: scelta dell'oggetto d'indagine (es.: caratteristiche socio-economiche/culturali dei turisti che giungono presso un Servizio turistico, soddisfazione dell'utente di un servizio, ecc...) 2) PIANIFICAZIONE DEL DISEGNO DI RICERCA: definizione dei tempi, dei luoghi, degli strumenti di misura da utilizzare, della numerosità del campione, nonché delle sue caratteristiche. LE FASI DI RICERCA (2) 3) RACCOLTA DEI DATI/INFORMAZIONI: è la fase di somministrazione degli strumenti di misura (quindi anche del questionario) 4) CODIFICA come vedremo in seguito, è la fase di sistematizzazione dei dati raccolti (nel caso dei questionari, i dati sono le risposte agli item) 5) ANALISI DEI DATI è la fase di applicazione delle procedure di analisi statistica per ricavare interpretazioni dei dati raccolti In questo modulo ci occuperemo della fase di codifica dei dati ....PERO' PRIMA INTEGRIAMO LA TERMINOLOGIA TECNICA (1) Unità di analisi: l’oggetto sociale studiato (es. famiglia, turista, città, ecc...) • Popolazione di riferimento: è definita dalla localizzazione nel tempo e nello spazio dell’unità di analisi (es. i turisti che hanno frequentato un Servizio turistico). Il simbolo N ne indica la numerosità. • Casi: gli esemplari dell’unità di analisi inclusi nella ricerca (es. i soggetti sperimentali, i turisti intervistati) • Campione: l’insieme dei casi. Il simbolo n ne indica la numerosità (o ampiezza). • ....PERO' PRIMA INTEGRIAMO LA TERMINOLOGIA TECNICA (2) Costrutto: la caratteristica, dell'unità, che si intende studiare (es.: la soddisfazione dell'unità “turista”). • Variabile manifesta: è il frutto delle procedure di “definizione operativa”. Viene rilevata sui casi. Nel questionario la variabile è l'item. • • Modalità: sono gli stati della variabile. Valori: i simboli assegnati alle modalità. In genere, ma non necessariamente, sono numerici (es. maschio = 1; femmina = 2). • Dati: le rilevazioni sulle persone che compongono il campione (es.: le risposte agli item di un questionario). • TIPI DI VARIABILI (ITEM) (2) Continue (non limitate a valori o categorie discrete) e discontinue (rientrano in categorie discrete) Quantitative (variano in grandezza) e Qualitative (variano in genere) – Alcune variabili considerate discontinue e qualitative nel senso comune, sono continue e quantitative per lo psicologo (es. introversione/estroversione; normale/nevrotico; mascolinità/femminilità) TIPI DI VARIABILI (1) Variabili dicotomiche: le variabili (item) con 2 modalità di risposta. Variabili politomiche: le variabili (item) con più di 2 modalità (compresi gli item tricotomici, a risp. Multipla, le scale di atteggiamento). Fisiche (es.: provenienza, n° figli, ecc...) e non fisiche (soddisfazione, motivazione, aspettative, ecc...) TIPI DI VARIABILI (ITEM) (2) • Nominali, ordinali, a intervalli equivalenti e di rapporti scale di misura Le scale di misura SCALA NOMINALE SCALA NOMINALE Rappresenta il livello più basso di misurazione • Permette di classificare eventi e oggetti in categorie • L’assegnazione di un numero alle categorie è puramente convenzionale: gli oggetti/eventi dello stesso tipo ottengono lo stesso valore numerico, quelli di un altro tipo ottengono un valore numerico differente. • Operazioni possibili: confronti uguale/diverso tra categorie Esempi La provenienza geografica è una variabile misurata su... La lunghezza dei capelli (in cm) è una variabile misurata su... Scala Nominale Scala Ordinale Scala a Intervalli Scala a Rapporti Scala Nominale Scala Ordinale Scala a Intervalli Scala a Rapporti Esempi Il titolo di studio (Licenza Media, Elementare, ecc.) è una variabile misurata su… Il punteggio totale in un test, nel quale a ciascuna risposta esatta si assegna 1 e a ciascuna risposta errata 0, è una variabile misurata su … Scala Nominale Scala Ordinale Scala a Intervalli Scala a Rapporti Scala Nominale Scala Ordinale Scala a Intervalli Scala a Rapporti Le scale di misura SCALA ORDINALE • Dispone oggetti ed eventi in sequenza a seconda della loro grandezza o della loro posizione in una graduatoria • Fornisce solo l’ordine degli oggetti/eventi, non la differenza fra essi. • Operazioni ammesse: – confornto uguale/diverso – confronto maggiore/minore Le scale di misura SCALA DI RAPPORTI • I rapporti fra i valori numerici hanno significato • Lo zero della scala è reale (corrisponde all’assenza della variabile) • Operazioni ammesse: – uguale/diverso – maggiore/minore – Addizione, sottrazione, moltiplicazione, divisione sui valori stessi Le scale di misura SCALA AD INTERVALLI EQUIVALENTI • Le differenze fra i valori numerici hanno significato (es.: è possibile dire che tra 10°C e 15°C ci sono 5°C di differenza) • Lo zero della scala è arbitrario (es.: scala Celsius) • Operazioni ammesse: – confronto uguale/diverso – confronto maggiore/minore LA CODIFICA DEI DATI È un processo di trasformazione dei dati grezzi (ad esempio le risposte di un questionario) in una tabella (matrice di dati) funzionale alla fase successiva di applicazione di analisi statistiche per l'interpretazione dei dati stessi. COSA SIGNIFICA CODIFICARE I DATI DI UN QUESTIONARIO? Assegnare ad ogni soggetto/osservazione (caso) un numero di identificazione (n. questionario). Assegnare ad ogni soggetto (caso) un valore(numerico o alfanumerico) per ciascuna delle n risposte alle n domande: ad ogni domanda del questionario deve corrispondere una colonna della matrice e ad ogni livello della variabile un numero. LE FASI DELLA PROCEDURA DI CODIFICA 1) Formulazione del tracciato-record 2) Formulazione del codebook 3) Inserimento dei dati raccolti (diversi sistemi: Spss, Excel, Access, Word, …) MATRICE DI DATI COS'E' UNA MATRICE DI DATI? Si tratta di un insieme rettangolare di numeri, dove in riga abbiamo i casi e in colonna le variabili. Infatti.... è anche detta matrice Casi per Variabili (CxV). In ogni cella derivante dall’incrocio fra una riga e una colonna abbiamo un dato, cioè il valore assunto da una particolare variabile su un particolare caso. LA MATRICE DI DATI VARIABILI CASI X1 X2 X3 X4 X5 ..... Xp 1 X11 X12 X13 X14 X15 ..... 2 X21 X22 X23 X24 X25 ....... 3 …….. 4 5 6 ... n Xnp X1p. IN SOSTANZA ... Si stratta di uno strumento di organizzazione dei dati empirici grezzi (raccolti con la somministrazione dello strumento di misura) che precede l'analisi statistica dei dati stessi. NORME DI CODIFICA Ogni colonna deve avere un nome (etichetta) diverso dalle altre Dare nomi brevi: es: prov, fam, sodd_amb.... Costruire e conservare un codice: un questionario con indicate a fianco delle domande stringhe usate e i valori numerici. COME CREARE LA MATRICE DI DATI? Il processo di codifica vero e proprio consta di due azioni fondamentali: LA FORMULAZIONE DEL TRACCIATO-RECORD LA FORMULAZIONE DEL CODEBOOK COS'E' IL TRACCIATO-RECORD? Il tracciato-record: specifica la posizione di ogni variabile nella riga della matrice (es. variabile Genere nella colonna 4 2) genere Titolo di studio età n° caso 1 2 3 4 5 6 7 8 9 PREPARAZIONE DEL TRACCIATO-RECORD La prima posizione del record è occupata sempre dal codice identificativo del caso (persona) Solitamente si decide di inserire per primi i dati anagrafici delle persone che costituiscono il campione Poi viene deciso l'ordine con il quale inserire le altre variabili N.B. Su tutti i casi devono essere rilevate le stesse informazioni (variabili) Il codice o codebook: contiene le regole di assegnazione di un valore numerico (es. maschio = 1; femmina = 2) ad ogni modalità dell'item. IN COSA CONSISTE IL CODEBOOK? Costruzione dello schema di codifica dei dati (norme di codifica) esplicito e chiaro (utilizzabile senza ambiguità), riportarlo per iscritto e conservarne una copia. Assegnare un codice molto diverso dagli altri per i dati mancanti (es: 999, 99). Quale schema utilizzare per le domande aperte e per gli “altro” (codifica e accordo tra giudici) Quali item/affermazioni hanno un valore contrario e devono quindi essere “rovesciati” Come assegnare i punteggi (punteggi alti = presenza dell’attributo in questione) CODIFICA DELLE DOMANDE APERTE Due giudici indipendenti leggono le risposte fornite dai soggetti che hanno compilato il questionario In modo autonomo raggruppano le risposte simili per argomento e valenza (positivo/negativo) categorie di codifica per ciascuna domanda aperta Le categorie vengono numerate Si applicano le categorie per codificare le risposte di ciascun sogg. Esempio di codebook ALCUNE INDICAZIONI Per predisporre la matrice di dati in modo che sia di facile gestione al momento dell’applicazione delle analisi statistiche. Infatti… È più pratico avere tutte le variabili quantitative in coda alle variabili. continua Esempio questionario soddisfazione utente Esempio questionario soddisfazione utente Record del Questionario La Vostra opinione è importante 1. Codice sogg 2. 3. item 1 Stato prove famigli nienza a item 2 item 3 item 4 …. Item 22 ESEMPIO CODEBOOK del Questionario La Vostra opinione è importante! continua ESEMPIO CODEBOOK Per la domanda aperta (ultima del questionario) dovranno essere formulate le classi di risposta, verranno numerate e verranno inserite nel codebook LA NUMERAZIONE DEI QUESTIONARI Il passaggio successivo alla formulazione del tracciatorecord e del codebook è la numerazione progressiva dei questionari compilati (es. dagli utenti), in modo che ad ogni persona corrisponda un codice identificativo (01, 02, 03...). L'INSERIMENTO DEI DATI IN UN FILE EXCEL IMPOSTIAMO IL FILE DATI DEL QUESTIONARIO “LA VOSTRA OPINIONE E' IMPORTANTE” COME INSERIRE I DATI? (1) • Aprire un file di Excel e lavorare solo sul foglio 1. Selezionare le colonne in cui inserire i dati e impostare il formato “Testo” • Inserire i nomi delle variabili (item) nella celle della prima riga. Prendere i nomi dal codebook. • Scrivere un nome (item) per ogni cella, seguendo l'ordine predefinito nel codebook. • In definitiva, si avrà una variabile per ogni colonna del foglio di lavoro. • INSERIRE I NOMI DELLE VARIABILI (definite nel codebook) N.B. Per motivi pratici sono state inserite solo le prime 12 variabili del questionario COME INSERIRE I DATI? (2) Inserire nella prima colonna sotto la voce “sogg” i codici attribuiti ai questionari. Per facilitare l’operazione di inserimento dei codici è possibile usare l’opzione “trascinamento” di Excel: Inserire due numeri progressivi in due celle successive (di una colonna) Evidenziare le due celle Posizionarsi con il mouse sull’angolo in basso a destra dell’area selezionata Quando compare la crocetta “+” all’angolo in basso a destra “Cliccare” con il mouse e trascinare in basso. A questo punto tutte le celle successive verranno numerate in ordine crescente. INSERIMENTO DEI CODICI Operazione di trascinamento COME INSERIRE I DATI? (3) Inserire i dati raccolti con i questionari. In ogni colonna verranno riportati i codici relativi alla risposta fornita da ciascuna persona. INSERIMENTO DEI DATI RELATIVI ALLE VARIABILI