LA TECNICA DELLE SCALE "Una scala è un insieme coerente di elementi (items) che sono considerati indicatori di un concetto più generale". Elemento è il singolo componente (affermazione, domanda, comportamento, risposta ad un test); La scala è l’insieme degli elementi; Il concetto sottostante viene denominato in maniera diversa a seconda delle discipline: gli psicologi parlano di “tratto” o “costrutto” (latente); i sociologi usano frequentemente la definizione di “varabile latente” 1 PROBLEMA ED OBIETTIVI La tecnica delle scale affronta uno dei problemi più difficili della ricerca sociale: la misurazione. In particolare, spiega come si possano trasferire dal piano teorico a quello empirico i concetti complessi, come stati emotivi, tratti psicologici, atteggiamenti politici, orientamenti di valore. Misurare gli atteggiamenti Attribuire un punteggio agli stimoli sulla base delle risposte degli individui Rilevare le proprietà non solo di individui, ma anche di altre unità di analisi, quali l’efficienza delle istituzioni, la coesione sociale, il potere,.. 2 La misurazione (M) La M è il processo attraverso cui si determina il valore o il livello, sia qualitativo che quantitativo, di un particolare attributo per una particolare unità d’analisi (Bailey,1985) La M, nel senso più ampio, consiste nell’attribuzione di numeri a oggetti o eventi seguendo determinate regole. Il fatto che si possano assegnare dei numeri seguendo regole differenti porta a differenti tipi di scala e differenti tipi di misurazione (Stevens, 1946). 3 L’Attendibilità L’attendibilità riguarda la “riproducibilità” del risultato e segnala il grado con il quale una certa procedura di traduzione di un concetto in variabile produce gli stessi risultati in prove ripetute con lo stesso strumento di rilevazione (stabilità) oppure con strumenti equivalenti (equivalenza) (P. Corbetta, 1999). Ad esempio, una bilancia è tanto più attendibile quanto più, replicando la pesata di uno stesso oggetto, si ottiene un peso prossimo al primo, sia che la replica sia effettuata con la stessa bilancia, sia con un’altra bilancia. 4 La validità La validità fa riferimento al grado col quale una certa procedura di traduzione di un concetto in una variabile effettivamente rileva il concetto che si intende rilevare. ES: Che il quoziente intellettivo (QI) rilevi effettivamente l’intelligenza o il prodotto interno lordo (PIL) misuri la ricchezza di una nazione sono interrogazioni che hanno a che fare con la validità di queste definizioni operative. 5 Il livello di misurazione (Stevens, 1946 e 1951; Siegel, 1956) Esistono diversi livelli di misurazione corrispondente alle diverse proprietà dei numeri. In genere, si distinguono in: SCALE NOMINALI; SCALE ORDINALI; SCALE AD INTERVALLI; SCALE A RAPPORTI. 6 Scale single Item 7 DOMANDA CHIUSA CON RISPOSTE ORDINATE: i. Autonomia semantica: ciascuna risposta ha un suo intrinseco significato; ii. Parziale autonomia semantica: ho bisogno di sapere quali alternative ho a disposizione; iii. Scale auto-ancoranti: solo gli estremi sono dotati di significato (termometro dei sentimenti). 8 Risposte semanticamente autonome Ogni risposta ha un suo significato compiuto Non è necessario conoscere il significato di tutte le alternative E' garantito solo l'ordine delle modalità, non è nota la istanza tra loro l'intervistato sceglie una categoria per il suo contenuto, indipendentemente dalla posizione nei confronti delle altre ESEMPIO: Qual è il suo titolo di studio? Nessun titolo 1 Licenza elementare 2 Licenza media 3 Diploma 4 Laurea 5 9 Risposte a parziale autonomia semantica Le diverse modalità di risposta non sono fra loro equidistanti. Il caso più comune è quello delle risposte ordinate in “molto”, “abbastanza”, “poco”, “per niente” e simili ESEMPIO: Lei si interessa di politica? Molto 4 Abbastanza 3 Poco 2 Per niente 1 10 L’opzione centrale neutra Quando la variabile è del tipo a “parziale autonomia semantica” si pone il problema dell’opportunità di offrire esplicitamente all’intervistato un’opzione centrale neutra, oppure costringere l’intervistato a schierarsi. Gli studiosi non sono d’accordo se una formulazione sia da preferire all’altra: l’offerta del punto neutrale può favorire la fedeltà della registrazione nei casi in cui effettivamente esistano delle posizioni intermedie, ma può costituire una scappatoia a coloro che preferiscono non esporre palesemente quello che pensano. E’, invece, altamente raccomandabile offrire sempre l’opportunità dell’opzione “non saprei” per evitare “pseudo-opinioni”. 11 LE SCALE AUTO-ANCORANTI Solo le 2 categorie estreme sono dotate di significato All’interno di un continuum l’intervistato colloca la sua posizione L’unità di misura della scala è soggettiva ESEMPIO 1: Qual è il suo livello di soddisfazione nei confronti dei seguenti aspetti della vita? insoddisfatto soddisfatto non saprei situazione economica rapporto con la moglie rapporto con i figli … 12 … LE SCALE AUTO-ANCORANTI ESEMPIO 2: In politica di solito si parla di sinistra e destra. Aiutandosi con questo cartellino, dove lei collocherebbe la sua posizione politica? Sinistra Destra Non saprei ESEMPIO 3: C’è chi sostiene che chi è disoccupato dovrebbe accettare qualsiasi impiego disponibile o altrimenti perdere i sussidi di disoccupazione. C’è chi pensa invece che chi è disoccupato dovrebbe avere il diritto di rifiutare un impiego che non desidera. Aiutandosi con questo cartoncino, dove collocherebbe la sua posizione? Accettare qualsiasi posizione oppure perdere i sussidi 1 Avere il diritto di impiego che non desidera 2 3 4 5 6 7 8 9 10 Non saprei 99 13 La tecniche di scaling multi-item Le scale grafiche Faces Pain Rating Scale Fonte: Wong et al., 2001 FACCIA 0: è molto felice, poiché non ha alcun dolore; FACCIA 1: sente appena un minimo dolore; FACCIA 2: sente un po’ di dolore; FACCIA 3: sente dolore; FACCIA 4: sente molto dolore; FACCIA 5: sente un dolore insopportabile. Ladder scale La ladder scale è una scala auto-ancorante. Questa tecnica è particolarmente utile se il rispondente ha un basso livello di istruzione. Scala a termometro Le scale di Likert • La tecnica fu ideata nel 1932 dallo psicologo americano Rensis Likert, con lo scopo di elaborare un nuovo strumento, più semplice rispetto ad altri, per la misurazione di opinioni e atteggiamenti. Alpha di Cronbach k 2 j k j 1 1 2 k 1 sum k st 1 k 1 k pj qj k j 1 KR20 1 2 k 1 sum Il differenziale semantico La tecnica del differenziale semantico è stata proposta da Osgood, Suci, Tannenbaum (1957). Lo scopo di questa scala è di riuscire a rilevare il significato che assume per gli individui alcuni termini (ad esempio, madre, patria, guerra). Osgood C. E., Suci G. J., Tannenbaum P. H. (1957), The Measurement of Meaning, University Of Illinois Press, Urbana. Esprima la sua opinione sull’insegnamento di “Statistica Sociale” sulla base della seguente domanda generale: Quali impressioni hanno suscitato in me l’insegnamento di Statistica Sociale? Nelle risposte, ci si deve concentrare su una coppia di aggettivi per volta, senza preoccuparsi del risultato globale, che sarà raggiunto attraverso un’elaborazione. Per ciascuna coppia di aggettivi opposti, barri il valore che ritiene opportuno. Differenziale semantico. Coppie di attributi utilizzate da Osgood, Suci e Tannenbaum (1957) Profilo semantico dell’insegnamento di statistica sociale La Scala di Guttman Guttman (1944) propone il suo scalogramma con l’obiettivo di superare il problema dell’unidimensionalità della scala presente nella tecnica di Likert. Questa scala nasce come una sequenza di gradini, una successione di elementi con difficoltà crescente, in modo che chi risponde affermativamente a una determinata domanda, deve aver necessariamente fatto lo stesso anche per tutte quelle che la precedono nella scala di difficoltà. Per questo motivo si parla di scalogramma o scala cumulativa (in contrasto con la denominazione scala additiva o sommativa attribuita alla scala di Likert, dove gli elementi sono tutti allo stesso livello). Tale cumulatività è considerata un assunto dell’esistenza di un continuum sottostante del quale sono indicatori gli elementi della scala. La scala della distanza sociale di Borgadus DOM. Accetteresti un uomo di colore?: 1. Lo accetterei come parente stretto; 2. 3. 4. 5. 6. 7. Lo accetterei nel mio club; Lo accetterei come vicino di casa; Lo accetterei come compagno di lavoro; Lo accetterei come concittadino; Lo accetterei come turista; Lo escluderei dal mio paese. La scala di Guttman • Lei sarebbe disposto ad avere un nero come visitatore nel suo paese, come vicino di casa, come amico personale, come sposo? (Corbetta, 2003: 234) • La riproducibilità e lo scalogramma di Guttman Individuazione degli errori di una scala Guttman Andiamo poi a riordinare colonne e righe della matrice stessa mettendo gli elementi della scala da sinistra verso destra secondo il numero di risposte affermative ricevute e i casi dall’alto verso il basso secondo il punteggio totale ricevuto . Coefficiente di riproducibilità n. errori n. risposte esatte Cr 1 n. totale risposte n. totale risposte 7 25 Cr 1 0,78 84 32 Cr ≥ 0,90 La Scala di Thurstone La Scala di Thurstone (1928 presume che, per ogni item, esista una capacità discriminatoria che varia da soggetto a soggetto e postula un continuum psicologico latente sul quale le frequenze rilevate per ogni item, si distribuiscono secondo una distribuzione normale. La scala è composta da 11 affermazioni selezionate da un “monte frasi” costituito da oltre 100 frasi valutate da “giudici”, cioè da persone selezionate rispetto alla loro competenza. Ogni giudice deve ordinare le frasi, assegnando valori che vanno da 0 a 10, in base al livello di significatività delle frasi. Fatta questa prima valutazione, si procede alla scelta delle 11 frasi: fra tutte le frasi che hanno ottenuto lo stesso punteggio si scelgono quelle che hanno ottenuto il maggior numero di consensi. Dopo di che si selezionano le 11 migliori frasi. Continuum scala di Thurstone: l’atteggiamento è considerato come continuum distribuito normalmente L’atteggiamento verso i tossicodipendenti (Pavsic, Pitrone, 2003: 57). 1. Ogni volta che sento che un giovane è morto per overdose provo una sensazione di sollievo; 2. Non ho alcuna comprensione verso i tossicodipendenti; 3. Il tossicodipendente finisce sempre per diventare uno spacciatore; 4. Per colpa dei tossicodipendenti camminare per strada è diventato pericoloso; 5. I nostri giovani si drogano perché sono stati abituati ad avere tutto; 6. Nessuno di noi può illudersi che il problema della tossicodipendenza non lo tocchi; 7. Il giovane che si droga è un disperato; 8. Credo che il dramma dei drogati sia un vero affare per tanta gente insospettabile; 9. Contro il tossicodipendente non servono misure repressive, ma una seria prevenzione; 10. Un giovane drogato ha bisogno di rispetto e solidarietà; 11 Ogni volta che vedo un giovane distrutto dalla droga non posso fare altro che sentirmi responsabile. Svantaggi della tecnica di Thurstone La scala di Thurstone presenta diversi punti critici, tra cui: (I) gli individui che presentano pattern di risposta diversi possono avere lo stesso punteggio d’atteggiamento; (II) il metodo non consente di cogliere l’intensità dell’accordo/disaccordo, essendo basato sul affermazioni dicotomiche; (III) la tecnica è costosa; (IV) I risultati sono condizionati dall’operato dei giudici, che non necessariamente riflettono la popolazione di riferimento. Le scale di Rasch Le scale finora descritte presentano un approccio deterministico, quindi, non sono ammesse deviazioni dal modello “teorico” e, se queste si verificano, sono considerate “errori”. Ogni intervistato dove rispondere in un certo modo ad un quesito; al contrario, in un approccio probabilistico, si assume che un individuo dà risposte ai quesiti con un certo grado di probabilità, che varia tra zero ed uno. L’individuo, che si trova in una certa posizione del continuum della variabile latente (ad esempio, la qualità della vita, la soddisfazione), ha una certa probabilità di dare una data risposta, ma per casualità, circostanze o altro ha anche una probabilità diversa da zero di dare una differente risposta. Nel modello probabilistico, si assume che esiste una relazione tra la posizione sul continuum e la probabilità di risposta ad una domanda della scala. Tale relazione viene chiamata “traccia”. La traccia è una curva che descrive la probabilità di rispondere affermativamente ad un item, a seconda della posizione dell’individuo sul continuum. La funzione della traccia non è lineare, ma assume la nota forma ad “s” della curva logistica La curva caratteristica di un item Le scale di Rasch La probabilità di risposta affermativa P dipende da due fattori: posizione dell’individuo sul continuum () e la “forza”/difficoltà dell’item (): La probabilità di un individuo i di dare una risposta positiva è pari a 0,5, se l’abilità del soggetto è uguale alla difficoltà dell’item (i): se = bi → = 0,5; se δ > bi → Pi > 0,5; se δ < bi → Pi < 0,5. La sequenza in termini di “difficoltà” degli elementi (bi) è determinata dalle risposte affermative ricevute dall’elemento → bi che è una variabile cardinale. La probabilità di un evento è un valore compreso tra zero ed uno. I modelli di Rasch: • . 1. Modello dicotomico di Rasch: è il caso più semplice, ciascun item della batteria prevede risposte dicotomiche ("vero o falso", "sì o no", "riuscita" o "non riuscita) e una sola risposta in ogni coppia di item (Rasch, 1960). 2. Binomial trials: ogni item è composto da k prove indipendenti di tipo dicotomico, l'abilità di un individuo in ogni item è legata alla somma del numero di volte in cui il soggetto ha avuto successo. È il caso di prove psico-motorie o altro. Si contano, per ogni item, il numero di successi x e il numero di fallimenti k-x conseguiti dall'individuo, nell'ipotesi che ciascun risultato sia indipendente dal risultato di ogni altra prova (Andrich, 1978a). 3. Poisson counts: il numero k di prove è fissato a priori e la probabilità di ottenere un successo su un item è molto piccola. Si pensi, ad esempio, ad esperimenti dove, in un dato tempo, si deve rispondere a quesiti molto difficili (Writght e Masters, 1982: 52-54) 4. Rating scale: le modalità delle risposte sono misurate con item che chiedono al rispondente di dare il grado di accordo o disaccordo su una serie di affermazioni. Gli individui che rispondono ai quesiti hanno un’identica percezione delle categorie di risposta dei differenti item (Andrich, 1978b). 5. Partial credit: anche in questo caso come nel rating scale, le modalità delle risposte sono misurate con item che chiedono al rispondente di dare il grado di accordo o disaccordo su una serie di affermazione. Gli individui, però, hanno una percezione differente delle categorie di risposta dei singoli item (Masters, 1982). 6. Rank model: in questo caso, invece di assegnare un punteggio a ogni passo in corrispondenza a ogni modalità di un item, si assegnano graduatorie di preferenze a ogni oggetto, indipendentemente da quanto gli oggetti differiscono (Linacre, 1994). •