La tecniche di scaling multi-item

annuncio pubblicitario
LA TECNICA DELLE SCALE
"Una scala è un insieme coerente di elementi (items) che
sono considerati indicatori di un concetto più generale".
Elemento è il singolo componente (affermazione,
domanda, comportamento, risposta ad un test);
La scala è l’insieme degli elementi;
Il concetto sottostante viene denominato in
maniera diversa a seconda delle discipline: gli
psicologi parlano di “tratto” o “costrutto”
(latente); i sociologi usano frequentemente la
definizione di “varabile latente”
1
PROBLEMA ED OBIETTIVI
La tecnica delle scale affronta uno dei problemi
più difficili della ricerca sociale: la misurazione. In
particolare, spiega come si possano trasferire dal
piano teorico a quello empirico i concetti
complessi, come stati emotivi, tratti psicologici,
atteggiamenti politici, orientamenti di valore.
Misurare gli atteggiamenti
Attribuire un punteggio agli stimoli sulla base
delle risposte degli individui
Rilevare le proprietà non solo di individui, ma
anche di altre unità di analisi, quali l’efficienza
delle istituzioni, la coesione sociale, il potere,..
2
La misurazione (M)
La M è il processo attraverso cui si determina il valore o il
livello, sia qualitativo che quantitativo, di un particolare
attributo per una particolare unità d’analisi (Bailey,1985)
La M, nel senso più ampio, consiste nell’attribuzione di
numeri a oggetti o eventi seguendo determinate regole. Il
fatto che si possano assegnare dei numeri seguendo regole
differenti porta a differenti tipi di scala e differenti tipi di
misurazione (Stevens, 1946).
3
L’Attendibilità
L’attendibilità riguarda la “riproducibilità” del risultato
e segnala il grado con il quale una certa procedura di
traduzione di un concetto in variabile produce gli stessi
risultati in prove ripetute con lo stesso strumento di
rilevazione (stabilità) oppure con strumenti equivalenti
(equivalenza) (P. Corbetta, 1999).
Ad esempio, una bilancia è tanto più attendibile quanto più, replicando la pesata di
uno stesso oggetto, si ottiene un peso prossimo al primo, sia che la replica sia
effettuata con la stessa bilancia, sia con un’altra bilancia.
4
La validità
La validità fa riferimento al grado col quale una certa procedura di traduzione di un
concetto in una variabile effettivamente rileva il concetto che si intende rilevare.
ES: Che il quoziente intellettivo (QI) rilevi effettivamente l’intelligenza o il prodotto
interno lordo (PIL) misuri la ricchezza di una nazione sono interrogazioni che hanno a
che fare con la validità di queste definizioni operative.
5
Il livello di misurazione
(Stevens, 1946 e 1951; Siegel, 1956)
Esistono diversi livelli di misurazione
corrispondente alle diverse proprietà dei
numeri.
In genere, si distinguono in:

SCALE NOMINALI;

SCALE ORDINALI;

SCALE AD INTERVALLI;

SCALE A RAPPORTI.
6
Scale single Item
7
DOMANDA CHIUSA CON RISPOSTE ORDINATE:
i. Autonomia semantica: ciascuna risposta ha un suo
intrinseco significato;
ii. Parziale autonomia semantica: ho bisogno di sapere
quali alternative ho a disposizione;
iii. Scale auto-ancoranti: solo gli estremi sono dotati di
significato (termometro dei sentimenti).
8
Risposte semanticamente autonome
 Ogni risposta ha un suo significato compiuto
 Non è necessario conoscere il significato di tutte le alternative
 E' garantito solo l'ordine delle modalità, non è nota la istanza tra loro
l'intervistato sceglie una categoria per il suo contenuto,
indipendentemente dalla posizione nei confronti delle altre
ESEMPIO: Qual è il suo titolo di studio?
Nessun titolo
1
Licenza elementare 2 
Licenza media
3
Diploma
4
Laurea
5
9
Risposte a parziale autonomia semantica
Le diverse modalità di risposta non sono fra loro equidistanti.
Il caso più comune è quello delle risposte ordinate in “molto”,
“abbastanza”, “poco”, “per niente” e simili
ESEMPIO: Lei si interessa di politica?
Molto
4
Abbastanza 3 
Poco
2
Per niente
1
10
L’opzione centrale neutra
Quando la variabile è del tipo a “parziale autonomia
semantica” si pone il problema dell’opportunità di
offrire esplicitamente all’intervistato un’opzione
centrale neutra, oppure costringere l’intervistato a
schierarsi.
Gli studiosi non sono d’accordo se una formulazione sia
da preferire all’altra: l’offerta del punto neutrale può
favorire la fedeltà della registrazione nei casi in cui
effettivamente esistano delle posizioni intermedie, ma
può costituire una scappatoia a coloro che preferiscono
non esporre palesemente quello che pensano.
E’, invece, altamente raccomandabile offrire sempre
l’opportunità dell’opzione “non saprei” per evitare
“pseudo-opinioni”.
11
LE SCALE AUTO-ANCORANTI
 Solo le 2 categorie estreme sono dotate di significato
 All’interno di un continuum l’intervistato colloca la sua posizione
 L’unità di misura della scala è soggettiva
ESEMPIO 1: Qual è il suo livello di soddisfazione nei confronti dei seguenti
aspetti della vita?
insoddisfatto
soddisfatto
non saprei
situazione economica
rapporto con la moglie
rapporto con i figli
…
12
… LE SCALE AUTO-ANCORANTI
ESEMPIO 2: In politica di solito si parla di sinistra e destra. Aiutandosi con questo
cartellino, dove lei collocherebbe la sua posizione politica?
Sinistra
Destra
Non saprei
ESEMPIO 3: C’è chi sostiene che chi è disoccupato dovrebbe accettare qualsiasi
impiego disponibile o altrimenti perdere i sussidi di disoccupazione. C’è chi pensa
invece che chi è disoccupato dovrebbe avere il diritto di rifiutare un impiego che non
desidera. Aiutandosi con questo cartoncino, dove collocherebbe la sua posizione?
Accettare qualsiasi
posizione oppure
perdere i sussidi
1
Avere il diritto di
impiego che non
desidera
2
3
4
5
6
7
8
9
10
Non saprei
99
13
La tecniche di scaling multi-item
Le scale grafiche
Faces Pain Rating Scale
Fonte: Wong et al., 2001
FACCIA 0: è molto felice, poiché non ha alcun
dolore;
FACCIA 1: sente appena un minimo dolore;
FACCIA 2: sente un po’ di dolore;
FACCIA 3: sente dolore;
FACCIA 4: sente molto dolore;
FACCIA 5: sente un dolore insopportabile.
Ladder scale
La ladder scale è una scala auto-ancorante.
Questa tecnica è particolarmente utile se il
rispondente ha un basso livello di istruzione.
Scala a termometro
Le scale di Likert
• La tecnica fu ideata nel 1932 dallo psicologo
americano Rensis Likert, con lo scopo di
elaborare un nuovo strumento, più semplice
rispetto ad altri, per la misurazione di opinioni
e atteggiamenti.
Alpha di Cronbach
 k 2 
  j 
k  j 1 

1 2
k  1   sum 




k
st 
1 k  1
 k

pj qj 


 k  j 1 
KR20 
1 2
k  1   sum 




Il differenziale semantico
La tecnica del differenziale semantico è stata
proposta da Osgood, Suci, Tannenbaum
(1957). Lo scopo di questa scala è di riuscire a
rilevare il significato che assume per gli
individui alcuni termini (ad esempio, madre,
patria, guerra). Osgood C. E., Suci G. J.,
Tannenbaum P. H. (1957), The Measurement
of Meaning, University Of Illinois Press,
Urbana.
Esprima la sua opinione sull’insegnamento di “Statistica Sociale” sulla base della seguente domanda generale:
Quali impressioni hanno suscitato in me l’insegnamento di Statistica Sociale? Nelle risposte, ci si deve
concentrare su una coppia di aggettivi per volta, senza preoccuparsi del risultato globale, che sarà raggiunto
attraverso un’elaborazione. Per ciascuna coppia di aggettivi opposti, barri il valore che ritiene opportuno.
Differenziale semantico. Coppie di
attributi utilizzate da Osgood, Suci e
Tannenbaum (1957)
Profilo semantico dell’insegnamento
di statistica sociale
La Scala di Guttman
Guttman (1944) propone il suo scalogramma con l’obiettivo di
superare il problema dell’unidimensionalità della scala
presente nella tecnica di Likert. Questa scala nasce come una
sequenza di gradini, una successione di elementi con difficoltà
crescente, in modo che chi risponde affermativamente a una
determinata domanda, deve aver necessariamente fatto lo
stesso anche per tutte quelle che la precedono nella scala di
difficoltà. Per questo motivo si parla di scalogramma o scala
cumulativa (in contrasto con la denominazione scala additiva
o sommativa attribuita alla scala di Likert, dove gli elementi
sono tutti allo stesso livello). Tale cumulatività è considerata
un assunto dell’esistenza di un continuum sottostante del
quale sono indicatori gli elementi della scala.
La scala della distanza sociale di
Borgadus
DOM. Accetteresti un uomo di colore?:
1. Lo accetterei come parente stretto;
2.
3.
4.
5.
6.
7.
Lo accetterei nel mio club;
Lo accetterei come vicino di casa;
Lo accetterei come compagno di lavoro;
Lo accetterei come concittadino;
Lo accetterei come turista;
Lo escluderei dal mio paese.
La scala di Guttman
• Lei sarebbe disposto ad avere un nero come visitatore nel suo paese,
come vicino di casa, come amico personale, come sposo? (Corbetta, 2003:
234)
•
La riproducibilità e lo scalogramma di
Guttman
Individuazione degli errori di una scala
Guttman
Andiamo poi a riordinare colonne e righe della matrice stessa mettendo gli elementi della scala da
sinistra verso destra secondo il numero di risposte affermative ricevute e i casi dall’alto verso il
basso secondo il punteggio totale ricevuto .
Coefficiente di riproducibilità
n. errori
n. risposte esatte
Cr  1

n. totale risposte n. totale risposte
7 25
Cr 1   0,78
84 32
Cr ≥ 0,90
La Scala di Thurstone
La Scala di Thurstone (1928 presume che, per ogni item, esista
una capacità discriminatoria che varia da soggetto a
soggetto e postula un continuum psicologico latente sul
quale le frequenze rilevate per ogni item, si distribuiscono
secondo una distribuzione normale.
La scala è composta da 11 affermazioni selezionate da un
“monte frasi” costituito da oltre 100 frasi valutate da
“giudici”, cioè da persone selezionate rispetto alla loro
competenza. Ogni giudice deve ordinare le frasi,
assegnando valori che vanno da 0 a 10, in base al livello di
significatività delle frasi. Fatta questa prima valutazione, si
procede alla scelta delle 11 frasi: fra tutte le frasi che hanno
ottenuto lo stesso punteggio si scelgono quelle che hanno
ottenuto il maggior numero di consensi. Dopo di che si
selezionano le 11 migliori frasi.
Continuum scala di Thurstone:
l’atteggiamento è considerato come
continuum distribuito normalmente
L’atteggiamento verso i tossicodipendenti (Pavsic,
Pitrone, 2003: 57).
1. Ogni volta che sento che un giovane è morto per overdose provo una
sensazione di sollievo;
2. Non ho alcuna comprensione verso i tossicodipendenti;
3. Il tossicodipendente finisce sempre per diventare uno spacciatore;
4. Per colpa dei tossicodipendenti camminare per strada è diventato
pericoloso;
5. I nostri giovani si drogano perché sono stati abituati ad avere tutto;
6. Nessuno di noi può illudersi che il problema della tossicodipendenza non
lo tocchi;
7. Il giovane che si droga è un disperato;
8. Credo che il dramma dei drogati sia un vero affare per tanta gente
insospettabile;
9. Contro il tossicodipendente non servono misure repressive, ma una seria
prevenzione;
10. Un giovane drogato ha bisogno di rispetto e solidarietà;
11 Ogni volta che vedo un giovane distrutto dalla droga non posso fare altro
che sentirmi responsabile.
Svantaggi della tecnica di Thurstone
La scala di Thurstone presenta diversi punti critici,
tra cui: (I) gli individui che presentano pattern di
risposta diversi possono avere lo stesso punteggio
d’atteggiamento; (II) il metodo non consente di
cogliere
l’intensità
dell’accordo/disaccordo,
essendo basato sul affermazioni dicotomiche; (III)
la tecnica è costosa; (IV) I risultati sono
condizionati dall’operato dei giudici, che non
necessariamente riflettono la popolazione di
riferimento.
Le scale di Rasch
Le scale finora descritte presentano un approccio
deterministico, quindi, non sono ammesse deviazioni dal
modello “teorico” e, se queste si verificano, sono
considerate “errori”. Ogni intervistato dove rispondere in
un certo modo ad un quesito; al contrario, in un approccio
probabilistico, si assume che un individuo dà risposte ai
quesiti con un certo grado di probabilità, che varia tra zero
ed uno. L’individuo, che si trova in una certa posizione del
continuum della variabile latente (ad esempio, la qualità
della vita, la soddisfazione), ha una certa probabilità di dare
una data risposta, ma per casualità, circostanze o altro ha
anche una probabilità diversa da zero di dare una differente
risposta.
Nel modello probabilistico, si assume che esiste
una relazione tra la posizione sul continuum e la
probabilità di risposta ad una domanda della
scala. Tale relazione viene chiamata “traccia”. La
traccia è una curva che descrive la probabilità di
rispondere affermativamente ad un item, a
seconda della posizione dell’individuo sul
continuum. La funzione della traccia non è
lineare, ma assume la nota forma ad “s” della
curva logistica
La curva caratteristica di un item
Le scale di Rasch
La probabilità di risposta affermativa P dipende da due fattori:
posizione dell’individuo sul continuum () e la
“forza”/difficoltà dell’item ():
La probabilità di un individuo i di dare una risposta positiva è
pari a 0,5, se l’abilità del soggetto è uguale alla difficoltà
dell’item (i): se = bi → = 0,5; se δ > bi → Pi > 0,5; se δ < bi
→ Pi < 0,5.
La sequenza in termini di “difficoltà” degli elementi (bi) è
determinata dalle risposte affermative ricevute
dall’elemento → bi che è una variabile cardinale.
La probabilità di un evento è un valore compreso tra zero ed
uno.
I modelli di Rasch:
•
.
1. Modello dicotomico di Rasch: è il caso più semplice, ciascun item della batteria prevede
risposte dicotomiche ("vero o falso", "sì o no", "riuscita" o "non riuscita) e una sola risposta in
ogni coppia di item (Rasch, 1960).
2. Binomial trials: ogni item è composto da k prove indipendenti di tipo dicotomico, l'abilità di
un individuo in ogni item è legata alla somma del numero di volte in cui il soggetto ha avuto
successo. È il caso di prove psico-motorie o altro. Si contano, per ogni item, il numero di
successi x e il numero di fallimenti k-x conseguiti dall'individuo, nell'ipotesi che ciascun
risultato sia indipendente dal risultato di ogni altra prova (Andrich, 1978a).
3. Poisson counts: il numero k di prove è fissato a priori e la probabilità di ottenere un successo
su un item è molto piccola. Si pensi, ad esempio, ad esperimenti dove, in un dato tempo, si
deve rispondere a quesiti molto difficili (Writght e Masters, 1982: 52-54)
4. Rating scale: le modalità delle risposte sono misurate con item che chiedono al rispondente
di dare il grado di accordo o disaccordo su una serie di affermazioni. Gli individui che
rispondono ai quesiti hanno un’identica percezione delle categorie di risposta dei differenti
item (Andrich, 1978b).
5. Partial credit: anche in questo caso come nel rating scale, le modalità delle risposte sono
misurate con item che chiedono al rispondente di dare il grado di accordo o disaccordo su
una serie di affermazione. Gli individui, però, hanno una percezione differente delle categorie
di risposta dei singoli item (Masters, 1982).
6. Rank model: in questo caso, invece di assegnare un punteggio a ogni passo in corrispondenza
a ogni modalità di un item, si assegnano graduatorie di preferenze a ogni oggetto,
indipendentemente da quanto gli oggetti differiscono (Linacre, 1994).
•
Scarica