Un approccio statistico multidimensionale per la - UniFI

Convegno su
“LA VALUTAZIONE DEI SERVIZI ALLA PERSONA”
Firenze, 25-26 Febbraio 2000
UN APPROCCIO STATISTICO MULTIDIMENSIONALE
PER LA VALUTAZIONE DELLA PERFORMANCE DEI SERVIZI
DI PUBBLICA UTILITA':
I Corsi di Formazione
Prof. Luigi D’Ambra
Dipartimento di Matematica e Statistica
Università "Federico" di Napoli
LA QUALITÀ DEI SERVIZI
La valutazione della qualità di un servizio
 definire in maniera precisa che cosa si intende per qualità di
un servizio
 individuare un chiaro modello “interpretativo” di riferimento
 contesto
multidimensionale (più aspetti concomitanti
intervengono nella formazione di un giudizio da parte del
cliente)
 Questo al fine di definire una misura indiretta della Customer
Satisfaction
ASPETTI E DEFINIZIONI (Farnum, 1994; Montgomery, 1996):
In letteratura non vi è una definizione di Qualità generalmente accettata:
"La Qualità si identifica con la
conformità alle specifiche" by Crosby
"La Qualità come inversamente
proporzionale alla variabilità del
processo sottostante o come perdita
impartita alla società " by Taguchi
L’American Society for Quality ha costruito una definizione particolarmente interessante:
"Insieme delle caratteristiche e delle proprietà di un’entità che conferiscono ad essa la
capacità di soddisfare esigenze espresse e implicite”
 Performance (Will the product do the job?)
 Added features (Does it have features beyond the basic
performance characteristics?)
 Reliability/durability (Will it last long time?)
 Conformance (Was the product made exactly as its design
specified?)
 Serviceability (Is it easy to fix?)
 Design (Does it look better than the competition?)
 Reputation (Does the company have a history of attention to
quality?)

Il concetto di Qualità evolve con il passare degli anni la
non precisione dei contorni e delle caratteristiche della
qualità (Parasuraman ed altri, 1985).
 La Qualità è una
(Parasuraman 1991)
grandezza Multidimensionale
LA QUALITÀ NEI SERVIZI
 Eperience Goods
ed esperienze

Servizi

beni immateriali

prestazioni
la progettazione della standardizzazione è particolarmente
complicata.
Peculiarità dei servizi:
 immaterialità: il servizio erogato è un bene immateriale;
 eterogeneità: la standardizzazione varia con il produttore, il
cliente
 non immagazzinabilità: la produzione non è separabile dal
consumo;
 interattività: comportano un’interazione tra fornitore del
servizio e cliente/utente.
TIPI DI SERVIZI
Le caratteristiche sopra evidenziate sono comuni a tutti i
servizi.
Distinguamo quattro tipologie:
a) Servizi di interfaccia: servizi la cui erogazione
prevede un’interazione tra fornitore e cliente (es. servizi di
formazione);
b) Servizi di elaborazione: si fornisce un vero e
proprio prodotto (es. scrittura di software, programmi di
ricerca);
c) Servizi di disponibilità: messa a disposizione di
oggetti (es. noleggio di automobili);
d) Servizi di processo: dove si garantisce la
disponibilità di un bene attraverso il controllo di un processo (es.
erogazione di energia elettrica);
QUALITÀ DEL SERVIZIO
il giudizio dei clienti si basa essenzialmente sulla discrepanza
"gap", sia in direzione che in ampiezza, tra quello che essi
considerano dover essere il servizio offerto dalle imprese, le
loro aspettative e la loro percezione della performance
effettiva (Gronroos, 1994).
 Le aspettative vanno considerate come lo standard di
riferimento
discrepanza positiva  indice di un servizio che genera
soddisfazione (=buona qualità)
insoddisfazione (=cattiva qualità)  la performance fornita è
percepita ad un livello più basso rispetto alle aspettative iniziali
Soddisfazione del cliente
 le aspettative
 i desideri che risultano dalle
motivazioni personali dell’individuo.
La soddisfazione percepita : classica discrepanza tra attese e
percezioni.
La qualità intesa come la capacità di gestire in maniera
ottimale l’interazione con l’utente/cliente.
qualità deve essere una cultura diffusa in maniera capillare
presso tutto il personale dell’organizzazione
MODELLI A CONFRONTO
Paradigma della discrepanza  il modello SERVQUAL
(Parasuraman ed al., 1985, 1989, 1990, 1994)
strumenti: un questionario diviso in tre parti: nella prima e nella
terza ci sono 22 domande per la valutazione rispettiva di
aspettative e percezioni di alcuni indicatori, nella seconda viene
richiesto agli intervistati di dare un peso a ciascuna dimensione
indagata.
Le dimensioni sono:
 ASPETTI TANGIBILI: Aspetti di strutture fisiche,
personale, attrezzature, strumenti di comunicazione.
 AFFIDABILITÀ: Capacità di prestare il servizio promesso in
modo affidabile e preciso.
 CAPACITÀ DI RISPOSTA: Volontà di aiutare i clienti e di
fornire il servizio con prontezza.
 CAPACITÀ DI RASSICURAZIONE: Competenza e cortesia
dei dipendenti e loro capacità di ispirare fiducia e sicurezza.
 EMPATIA: Assistenza premurosa e individualizzata prestata
al cliente.
Queste "dimensioni" sono caratteristiche presenti in maniera
trasversale in tutti i tipi di servizi
Attraverso tecniche MCDA (Multiple Criteria Decision Aiding
Methods, Ostanello, 1985):
non si effettua alcuna scalarizzazione sui dati
si consente la valutazione della qualità in linea (attraverso carte
di controllo per attributi di tipo "p" che consentono di
monitorare l'andamento nel tempo del differenziale tra Qa e
Qp).
Le tecniche si basano sull’uso di quantificatori linguistici definiti
nell’ambito della Fuzzy Logic, particolarmente adatti
all’aggregazione di informazioni raccolte su scala verbale.
………………………………………………….
TABELLA: confronto di alcuni metodi per la valutazione della qualità del servizio (Ripreso da
Franceschini e Rossetto, 97)
Metodologie
Two-Way
Schvaneveldt
Enkawa
Miyakawa
(1991)
SERVPERF
Cronin
Taylor
(1992)
Normed
Quality
Teas
(1993)
Qualitometro
Franceschini
Rossetto
(1996)
I fattori
latenti di
valutazione:
aspetti
"oggettivi"
(attributi
della qualità) e
"soggettivi"
(livelli di
soddisfazione)
Si considerano
le
sole
"percezioni"
senza la
componente
delle
attese e senza i
pesi
dell’importanza
secondo la
formula:
Il problema
delle
attese ha a
distinguere tra
attesa
ideale I ed
attesa
realizzabile Ae
in
modo da
calcolare la
qualità del
servizio
secondo la
formula:
Si misurano le
attese e le
Percezioni in
momenti
separati.
Tecniche
MCDA.
Raccolta dati
Clienti di
Caratteristiche compagnie
del campione
telefoniche,
due
assicurazioni,
due
banche
Banche,
ristoranti,
lavanderie,
Supermercati
Due banche,
due
aziende di
controllo
antinquinament
o, due
lavanderie, due
fast
food
Tre grandi
catene di
supermercati
Utenti del
servizio
biblioteca del
Dipartimento
DISPEA
Numero di
enunciati
(attese più
percezioni)
22+22
Non esplicitato
22
10+10+10+10+10 8+8
Scale per le
risposte
Semantica
differenziale a
7 punti
Semantica a 5
punti
Semantica
differenziale
a 7 punti
Semantica
differenziale a
7
punti
Comparativa a 7
punti
Importanza
delle
dimensioni
Valutazione dei Non richiesto
pesi a
somma costante
Valutazione dei Valutazione dei
pesi a
pesi
somma costante a somma
costante
Comparativa a 7
punti
Fondamento
teorico alla
base del
metodo
SERVQUAL
Revisionato
Parasuraman
Zeithaml
Berry
(1991)
Teoria dei Gap:
differenza tra
percezioni ed
attese
mediata
dall’effetto
dei pesi
dall’importanza
assegnata ad
ogni
dimensione
secondo
la formula???
Modalità di
consegna del
questionario
Postale
Non precisato
Postale
Colloquio
Attese prima
della
fruizione del
servizio e
percezioni dopo
la
ricezione
Livello di
intrusione nei
confronti del
misurando
Alto
Medio
Alto
Alto
Basso
Effetto di
Idiosincrasia
Alto
Medio
Medio
Alto
Basso
Tipo di
pre-elaborazio
ne
dei dati
Scalarizzazione Scalarizzazione Scalarizzazione Scalarizzazione Senza
scalarizzazione
Analisi dei dati Analisi
fattoriale
seguita da
rotazione
obliqua
Analisi
fattoriale
Analisi
fattoriale
Seguita da
rotazione
Obliqua
Analisi
fattoriale
seguita da
rotazione
obliqua
Metodi di
MCDA e carte
di controllo di
tipo "p"
Affidabilità
(coefficiente
di
Cronbach)
Da 0.8 a 0.93
Non esplicitato
Da 0.63 a 0.98
Calcolati altri
coefficienti di
validità ed
affidabilità
Calcolo della
qualità
"globale" come
indicatore di
affidabilità
Numero delle
dimensioni
Cinque:
Cinque:
Cinque:
Cinque:
Cinque:
Aspetto,
affidabilità,
capacità di
risposta,
capacità di
rassicurazione,
empatia
Prestazione,
sicurezza,
completezza,
facilità di
utilizzo,
emotività/ambi
ente
Aspetto,
affidabilità,
capacità di
risposta,
capacità di
rassicurazione,
empatia
Aspetto,
affidabilità,
capacità di
risposta,
capacità di
rassicurazione,
empatia
Aspetto,
affidabilità,
capacità di
risposta,
capacità di
rassicurazione,
empatia
 L’applicazione operativa di qualsiasi modello concettuale, per
la valutazione della soddisfazione del cliente/utente, basato
esclusivamente sulla differenza fra punteggi è oggetto di un
ampio dibattito in letteratura principalmente per motivi
psicometrici, e specialmente quando tali discrepanze sono
utilizzate per analisi multivariate.
 Al fine di raggiungere un’alta capacità esplicativa,
bisognerebbe cogliere, oltre alla discrepanza, anche le
caratteristiche comuni e le relazioni tra le due tabelle per
vedere come la valutazione espressa dalla prima influenza
l'altra e viceversa.
Le scale di punteggio utilizzate nel SERVQUAL sono di tipo
“semantico differenziale” si tratta di scale che possono
ritenersi “solo ordinate” e tuttavia vengono ritenute scale ad
intervalli. Ciò a senso solo se “differenze numeriche uguali”
possono ritenersi tali “oggettivamente” (Zanella, Cerri 1999).
ALCUNI PROBLEMI NELLA VALUTAZIONE DELLA
QUALITA'DEI SERVIZI D'INTERFACCIA: RILEVAZIONE E
CODIFICA DEI DATI
1. la misura di alcune grandezze su un certo numero di oggetti (o
soggetti)  CAMPIONAMENTO CASUALE
2. l’introduzione di alcuni criteri di giudizio per la codifica delle
variabili. TRATTAMENTO DELLE VARIABILI ORDINALI.
 codifica numerica dei giudizi espressi sui questionari
 l’origine del sistema di riferimento differisce da
soggetto a soggetto
 la distanza dei punti successivi sulla scala differisce
da soggetto a soggetto
 la distanza dei punti successivi della scala potrebbe
non essere lineare per ogni soggetto
Omogeneità dei sistemi di riferimento??? L’aggregazione delle
misure impone, inoltre, il rispetto almeno dell’ipotesi di
omogeneità dei sistemi di riferimento.
3. ANALISI DI TABELLE MISTE DI DATI
4. INFORMAZIONI ESTERNE SULLE UNITÀ STATISTICHE
SOLUZIONI PROPOSTE
1. Modello Psicometrico di Thurstone (1925)
Trattamento variabili ordinali
2. Rasch Analysis (Rasch 1960): si ricavano punteggi
logit che permettono di superare i problemi di non
confrontabilità delle scale ordinali.
Approccio della Regressione monotona
Trattamento dati misti
Metodi Multidimensionali: l'Analisi
non lineare dei dati
Metodi Multidimensionali:
Analisi della Co-Inerzia
Analisi di tabelle totalmente sovrapponibili
L’APPROCCIO PSICOMETRICO DI THURSTONE
 Consideriamo un questionario definito da K variabili ordinali
X k (k  1,  , K ) con egual numero di categorie I (i  1,  , I ) di
temine generale x ki .
 Sia Pr( X ki  i)  p ki la probabilità che la variabile k sia uguale a i
Fk (i ) 
p
iS , j i
kj
è la probabilità che abbiamo almeno una delle
prime i categorie, con
S  1,, I .
 A ciascuna variabile categorica ordinata (i giudizi) X
corrisponde una variabile casuale latente di tipo normale Z
(“true” scale).
 Utilizziamo: Scala ad intervallo.
 A ciascun valore ordinato x ki corrisponde un valore z ki   i
tale che  i   i 1 k (i=1,..,I) definendo, per ciascuna
distribuzione
Z k , il quantile associato alla categoria xki  i
della variabile X k . Da cui le seguenti identità:
   k
 i
 k
Se
 (.)
i   k

  1 Fk (i )   ki
  Fk (i)
k
;

i(i=1,…I)
 1,  , I 
k(k=1,…K)
 1,  , K 
è la funzione cumulativa di una variabile normale
k
 2k
standardizzata allora ,
e
sono, rispettivamente, la
media e la varianza della variabile normale latente Z k .

 ki è il valore osservabile (reiterando le X osservazioni) non
superabile da una variabile casuale normale con probabilità
Fk (i) .
 Consideriamo la media di
*i  (  i   )   i
.
 ki rispetto a K, abbiamo che
  (1 / K )k 1 (1 / k )
K
 Se poniamo
(reciproco della media
armonica dei quadrati medi delle differenze della variabile
Z
latente k ),
valori di
*i
  (1 / K )k 1  k / k
K
e
i  (1 / k )k 1  ki
K
, otteniamo i
che sono compatibili con i “veri” valori latenti
 In tal modo, sostituiamo le originali variabili categoriche
ordinali con i valori
*i
definiti su una scala ad intervallo.
i .
L’APPROCCIO DELLA REGRESSIONE MONOTONA DI
KRUSKAL
Sia Y una variabile dipendente ordinale (convenzionalmente
rappresentata da un insieme di punteggi)
y1  ....  yn
e siano
ẑ1  ....  ẑ n
le trasformazioni delle variabili di risposta secondo una funzione
di trasformazione f(.), scelta in modo da rispettare
l’ordinamento iniziale.
Si pone
m
z j ()   g jss
s 1
g js sono valori numerici noti che descrivono i livelli dei fattori
esplicativi
s i coefficienti
Indichiamo con z j () il valore di media aritmetica
Si procede in modo iterativo a determinare il “direct stress”
(Kruskal 1965)
1/ 2

 n (ẑ z ()) 2
 

j
j

 
j 1
ˆ
S(f̂ *;*)  min  min f 
n
 
2


 (z j ()  z j ())  
j 1


 
essa rappresenta una misura descrittiva della bontà di
adattamento della trasformazione monotona f(.)
L’algoritmo di minimizzazione viene descritto in Kruskal (1964,
1965).
RASCH ANALYSIS (Rasch 1960)
Tecnica appartenente ai Latent Trait Models.
Trasformazione degli indicatori qualitativi in quantitativi,
definiti su numeri naturali o reali.
La scelta dei questionari è tale che gli indicatori utilizzati
sottendono un solo aspetto latente sulla base dell’abilità degli
individui, delle difficoltà delle prove, dei diversi livelli di
riuscita, (ad es. capacità motoria, capacità intellettiva dei
disabili) e secondariamente attraverso l’utilizzo di un modello
logistico che rende additive e quantitative le scale ordinali
attraverso cui sono espressi i risultati dei questionari
La Rasch Analysis consente di utilizzare i punteggi logit quali
misure oggettive, indipendenti dal campione di individui e dalla
tipologia del questionario, superando i problemi della non
confrontabilità delle valutazioni espresse su scale ordinali.
METODI STATISTICI MULTIDIMENSIONALI PER LA
VALUTAZIONE DELLA QUALITA DEI SERVIZI
 l'Analisi in Componenti Principali (ACP):
X(n,p) matrice di dati, relativa ad n unità statistiche e p
variabili,
Obiettivi: ridurre il numero delle p variabili iniziali a q<p
variabili non correlate di varianza massima e di importanza
decrescente. senza perdere molto dell'informazione statistica
 l'Analisi Canonica di Hotelling (e sue generalizzazioni)
risulta avere un grande interesse teorico
X(n,p) matrice di dati, relativa ad n unità statistiche e p
variabili,
Y(n,q) matrice di dati, relativa ad n unità statistiche e q
variabili,
Obiettivi: ridurre il numero delle variabili iniziali mediante la
costruzione di variabili canoniche che massimizzino la
correlazione tra i due data set di variabili.
Caso particolare: Modello di Regressione lineare multivariata
Problemi: le variabili di sintesi sono poco "esplicative" del loro
gruppo di appartenenza
Soluzioni proposte: massimizzare non più il coefficiente di
correlazione (soluzione dell’analisi canonica di Hotelling), ma la
covarianza tra combinazioni lineari delle variabili delle matrici X
ed Y (Tucker 1958).
I metodi che massimizzano la covarianza  compromesso tra
l'analisi canonica dei gruppi di variabili delle matrici X ed Y e
le Analisi in componenti principali di ciascun gruppo di
variabili.
 Il criterio della covarianza  l’Analisi della co-inerzia e del
Partial Least Squares (PLS).
Nel PLS e nell'analisi di co-inerzia, viene costruita una sequenza
di variabili non correlate, combinazioni lineari delle variabili di
partenza.
ANALISI DELLA CO-INERZIA
Analisi di co-inerzia di due tabelle  Analisi inter-battery di
Tucker (1958)  Analisi canonica su variabili qualitative di Cazes
(1980)  l’analisi delle corrispondenze per tabelle di profili
ecologici (Mercier et al.,1992).
I metodi di analisi tradizionali (ACP e AC) descrivono una tabella
di dati ricercando gli assi ortogonali sui quali la proiezione dei
dati sia di varianza massima.
L’analisi di correlazione canonica massimizza la correlazione fra
le componenti ricercando coppie di vettori di coefficienti w e c.
L’analisi di co-inerzia invece massimizza la seguente quantità
(Tucker, 1958):
Cov(Xw, Yc )  Cor(Xw, Yc ) Var(Xw) Var(Yc )
(1)
Dalla (1) si evidenzia un compromesso tra l’analisi canonica e le
due analisi semplici.
 Effettua simultaneamente le analisi di inerzia delle due
matrici (Chessel & Carrel, 1997)
 Evidenzia le caratteristiche comuni e le relazioni tra le due
matrici  alta capacità esplicativa
 come il PLS, può essere usata anche quando il numero delle
variabili è maggiore del numero delle osservazioni.
GENERALIZZAZIONE DEL CRITERIO
In letteratura sono presenti alcune generalizzazioni della
co-inerzia e del PLS.
Il criterio (1) si generalizza (D’Ambra, Sabatier, Amenta, 1998)
al caso di K matrici Xk (g vettore di coefficienti):
K
pk
K
max  . Cov ( X t , Yg )  max  cov 2 ( X k t k , Yg )
2
k 1 j 1
( j)
k
kj
k 1
ANALISI DI TABELLE TOTALMENTE SOVRAPPONIBILI
Studio della co-struttura e studio delle differenze
 Due triplette statistiche (X, Q, D) e (Y, Q, D)
 sovrapponibili quando descrivono le
stesse unità statistiche
 totalmente sovrapponibili se
descrivono le stesse unità statistiche (n
righe) per mezzo delle stesse variabili (p
colonne) (Lafosse, 1985, 1989).
Attraverso l’analisi di co-inerzia, si ricerca un asse, detto di
co-inerzia, che massimizzi la covarianza tra le coordinate delle
proiezioni delle due matrici, attraverso il passaggio dalle
triplette (X, Q, D) e (Y, Q, D) alla tripletta (XTDY, R, Q).
Principale proprietà  simultaneamente l’analisi di inerzia di
ciascuna delle due matrici.
 Nel caso di tabelle non completamente sovrapponibili, gli
individui di ogni matrice vengono descritti da variabili diverse,
e si trovano dunque in spazi differenti: ciò implica che le
coppie degli assi di co-inerzia sono elementi di due spazi
diversi (per riportare le due nubi nello stesso spazio, si
utilizzano le metriche di Mahalanobis , si veda Casin e Turlot,
1986).
L’utilizzo dell’analisi procustiana non sembra soddisfacente
Lafosse (1985,1989) considera due nubi di n punti e procede poi
attraverso due fasi:
Rotazione procustiana ortogonale di una nube verso l’altra
 Nel caso di completa sovrapponibilità, si pone la questione
riguardante l’esistenza di un asse di co-inerzia comune alle
due nubi.
La completa sovrapponibilità delle due tabelle di dati ci
autorizza a considerare le unità statistiche delle due tabelle
come elementi di un unico spazio.
L’analisi della differenza è invece definita dalla tripletta
(Y-X,Q, Dn): questa analisi permette di esplicitare se ed in che
cosa le due matrici sono diverse.
In pratica si prende come riferimento l’informazione contenuta
nella X e si cerca di descrivere in che misura la descrizione degli
stessi individui fornita dalla Y se ne discosta. Perfettamente
simmetrico è il caso della tripletta (X -Y,Q, Dn), definita sugli
stessi assi della tripletta precedente.
L’analisi della co-struttura (co-inerzia) e l’analisi della
differenza sono strettamente legate.
Siano IX, IY e ID le inerzie associate, rispettivamente, all’analisi
in componenti principali delle matrici X, Y ed X-Y.
L’Analisi della Co-Inerzia di tabelle totalmente sovrapponibili e
l’Analisi delle Differenze risultano essere legate dalla relazione
2tr( X 'Y )  I X  I Y  I D
Appare evidente come sia riduttivo, nell’analisi della
soddisfazione del cliente considerare solo la discrepanza tra
percezione ed aspettative, in quanto si verrebbe a cogliere solo
un’aspetto del fenomeno, mentre appare più interessante
considerare il potere informativo anche delle altre componenti:
le singole attese, le singole percezioni ed il loro legame.
OPTIMAL SCALING E ANALISI NON LINEARE DEI DATI
Optimal Scaling
1. Due variabili categoriche  assegniamo dei valori di scala alle
categorie di una variabile categorica al fine di ottimizzare un
qualche criterio di discriminazione tra i gruppi di categorie.
Quindi si ricercano i valori di scala per ciascun insieme di
categorie che comportano la correlazione più elevata possibile
tra la variabile riga e la variabile colonna.
2. La posizione delle categorie sul primo asse principale di
un’Analisi delle Corrispondenze fornisce degli ottimi valori di
scala per le categorie secondo il criterio di massimizzazione
della varianza (Greenacre 1993) dei punteggi (scores) degli
individui.
Scale value which lead to scores with maximum variance
define an optimal scale
Analisi delle Corrispondenze Multiple:Homogeneity Analysis o
Dual Scaling
Generalizzazione al caso di più di due variabili dell’optimal
scaling
1. In un contesto multivariato l’optimal scaling può essere
generalizzato alla ricerca dei valori di scala delle categorie di
tutte le variabili così da ottimizzare una più generale misura
di correlazione tra tutte le variabili.
Supponiamo di avere un insieme di valori di scala per le J
categorie delle Q variabili (variabili quantificate). A ciascun
individuo saranno associati Q valori di scala.
Un punteggio (score) può essere assegnato all’individuo come
uguale alla media di questi Q valori di scala (ripetiamo per
ciascun individuo e calcoliamo N punteggi “scores”).
L’idea è di sostituire la matrice originale dei dati con l’insieme
delle quantificazioni, corrispondenti alle J categorie, e i
punteggi (scores) che ne derivano, alle I unità statistiche. La
vicinanza dei punteggi ai valori di scala è definito in termini della
somma dei quadrati delle differenze, problema dei Minimi
Quadrati.
Matematicamente equivalente  Massimizzare la
correlazione tra i punteggi degli individui e i valori di scala delle
componenti (valori di scala delle categorie).
Trasformazione delle variabili categoriche mediante funzioni
monotone, ad es. funzioni di codifica B.spline.
Ottimizzazione dell’omogeneità tra le variabili grazie ad un
algoritmo di tipo ALS (Alternating Least Squares).
 Analisi non lineare delle Componenti Principali. Algoritmo:
Princals
X(n,p) matrice di dati, relativa ad n unità statistiche e p variabili
nominali, ordinali e numeriche, a differenza di Prinqual by
Tenenhaus che tratta solo con variabili ordinali e numeriche
discrete