Convegno su “LA VALUTAZIONE DEI SERVIZI ALLA PERSONA” Firenze, 25-26 Febbraio 2000 UN APPROCCIO STATISTICO MULTIDIMENSIONALE PER LA VALUTAZIONE DELLA PERFORMANCE DEI SERVIZI DI PUBBLICA UTILITA': I Corsi di Formazione Prof. Luigi D’Ambra Dipartimento di Matematica e Statistica Università "Federico" di Napoli LA QUALITÀ DEI SERVIZI La valutazione della qualità di un servizio definire in maniera precisa che cosa si intende per qualità di un servizio individuare un chiaro modello “interpretativo” di riferimento contesto multidimensionale (più aspetti concomitanti intervengono nella formazione di un giudizio da parte del cliente) Questo al fine di definire una misura indiretta della Customer Satisfaction ASPETTI E DEFINIZIONI (Farnum, 1994; Montgomery, 1996): In letteratura non vi è una definizione di Qualità generalmente accettata: "La Qualità si identifica con la conformità alle specifiche" by Crosby "La Qualità come inversamente proporzionale alla variabilità del processo sottostante o come perdita impartita alla società " by Taguchi L’American Society for Quality ha costruito una definizione particolarmente interessante: "Insieme delle caratteristiche e delle proprietà di un’entità che conferiscono ad essa la capacità di soddisfare esigenze espresse e implicite” Performance (Will the product do the job?) Added features (Does it have features beyond the basic performance characteristics?) Reliability/durability (Will it last long time?) Conformance (Was the product made exactly as its design specified?) Serviceability (Is it easy to fix?) Design (Does it look better than the competition?) Reputation (Does the company have a history of attention to quality?) Il concetto di Qualità evolve con il passare degli anni la non precisione dei contorni e delle caratteristiche della qualità (Parasuraman ed altri, 1985). La Qualità è una (Parasuraman 1991) grandezza Multidimensionale LA QUALITÀ NEI SERVIZI Eperience Goods ed esperienze Servizi beni immateriali prestazioni la progettazione della standardizzazione è particolarmente complicata. Peculiarità dei servizi: immaterialità: il servizio erogato è un bene immateriale; eterogeneità: la standardizzazione varia con il produttore, il cliente non immagazzinabilità: la produzione non è separabile dal consumo; interattività: comportano un’interazione tra fornitore del servizio e cliente/utente. TIPI DI SERVIZI Le caratteristiche sopra evidenziate sono comuni a tutti i servizi. Distinguamo quattro tipologie: a) Servizi di interfaccia: servizi la cui erogazione prevede un’interazione tra fornitore e cliente (es. servizi di formazione); b) Servizi di elaborazione: si fornisce un vero e proprio prodotto (es. scrittura di software, programmi di ricerca); c) Servizi di disponibilità: messa a disposizione di oggetti (es. noleggio di automobili); d) Servizi di processo: dove si garantisce la disponibilità di un bene attraverso il controllo di un processo (es. erogazione di energia elettrica); QUALITÀ DEL SERVIZIO il giudizio dei clienti si basa essenzialmente sulla discrepanza "gap", sia in direzione che in ampiezza, tra quello che essi considerano dover essere il servizio offerto dalle imprese, le loro aspettative e la loro percezione della performance effettiva (Gronroos, 1994). Le aspettative vanno considerate come lo standard di riferimento discrepanza positiva indice di un servizio che genera soddisfazione (=buona qualità) insoddisfazione (=cattiva qualità) la performance fornita è percepita ad un livello più basso rispetto alle aspettative iniziali Soddisfazione del cliente le aspettative i desideri che risultano dalle motivazioni personali dell’individuo. La soddisfazione percepita : classica discrepanza tra attese e percezioni. La qualità intesa come la capacità di gestire in maniera ottimale l’interazione con l’utente/cliente. qualità deve essere una cultura diffusa in maniera capillare presso tutto il personale dell’organizzazione MODELLI A CONFRONTO Paradigma della discrepanza il modello SERVQUAL (Parasuraman ed al., 1985, 1989, 1990, 1994) strumenti: un questionario diviso in tre parti: nella prima e nella terza ci sono 22 domande per la valutazione rispettiva di aspettative e percezioni di alcuni indicatori, nella seconda viene richiesto agli intervistati di dare un peso a ciascuna dimensione indagata. Le dimensioni sono: ASPETTI TANGIBILI: Aspetti di strutture fisiche, personale, attrezzature, strumenti di comunicazione. AFFIDABILITÀ: Capacità di prestare il servizio promesso in modo affidabile e preciso. CAPACITÀ DI RISPOSTA: Volontà di aiutare i clienti e di fornire il servizio con prontezza. CAPACITÀ DI RASSICURAZIONE: Competenza e cortesia dei dipendenti e loro capacità di ispirare fiducia e sicurezza. EMPATIA: Assistenza premurosa e individualizzata prestata al cliente. Queste "dimensioni" sono caratteristiche presenti in maniera trasversale in tutti i tipi di servizi Attraverso tecniche MCDA (Multiple Criteria Decision Aiding Methods, Ostanello, 1985): non si effettua alcuna scalarizzazione sui dati si consente la valutazione della qualità in linea (attraverso carte di controllo per attributi di tipo "p" che consentono di monitorare l'andamento nel tempo del differenziale tra Qa e Qp). Le tecniche si basano sull’uso di quantificatori linguistici definiti nell’ambito della Fuzzy Logic, particolarmente adatti all’aggregazione di informazioni raccolte su scala verbale. …………………………………………………. TABELLA: confronto di alcuni metodi per la valutazione della qualità del servizio (Ripreso da Franceschini e Rossetto, 97) Metodologie Two-Way Schvaneveldt Enkawa Miyakawa (1991) SERVPERF Cronin Taylor (1992) Normed Quality Teas (1993) Qualitometro Franceschini Rossetto (1996) I fattori latenti di valutazione: aspetti "oggettivi" (attributi della qualità) e "soggettivi" (livelli di soddisfazione) Si considerano le sole "percezioni" senza la componente delle attese e senza i pesi dell’importanza secondo la formula: Il problema delle attese ha a distinguere tra attesa ideale I ed attesa realizzabile Ae in modo da calcolare la qualità del servizio secondo la formula: Si misurano le attese e le Percezioni in momenti separati. Tecniche MCDA. Raccolta dati Clienti di Caratteristiche compagnie del campione telefoniche, due assicurazioni, due banche Banche, ristoranti, lavanderie, Supermercati Due banche, due aziende di controllo antinquinament o, due lavanderie, due fast food Tre grandi catene di supermercati Utenti del servizio biblioteca del Dipartimento DISPEA Numero di enunciati (attese più percezioni) 22+22 Non esplicitato 22 10+10+10+10+10 8+8 Scale per le risposte Semantica differenziale a 7 punti Semantica a 5 punti Semantica differenziale a 7 punti Semantica differenziale a 7 punti Comparativa a 7 punti Importanza delle dimensioni Valutazione dei Non richiesto pesi a somma costante Valutazione dei Valutazione dei pesi a pesi somma costante a somma costante Comparativa a 7 punti Fondamento teorico alla base del metodo SERVQUAL Revisionato Parasuraman Zeithaml Berry (1991) Teoria dei Gap: differenza tra percezioni ed attese mediata dall’effetto dei pesi dall’importanza assegnata ad ogni dimensione secondo la formula??? Modalità di consegna del questionario Postale Non precisato Postale Colloquio Attese prima della fruizione del servizio e percezioni dopo la ricezione Livello di intrusione nei confronti del misurando Alto Medio Alto Alto Basso Effetto di Idiosincrasia Alto Medio Medio Alto Basso Tipo di pre-elaborazio ne dei dati Scalarizzazione Scalarizzazione Scalarizzazione Scalarizzazione Senza scalarizzazione Analisi dei dati Analisi fattoriale seguita da rotazione obliqua Analisi fattoriale Analisi fattoriale Seguita da rotazione Obliqua Analisi fattoriale seguita da rotazione obliqua Metodi di MCDA e carte di controllo di tipo "p" Affidabilità (coefficiente di Cronbach) Da 0.8 a 0.93 Non esplicitato Da 0.63 a 0.98 Calcolati altri coefficienti di validità ed affidabilità Calcolo della qualità "globale" come indicatore di affidabilità Numero delle dimensioni Cinque: Cinque: Cinque: Cinque: Cinque: Aspetto, affidabilità, capacità di risposta, capacità di rassicurazione, empatia Prestazione, sicurezza, completezza, facilità di utilizzo, emotività/ambi ente Aspetto, affidabilità, capacità di risposta, capacità di rassicurazione, empatia Aspetto, affidabilità, capacità di risposta, capacità di rassicurazione, empatia Aspetto, affidabilità, capacità di risposta, capacità di rassicurazione, empatia L’applicazione operativa di qualsiasi modello concettuale, per la valutazione della soddisfazione del cliente/utente, basato esclusivamente sulla differenza fra punteggi è oggetto di un ampio dibattito in letteratura principalmente per motivi psicometrici, e specialmente quando tali discrepanze sono utilizzate per analisi multivariate. Al fine di raggiungere un’alta capacità esplicativa, bisognerebbe cogliere, oltre alla discrepanza, anche le caratteristiche comuni e le relazioni tra le due tabelle per vedere come la valutazione espressa dalla prima influenza l'altra e viceversa. Le scale di punteggio utilizzate nel SERVQUAL sono di tipo “semantico differenziale” si tratta di scale che possono ritenersi “solo ordinate” e tuttavia vengono ritenute scale ad intervalli. Ciò a senso solo se “differenze numeriche uguali” possono ritenersi tali “oggettivamente” (Zanella, Cerri 1999). ALCUNI PROBLEMI NELLA VALUTAZIONE DELLA QUALITA'DEI SERVIZI D'INTERFACCIA: RILEVAZIONE E CODIFICA DEI DATI 1. la misura di alcune grandezze su un certo numero di oggetti (o soggetti) CAMPIONAMENTO CASUALE 2. l’introduzione di alcuni criteri di giudizio per la codifica delle variabili. TRATTAMENTO DELLE VARIABILI ORDINALI. codifica numerica dei giudizi espressi sui questionari l’origine del sistema di riferimento differisce da soggetto a soggetto la distanza dei punti successivi sulla scala differisce da soggetto a soggetto la distanza dei punti successivi della scala potrebbe non essere lineare per ogni soggetto Omogeneità dei sistemi di riferimento??? L’aggregazione delle misure impone, inoltre, il rispetto almeno dell’ipotesi di omogeneità dei sistemi di riferimento. 3. ANALISI DI TABELLE MISTE DI DATI 4. INFORMAZIONI ESTERNE SULLE UNITÀ STATISTICHE SOLUZIONI PROPOSTE 1. Modello Psicometrico di Thurstone (1925) Trattamento variabili ordinali 2. Rasch Analysis (Rasch 1960): si ricavano punteggi logit che permettono di superare i problemi di non confrontabilità delle scale ordinali. Approccio della Regressione monotona Trattamento dati misti Metodi Multidimensionali: l'Analisi non lineare dei dati Metodi Multidimensionali: Analisi della Co-Inerzia Analisi di tabelle totalmente sovrapponibili L’APPROCCIO PSICOMETRICO DI THURSTONE Consideriamo un questionario definito da K variabili ordinali X k (k 1, , K ) con egual numero di categorie I (i 1, , I ) di temine generale x ki . Sia Pr( X ki i) p ki la probabilità che la variabile k sia uguale a i Fk (i ) p iS , j i kj è la probabilità che abbiamo almeno una delle prime i categorie, con S 1,, I . A ciascuna variabile categorica ordinata (i giudizi) X corrisponde una variabile casuale latente di tipo normale Z (“true” scale). Utilizziamo: Scala ad intervallo. A ciascun valore ordinato x ki corrisponde un valore z ki i tale che i i 1 k (i=1,..,I) definendo, per ciascuna distribuzione Z k , il quantile associato alla categoria xki i della variabile X k . Da cui le seguenti identità: k i k Se (.) i k 1 Fk (i ) ki Fk (i) k ; i(i=1,…I) 1, , I k(k=1,…K) 1, , K è la funzione cumulativa di una variabile normale k 2k standardizzata allora , e sono, rispettivamente, la media e la varianza della variabile normale latente Z k . ki è il valore osservabile (reiterando le X osservazioni) non superabile da una variabile casuale normale con probabilità Fk (i) . Consideriamo la media di *i ( i ) i . ki rispetto a K, abbiamo che (1 / K )k 1 (1 / k ) K Se poniamo (reciproco della media armonica dei quadrati medi delle differenze della variabile Z latente k ), valori di *i (1 / K )k 1 k / k K e i (1 / k )k 1 ki K , otteniamo i che sono compatibili con i “veri” valori latenti In tal modo, sostituiamo le originali variabili categoriche ordinali con i valori *i definiti su una scala ad intervallo. i . L’APPROCCIO DELLA REGRESSIONE MONOTONA DI KRUSKAL Sia Y una variabile dipendente ordinale (convenzionalmente rappresentata da un insieme di punteggi) y1 .... yn e siano ẑ1 .... ẑ n le trasformazioni delle variabili di risposta secondo una funzione di trasformazione f(.), scelta in modo da rispettare l’ordinamento iniziale. Si pone m z j () g jss s 1 g js sono valori numerici noti che descrivono i livelli dei fattori esplicativi s i coefficienti Indichiamo con z j () il valore di media aritmetica Si procede in modo iterativo a determinare il “direct stress” (Kruskal 1965) 1/ 2 n (ẑ z ()) 2 j j j 1 ˆ S(f̂ *;*) min min f n 2 (z j () z j ()) j 1 essa rappresenta una misura descrittiva della bontà di adattamento della trasformazione monotona f(.) L’algoritmo di minimizzazione viene descritto in Kruskal (1964, 1965). RASCH ANALYSIS (Rasch 1960) Tecnica appartenente ai Latent Trait Models. Trasformazione degli indicatori qualitativi in quantitativi, definiti su numeri naturali o reali. La scelta dei questionari è tale che gli indicatori utilizzati sottendono un solo aspetto latente sulla base dell’abilità degli individui, delle difficoltà delle prove, dei diversi livelli di riuscita, (ad es. capacità motoria, capacità intellettiva dei disabili) e secondariamente attraverso l’utilizzo di un modello logistico che rende additive e quantitative le scale ordinali attraverso cui sono espressi i risultati dei questionari La Rasch Analysis consente di utilizzare i punteggi logit quali misure oggettive, indipendenti dal campione di individui e dalla tipologia del questionario, superando i problemi della non confrontabilità delle valutazioni espresse su scale ordinali. METODI STATISTICI MULTIDIMENSIONALI PER LA VALUTAZIONE DELLA QUALITA DEI SERVIZI l'Analisi in Componenti Principali (ACP): X(n,p) matrice di dati, relativa ad n unità statistiche e p variabili, Obiettivi: ridurre il numero delle p variabili iniziali a q<p variabili non correlate di varianza massima e di importanza decrescente. senza perdere molto dell'informazione statistica l'Analisi Canonica di Hotelling (e sue generalizzazioni) risulta avere un grande interesse teorico X(n,p) matrice di dati, relativa ad n unità statistiche e p variabili, Y(n,q) matrice di dati, relativa ad n unità statistiche e q variabili, Obiettivi: ridurre il numero delle variabili iniziali mediante la costruzione di variabili canoniche che massimizzino la correlazione tra i due data set di variabili. Caso particolare: Modello di Regressione lineare multivariata Problemi: le variabili di sintesi sono poco "esplicative" del loro gruppo di appartenenza Soluzioni proposte: massimizzare non più il coefficiente di correlazione (soluzione dell’analisi canonica di Hotelling), ma la covarianza tra combinazioni lineari delle variabili delle matrici X ed Y (Tucker 1958). I metodi che massimizzano la covarianza compromesso tra l'analisi canonica dei gruppi di variabili delle matrici X ed Y e le Analisi in componenti principali di ciascun gruppo di variabili. Il criterio della covarianza l’Analisi della co-inerzia e del Partial Least Squares (PLS). Nel PLS e nell'analisi di co-inerzia, viene costruita una sequenza di variabili non correlate, combinazioni lineari delle variabili di partenza. ANALISI DELLA CO-INERZIA Analisi di co-inerzia di due tabelle Analisi inter-battery di Tucker (1958) Analisi canonica su variabili qualitative di Cazes (1980) l’analisi delle corrispondenze per tabelle di profili ecologici (Mercier et al.,1992). I metodi di analisi tradizionali (ACP e AC) descrivono una tabella di dati ricercando gli assi ortogonali sui quali la proiezione dei dati sia di varianza massima. L’analisi di correlazione canonica massimizza la correlazione fra le componenti ricercando coppie di vettori di coefficienti w e c. L’analisi di co-inerzia invece massimizza la seguente quantità (Tucker, 1958): Cov(Xw, Yc ) Cor(Xw, Yc ) Var(Xw) Var(Yc ) (1) Dalla (1) si evidenzia un compromesso tra l’analisi canonica e le due analisi semplici. Effettua simultaneamente le analisi di inerzia delle due matrici (Chessel & Carrel, 1997) Evidenzia le caratteristiche comuni e le relazioni tra le due matrici alta capacità esplicativa come il PLS, può essere usata anche quando il numero delle variabili è maggiore del numero delle osservazioni. GENERALIZZAZIONE DEL CRITERIO In letteratura sono presenti alcune generalizzazioni della co-inerzia e del PLS. Il criterio (1) si generalizza (D’Ambra, Sabatier, Amenta, 1998) al caso di K matrici Xk (g vettore di coefficienti): K pk K max . Cov ( X t , Yg ) max cov 2 ( X k t k , Yg ) 2 k 1 j 1 ( j) k kj k 1 ANALISI DI TABELLE TOTALMENTE SOVRAPPONIBILI Studio della co-struttura e studio delle differenze Due triplette statistiche (X, Q, D) e (Y, Q, D) sovrapponibili quando descrivono le stesse unità statistiche totalmente sovrapponibili se descrivono le stesse unità statistiche (n righe) per mezzo delle stesse variabili (p colonne) (Lafosse, 1985, 1989). Attraverso l’analisi di co-inerzia, si ricerca un asse, detto di co-inerzia, che massimizzi la covarianza tra le coordinate delle proiezioni delle due matrici, attraverso il passaggio dalle triplette (X, Q, D) e (Y, Q, D) alla tripletta (XTDY, R, Q). Principale proprietà simultaneamente l’analisi di inerzia di ciascuna delle due matrici. Nel caso di tabelle non completamente sovrapponibili, gli individui di ogni matrice vengono descritti da variabili diverse, e si trovano dunque in spazi differenti: ciò implica che le coppie degli assi di co-inerzia sono elementi di due spazi diversi (per riportare le due nubi nello stesso spazio, si utilizzano le metriche di Mahalanobis , si veda Casin e Turlot, 1986). L’utilizzo dell’analisi procustiana non sembra soddisfacente Lafosse (1985,1989) considera due nubi di n punti e procede poi attraverso due fasi: Rotazione procustiana ortogonale di una nube verso l’altra Nel caso di completa sovrapponibilità, si pone la questione riguardante l’esistenza di un asse di co-inerzia comune alle due nubi. La completa sovrapponibilità delle due tabelle di dati ci autorizza a considerare le unità statistiche delle due tabelle come elementi di un unico spazio. L’analisi della differenza è invece definita dalla tripletta (Y-X,Q, Dn): questa analisi permette di esplicitare se ed in che cosa le due matrici sono diverse. In pratica si prende come riferimento l’informazione contenuta nella X e si cerca di descrivere in che misura la descrizione degli stessi individui fornita dalla Y se ne discosta. Perfettamente simmetrico è il caso della tripletta (X -Y,Q, Dn), definita sugli stessi assi della tripletta precedente. L’analisi della co-struttura (co-inerzia) e l’analisi della differenza sono strettamente legate. Siano IX, IY e ID le inerzie associate, rispettivamente, all’analisi in componenti principali delle matrici X, Y ed X-Y. L’Analisi della Co-Inerzia di tabelle totalmente sovrapponibili e l’Analisi delle Differenze risultano essere legate dalla relazione 2tr( X 'Y ) I X I Y I D Appare evidente come sia riduttivo, nell’analisi della soddisfazione del cliente considerare solo la discrepanza tra percezione ed aspettative, in quanto si verrebbe a cogliere solo un’aspetto del fenomeno, mentre appare più interessante considerare il potere informativo anche delle altre componenti: le singole attese, le singole percezioni ed il loro legame. OPTIMAL SCALING E ANALISI NON LINEARE DEI DATI Optimal Scaling 1. Due variabili categoriche assegniamo dei valori di scala alle categorie di una variabile categorica al fine di ottimizzare un qualche criterio di discriminazione tra i gruppi di categorie. Quindi si ricercano i valori di scala per ciascun insieme di categorie che comportano la correlazione più elevata possibile tra la variabile riga e la variabile colonna. 2. La posizione delle categorie sul primo asse principale di un’Analisi delle Corrispondenze fornisce degli ottimi valori di scala per le categorie secondo il criterio di massimizzazione della varianza (Greenacre 1993) dei punteggi (scores) degli individui. Scale value which lead to scores with maximum variance define an optimal scale Analisi delle Corrispondenze Multiple:Homogeneity Analysis o Dual Scaling Generalizzazione al caso di più di due variabili dell’optimal scaling 1. In un contesto multivariato l’optimal scaling può essere generalizzato alla ricerca dei valori di scala delle categorie di tutte le variabili così da ottimizzare una più generale misura di correlazione tra tutte le variabili. Supponiamo di avere un insieme di valori di scala per le J categorie delle Q variabili (variabili quantificate). A ciascun individuo saranno associati Q valori di scala. Un punteggio (score) può essere assegnato all’individuo come uguale alla media di questi Q valori di scala (ripetiamo per ciascun individuo e calcoliamo N punteggi “scores”). L’idea è di sostituire la matrice originale dei dati con l’insieme delle quantificazioni, corrispondenti alle J categorie, e i punteggi (scores) che ne derivano, alle I unità statistiche. La vicinanza dei punteggi ai valori di scala è definito in termini della somma dei quadrati delle differenze, problema dei Minimi Quadrati. Matematicamente equivalente Massimizzare la correlazione tra i punteggi degli individui e i valori di scala delle componenti (valori di scala delle categorie). Trasformazione delle variabili categoriche mediante funzioni monotone, ad es. funzioni di codifica B.spline. Ottimizzazione dell’omogeneità tra le variabili grazie ad un algoritmo di tipo ALS (Alternating Least Squares). Analisi non lineare delle Componenti Principali. Algoritmo: Princals X(n,p) matrice di dati, relativa ad n unità statistiche e p variabili nominali, ordinali e numeriche, a differenza di Prinqual by Tenenhaus che tratta solo con variabili ordinali e numeriche discrete