Un approccio di misurazione degli effetti dei fattori ordinali An Effect Measure Approach of Ordinal Factors Amedeo De Luca Istituto di Statistica, Università Cattolica di Milano; e-mail: [email protected] Abstract: To estimate the value of effects over a response variable (overall customer satisfaction) of ordinal independent variables, according to an additive effect model, an additive binary coding of the above-mentioned variables is adopted. The dependent variable is described through function of indicator variables of a dichotomous kind. Keywords: additive coding, dummy variable, experimental research, interaction. 1. Introduzione Nelle ricerche di mercato i giudizi di valutazione, assegnati da un campione di soggetti agli attributi di un prodotto, vengono espressi solitamente su scala ordinale di punteggio. Nella situazione applicativa qui considerata le valutazioni (di customer satisfaction) sono assegnate ai singoli attributi (variabili esplicative o predittori) su una scala a cinque passi, mentre la valutazione globale o overall del prodotto (variabile dipendente) è espressa in forma dicotomica (“soddisfatto” (1), “non soddisfatto”(0)). Per giungere ad un modello che metta in relazione funzionale le valutazioni espresse sui vari attributi con la valutazione di overall, le prime devono essere considerate variabili rilevate su scala ordinale. Nel presente lavoro i parametri del modello in argomento sono stimati con la tecnica della regressione descrittiva su variabili indicatrici, prendendo le mosse dallo schema di codifica binaria additiva – applicata ai predittori – che riconosce naturalmente l’ordinamento delle modalità (e che permette di giungere a parametri più efficienti di quelli ottenuti muovendo dalla semplice codifica binaria disgiuntiva; De Luca, 1999). Nel lavoro la formula dell’errore standard dei parametri del modello viene specificata tenendo presente la peculiarità della codifica binaria adottata per i predittori. Di detti parametri si dà, inoltre, un’interpretazione secondo l’ottica della programmazione degli esperimenti. 2. Stima dei parametri del modello di regressione su variabili indicatrici con codifica binaria additiva Con lo schema di codifica binaria additiva completa, I categorie o classi (esemplificate nella Tab. 1) di una variabile indipendente, espresse in funzione di I variabili binarie, si presentano, per I = 5, secondo lo schema riportato nella Tab. 1. Tab.1: Codifica binaria additiva completa delle classi di giudizio di valutazione di un attributo di prodotto Variabili indicatrici Classi ordinali (i) Per nulla soddisfatto Poco soddisfatto Abbastanza soddisfatto Soddisfatto Molto soddisfatto Z1 Z2 Z3 Z4 Z5 1 1 1 1 1 0 1 1 1 1 0 0 1 1 1 0 0 0 1 1 0 0 0 0 1 Il connesso modello di regressione su variabili indicatrici è il seguente: y = Z + e, (1) in cui è indicato con: Z la matrice di dimensioni n5 delle variabili indicatrici dei giudizi di valutazione xij, i = 1, 2, …, 5, j = 1, 2, …, n, rilevati su un campione di n unità; y il vettore colonna n1 delle osservazioni yj, j = 1, 2, …, n (è yj = 1 se il rispondente esprime la modalità “soddisfatto”; yj = 0 nel caso contrario); il vettore colonna I1 dei parametri di regressione incogniti delle categorie; e il vettore colonna n1 degli errori di osservazione. Le osservazioni yj si interpretano come determinazioni di variabili bernoulliane di parametro pj. È quindi: yj = pj + ej; le quantità ej sono di media nulla e varianza pj(1 – pj). Il vettore delle medie p = [ p1, p2, …, pn ]' si interpreta come: p = Z . In forma vettoriale il connesso modello è: p1 p 2 p = p3 = Z = . p n 1 1 1 . 1 0 0 0 0 1 1 0 0 0 2 1 1 0 0 . 3 . . . . 4 5 1 1 1 1 (2) La forma algebrica del modello riparametrizzato (Zanella, 1964), in conseguenza della condizione di annullamento del primo parametro (De Luca, 1999) è: yj = c + 2 z2j + 3 z3j + 4 z4j + 5 z5j + ej , (3) è c = 1 ( 1 è il parametro della classe di riferimento, la prima). Indicando con M (Y| zi ) la media in distribuzione di Y condizionata dalla modalità zi di Z risulta: [ 1* , 2* , 3* , 4* , 5* ] ' = [ M (Y| z1 ), M (Y| z 2 ), M (Y| z 3 ), M (Y| z 4 ), M (Y| z 5 )]' . (4) i con i* k . Per s >1 attributi la matrice Z si compone di s blocchi di I-1 colonk 1 ne di variabili zmi, m = 1, 2, …, s, oltre alla colonna di intercetta, e la (3) diviene : s yj = c + 5 m 1 i 2 (m) i zmij + ej , (5) dove i(m ) indica il parametro della categoria i del predittore m. Nella (5) il valore di c corrisponde alla media condizionata M (Y| z11, z21,..., zs1 ) = 1. 3. Errori standard dei parametri del modello I parametri della (5) sono stati stimati sui dati provenienti da una ricerca sulla customer satisfaction del servizio bancario, svolta su un campione casuale di 400 clienti di banca; come predittori sono stati considerati gli attributi “cortesia” e “competenza” del personale (per ogni combinazione di modalità si ha più di una osservazione). Nella Tab. 2 si riporta, accanto a ciascun parametro del modello (con s = 2), il relativo errore standard (approssimato), la cui formula - dato il tipo di Tab.2: Parametri della funzione di risposta basata sulla codifica binaria additiva per il caso di due predittori Variabili indipendenti e categorie costante primo attributo: i =1 i =2 i =3 i =4 i =5 secondo attributo: i =1 i =2 i =3 i =4 i =5 Parametro Errore standard 0,024639 0,152145 Parametro standardizzato 0,161944 0 0,146002 0,166212 0,200253 0,025510 0,154818 0,071696 0,098040 0,129870 0,943056 2,318288 2,042564 0,196427 0 0,073902 0,169377 0,146116 0,018510 0,162615 0,064763 0,118751 0,205809 0,454460 2,615336 1,230440 0,089938 3i codifica binaria additiva adottato - la esprimiamo nel modo seguente: p [ pi (1 pi ) / ni p i 1 (1 p i 1 ) / ni 1 ] 1/2 i (6) con pi y ihj / ni e p i 1 y i 1hj / ni 1 , dove, con ovvie notazioni dovute alla ihj ihj presenza di due fattori, yihj è il valore 0 o 1 della risposta y che corrisponde al giudizio di classe ih, j; ni e ni-1 indicano il numero di giudizi di classe i e i-1 per un predittore, qualsiasi sia il livello dell’altro. È p1 M (Y| z11, z21 ). In Tab. 2 si dà per ogni parametro il valore standardizzato (la sua distribuzione teorica è da studiare). 4. Modello di regressione per predittori non indipendenti Per due predittori non indipendenti tra di loro il modello (5) diviene: 2 5 5 5 yj = c + i( m ) z ij + ih(12) z ihj e j m 1 i 2 i 1 h 1 (7) con zihj = 0 per ih = 1, zihj = 1 per i, h 1, j = 1, 2, …, n; ih(12) indica l’effetto di interazione della modalità i del fattore 1 con la modalità h del fattore 2. Il modello (7) presenta una matrice Z, di dimensioni n25, del seguente tipo: 1 1 1 . 1 1 0 0 0 1 0 0 0 | 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 1 0 0 | 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 1 1 0 | 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 . . . . . . . . | . . . . . . . . . . . . . . . . 1 1 1 1 1 1 1 1 | 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 Le colonne della matrice dalla decima in poi attengono alle combinazioni (interazioni) delle categorie di indice i, h 1. Il vettore dei parametri del modello è il seguente: (12) (12) (12) (12) (12) (12) M (Y|z11, z21 ), 2(1) , . , 5(1) , 2( 2) , . , 5( 2) , 22 ' , . , 25 , 32 , ... , 42 , ... , 52 , . , 55 M (Y| z11, z21 ) è la media dei casi con valore 1 nel vettore di Y attinenti alla classe di rife- rimento; è ih(12) = M (Y| z1i , z2 h ) M (Y| z1i ) M (Y| z2 h ) M (Y| z11, z21 ) . 5. Interpretazione dei parametri nell’ottica della sperimentazione Il modello a due fattori di analisi della varianza ad effetti principali e di interazione è: Yihj = M (Y| z11, z21 ) + i(1) + h( 2) + ih(12) Eihj, i = h = 2, …, 5, j = 1, 2, …, n, (8) 2(1) esprime l’effetto (scostamento dalla media della classe di riferimento) del primo fattore, quando questo passa dal primo al secondo livello; 3(1) è l’ulteriore effetto, che si aggiunge al precedente, ecc.; analogo significato hanno i parametri h( 2) del secondo fattore; ih(12) è la correzione da apportare alla somma delle medie i(1) + h( 2) . Ringraziamenti L’autore ringrazia vivamente il Prof. A. Zanella per i consigli ricevuti. Riferimenti bibliografici De Luca A. (1999) Un modello di misurazione della Customer Satisfaction con codifica binaria additiva dei predittori ordinali, in: Contributi alla Giornata di Studio “Valutazione della Qualità e Customer Satisfaction: il ruolo della Statistica”. Università Cattolica di Milano, Istituto di Statistica, 219-230. Hardy M.A. (1993) Regression with dummy variables, Sage Publications, London. Zanella A. (1964) Un nuovo tipo di parametri per la interpretazione dei disegni fattoriali, Statistica, 2, 297-327.