1 - UniFI

Un approccio di misurazione degli effetti
dei fattori ordinali
An Effect Measure Approach of Ordinal Factors
Amedeo De Luca
Istituto di Statistica, Università Cattolica di Milano; e-mail: [email protected]
Abstract: To estimate the value of effects over a response variable (overall customer
satisfaction) of ordinal independent variables, according to an additive effect model,
an additive binary coding of the above-mentioned variables is adopted. The
dependent variable is described through function of indicator variables of a
dichotomous kind.
Keywords: additive coding, dummy variable, experimental research, interaction.
1. Introduzione
Nelle ricerche di mercato i giudizi di valutazione, assegnati da un campione di soggetti agli attributi di un prodotto, vengono espressi solitamente su scala ordinale di
punteggio.
Nella situazione applicativa qui considerata le valutazioni (di customer satisfaction)
sono assegnate ai singoli attributi (variabili esplicative o predittori) su una scala a
cinque passi, mentre la valutazione globale o overall del prodotto (variabile dipendente) è espressa in forma dicotomica (“soddisfatto” (1), “non soddisfatto”(0)).
Per giungere ad un modello che metta in relazione funzionale le valutazioni espresse
sui vari attributi con la valutazione di overall, le prime devono essere considerate
variabili rilevate su scala ordinale.
Nel presente lavoro i parametri del modello in argomento sono stimati con la tecnica
della regressione descrittiva su variabili indicatrici, prendendo le mosse dallo schema di codifica binaria additiva – applicata ai predittori – che riconosce naturalmente
l’ordinamento delle modalità (e che permette di giungere a parametri più efficienti
di quelli ottenuti muovendo dalla semplice codifica binaria disgiuntiva; De Luca,
1999).
Nel lavoro la formula dell’errore standard dei parametri del modello viene
specificata tenendo presente la peculiarità della codifica binaria adottata per i predittori. Di detti parametri si dà, inoltre, un’interpretazione secondo l’ottica della programmazione degli esperimenti.
2. Stima dei parametri del modello di regressione su variabili
indicatrici con codifica binaria additiva
Con lo schema di codifica binaria additiva completa, I categorie o classi (esemplificate nella Tab. 1) di una variabile indipendente, espresse in funzione di I variabili binarie, si presentano, per I = 5, secondo lo schema riportato nella Tab. 1.
Tab.1: Codifica binaria additiva completa delle classi di giudizio di valutazione di un attributo di prodotto
Variabili indicatrici
Classi ordinali (i)
Per nulla soddisfatto
Poco soddisfatto
Abbastanza soddisfatto
Soddisfatto
Molto soddisfatto
Z1
Z2
Z3
Z4
Z5
1
1
1
1
1
0
1
1
1
1
0
0
1
1
1
0
0
0
1
1
0
0
0
0
1
Il connesso modello di regressione su variabili indicatrici è il seguente:
y = Z  + e,
(1)
in cui è indicato con: Z la matrice di dimensioni n5 delle variabili indicatrici dei
giudizi di valutazione xij, i = 1, 2, …, 5, j = 1, 2, …, n, rilevati su un campione di n
unità; y il vettore colonna n1 delle osservazioni yj, j = 1, 2, …, n (è yj = 1 se il rispondente esprime la modalità “soddisfatto”; yj = 0 nel caso contrario);  il vettore
colonna I1 dei parametri di regressione incogniti delle categorie; e il vettore colonna n1 degli errori di osservazione. Le osservazioni yj si interpretano come determinazioni di variabili bernoulliane di parametro pj. È quindi: yj = pj + ej; le quantità ej
sono di media nulla e varianza pj(1 – pj). Il vettore delle medie p = [ p1, p2, …, pn ]' si
interpreta come: p = Z . In forma vettoriale il connesso modello è:
 p1 
p 
 2
p =  p3  = Z  =
 
 . 
 p n 
1
1

1

.
1
0 0 0 0
 1 

 
1 0 0 0
 2
1 1 0 0 .  3 

 
. . . .
 4 
 5 
1 1 1 1
(2)
La forma algebrica del modello riparametrizzato (Zanella, 1964), in conseguenza
della condizione di annullamento del primo parametro (De Luca, 1999) è:
yj = c + 2 z2j + 3 z3j + 4 z4j + 5 z5j + ej ,
(3)
è c =  1 (  1 è il parametro della classe di riferimento, la prima). Indicando con
M (Y| zi ) la media in distribuzione di Y condizionata dalla modalità zi di Z risulta:
[ 1* ,  2* ,  3* ,  4* ,  5* ] ' = [ M (Y| z1 ), M (Y| z 2 ), M (Y| z 3 ), M (Y| z 4 ), M (Y| z 5 )]' .
(4)
i
con  i*    k . Per s >1 attributi la matrice Z si compone di s blocchi di I-1 colonk 1
ne di variabili zmi, m = 1, 2, …, s, oltre alla colonna di intercetta, e la (3) diviene :
s
yj = c +
5
 
m 1 i  2
(m)
i
zmij + ej ,
(5)
dove  i(m ) indica il parametro della categoria i del predittore m. Nella (5) il valore di
c corrisponde alla media condizionata M (Y| z11, z21,..., zs1 ) = 1.
3. Errori standard dei parametri del modello
I parametri della (5) sono stati stimati sui dati provenienti da una ricerca sulla
customer satisfaction del servizio bancario, svolta su un campione casuale di 400
clienti di banca; come predittori sono stati considerati gli attributi “cortesia” e
“competenza” del personale (per ogni combinazione di modalità si ha più di una
osservazione). Nella Tab. 2 si riporta, accanto a ciascun parametro del modello (con
s = 2), il relativo errore standard (approssimato), la cui formula - dato il tipo di
Tab.2: Parametri della funzione di risposta basata sulla codifica binaria additiva per il caso di due predittori
Variabili indipendenti
e categorie
costante
primo attributo:
i =1
i =2
i =3
i =4
i =5
secondo attributo:
i =1
i =2
i =3
i =4
i =5
Parametro
Errore standard
0,024639
0,152145
Parametro
standardizzato
0,161944
0
0,146002
0,166212
0,200253
0,025510
0,154818
0,071696
0,098040
0,129870
0,943056
2,318288
2,042564
0,196427
0
0,073902
0,169377
0,146116
0,018510
0,162615
0,064763
0,118751
0,205809
0,454460
2,615336
1,230440
0,089938
3i
codifica binaria additiva adottato - la esprimiamo nel modo seguente:




 p  [ pi (1  pi ) / ni  p i 1 (1  p i 1 ) / ni 1 ] 1/2
i

(6)

con pi   y ihj / ni e p i 1   y i 1hj / ni 1 , dove, con ovvie notazioni dovute alla
ihj
ihj
presenza di due fattori, yihj è il valore 0 o 1 della risposta y che corrisponde al giudizio di classe ih, j; ni e ni-1 indicano il numero di giudizi di classe i e i-1 per un

predittore, qualsiasi sia il livello dell’altro. È p1  M (Y| z11, z21 ). In Tab. 2 si dà per
ogni parametro il valore standardizzato (la sua distribuzione teorica è da studiare).
4. Modello di regressione per predittori non indipendenti
Per due predittori non indipendenti tra di loro il modello (5) diviene:
2
5
5
5
yj = c +   i( m ) z ij +   ih(12) z ihj  e j
m 1 i  2
i 1 h 1
(7)
con zihj = 0 per ih = 1, zihj = 1 per i, h  1, j = 1, 2, …, n;  ih(12) indica l’effetto di
interazione della modalità i del fattore 1 con la modalità h del fattore 2. Il modello
(7) presenta una matrice Z, di dimensioni n25, del seguente tipo:
1
1

1

.
1
1 0 0 0 1 0 0 0 | 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
1 0 0 0 1 1 0 0 | 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0
1 0 0 0 1 1 1 0 | 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0

. . . . . . . . | . . . . . . . . . . . . . . . .
1 1 1 1 1 1 1 1 | 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1
Le colonne della matrice dalla decima in poi attengono alle combinazioni (interazioni) delle categorie di indice i, h  1. Il vettore dei parametri del modello è il seguente:
(12)
(12)
(12)
(12)
(12)
(12)
 M (Y|z11, z21 ), 2(1) , . , 5(1) , 2( 2) , . , 5( 2) , 22
'
, . , 25
, 32
, ... , 42
, ... , 52
, . , 55
M (Y| z11, z21 ) è la media dei casi con valore 1 nel vettore di Y attinenti alla classe di rife-
rimento; è  ih(12) = M (Y| z1i , z2 h )  M (Y| z1i )  M (Y| z2 h )  M (Y| z11, z21 ) .
5. Interpretazione dei parametri nell’ottica della sperimentazione
Il modello a due fattori di analisi della varianza ad effetti principali e di interazione è:
Yihj = M (Y| z11, z21 ) +  i(1) +  h( 2) +  ih(12)  Eihj, i = h = 2, …, 5, j = 1, 2, …, n,
(8)
 2(1) esprime l’effetto (scostamento dalla media della classe di riferimento) del primo
fattore, quando questo passa dal primo al secondo livello;  3(1) è l’ulteriore effetto,
che si aggiunge al precedente, ecc.; analogo significato hanno i parametri  h( 2) del secondo fattore;  ih(12) è la correzione da apportare alla somma delle medie  i(1) +  h( 2) .
Ringraziamenti
L’autore ringrazia vivamente il Prof. A. Zanella per i consigli ricevuti.
Riferimenti bibliografici
De Luca A. (1999) Un modello di misurazione della Customer Satisfaction con
codifica binaria additiva dei predittori ordinali, in: Contributi alla Giornata di
Studio “Valutazione della Qualità e Customer Satisfaction: il ruolo della
Statistica”. Università Cattolica di Milano, Istituto di Statistica, 219-230.
Hardy M.A. (1993) Regression with dummy variables, Sage Publications, London.
Zanella A. (1964) Un nuovo tipo di parametri per la interpretazione dei disegni
fattoriali, Statistica, 2, 297-327.