1
Data Envelopment Analisys (DEA)
Il problema
In molti settori produttivi operano entità multi-unità (ad es. una catena di alberghi; ogni albergo è una
unità); desideriamo sapere quali sono efficienti. Perché:
1. per valutare i manager
2. per studiare le caratteristiche delle unità efficienti e trasferire i loro lati positivi alle unità
inefficienti: cosa c’è di buono nelle unità “buone”
3. per trovare opportunità di miglioramento delle unità inefficienti: dove e come dovrebbero essere
migliorate; cosa c’è di cattivo nelle unità “cattive”
4. guadagnare conoscenza sulle condizioni che favoriscono i nostri affari: grande/piccolo mercato,
alta/bassa qualità di servizio ai clienti, etc.
5. altro?
La DEA nasce nel 1978 grazie a Charnes, Cooper e Rhodes. Suo obiettivo è valutare, tramite un modello di
programmazione lineare, l’efficienza relativa (non assoluta) di unità produttive dette Decision Making Unit
(DMU) in una organizzazione. E’ stata ampiamente utilizzata, in particolare nel settore turistico.
Si suppone che ogni DMU abbia degli input e degli output, correlati fra di loro; in qualche modo il rapporto
fra output e input deve portare a determinare quale sia la DMU più efficiente.
Notazione
Una prima nota è per le variabili di un problema di LP che a volte appaiono asteriscate: è una convenzione
internazionale che, ad esempio w*, indichi il valore delle variabili w all’ottimo; è improprio, ma si dice che è
il valore ottimo delle variabili.
Efficienza
Come misurare l’efficienza? Tradizionalmente si fa E =
output
; con un output  input si ha un numero
input
grande, quindi E è grande.
Si supponga di avere delle filiali di banche ed una sola misura di input (# dipendenti) e di output (#
transazioni).
Branch
Personal
Croydon
Dorking
Redhill
Reigate
125
44
80
23
Number of transactions
staff ('000s)
18
16
17
11
Chi è più efficiente? Una maniera tipica di misurare è tramite rapporti (nel senso di divisioni):
Branch
Croydon
Dorking
Redhill
Reigate
Personal transactions
per staff member ('000s)
6.94
2.75
4.71
2.09
2
In casi di questo tipo, si fa normalmente 100 l’efficienza del più efficiente (Croydon) e si rapportano gli altri
a lui, misurando l’efficienza relativa:
Branch
Croydon
Dorking
Redhill
Reigate
Relative efficiency
100(6.94/6.94) = 100%
100(2.75/6.94) = 40%
100(4.71/6.94) = 68%
100(2.09/6.94) = 30%
Come conclusione del processo di valutazione si ha tipicamente o un orientamento all’input (e.g.
mantenere lo stesso output con una riduzione dell’input – una persona in meno) o un orientamento
all’output (e.g. aumentare l’output mantenendo fisso l’input – incrementare le transazioni senza variare il
numero di personale).
La realtà però ci offre molti output e molti input; quale scegliere? Con molti output e molti input si hanno
molti numeri, e questo è inaccettabile: abbiamo bisogno di un singolo numero.
Branch
Croydon
Dorking
Redhill
Reigate
Personal transactions
(‘000s)
125
44
80
23
Business
transactions (‘000s)
50
20
55
12
Number of staff
18
16
17
11
Una maniera per gestire
questi casi più complessi è di
ricorrere alla grafica:
come si osserva Croydon è
quanto di meglio in relazione
ad una misura, mentre
Redhill lo è per un’altra.
La linea tracciata è chiamata
frontiera efficiente: essa
rappresenta il meglio che le
DMU non sulla frontiera
possono presumibilmente
(considerando la realtà come
una buona misura
dell’ottimalità) raggiungere.
Il nome Data Envelopment
Analysis viene dal fatto che la frontiera efficiente inviluppa tutti i dati.
Dominanza
3
Diciamo che la DMU k è non dominata se non esiste una DMU k’ tale
input2
che input1, k ' ≤ input1, k e input2, k ' ≤ input2, k : ad esempio tutte le
1
2
DMU con il circoletto intorno sono non dominate; la 3 è dominata
dalla 5.
3
5
4
Il concetto di dominanza mira ad affermare che, se una DMU è
dominata, non è poi così efficiente.
input1
Assunzione
E’ consentito formare nuove DMU come somme pesate di DMU esistenti per ottenere una DMU composita,
sintetica, virtuale.
Ci sono m input, i=1,…,m e n output, j=1,…,n.
Il livello dell’input i della DMU k è indicato con xik mentre il suo output da yik . Se si vuole costruire una
DMU composita, il peso da applicare alla DMU k è wk .
Supponendo di costruire una DMU composita chiaramente sarà wk ≥ 0 ∀k ; essi inoltre saranno o:
1.
∑w
= 1 , il chè implica che la DMU composita sia una combinazione convessa delle DMU esistenti
∑w
libero, cioè la DMU composita starebbe nel cono generato dalle DMU esistenti
k
k
2.
k
k
Come scegliere fra 1 e 2: dipende dall’orientamento riguardo le economie di scala.
DMUcomposita ,
Scegliendo 2, ha senso scrivere ad esempio 1 DMU 2 + 1 DMU 8 + 1 DMU17 =
2
2
2
dove la DMU composita dovrebbe sovrastare in efficienza quelle di partenza; in questo caso il peso totale è
∑w
k
k
=
3
e, implicitamente, stiamo assumendo che le “piccole” DMU 2, 8, 17 possano essere dilatate del
2
50%, senza perdite di efficienza; questo si chiama constant return to scale.
Viceversa, imponendo
∑w
k
k
DMUcomposita ,
= 1 e scrivendo 1 DMU 2 + 1 DMU 8 + 1 DMU17 =
2
2
2
si impone che la DMU composita operi alla stessa scala che quelle esistenti.
Sommario
∑w
k
=1
Vantaggi
Non assume CRS
k
∑w
k
libero
Più facile trovare la sol
Svantaggi
Più difficile trovare la sol. poiché
il problema è più vincolato
Assume CRS
k
Raffinamento del concetto di dominanza:
La DMU k (eventualmente composita) domina la k0 se sono vere entrambe le:
4
1)
xik ≤ xik0
i=
1,..., m (la DMU k utilizza meno di ciascun input della k0)
2)
y jk ≥ y jk0
j=
1,..., n (la DMU k produce più di ciascun output)
Una maniera alternativa di dire le cose è di introdurre E ( ≤ 1 ; tipicamente chiamata efficienza) e scrivere
che k domina k0 se è vera una delle:
1’)
xik ≤ Exik0
i=
1,..., m e vale la 2); cioè la DMU k utilizza solo 100E% dell’input di k0 per produrre
lo stesso o un migliore output;
2’)
y jk ≥
1
y jk
E 0
1,..., n e vale la 1); cioè la DMU k produce 100(1/E)% dell’output di k0 e utilizza
j=
lo stesso o meno input.
Quale approccio seguire dei 2 presentati è largamente questione di gusto: se si pensa che i manager
debbano raggiungere livelli di output più o meno fissi, ma ridurre i costi (input) si segue 1’; se si pensa che i
manager debbano massimizzare gli output in presenza di un livello fisso di input si segua la 2’.
Da un punto di vista algebrico è bene che E sia il più piccolo possibile anche se stona “minimizzare
l’efficienza”; si hanno 4 problemi (a seconda di come si tratta
∑w
k
):
k
min E
=
s.t. ∑ wk xik ≤ Exik0 i 1,..., m;1')
min
s.t.
k
=
∑ wk y jk ≥ y jk0 j 1,..., n; 2)
k
E
∑w x
k ik
≤ xik0
k
∑w y
k
jk
≥
k
1
y jk
E 0




 ∑ wk 1=

 ∑ wk 1
 k

 k

0
wk ≥=
k 1,..., d
wk ≥ 0
input oriented: ottieni lo stesso output per E<1 input
Output oriented
Di solito i 2 modelli output oriented sono scritti come:
max E '
s.t.
...
dove E’=1/E. Fra l’altro ciò permette di eliminare la non linearità presente.
∑w y
k
jk
≥ E ' y jk0
k
Discussione
Si veda l’esempio di soluzione con LINGO dei problemi di cui sono forniti a seguito i dati: Excel su questo
problema fallisce, mostrando la sua inaffidabilità.
5
Inputs
Staff
Supply expenses
Days open
City
Center
University Suburban Country
28,5
16,2
27,6
21
123
128
348
154
106
64
104
104
Lunches served
Dinners served
Servers trained
Managers trained
City
Center
University Suburban Country
4814
3462
3672
3316
4310
2711
4598
5646
25
15
17
16
4
3
2
8
Outputs
Sono disponibili le soluzioni con
∑w
k
k
= 1 e con
∑w
k
libero.
k
Osservazioni
• Qualunque sia la condizione sui wk, risolvendo il problema per CC, University e Country (k0=1,2,4) si
ottiene E*=1 e w* formato da tutti 0 con un 1 in posizione k0: la conclusione è che queste 3 DMU
non sono dominabili
•
Con k0=3 e
∑w
k
= 1 , si ha E*=90.39% e w*=(0.21,0.26,0,0.52), cioè 21%DMUcc + 26%DMUuniv +
k
•
•
52%DMUcountry = DMUSub
Le 3 DMU sono il peer group (il gruppo dei “pari”; i leader); è fra i membri dei peer group che si
devono cercare i comportamenti virtuosi da estendere agli altri: ad esempio, perché le supply
expenses di Sub sono così rilevanti rispetto agli altri.
Con k0=3 e
∑w
k
libero, si ha E*=88.77% e w*=(0,0.54,0,0.55); come era lecito attendersi, poiché
k
•
•
il problema è meno vincolato, il valore di E è inferiore
Il fatto che la somma dei pesi sia >1 indica che la DMU Sub è in uno stato di return to scale
crescente, cioè la sua dimensione ridotta la sta danneggiando nella valutazione comparativa.
La DMU composita (54%DMUuniv+55%DMUcountry) produce lo stesso output usando solo l’89%
dell’input. Le DMU univ e country formano il peer group
Considerazioni generali
•
•
E’ necessario risolvere i problemi di LP per k0=1,…,d
I pesi w* sono differenti per k0 differenti; ciò è bene e male:
o bene: ogni DMU è libera di scegliere i propri pesi per apparire al meglio possibile
o male: è difficile paragonare le ragioni dell’inefficienza fra 2 DMU inefficienti
•
“best-case” (è un problema algebrico): input oriented,
∑w
k
= 1 , si supponga che ci sia un output j
k
tale per cui y jk0 = max y jk , si supponga inoltre che il meglio di k0 sia j; detto altrimenti, l’output j di
k
6
k0 (la DMU sotto esame) sia il massimo per k0 e sia anche pari al massimo per lo stesso tipo di
output fra le DMU (è una coincidenza che si può verificare); in questo caso E*=1 poiché non c’è
maniera (algebrica) per combinazioni convesse di altre DMU di battere k0 su j, e questo anche se k0
fosse orribile sotto ogni altro punto di vista. Una cosa analoga si avrebbe nel caso output oriented
con xik0 = min xik . Implicazione: specialmente con
k
•
•
∑w
k
= 1 (ma purtroppo anche nel caso dei w
k
liberi) per non avere il risultato che tutte le DMU (o quasi) risultino efficienti è necessario avere il nr
delle DMU >> m+n.
Nonostante il punto precedente la DEA si è mostrata utile con la maggior parte dei dati reali noti,
mostrando l’inefficienza di oltre il 50% delle DMU
Dover avere molte DMU rispetto ad input ed output impone selettività su questi ultimi.
DEA e dualità
Come esempio prendiamo il modello input-oriented a w liberi:
min
w, E
s.t.
E
∑w x
∑w y
k ik
≤ Exik0
1,..., m;
i=
≥ y jk0
1,..., n;
j=
k
k
jk
k
wk ≥ 0
E libero
1,..., d
k=
Il problema posto è in una forma (quasi) canonica: non lo è poiché la variabile E è libera. La definizione di
duale per la forma canonica è:
Forma canonica
min cx
s.t. Ax ≥ b
x≥0
Porto il problema in forma canonica, ponendo E=E1-E2:
min
E1 − E2 + ∑ 0 wk
s.t.
∑ wk xik ≤ ( E1 − E2 ) xik0
∀i
∑w y
∀j
k
k
k
jk
≥ y jk0
k
wk , E1 , E2 ≥ 0
Porto tutte le variabili a sinistra:
max w T b
s.t.
wT A ≤ c
w≥0
7
E1 − E2
( E1 − E2 ) xik0 − ∑ wk xik ≥ 0 ∀i
min
s.t.
∑w y
k
k
jk
≥ y jk0
∀j
k
wk , E1 , E2 ≥ 0
Come è fatta la matrice A di questo problema e come sono fatti il vettore b e il vettore c:
A=
0
x1k0
− x1k0
− x11
... − x1d
...
...
...
xmk0
− xmk0
− xm1
... ...
... − xmd
0
0
...
0
...
0
y11
...
... y1d
... ...
yn1
ynd
...
1
−1
c=
0
...
0
b=
y1k0
...
ynk0
Introducendo, al posto delle w indicate nella espressione generale del duale, le m variabili ui e le n variabili
vj, la nuova funzione obiettivo diverrà: max
u ,v
m
∑v y
j
jk0
; i primi 2 vincoli saranno:
j
m
∑u x
≥ 1 e −∑ ui xik0 ≥ −1 ; l’ultimo può essere riscritto come:
luogo a :
∑u x
i =1
i ik0
i =1
m
i =1
i ik0
m
∑u x
i =1
i ik0
≤ 1 ; insieme, i 2 vincoli danno
= 1 . Seguiranno d vincoli −∑ ui xik + ∑ v j y jk ≤ 0 . Come conclusione il duale del
i
j
modello input-oriented a w liberi è:
max
u ,v
s.t.
∑v y
jk0
∑v y
jk
j
j
j
j
∑u x
− ∑ ui xik ≤ 0 ∀k
i
i ik0
=1
i
u, v ≥ 0
Questo duale può essere riscritto come:
∑v y
∑u x
j
max
u ,v
jk0
j
i ik0
i
∑v y
∑u x
j
s.t.
jk
j
i ik
i
u, v ≥ 0
≤ 1 ∀k
(1)
8
che è come venne presentata inizialmente la DEA, quando oggi si preferisce l’impostazione data in queste
note.
Si osservi (1) e si valuti la soluzione con u*=0 oppure con v*=0.
u*=0 non si può verificare altrimenti verrebbe violato il vincolo di uguaglianza. v*=0 invece si, anche se
appare privo di senso pratico. Per evitare una tale situazione si può introdurre un numero piccolo ma
strettamente positivo come in:
max
∑v y
jk0
∑v y
jk
j
u ,v
j
s.t.
wk
j
j
i
∑u x
E
− ∑ ui xik ≤ 0 ∀k
i ik0
=1
i
ui ≥ ε
vj ≥ ε
si
tj
Quale sia la ripercussione di allontanare da 0 le u e le v si vede nel duale, che è:


E − ε  ∑ si − ∑ t j 
j
 i

Exik0 − ∑ wk xik − si = 0 ∀i
min
s.t.
k
−t
∑ w y=
k
jk
j
y jk0
∀j
k
si , t j , wk ≥ 0; E libera
Questo modello può essere riscritto come:
min
s.t.


E − ε  ∑ si − ∑ t j 
j
 i

∑ wk xik ≤ Exik0
∀i
∑w y
∀j
k
k
jk
=
− t j y jk0
k
si , t j , wk ≥ 0; E libera
che è il modello originale con le slack penalizzate.
Ora che si è visto che la dualizzazione fa passare dal modello presentato a quello originale, è lecito chiedersi
quale sia l’effetto di
∑
Il modello originale è:
k
wk = 1 .
9
min
w, E
s.t.
ui
E
∑ w x ≤ Ex
∑w y ≥ y
∑w =1
1,..., m;
i=
wk ≥ 0
E libero
1,..., d
k=
k ik
ik0
k
vj
k
jk
1,..., n;
j=
jk0
k
σ
k
k
Il suo duale è:
max σ + ∑ v j y jk0
σ ,u , v
s.t.
j
∑v y
j
jk
j
∑u x
i ik0
− ∑ ui xik + σ ≤ 0
i
=1
i
u, v ≥ 0
Questo, riscritto secondo la forma della DEA originale, diviene:
σ + ∑ v j y jk
max
0
j
∑u x
i ik0
i
σ + ∑ v j y jk
s.t.
j
∑u x
0
≤1
i ik
i
u, v ≥ 0
Qui σ è il surplus/deficit in output guadagnato, forzando il rendimento di scala costante.
E’ da ricordare che ui* , v*j sono variabili duali ottime nel problema di LP in considerazione; può essere utile
controllarne i valori per interpretare i risultati:
ui vicino a 0
input i non importante per la DMU k0, che probabilmente si comporta male con tale input
ui>>0
la DMU k0 utilizza l’input i in modo più efficiente degli altri input
Variazioni della DEA
Ci sono situazioni in cui gli input, anche rilevanti, non sono sotto il controllo dei manager: ad esempio, il
numero di stanze in un hotel, il costo della vita in una città, la popolazione del mercato, etc.; è stupido
chiedere ad un manager di utilizzare solo Exik0 di un input che non controlla. Nel caso di input non
controllabili sembra più ragionevole utilizzare un approccio misto, come in:
10
min
w, E
s.t.
E
 xik0
w
x
≤
∑k k ik  Ex
 ik0
∑ wk y jk ≥ y jk0
se l'input i non è controllabile
∀i
se è controllabile
∀j
k
wk ≥ 0, E libero
Un altro problema anomalo è quello dei sindacati: come paragonare alberghi sindacalizzati ad altri che non
lo sono. La strategia utilizzata in letteratura è quella di restringere le DMU a quelle che hanno lo stesso o un
più facile ambiente operativo.
DEA ed economie di scala
La DMU A è inefficiente, cioè non è sulla frontiera.
Se si ragiona input-oriented, si mantenga lo stesso output, muovendosi verso la frontiera, raggiungendo B;
allora xB/xA<1 è la efficienza tecnica di input di A (ovviamente considerando solo i fattori di produzione, non
gli effetti di scala).
frontiera efficiente
di produzione
Outputs Y
Se si ragiona output-oriented, si mantengano gli
stessi input e si vada alla frontiera a C. Allora
l’efficienza tecnica di output di A è yC/yA>1.
Questi effetti tecnici sono stati ottenuti con
∑w
k
= 1 (la DMU composita viene forzata ad avere
k
yW
yC
yA
W
F
D
DRS
C
A
V B
IRS
xV xB xA
Inputs X
la stessa scala delle componenti).
Si noti che qui l’efficienza (output/input) è la
pendenza della linea dall’origine: la DMU F è la più
efficiente poiché si trova ad un livello di scala
ottimale; D è troppo grande per essere efficiente
(DRS); B è troppo piccola (IRS).
Per un caso input oriented, per tener conto anche
delle economie di scala, per quanto concerne A, manteniamo lo stesso output (yA), ci spostiamo alla linea
ottimale di scala di F e otteniamo la DMU virtuale V; V è oltre la frontiera efficiente, ma è in scala di F
assumendo CRS; allora l’efficienza di input di A, aggregata (scala+tecnica), è xV/xA<1.
Come discriminare fra DMU efficienti?
Alcuni passi per rendere migliori le DMU buone:
1)
Utilizzare le variabili duali ( ui , v j ): se >>0, raccolgono gli input e gli output in cui ogni DMU si comporta
bene.
11
2)
Se la DMU k0 è efficiente, ma quasi tutte le ui , v j = 0 può essere semplicemente un outlier;
sperimenta con
∑w
k
= 1 ; prova ad eliminare temporaneamente quegli input/output, per vedere se
k
la DMU diventa inefficiente.
12
Bibliografia
Autore sconosciuto, http://moezh.tripod.com/DEAtutorial/DEAtutorial.html
T. Anderson, A Data Envelopment Analysis (DEA) Home Page, http://www.emp.pdx.edu/dea/homedea.html
J. E. Beasley, Data Envelopment Analysis, http://people.brunel.ac.uk/~mastjjb/jeb/or/dea.html
A. Charnes, W.W. Cooper, E. Rhodes, Measuring the efficiency of decision making units, EJOR 2 (1978) 429-444
W. W. Cooper, L. M. Seiford, J. Zhu, Data Envelopment Analysis History Models and Interpretations, Springer, disponibile sul web cercando il titolo
T. McCormick, DEA, Note delle lezioni, 1999
M. Trick, Chapter 12, Data Envelopment Analysis, http://mat.gsia.cmu.edu/classes/QUANT/NOTES/chap12.pdf