1 Data Envelopment Analisys (DEA) Il problema In molti settori produttivi operano entità multi-unità (ad es. una catena di alberghi; ogni albergo è una unità); desideriamo sapere quali sono efficienti. Perché: 1. per valutare i manager 2. per studiare le caratteristiche delle unità efficienti e trasferire i loro lati positivi alle unità inefficienti: cosa c’è di buono nelle unità “buone” 3. per trovare opportunità di miglioramento delle unità inefficienti: dove e come dovrebbero essere migliorate; cosa c’è di cattivo nelle unità “cattive” 4. guadagnare conoscenza sulle condizioni che favoriscono i nostri affari: grande/piccolo mercato, alta/bassa qualità di servizio ai clienti, etc. 5. altro? La DEA nasce nel 1978 grazie a Charnes, Cooper e Rhodes. Suo obiettivo è valutare, tramite un modello di programmazione lineare, l’efficienza relativa (non assoluta) di unità produttive dette Decision Making Unit (DMU) in una organizzazione. E’ stata ampiamente utilizzata, in particolare nel settore turistico. Si suppone che ogni DMU abbia degli input e degli output, correlati fra di loro; in qualche modo il rapporto fra output e input deve portare a determinare quale sia la DMU più efficiente. Notazione Una prima nota è per le variabili di un problema di LP che a volte appaiono asteriscate: è una convenzione internazionale che, ad esempio w*, indichi il valore delle variabili w all’ottimo; è improprio, ma si dice che è il valore ottimo delle variabili. Efficienza Come misurare l’efficienza? Tradizionalmente si fa E = output ; con un output input si ha un numero input grande, quindi E è grande. Si supponga di avere delle filiali di banche ed una sola misura di input (# dipendenti) e di output (# transazioni). Branch Personal Croydon Dorking Redhill Reigate 125 44 80 23 Number of transactions staff ('000s) 18 16 17 11 Chi è più efficiente? Una maniera tipica di misurare è tramite rapporti (nel senso di divisioni): Branch Croydon Dorking Redhill Reigate Personal transactions per staff member ('000s) 6.94 2.75 4.71 2.09 2 In casi di questo tipo, si fa normalmente 100 l’efficienza del più efficiente (Croydon) e si rapportano gli altri a lui, misurando l’efficienza relativa: Branch Croydon Dorking Redhill Reigate Relative efficiency 100(6.94/6.94) = 100% 100(2.75/6.94) = 40% 100(4.71/6.94) = 68% 100(2.09/6.94) = 30% Come conclusione del processo di valutazione si ha tipicamente o un orientamento all’input (e.g. mantenere lo stesso output con una riduzione dell’input – una persona in meno) o un orientamento all’output (e.g. aumentare l’output mantenendo fisso l’input – incrementare le transazioni senza variare il numero di personale). La realtà però ci offre molti output e molti input; quale scegliere? Con molti output e molti input si hanno molti numeri, e questo è inaccettabile: abbiamo bisogno di un singolo numero. Branch Croydon Dorking Redhill Reigate Personal transactions (‘000s) 125 44 80 23 Business transactions (‘000s) 50 20 55 12 Number of staff 18 16 17 11 Una maniera per gestire questi casi più complessi è di ricorrere alla grafica: come si osserva Croydon è quanto di meglio in relazione ad una misura, mentre Redhill lo è per un’altra. La linea tracciata è chiamata frontiera efficiente: essa rappresenta il meglio che le DMU non sulla frontiera possono presumibilmente (considerando la realtà come una buona misura dell’ottimalità) raggiungere. Il nome Data Envelopment Analysis viene dal fatto che la frontiera efficiente inviluppa tutti i dati. Dominanza 3 Diciamo che la DMU k è non dominata se non esiste una DMU k’ tale input2 che input1, k ' ≤ input1, k e input2, k ' ≤ input2, k : ad esempio tutte le 1 2 DMU con il circoletto intorno sono non dominate; la 3 è dominata dalla 5. 3 5 4 Il concetto di dominanza mira ad affermare che, se una DMU è dominata, non è poi così efficiente. input1 Assunzione E’ consentito formare nuove DMU come somme pesate di DMU esistenti per ottenere una DMU composita, sintetica, virtuale. Ci sono m input, i=1,…,m e n output, j=1,…,n. Il livello dell’input i della DMU k è indicato con xik mentre il suo output da yik . Se si vuole costruire una DMU composita, il peso da applicare alla DMU k è wk . Supponendo di costruire una DMU composita chiaramente sarà wk ≥ 0 ∀k ; essi inoltre saranno o: 1. ∑w = 1 , il chè implica che la DMU composita sia una combinazione convessa delle DMU esistenti ∑w libero, cioè la DMU composita starebbe nel cono generato dalle DMU esistenti k k 2. k k Come scegliere fra 1 e 2: dipende dall’orientamento riguardo le economie di scala. DMUcomposita , Scegliendo 2, ha senso scrivere ad esempio 1 DMU 2 + 1 DMU 8 + 1 DMU17 = 2 2 2 dove la DMU composita dovrebbe sovrastare in efficienza quelle di partenza; in questo caso il peso totale è ∑w k k = 3 e, implicitamente, stiamo assumendo che le “piccole” DMU 2, 8, 17 possano essere dilatate del 2 50%, senza perdite di efficienza; questo si chiama constant return to scale. Viceversa, imponendo ∑w k k DMUcomposita , = 1 e scrivendo 1 DMU 2 + 1 DMU 8 + 1 DMU17 = 2 2 2 si impone che la DMU composita operi alla stessa scala che quelle esistenti. Sommario ∑w k =1 Vantaggi Non assume CRS k ∑w k libero Più facile trovare la sol Svantaggi Più difficile trovare la sol. poiché il problema è più vincolato Assume CRS k Raffinamento del concetto di dominanza: La DMU k (eventualmente composita) domina la k0 se sono vere entrambe le: 4 1) xik ≤ xik0 i= 1,..., m (la DMU k utilizza meno di ciascun input della k0) 2) y jk ≥ y jk0 j= 1,..., n (la DMU k produce più di ciascun output) Una maniera alternativa di dire le cose è di introdurre E ( ≤ 1 ; tipicamente chiamata efficienza) e scrivere che k domina k0 se è vera una delle: 1’) xik ≤ Exik0 i= 1,..., m e vale la 2); cioè la DMU k utilizza solo 100E% dell’input di k0 per produrre lo stesso o un migliore output; 2’) y jk ≥ 1 y jk E 0 1,..., n e vale la 1); cioè la DMU k produce 100(1/E)% dell’output di k0 e utilizza j= lo stesso o meno input. Quale approccio seguire dei 2 presentati è largamente questione di gusto: se si pensa che i manager debbano raggiungere livelli di output più o meno fissi, ma ridurre i costi (input) si segue 1’; se si pensa che i manager debbano massimizzare gli output in presenza di un livello fisso di input si segua la 2’. Da un punto di vista algebrico è bene che E sia il più piccolo possibile anche se stona “minimizzare l’efficienza”; si hanno 4 problemi (a seconda di come si tratta ∑w k ): k min E = s.t. ∑ wk xik ≤ Exik0 i 1,..., m;1') min s.t. k = ∑ wk y jk ≥ y jk0 j 1,..., n; 2) k E ∑w x k ik ≤ xik0 k ∑w y k jk ≥ k 1 y jk E 0 ∑ wk 1= ∑ wk 1 k k 0 wk ≥= k 1,..., d wk ≥ 0 input oriented: ottieni lo stesso output per E<1 input Output oriented Di solito i 2 modelli output oriented sono scritti come: max E ' s.t. ... dove E’=1/E. Fra l’altro ciò permette di eliminare la non linearità presente. ∑w y k jk ≥ E ' y jk0 k Discussione Si veda l’esempio di soluzione con LINGO dei problemi di cui sono forniti a seguito i dati: Excel su questo problema fallisce, mostrando la sua inaffidabilità. 5 Inputs Staff Supply expenses Days open City Center University Suburban Country 28,5 16,2 27,6 21 123 128 348 154 106 64 104 104 Lunches served Dinners served Servers trained Managers trained City Center University Suburban Country 4814 3462 3672 3316 4310 2711 4598 5646 25 15 17 16 4 3 2 8 Outputs Sono disponibili le soluzioni con ∑w k k = 1 e con ∑w k libero. k Osservazioni • Qualunque sia la condizione sui wk, risolvendo il problema per CC, University e Country (k0=1,2,4) si ottiene E*=1 e w* formato da tutti 0 con un 1 in posizione k0: la conclusione è che queste 3 DMU non sono dominabili • Con k0=3 e ∑w k = 1 , si ha E*=90.39% e w*=(0.21,0.26,0,0.52), cioè 21%DMUcc + 26%DMUuniv + k • • 52%DMUcountry = DMUSub Le 3 DMU sono il peer group (il gruppo dei “pari”; i leader); è fra i membri dei peer group che si devono cercare i comportamenti virtuosi da estendere agli altri: ad esempio, perché le supply expenses di Sub sono così rilevanti rispetto agli altri. Con k0=3 e ∑w k libero, si ha E*=88.77% e w*=(0,0.54,0,0.55); come era lecito attendersi, poiché k • • il problema è meno vincolato, il valore di E è inferiore Il fatto che la somma dei pesi sia >1 indica che la DMU Sub è in uno stato di return to scale crescente, cioè la sua dimensione ridotta la sta danneggiando nella valutazione comparativa. La DMU composita (54%DMUuniv+55%DMUcountry) produce lo stesso output usando solo l’89% dell’input. Le DMU univ e country formano il peer group Considerazioni generali • • E’ necessario risolvere i problemi di LP per k0=1,…,d I pesi w* sono differenti per k0 differenti; ciò è bene e male: o bene: ogni DMU è libera di scegliere i propri pesi per apparire al meglio possibile o male: è difficile paragonare le ragioni dell’inefficienza fra 2 DMU inefficienti • “best-case” (è un problema algebrico): input oriented, ∑w k = 1 , si supponga che ci sia un output j k tale per cui y jk0 = max y jk , si supponga inoltre che il meglio di k0 sia j; detto altrimenti, l’output j di k 6 k0 (la DMU sotto esame) sia il massimo per k0 e sia anche pari al massimo per lo stesso tipo di output fra le DMU (è una coincidenza che si può verificare); in questo caso E*=1 poiché non c’è maniera (algebrica) per combinazioni convesse di altre DMU di battere k0 su j, e questo anche se k0 fosse orribile sotto ogni altro punto di vista. Una cosa analoga si avrebbe nel caso output oriented con xik0 = min xik . Implicazione: specialmente con k • • ∑w k = 1 (ma purtroppo anche nel caso dei w k liberi) per non avere il risultato che tutte le DMU (o quasi) risultino efficienti è necessario avere il nr delle DMU >> m+n. Nonostante il punto precedente la DEA si è mostrata utile con la maggior parte dei dati reali noti, mostrando l’inefficienza di oltre il 50% delle DMU Dover avere molte DMU rispetto ad input ed output impone selettività su questi ultimi. DEA e dualità Come esempio prendiamo il modello input-oriented a w liberi: min w, E s.t. E ∑w x ∑w y k ik ≤ Exik0 1,..., m; i= ≥ y jk0 1,..., n; j= k k jk k wk ≥ 0 E libero 1,..., d k= Il problema posto è in una forma (quasi) canonica: non lo è poiché la variabile E è libera. La definizione di duale per la forma canonica è: Forma canonica min cx s.t. Ax ≥ b x≥0 Porto il problema in forma canonica, ponendo E=E1-E2: min E1 − E2 + ∑ 0 wk s.t. ∑ wk xik ≤ ( E1 − E2 ) xik0 ∀i ∑w y ∀j k k k jk ≥ y jk0 k wk , E1 , E2 ≥ 0 Porto tutte le variabili a sinistra: max w T b s.t. wT A ≤ c w≥0 7 E1 − E2 ( E1 − E2 ) xik0 − ∑ wk xik ≥ 0 ∀i min s.t. ∑w y k k jk ≥ y jk0 ∀j k wk , E1 , E2 ≥ 0 Come è fatta la matrice A di questo problema e come sono fatti il vettore b e il vettore c: A= 0 x1k0 − x1k0 − x11 ... − x1d ... ... ... xmk0 − xmk0 − xm1 ... ... ... − xmd 0 0 ... 0 ... 0 y11 ... ... y1d ... ... yn1 ynd ... 1 −1 c= 0 ... 0 b= y1k0 ... ynk0 Introducendo, al posto delle w indicate nella espressione generale del duale, le m variabili ui e le n variabili vj, la nuova funzione obiettivo diverrà: max u ,v m ∑v y j jk0 ; i primi 2 vincoli saranno: j m ∑u x ≥ 1 e −∑ ui xik0 ≥ −1 ; l’ultimo può essere riscritto come: luogo a : ∑u x i =1 i ik0 i =1 m i =1 i ik0 m ∑u x i =1 i ik0 ≤ 1 ; insieme, i 2 vincoli danno = 1 . Seguiranno d vincoli −∑ ui xik + ∑ v j y jk ≤ 0 . Come conclusione il duale del i j modello input-oriented a w liberi è: max u ,v s.t. ∑v y jk0 ∑v y jk j j j j ∑u x − ∑ ui xik ≤ 0 ∀k i i ik0 =1 i u, v ≥ 0 Questo duale può essere riscritto come: ∑v y ∑u x j max u ,v jk0 j i ik0 i ∑v y ∑u x j s.t. jk j i ik i u, v ≥ 0 ≤ 1 ∀k (1) 8 che è come venne presentata inizialmente la DEA, quando oggi si preferisce l’impostazione data in queste note. Si osservi (1) e si valuti la soluzione con u*=0 oppure con v*=0. u*=0 non si può verificare altrimenti verrebbe violato il vincolo di uguaglianza. v*=0 invece si, anche se appare privo di senso pratico. Per evitare una tale situazione si può introdurre un numero piccolo ma strettamente positivo come in: max ∑v y jk0 ∑v y jk j u ,v j s.t. wk j j i ∑u x E − ∑ ui xik ≤ 0 ∀k i ik0 =1 i ui ≥ ε vj ≥ ε si tj Quale sia la ripercussione di allontanare da 0 le u e le v si vede nel duale, che è: E − ε ∑ si − ∑ t j j i Exik0 − ∑ wk xik − si = 0 ∀i min s.t. k −t ∑ w y= k jk j y jk0 ∀j k si , t j , wk ≥ 0; E libera Questo modello può essere riscritto come: min s.t. E − ε ∑ si − ∑ t j j i ∑ wk xik ≤ Exik0 ∀i ∑w y ∀j k k jk = − t j y jk0 k si , t j , wk ≥ 0; E libera che è il modello originale con le slack penalizzate. Ora che si è visto che la dualizzazione fa passare dal modello presentato a quello originale, è lecito chiedersi quale sia l’effetto di ∑ Il modello originale è: k wk = 1 . 9 min w, E s.t. ui E ∑ w x ≤ Ex ∑w y ≥ y ∑w =1 1,..., m; i= wk ≥ 0 E libero 1,..., d k= k ik ik0 k vj k jk 1,..., n; j= jk0 k σ k k Il suo duale è: max σ + ∑ v j y jk0 σ ,u , v s.t. j ∑v y j jk j ∑u x i ik0 − ∑ ui xik + σ ≤ 0 i =1 i u, v ≥ 0 Questo, riscritto secondo la forma della DEA originale, diviene: σ + ∑ v j y jk max 0 j ∑u x i ik0 i σ + ∑ v j y jk s.t. j ∑u x 0 ≤1 i ik i u, v ≥ 0 Qui σ è il surplus/deficit in output guadagnato, forzando il rendimento di scala costante. E’ da ricordare che ui* , v*j sono variabili duali ottime nel problema di LP in considerazione; può essere utile controllarne i valori per interpretare i risultati: ui vicino a 0 input i non importante per la DMU k0, che probabilmente si comporta male con tale input ui>>0 la DMU k0 utilizza l’input i in modo più efficiente degli altri input Variazioni della DEA Ci sono situazioni in cui gli input, anche rilevanti, non sono sotto il controllo dei manager: ad esempio, il numero di stanze in un hotel, il costo della vita in una città, la popolazione del mercato, etc.; è stupido chiedere ad un manager di utilizzare solo Exik0 di un input che non controlla. Nel caso di input non controllabili sembra più ragionevole utilizzare un approccio misto, come in: 10 min w, E s.t. E xik0 w x ≤ ∑k k ik Ex ik0 ∑ wk y jk ≥ y jk0 se l'input i non è controllabile ∀i se è controllabile ∀j k wk ≥ 0, E libero Un altro problema anomalo è quello dei sindacati: come paragonare alberghi sindacalizzati ad altri che non lo sono. La strategia utilizzata in letteratura è quella di restringere le DMU a quelle che hanno lo stesso o un più facile ambiente operativo. DEA ed economie di scala La DMU A è inefficiente, cioè non è sulla frontiera. Se si ragiona input-oriented, si mantenga lo stesso output, muovendosi verso la frontiera, raggiungendo B; allora xB/xA<1 è la efficienza tecnica di input di A (ovviamente considerando solo i fattori di produzione, non gli effetti di scala). frontiera efficiente di produzione Outputs Y Se si ragiona output-oriented, si mantengano gli stessi input e si vada alla frontiera a C. Allora l’efficienza tecnica di output di A è yC/yA>1. Questi effetti tecnici sono stati ottenuti con ∑w k = 1 (la DMU composita viene forzata ad avere k yW yC yA W F D DRS C A V B IRS xV xB xA Inputs X la stessa scala delle componenti). Si noti che qui l’efficienza (output/input) è la pendenza della linea dall’origine: la DMU F è la più efficiente poiché si trova ad un livello di scala ottimale; D è troppo grande per essere efficiente (DRS); B è troppo piccola (IRS). Per un caso input oriented, per tener conto anche delle economie di scala, per quanto concerne A, manteniamo lo stesso output (yA), ci spostiamo alla linea ottimale di scala di F e otteniamo la DMU virtuale V; V è oltre la frontiera efficiente, ma è in scala di F assumendo CRS; allora l’efficienza di input di A, aggregata (scala+tecnica), è xV/xA<1. Come discriminare fra DMU efficienti? Alcuni passi per rendere migliori le DMU buone: 1) Utilizzare le variabili duali ( ui , v j ): se >>0, raccolgono gli input e gli output in cui ogni DMU si comporta bene. 11 2) Se la DMU k0 è efficiente, ma quasi tutte le ui , v j = 0 può essere semplicemente un outlier; sperimenta con ∑w k = 1 ; prova ad eliminare temporaneamente quegli input/output, per vedere se k la DMU diventa inefficiente. 12 Bibliografia Autore sconosciuto, http://moezh.tripod.com/DEAtutorial/DEAtutorial.html T. Anderson, A Data Envelopment Analysis (DEA) Home Page, http://www.emp.pdx.edu/dea/homedea.html J. E. Beasley, Data Envelopment Analysis, http://people.brunel.ac.uk/~mastjjb/jeb/or/dea.html A. Charnes, W.W. Cooper, E. Rhodes, Measuring the efficiency of decision making units, EJOR 2 (1978) 429-444 W. W. Cooper, L. M. Seiford, J. Zhu, Data Envelopment Analysis History Models and Interpretations, Springer, disponibile sul web cercando il titolo T. McCormick, DEA, Note delle lezioni, 1999 M. Trick, Chapter 12, Data Envelopment Analysis, http://mat.gsia.cmu.edu/classes/QUANT/NOTES/chap12.pdf