La teoria delle decisioni L’oggetto della Decision Theory è la decisione intesa come scelta tra alternative • Esempi: se introdurre o meno di un nuovo prodotto, se rinnovare un impianto oppure aprirne uno nuovo, se effettuare o meno un investimento, di quanto rifornirsi per soddisfare una domanda di prodotto, ... Teoria delle Decisioni Decisioni dagli esiti non deterministici • Le conseguenze di una decisione non sono certe • Casi diversi da quelli affrontati con i metodi di ottimizzazione (funzione obiettivo = misura certa della prestazione) 30/01/2002 15.15 M.Paolucci, R.Pesenti M.Paolucci, R.Pesenti 1 2 La teoria delle decisioni La teoria delle decisioni Un semplice esempio • The newsvendor model: Un venditore di giornali deve decidere di quanto rifornirsi Acquista i giornali a 40 e li vende a 75 Non conosce a priori quale sarà la domanda di giornali Se si rifornisce in eccesso perde l’investimento (40 per invenduto) Se si rifornisce in difetto perde potenziali clienti (stima 50 per cliente) Se ad esempio i livelli di domanda fossero d=0,1,2,3 Fasi dell’analisi decisionale (Decision Analysis, DA) • Individuazione delle alternative Ai, i=1,...,m (mutuamente esclusive) • Individuazione degli eventi futuri (stati della natura) Sj, j=1,...,n (esaustivi e mutuamente esclusivi) ∪i Si = S Si ∩ Sj = ∅ ; • Calcolo (stima) degli esiti della scelta nei diversi stati della natura (payoff) Vij, i=1,...,m; j=1,...,n Livello della domanda Decisione 0 1 2 3 0 0 -50 -100 -150 1 -40 35 -15 -65 2 -80 -5 70 20 3 -120 -45 30 105 Matrice dei Payoff M.Paolucci, R.Pesenti S1 ... Sn A1 V11 ... V1n ... ... Vij ... An Vm1 ... Vmn M.Paolucci, R.Pesenti 3 4 La teoria delle decisioni La teoria delle decisioni certezza Fasi dell’analisi decisionale • Valutazione delle alternative Tre classi di decisioni • Decisioni in condizioni di certezza lo stato futuro della natura (esiti della decisione) sono certi • Decisioni in condizioni di rischio lo stato futuro della natura è noto in probabilità • Decisioni in condizioni di incertezza non si conosce nulla circa lo stato futuro della natura ProdMix rischio incertezza cj var. aleatorie cj cj∈{cj1, cj2, cj3} p(cj) Imperfezione dell’informazione Inaffidabilità dei modelli (insoddisfazione delle soluzioni) Condizioni di rischio • la probabilità fornisce una misura del “rischio” di una decisioni • normalmente è una probabilità soggettiva (stima) • Sono tre modelli “artificiali” (nella realtà non si verificano quasi mai) • Si cerca di modellare le situazioni di informazione imperfetta o parziale M.Paolucci, R.Pesenti M.Paolucci, R.Pesenti 5 6 La teoria delle decisioni La teoria delle decisioni Decisioni strutturate e non strutturate Nella realtà i fattori soggettivi (emotivi, avversione al rischio, valutazioni non quantitative) giocano un ruolo fondamentale La teoria delle decisioni fornisce un supporto metodologico per confrontare alternative decisionali I metodi assumono un comportamento razionale del decisore (Decision Maker, DM): • “Un DM è razionale se sceglie l’alternativa che giudica la migliore” • Assunzioni della DA: il DM è in grado di quantificare i suoi giudizi sui possibili stati futuri della natura (probabilità soggettive) il DM è in grado di specificare le sue preferenze circa la desiderabilità delle alternative (teoria dell’utilità) il DM (consistentemente rispetto alle probabilità soggettive e alla propria utilità) sceglie l’alternativa che massimizza l’utilità attesa Strutturate Non strutturate Certezza Ripetitività Operative Obiettivo singolo Procedure disponibili Incertezza Unicità Strategiche Obiettivi multipli contrastanti Non esistono procedure DM sempre razionali DM spesso non razionali Ruolo della DA • fornire strumenti metodologici che aiutano i DM a prendere decisioni razionali, ossia consistenti con i loro giudizi di preferenza M.Paolucci, R.Pesenti M.Paolucci, R.Pesenti 7 8 La teoria delle decisioni D.A. – Decisioni in condizioni di rischio Si suppongono specificate le probabilità (soggettive) degli stati futuri della natura Teoria delle decisioni vs Teoria dei giochi Si basano sulla massimizzazione del valore atteso • Alternative Ai, i=1,...,m • Nella Game Theory si ipotizza la presenza di più DM che operano in competizione ⇒ la decisione del DM è presa in presenza di entità intelligenti che agiscono in opposizione (tendono a determinare uno stato futuro sfavorevole per il DM) e possono subire a loro volta conseguenze (negative) in seguito alla decisione del DM • Stati delle natura Sj, j=1,...,n • Probabilità di occorrenza degli stati p(Sj) • Matrice dei payoff V (n×m) V =[Vij,i=1,...,m j=1,...,n] • Valore monetario atteso dell’alternativa i EVi = ∑j p(Sj)Vij • Nella Decision Analysis non esiste un entità che opera in opposizione ma un’entità, la “natura”, che determina lo stato futuro restando indifferente rispetto alle decisioni del DM (l’oppositore è la natura che non agisce in modo malevolo) • Valore monetario atteso massimo (EV) EV = maxi EVi A* = { Ai : i = arg maxi EVi } M.Paolucci, R.Pesenti M.Paolucci, R.Pesenti 9 D.A. – Decisioni in condizioni di rischio D.A. – Decisioni in condizioni di rischio Il criterio del massimo EV non è generalmente accettabile Il criterio del massimo EV non è generalmente accettabile • Esempio 1: decidere un investimento • Esempio 2: una diversa opportunità di un investimento per DM1 ricavo 100.000 p=0,5 ricavo 23.000 p=0,5 18.000 Investimento 80000 Investimento EV = 30.000 di 20.000 1-p=0,5 ricavo 0 10 di 5.000 -20000 1-p=0,5 ricavo 0 Guadagno atteso = EV = 30.000 EV = 6.500 -5000 Guadagno atteso = EV = 6.500 Due diversi decisori: DM1: una perdita > 5.000 corrisponde alla bancarotta ⇒non investe Anche se il EV è molto inferiore DM1 questa volta accetta di investire! DM2: dispone di un surplus di capitale ⇒investe La decisione dipende dalla diversa propensione del DM a rischiare M.Paolucci, R.Pesenti M.Paolucci, R.Pesenti 11 12 D.A. – Decisioni in condizioni di rischio D.A. – Decisioni in condizioni di rischio Il criterio del massimo EV non è generalmente accettabile La decisione è presa considerando l’utilità attesa • Perché il criterio del massimo valore atteso monetario non funziona? L’utilità è una misura (cardinale) della preferenza di un DM in presenza di rischio • Si basa sull’ipotesi che la situazione decisionale si possa ripetere un numero sufficiente grande di volte: Tiene conto dei payoff delle alternative ma anche della diversa avversione o propensione al rischio del DM se Zi, i=1,..n sono le realizzazioni di una variabile aleatoria Z con media E[Z] e varianza σ2 ... La funzione di utilità, U(.), fornisce un valore numerico che è legato al valore intrinseco della decisione per un DM la media della sequenza campionaria tende a E[Z] per n →∞ dato che la varianza della sequenza σ2 / n →0 U(.) esprime una misura soggettiva: • se A > B (A è preferita a B) ⇒U(A) > U(B) • U(A) è una misura proporzionale alla preferenza del DM per A • è determinata fissando l’origine (zero) e la scala dei valori di utilità • Il criterio si basa sulla legge dei grandi numeri ma la decisione reale è unica e non può essere ripetuta M.Paolucci, R.Pesenti M.Paolucci, R.Pesenti 13 D.A. – Decisioni in condizioni di rischio 14 D.A. – Decisioni in condizioni di rischio Costruzione della funzione di utilità (l’esperimento di Von NeumannMorgenstern) Esempio: A1:investimento es. 1, A2:investimento es. 2. • La lotteria standard (standard lottery) S(p) Scelta p 1-p XE XD U(XE) EU(A1) = 50 U(XD) U(XE) =100 p=0,5 80.000 1-p = 0,5 -20.000 p=0,5 18.000 U(X1) =95 1-p = 0,5 -5.000 U(X2) =75 U(XD)=0 Scelta • XE è la conseguenza più desiderabile (utilità massima) • XD è la conseguenza meno desiderabile (utilità minima) EU(A2) = 85 • Data un’alternativa A, U(A) si costruisce chiedendo al DM di specificare per quale livello di p risulta indifferente scegliere A o partecipare alla lotteria S(p) M.Paolucci, R.Pesenti U(A) = EV(S(p)) = pU(XE)+(1-p)U(XD) M.Paolucci, R.Pesenti 15 16 D.A. – Decisioni in condizioni di rischio D.A. – Decisioni in condizioni di rischio Determinazione dell’utilità delle alternative: Commenti (cont.): in questo caso, l’utilità è normalizzata a 100. Altre scelte possono essere adottate, vedi in seguito la CME. alla conseguenza X2 è imposta utilità 75, i.e., il decisore piuttosto che perdere con certezza 5.000 EUR parteciperebbe ad una lotteria in cui la probabilità di vittoria di 80.000 EUR è ≥75% e la probabilità di perdere 20.000 EUR è il ≤25%. Si noti che il DM preferisce perdere Si inizia fissando l’utilità delle conseguenze ultime delle varie decisioni, si procede quindi all’indietro determinando l’utilità delle varie alternative: con certezza 5.000 EUR per probabilità di perdita superiore al 25%; alla conseguenza più desiderabile XE è imposta utilità 100; data l’utilità delle sue possibili conseguenze, l’utilità (attesa) dell’alternativa A1 (vedi lucidi successivi) è 50 = 0.5U(XE)+ 0.5U(XD); alla conseguenza meno desiderabile XD è imposta utilità 0; alla conseguenza X1 è imposta utilità 95, i.e., il decisore rinuncerebbe ai suoi 18.000 EUR solo per partecipare ad una lotteria in cui la probabilità di vittoria di 80.000 EUR è ≥ 95% e la probabilità di perdere 20.000 EUR è ≤5%; in modo analogo, l’utilità (attesa) dell’alternativa A2 è 85 = 0.5U(X1)+ 0.5U(X2). (continua) M.Paolucci, R.Pesenti M.Paolucci, R.Pesenti 17 D.A. – Decisioni in condizioni di rischio 18 D.A. – Decisioni in condizioni di rischio Esempio: Calcolo utilità A2. p=0,5 Scelta A2 1-p = 0,5 calcolando la probabilità totale che si verifichi 80.000 e –20.000 si ottiene, l’albero seguente. 18.000 U(X1) =95 -5.000 U(X2) =75 Data la definizione di utilità alla Von Neumann-Morgenstern, i due alberi sono equivalenti. p=0,95 p=0,5 Scelta Scelta 80.000 A2 p=0,85 1-p = 0,15 80.000 -20.000 U(X1) =95 1-p = 0,05 -20.000 per il DM scegliere l’alternativa A2 equivale a sottoporsi ad una lotteria in cui vi sia la probabilità p=0,85 di vincere 20.000EUR e la probabilità 1-p=0,15 di perdere 20.000EUR. L’utilità di A2 corrisponde quindi a 0,85 ovvero al valore atteso ottenendo mediando le utilità di X1 e X2. A2 p=0,75 1-p = 0,5 80.000 U(X2) =75 1-p = 0,25 Questo risultato è vero in generale come si può banalmente provare, imponendo le utilità e le probabilità come dei parametri. -20.000 M.Paolucci, R.Pesenti M.Paolucci, R.Pesenti 19 20 D.A. – Decisioni in condizioni di rischio D.A. – Decisioni in condizioni di rischio Costruzione della funzione di utilità: la CME (Certezza Monetaria Equivalente) 1 Costruzione della funzione di utilità: la CME (Certezza Monetaria Equivalente) retta del valore atteso EVi=piXE+(1-pi)XD pi • La CME è anche la minima somma a cui il DM è disposto a cedere il diritto a partecipare alla lotteria S(pi) Esempio: lotteria con premi A e B premio di rischio (risk premium) > 0 in presenza di avversione al rischio funzione di utilità 0 XD CMEi B Vj 500 2 Uj 1 0 p 1-p Ai XE • La CME è il massimo valore che il DM è disposto a pagare per una lotteria con probabilità pi, ossia con EV pari ad Ai Se p=0,5 EV=500p+2(1-p)=251 • L’utilità della CME è uguale alla utilità della lotteria CME=21 U(CMEi) = piU(XE) + (1-pi)U(XD) M.Paolucci, R.Pesenti A 1 0,5 0 2 21 251 500 M.Paolucci, R.Pesenti 21 D.A. – Decisioni in condizioni di rischio 22 D.A. – Decisioni in condizioni di rischio Costruzione della funzione di utilità: L’avversione al rischio Scelta della struttura della funzione di utilità • La curva di utilità indica l’avversione o propensione al rischio del DM Proprietà locali di U(x) DM avverso al rischio DM propenso al rischio (concava) (convessa) Per studiare le proprietà locali della funzione utilità si suppone di avere un capitale x e di partecipare ad una lotteria il cui risultato è il valore stocastico D definito dai possibili premi –d ≤ d i ≤ d, ognuno con probabilità pi e dove d è un valore infinitesimo. Sia EV=E{D} = 0, mentre ovviamente sia var{D} > 0. La certezza monetaria equivalente di questa situazione CME(x+D) è vicino a x (coinciderebbe con x, se d=0) e dipende da var{D}. In ipotesi di avversione al rischio, CME(x+D) diminuisce all’aumentare di var{D}. • L’andamento della curva per un DM può variare nel tempo • La curva è non decrescente (l’utilità cresce con il ritorno) • Com’è la curva nel caso di indifferenza al rischio? M.Paolucci, R.Pesenti M.Paolucci, R.Pesenti 23 24 D.A. – Decisioni in condizioni di rischio D.A. – Decisioni in condizioni di rischio Calcolo di CME(x+D) U(CME(x +D)) = ΣiU(x+di)pi ≅ Σi (U(x)+ U’(x) di + ½U”(x) di2) pi = = U(x)Σipi + U’(x)Σi di pi+ ½ U”(x)Σ 2 i di pi = Proprietà globali di U(x) U(x) + ½ U”(x) var{D} Dalla soluzione dell’equazione differenziale da cui U”(x) +r(x)U’(x) = 0 CME(x +D) = U-1(U(x) + ½ U”(x) var{D}) ≅ U(xmin) = 0 ≅ x + ½ (U”(x) var{D}) / U’(x) = x - ½ r(x) var{D} U(xmax) = 100 Nella prima equazione si sono approssimati in valori di U(.) con il suo sviluppo in serie di Taylor fino al secondo grado in quanto la somma delle componenti di primo grado è uguale a 0. si ottiene la funzione di utilità U(x) desiderata. Al variare di r(x) si ottengono funzioni di utilità diverse. Nella seconda equazione si sono approssimati in valori di U-1 (.) con il suo sviluppo in serie di Taylor, tenendo presente che la derivata di una funzione inversa è uguale all’inverso della derivata della funzione diretta. La funzione r(x) è detta Pratt-Arrow measure of [absolute] risk aversion. Se il DM è avverso al rischio r(x) ≥ 0, in quanto U”(x) ≤ 0 e U’(x) ≥ 0. M.Paolucci, R.Pesenti M.Paolucci, R.Pesenti 25 26 D.A. – Decisioni in condizioni di rischio D.A. – Decisioni in condizioni di rischio r(x) = r = costante r(x) decrescente in x U(x) = a - b e-rx è ragionevole ritenere che il DM abbia la stessa r per lotterie diverse se queste coinvolgono valori paragonabili. r(x) costante implica che l’avversione al rischio del DM non dipende dalla disponibilità del capitale, ma solo dalla variabilità dei possibili risultati della lotteria. Equivalentemente: • Il DM decide se partecipare a una lotteria solo in base alle probabilità dei vari premi e ai loro valori relativi. Il DM ritiene che i CME di due lotterie, i cui premi corrispondenti hanno le stesse probabilità e hanno valori che differiscono per una costante Q, a loro volta differiscono per la stessa costante Q. • Esempio, se il DM ritiene che vale la pena partecipare ad una lotteria con costo 1000 dove vi è il 50% di probabilità di ricavare 500 e il 50% di probabilità di ricavare 2000, allo stesso modo riterrà che vale la pena partecipare ad una lotteria con costo 10000 dove vi è il 50% di probabilità di ricavare 9500 e il 50% di probabilità di ricavare 11000. r(x) = 1/(x + c) ⇒U(x) = a + b log(x + c) r(x) = (1 - α)/(x + c) con 0 <α < 1 ⇒U(x) = a + b(1/α)(x+c)α r(x) decrescente in x implica che l’avversione al rischio del DM diminuisce con la maggiore disponibilità del capitale. Equivalentemente • Il DM diventa meno sensibile a possibili variazioni del proprio capitale finale. Il DM è tanto meno disponibile a pagare un premio di rischio per evitare tali variazioni tanto più piccole sono le variazioni rispetto al capitale. • Esempio, il DM potrebbe ritenere che non vale la pena partecipare ad una lotteria con costo 1000 dove vi è il 50% di probabilità di ricavare 500 e il 50% di probabilità di ricavare 2000, ma che valga la pena partecipare ad una lotteria con costo 10000 dove vi è il 50% di probabilità di ricavare 9500 e il 50% di probabilità di ricavare 11000. Si noti che non vale lo stesso ragionamento per valori in proporzione, e.g., costo 10000, premi 5000 e 20000. M.Paolucci, R.Pesenti M.Paolucci, R.Pesenti 27 28 D.A. – Decisioni in condizioni di rischio D.A. – Decisioni in condizioni di rischio Esempio di stima empirica della curva di utilità Il management della ACME, che si vuole mantenere coerente con le decisioni A, B, C e D, prese nel passato, deve decidere se accettare l’investimento E. Investimento richiesto Ricavo atteso in caso di successo Probabilità a priori di successo Investimento effettuato o rifiutato A 100 200 60% effettuato B 150 250 70% rifiutato C 120 300 85% effettuato D 40 70 60% rifiutato E 90 150 75% da decidere Nell’ipotesi che il denaro se non investito produca guadagno nullo si può affermare che Valore monetario Stima U(0) Correttezza stima Valore con utilità 0 Valore con utilità 100 A 0 60% sovrastima -100 100 B 0 70% sottostima -150 100 C 0 85% sovrastima -120 180 D 0 60% sottostima -40 30 Se il denaro potesse essere investito anche in altro modo nella colonna valore monetario si dovrebbe inserire il guadagno prodotto dall’investimento alternativo M.Paolucci, R.Pesenti M.Paolucci, R.Pesenti 29 D.A. – Decisioni in condizioni di rischio 30 D.A. – Decisioni in condizioni di rischio Nell’ipotesi ragionevole che si possa usare una r(x) = r per tutti gli investimenti deve valere che Investimento C: U(0) ≤0.60U(180) + 0.40 U(-120) e-0r ≥ 0.85 e-180r+ 0.15 e120r Investimento A: U(0) ≤0.60U(100) + 0.40 U(-100) a-b e-0r ≤0.60(a - b e-100r) e-0r ≥ 0.60 e-100r+ 0.40 e100r + 0.40(a - b 0 ≤r ≤0.0153 Investimento D: U(0) ≥ 0.60U(40) + 0.40 U(-30) e100r) e-0r ≤0.70 e-40r+ 0.30 e30r (*) risolvendo numericamente la disequazione (*) si ottiene che per ogni 0 ≤ r ≤ 0.0040, dove 0.0040 è il valore massimo di r per cui la (*) è vera, l’utilità di 0 è minore dell’utilità della lotteria corrispondente e che quindi l’investimento A viene eseguito. Investimento B: U(0) ≥ 0.70U(100) + 0.30 U(-150) e-0r ≤0.70 e-100r+ 0.30 e150r r ≥ 0.0033 Dai risultati ottenuti per i diversi investimenti si deduce che 0.0035 ≤r ≤0.0040 Investimento E: si calcola U(0)= 0.75U(60) + 0.25 U(-90) per r≠0, ottenendo r=0,0090 da cui si deduce che per 0.0035 ≤ r ≤0.0040 si ha U(0) ≤0.75U(60) + 0.25 U(-90). (**) risolvendo numericamente la disequazione (**) si ottiene che per ogni r ≥ 0.0035, dove La scelta di effettuare l’investimento E sarebbe quindi coerente con le decisioni passate. 0.0035 è il valore minimo di r per cui la (**) è vera, l’utilità di 0 è maggiore dell’utilità della lotteria corrispondente e che quindi l’investimento B non viene eseguito M.Paolucci, R.Pesenti M.Paolucci, R.Pesenti 31 32 D.A. – Decisioni in condizioni di rischio D.A. – Decisioni in condizioni di rischio Esempio di stima empirica della curva di utilità Alberi decisionali • Formalizzano le decisioni in condizioni di rischio in base al criterio del valore (utilità) attesa (Ipotesi: i payoff esprimono l’utilità del DM) • Mettono in evidenza le conseguenze delle decisioni • Utili per studiare processi decisionali a stadi (sequenza di decisioni) Si stimi il valore di r per una funzione di utilità U(x) = a - b e-rx sapendo che il DM ritiene β la CME di una lotteria i cui premi sono distribuiti normalmente con media µ e deviazione standard σ. Deve valere e − rβ 1 = 2π σ +∞ ∫e − ( x− µ )2 2σ 2 • Elementi: e − rx dx nodi di decisione: scelta tra alternative −∞ nodi evento: si verifica uno tra più stati della natura da cui e − rβ = e − rµ + r 2σ 2 2 1 2π σ 2 2 +∞ ( x − ( µ − rσ )) − 2σ 2 ∫e dx ⇔ r = −∞ nodi terminali: foglie dell’albero con associati i valori di guadagno (utilità) determinato dalla catena di decisioni ed eventi 2( µ − β ) σ2 M.Paolucci, R.Pesenti M.Paolucci, R.Pesenti 33 D.A. – Decisioni in condizioni di rischio D.A. – Decisioni in condizioni di rischio Alberi decisionali Alberi decisionali • Esempio • Esempi eventi A1 conseguenze p1 se Acme attende la concorrenza potrebbe precederla annunciando il proprio prodotto rubandole fette di mercato ... Am la ditta Acme vuole introdurre un nuovo prodotto non completamente testato sul mercato il prodotto se introdotto troppo in anticipo potrebbe non soddisfare i clienti perché presenta ancora difetti cm1 ... punto di decisione 34 la decisione si sviluppa su T=3 periodi (e.g., mesi) pn sono stati stimanti per t=1,...,T: – rt profitto se Acme immette il prodotto prima della concorrenza – gt profitto se Acme immette il prodotto insieme alla concorrenza alternative – ht profitto se Acme immette il prodotto dopo la concorrenza supponiamo che rt > gt > ht (anche se per t=1 potrebbe non valere) M.Paolucci, R.Pesenti M.Paolucci, R.Pesenti 35 36 D.A. – Decisioni in condizioni di rischio D.A. – Decisioni in condizioni di rischio Alberi decisionali Alberi decisionali • Esempio • Esempio pt la probabilità (soggettiva stimata) che la concorrenza annunci il prodotto sul mercato nel periodo t Si calcola il EV e lo si associa ad ogni nodo evento Si calcola il massimo EV tra i nodi evento e lo si associa al nodo decisione Acme ha deciso di immettere il prodotto comunque se la concorrenza annuncia il proprio annuncio annuncio p1 EVimm g1 imm. immissione 1-p1 f1 r1 p1 g1 1-p1 r1 EVimm=p1g1+(1-p1)r1 EVnon imm=p1h1 non annuncio non annuncio non immissione M.Paolucci, R.Pesenti p1 h1 1-p1 0 p1 h1 EVnon imm 1-p1 0 non imm. f1=max [EVimm, EVnon imm] M.Paolucci, R.Pesenti 37 D.A. – Decisioni in condizioni di rischio D.A. – Decisioni in condizioni di rischio Alberi decisionali Alberi decisionali • Esempio: T=3 periodi e per t=3 si stima che la concorrenza annuncerà • Esempio certamente annuncio EVimm imm. f1 p1 g1 1-p1 r1 Si procede a ritroso dallo stadio 3 (backward come per la P.D.) p3 non annuncio non imm. p1 p2 g2 1-p2 r2 imm. g3 EVi3 = p3 g3 EVni3 =p3 h3 h1 imm. EVnon imm 1-p1 p2 f2 M.Paolucci, R.Pesenti 38 non imm. f3 p3 h2 non imm. h3 p3 = 1 f3= max [EVi3, EVni3 ]= g3 p3 f3 p3 g3 imm. 1-p2 non imm. h3 M.Paolucci, R.Pesenti 39 40 D.A. – Decisioni in condizioni di rischio D.A. – Decisioni in condizioni di rischio Alberi decisionali Alberi decisionali • Esempio • Esempio Per t=2 Per t=1 p2 imm. f2 non imm. g2 1-p2 r2 p2 h2 EVi2 = p2 g2 + (1- p2 )r2 EVni 2 imm. = p2 h2 + (1- p2 )f3 = p2 h2 + (1- p2 )g3 f1 non imm. g1 1-p1 r1 p1 h1 EVi1 = p1 g1 + (1- p1 )r1 EVni2 = p1 h1 + (1- p1 )f2 f1= max [EVi1, EVni1 ] 1-p1 f2= max [EVi2, EVni2 ] 1-p2 p1 f2 f3 M.Paolucci, R.Pesenti M.Paolucci, R.Pesenti 41 D.A. – Decisioni in condizioni di rischio D.A. – Decisioni in condizioni di rischio Alberi decisionali Il valore atteso della perdita di opportunità (Expected Opportunity Loss, EOL) • Esempio: caso numerico 1 ⋅ 90 (imm .) f 3 = max 1 ⋅ 80 ( non imm .) 42 • Considera la perdita rispetto il massimo guadagno possibile h1=40 g1=50 r1=60 p1=0,2 h2=75 g2=80 r2=100 p2=0,4 h3=80 g3=90 Lij = Vjmax – Vij p3=1 dove Vjmax = maxi Vij n EOLi = ∑ p(S j )Lij 0,4 ⋅ 80 + 0,6 ⋅100 = 92 (imm.) f 2 = max 0,4 ⋅ 75 + 0,6 ⋅ 90 = 84 (non imm.) j =1 EOL* = min EOLi i 0,2 ⋅ 50 + 0,8 ⋅ 60 = 58 (imm.) f1 = max 0,2 ⋅ 40 + 0,8 ⋅ 92 = 81,6 (non imm.) M.Paolucci, R.Pesenti M.Paolucci, R.Pesenti 43 44 D.A. – Decisioni in condizioni di rischio D.A. – Decisioni in condizioni di rischio Il valore atteso della perdita di opportunità (Expected Opportunity Loss, EOL) • Esempio Il valore atteso della perdita di opportunità (Expected Opportunity Loss, EOL) • Due osservazioni: Vij ann. non ann. Lij ann. non ann. p=0,4 1-p=0,6 p=0,4 1-p=0,6 imm. g1=50 r1=60 imm. 0 0 non imm. h1=40 0 non imm. 10 60 EV* = max [0,4⋅ 50+0,6⋅ 60; 0,4⋅ 40] Il criterio del massimo EV e del minimo EOL forniscono sempre la medesima soluzione Nell’esempio il problema decisionale era di semplice soluzione perché l’alternativa “immettere” era dominante! Nella DA le alternative dominate possono essere escluse EOL* = min [0; 0,4⋅ 10+0,6 ⋅ 60] Definizione = 0 (imm.) Ai è dominata se esiste una Ak, k≠i, tale che Vij ≤V kj ∀j e vale Vij<Vkj per = 56 (imm.) almeno un j M.Paolucci, R.Pesenti M.Paolucci, R.Pesenti 45 46 D.A. – Decisioni in condizioni di rischio D.A. – Decisioni in condizioni di rischio Esempio: la scelta se prendere o meno l’ombrello piove (p=0,4) Il valore atteso della informazione perfetta (Expected Value of Perfect Information, EVPI) 5 ombrello • L’informazione perfetta è quella che permetta al DM di scegliere l’alternativa più conveniente in funzione dello stato di natura che si verifica EV=0,8 non ombrello • Normalmente una decisione viene presa a priori, i.e., prima che accadano gli eventi che influenzeranno le conclusioni Decisione senza informazione perfetta -2 non piove (p= 0,6) piove -10 non piove 7 5 non ombrello -10 piove (p=0,4) EVPI =6,2 • Essendo disponibile l’informazione perfetta è come se la decisione venisse presa a posteriori, i.e., a valle dell’occorrenza degli eventi casuali. ombrello Decisione con informazione perfetta ombrello non piove (p= 0,6) non ombrello -2 7 Per stabilire il valore dell’informazione perfetta è necessario stabilire a priori tutti gli eventi mutuamente esclusivi che si possono realizzare in natura e che influenzerebbero la decisione. In questo caso piove/non piove. M.Paolucci, R.Pesenti M.Paolucci, R.Pesenti 47 48 D.A. – Decisioni in condizioni di rischio D.A. – Decisioni in condizioni di rischio Il valore atteso della informazione perfetta (Expected Value of Perfect Information, EVPI) Il valore atteso della informazione perfetta (Expected Value of Perfect Information, EVPI) • Sfruttando l’informazione perfetta ottengo il massimo guadagno (utilità) possibile • Il valore atteso con l’informazione perfetta (EVPI, Expected Value with Perfect Information) rispetto agli stati di natura Sj risulta essere: EV PI = • Quanto sarà disposta a pagare l’Acme una spia industriale che le vendesse l’informazione su ciò che farà la concorrenza? 90 f 3 = 1 ⋅ max 80 n ∑ j =1 p ( S j )V max j 80 100 f 2 = 0 , 4 ⋅ max + 0 , 6 ⋅ max = 92 75 90 50 60 f 1 = 0 , 2 ⋅ max + 0 , 8 ⋅ max = 83 , 6 40 92 • Quanto vale l’informazione perfetta (quanto al massimo sarei disposto a pagarla)? EVPI = EV PI − EV EVPI = EV PI − EV = 83 , 6 − 81 , 6 = 2 Nell’esempio EVPI = 6,2 - 0,8 = 5,4 M.Paolucci, R.Pesenti M.Paolucci, R.Pesenti 49 50 D.A. – Decisioni in condizioni di rischio D.A. – Decisioni in condizioni di rischio Your company is considering whether it should tender for two contracts (MS1 and MS2) on offer from a government department for the supply of certain components. The company has three options: tender for MS1 only; or tender for MS2 only; or tender for both MS1 and MS2. If tenders are to be submitted the company will incur additional costs. These costs will have to be entirely recouped from the contract price. The risk, of course, is that if a tender is unsuccessful the company will have made a loss. The cost of tendering for contract MS1 only is £50,000. The component supply cost if the tender is successful would be £18,000. The cost of tendering for contract MS2 only is £14,000. The component supply cost if the tender is successful would be £12,000. The cost of tendering for both contract MS1 and contract MS2 is £55,000. The component supply cost if the tender is successful would be £24,000. For each contract, possible tender prices have been determined. In addition, subjective assessments have been made of the probability of getting the contract with a particular tender price as shown below. Note here that the company can only submit one tender and cannot, for example, submit two tenders (at different prices) for the same contract. Option Possible Probability tender of getting prices (£) Contract MS1 only 130,000 0.20 115,000 0.85 MS2 only 70,000 0.15 65,000 0.80 60,000 0.95 MS1 and MS2 190,000 0.05 140,000 0.65 In the event that the company tenders for both MS1 and MS2 it will either win both contracts (at the price shown above) or no contract at all. M.Paolucci, R.Pesenti Esempio: Si consideri il problema proposto dal prof. Beasley in http://mscmga.ms.ic.ac.uk/jeb/or/decmore.html e riportato nel lucido seguente. In particolare: • Si determini la decisione ottima in base all’EV. • Si determini inoltre la decisione ottima in presenza di informazione perfetta e quindi si calcoli il valore EVPI. M.Paolucci, R.Pesenti 51 52 D.A. – Decisioni in condizioni di rischio EV = -27,60 TP = 130 0,20 62 0,80 -50 EV = 32,45 MS1 Determinazione decisione ottima sulla base di probabilità soggettive. 0,85 47 TP = 115 EV = 32,45 0,15 -50 EV = -5,30 0,15 44 0,85 EV = 28,40 0,80 TP = 65 -14 0,20 -14 TP = Tender Price 0,95 34 0,05 -14 EV = Expected Monetary Value 0,05 111 0,95 -55 0,65 61 0,35 -55 TP = 70 EV = 32,45 EV = 31,60 MS2 TP = 60 EV = 31,60 MS1 & 2 EV = -46,70 TP = 190 EV = 20,40 TP = 140 EV = 20,40 D.A. – Decisioni in condizioni di rischio Passi da eseguire per il calcolo a ritroso dell’EVPI: Si calcolano gli EVPI associati alle decisioni di secondo livello (le offerte da proporre avendo scelto di partecipare ad un tender specifico) Al primo livello si sceglie il massimo degli EVPI di secondo livello. 39 M.Paolucci, R.Pesenti M.Paolucci, R.Pesenti 53 D.A. – Decisioni in condizioni di rischio 54 D.A. – Decisioni in condizioni di rischio Passi da eseguire per il calcolo di EVPI seconda decisione avendo scelto di partecipare al tender MS1: Definizione della matrice di payoff: • alternative: prezzi dei tender TP = 130, TP = 115, TP = 0; • stati della natura (eventi mutuamente esclusivi che influenzano le conclusioni della decisione): disponibilità del cliente ad accettare un TP, i.e., disponibilità ad accettare un TP=130, disponibilità ad accettare un TP=115, ma non un TP=130, disponibilità ad accettare solo TP <115. Ovviamente se il cliente è disposto ad accettare un dato TP si può offrire tale TP o un TP di valore minore con la certezza di vincere il tender. M.Paolucci, R.Pesenti Matrice dei payoff cliente accetta TP=130 o minore cliente accetta TP=115 o minore, ma non TP=130 cliente accetta solo TP<115, ma non TP=115 TP = 130 62 -50 -50 TP = 115 47 47 -50 TP = 0* -50 -50 -50 L’alternativa TP=0 è dominata e quindi non verrà più considerata (né è riportata nell’albero decisionale). In rosso le scelte ottime in caso di informazione perfetta disponibile. M.Paolucci, R.Pesenti 55 56 D.A. – Decisioni in condizioni di rischio D.A. – Decisioni in condizioni di rischio Calcolo delle probabilità di realizzazione di uno degli stati della natura (continuazione) Calcolo delle probabilità di realizzazione di uno degli stati della natura (eventi futuri): • Il cliente accetta TP=130 (o minore) con probabilità p130=0,20, infatti la probabilità a priori di vincere il tender offrendo un TP=130 appare, dai dati del problema, essere uguale a 0,20 • Il cliente accetta solo TP<115, ma non TP=115 o maggiori con probabilità p0=0,15, infatti la probabilità a priori di perdere il tender offrendo un TP=115 appare essere uguale a 0,15 • Il cliente accetta TP=115 o minore, ma non TP=130, con probabilità p115=0,65. Dai dati del problema si evince infatti che la probabilità a priori di vincere il tender offrendo un TP=115 appare essere uguale a 0,80. In tale situazione però si deve anche comprendere il caso in cui il cliente avrebbe accettato un TP=130, che però non gli è stato proposto. La probabilità è quindi ottenuta come segue p115= 0,80 – 0,20 probabilità che il cliente rifiuti un TP=130, ma accetti un TP=115 funzione di distribuzione della probabilità che il cliente accetti un’offerta di valore x probabilità che il cliente accetti un TP=130 probabilità che il cliente rifiuti un TP=115 0,15 0,65 115 0,20 130 valore offerta NB: l’area sottesa dalla curva tra 115 e infinito (uguale a 0,85) indica la probabilità che il cliente accetti un TP=115 M.Paolucci, R.Pesenti M.Paolucci, R.Pesenti 57 D.A. – Decisioni in condizioni di rischio 58 D.A. – Decisioni in condizioni di rischio Seconda decisione, avendo scelto di partecipare al tender MS1, in assenza di informazione perfetta. EV = -27,60 TP = 130 EV = 32,45 MS1 TP = 115 EV = 32,45 0,20 62 0,80 -50 0,85 47 0,15 -50 Analisi a ritroso del nuovo albero: • Se fosse noto che il cliente è disposto ad accettare un TP=130 certamente si proporrebbe tale valore per il TP • Se fosse noto che il cliente è disposto ad accettare un TP=115, ma non un TP=130, certamente si proporrebbe il TP=115 • Se fosse noto che il cliente non è disposto ad accettare nemmeno un TP=115 si perderebbero in ogni caso le 50K£ già investite Seconda decisione, avendo scelto di partecipare al tender MS1, in presenza di informazione perfetta. 62 TP = 130 TP = 115 0,20 EVpi = 35,45 0,65 MS1 0,15 47 TP = 130 -50 TP = 115 TP = 130 47 TP = 115 -50 -50 M.Paolucci, R.Pesenti M.Paolucci, R.Pesenti 59 60 D.A. – Decisioni in condizioni di rischio D.A. – Decisioni in condizioni di rischio Calcolo del valore dell’informazione perfetta: quando si calcola il valore dell’informazione perfetta, non si conosce ancora il contenuto dell’informazione (ovvero quale stato di natura si realizzerà), però si suppone che al momento della decisione tale informazione sarà disponibile e che quindi sarà scelta l’alternativa migliore. Nell’esempio si osserva che: • Con p130=0,20, al momento della decisione, sarà noto che il cliente sarà disponibile ad accettare un TP=130 e quindi si offrirà un TP=130 • Con p115=0,65, al momento della decisione, sarà noto che il cliente sarà disponibile ad accettare un TP=115, ma non un TP=130, e quindi si offrirà un TP=115 • Con p0=0,15, al momento della decisione, sarà noto che il cliente non sarà disponibile ad accettare nemmeno un TP=115, e Con p130=0,65, al momento della decisione, sarà noto che il cliente sarà disponibile ad accettare un TP=115, ma non un TP=130, e quindi si offrirà un TP=115 sapendo che si perderà comunque il tender Successive riduzioni dell’albero ottenuto con l’informazione perfetta, supposto che la prima decisione sia di partecipare al tender MS1. 62 0,20 0,65 47 MS1 0,15 -50 35,45 MS1 M.Paolucci, R.Pesenti M.Paolucci, R.Pesenti 61 D.A. – Decisioni in condizioni di rischio 62 TP = 130 47 TP = 115 -50 TP = 115 44 TP = 70 0,65 39 TP = 65 0,15 34 TP = 60 -14 TP = 60 111 TP = 190 61 TP = 140 -55 TP = 140 0,20 0,65 EVpi = 35,45 0,15 MS1 EV = 36,35 EVpi = 36,35 0,15 MS2 0,05 MS1 & 2 0,05 0,60 EVpi = 22,90 62 D.A. – Decisioni in condizioni di rischio Albero decisionale che si ottiene applicando i ragionamenti precedenti ai vari tender, avendo già scelto la seconda decisione ottima una volta nota l’informazione perfetta. Fino a questo momento si è supposto di potere accedere all’informazione perfetta solo dopo avere preso la decisione. Ci si è rivolti al “consulente” solo per decidere l’offerta da compiere. Si può invece supporre di accedere all’informazione perfetta anche prima di prendere la prima decisione. Ci si rivolge al “consulente” per decidere il tender a cui partecipare e l’offerta da compiere. Si devono analizzare tutti gli stati di natura mutualmente esclusivi che si possono realizzare e stabilire per ognuno di essi la decisione ottima da compiere e la probabilità che si realizzi. 0,35 M.Paolucci, R.Pesenti M.Paolucci, R.Pesenti 63 64 D.A. – Decisioni in condizioni di rischio D.A. – Decisioni in condizioni di rischio Stati di natura che si possono realizzare (decisioni conseguenti). Il cliente (la natura) può essere disponibile a: 1. accettare offerta 130 per MS1, accettare offerta 70 per MS2, accettare offerta 190 per MS1&2 (si sceglie quindi di partecipare al tender MS1&2 con offerta 190 profitto 111) 2. accettare offerta 130 per MS1, accettare offerta 70 per MS2, accettare offerta 140 ma non 190 per MS1&2 (si sceglie quindi di partecipare al tender MS1 con offerta 130 profitto 62) 3. accettare offerta 130 per MS1, accettare offerta 70 per MS2, non accettare nemmeno offerta 140 per MS1&2 (si sceglie quindi di partecipare al tender MS1 con offerta 130 profitto 62) 4. accettare offerta 130 per MS1, accettare offerta 65 ma non 70 per MS2, accettare offerta 190 per MS1&2 (si sceglie quindi di partecipare al tender MS1 con offerta 130 profitto 62) 5. ......... .... ....... 36. non accettare nemmeno offerta 115 per MS1, non accettare nemmeno offerta 65 per MS2, non accettare nemmeno offerta 140 per MS1&2 (si sceglie quindi di non partecipare ad alcun tender con profitto 0) M.Paolucci, R.Pesenti Non sempre è possibile calcolare probabilità dei diversi stati di natura realizzabili sulla base delle informazioni inizialmente disponibili a meno di non fare ipotesi che a volte possono risultare discutibili. Si considerino ad esempio il seguenti stati: • disponibilità del cliente ad accettare offerta 130 per MS1, accettare offerta 70 per MS2, accettare offerta 190 per MS1&2. Se si ritengono le decisioni del cliente indipendenti tra loro, la probabilità dello stato è p1= 0.20 • 0.15 • 0.05 = 0.0015 • disponibilità del cliente ad accettare offerta 130 per MS1, accettare offerta 70 per MS2, accettare offerta 140 ma non 190 per MS1&2. Se si ritengono le decisioni del cliente indipendenti tra loro, la probabilità dello stato è p2= 0.20 • 0.15 • 0.60 = 0.018. In questo caso questo l’ipotesi di indipendenza delle decisioni è discutibile in quanto è strano che il cliente sia disposto a pagare 200 per i due tender separati, ma non a pagare 190 per il tender MS1&2. M.Paolucci, R.Pesenti 65 66 D.A. – Decisioni in condizioni di rischio D.A. – Decisioni in condizioni di rischio Le probabilità dei diversi stati dovrebbero essere valutate caso per caso in base alle informazioni sulla natura (ad esempio si può supporre che il cliente sia razionale). In particolare la probabilità di uno stato di natura caratterizzato dalla realizzazione di tre eventi, e.g., A, B e C, dovrebbe essere calcolato in base alle probabilità condizionate, come ad esempio P(ABC) = P(C)P(B|C)P(A|BC), non in base alla formula P(ABC) = P(C)P(B)P(A). In dati disponibili e le ipotesi sulla razionalità del cliente però non sono sempre sufficienti a determinare, nemmeno utilizzando Bayes, le probabilità condizionate richieste. Il valore atteso della informazione campionaria (Expected Value of Sample Information, EVSI) • L’informazione perfetta non è disponibile • Se EVPI è non trascurabile si può valutare l’opportunità di acquisire informazione su quali alternative scegliere • Indagine di mercato (I): IEi = l’indagine ha esito Ei • Si valuta (sulla base di analoghe indagini passate) la probabilità che l’informazione acquisita suggerisca una alternativa quando si verifica uno certo stato Supposto di essere riusciti a calcolare le probabilità dei diversi stati e il valore della decisione ottima in ognuno degli stati si può poi calcolare il valore EVpi e quindi EVPI. M.Paolucci, R.Pesenti ⇒p(IEi | Sj) M.Paolucci, R.Pesenti 67 68 D.A. – Decisioni in condizioni di rischio D.A. – Decisioni in condizioni di rischio Esempio: la scelta se prendere o meno l’ombrello piove (p=0,4) Il valore atteso della informazione campionaria (continua) 5 ombrello • Normalmente una decisione viene presa a priori, i.e., prima che accadano gli eventi che influenzeranno le conclusioni EV=0,8 non ombrello • Con l’informazione campionaria la decisione avviene a valle di un’indagine campionaria, dai cui risultati (casuali) si possono prevedere con maggiore precisione gli eventi (stati di natura) che accadranno. -2 non piove (p= 0,6) piove -10 non piove 7 Decisione senza informazione campionaria piove previsioni pioggia M.Paolucci, R.Pesenti non ombrello EVSI Decisione con informazione campionaria M.Paolucci, R.Pesenti 5 ombrello previsioni no pioggia non piove -2 piove -10 non piove 7 piove 5 ombrello non ombrello non piove -2 piove -10 non piove 7 69 D.A. – Decisioni in condizioni di rischio 70 D.A. – Decisioni in condizioni di rischio Esempio: la scelta se prendere o meno l’ombrello • Probabilità a priori degli stati di natura P(Sj): P(piove) = 0.4 P(non piove) = 0.6 Le probabilità a priori P(Sj) possono, e.g., essere dedotte dal rapporto tra il numero di giornate piovose e il numero delle giornate totali del mese che si sono verificate nello stesso periodo di osservazione negli anni precedenti • Probabilità condizionate P(IEi| Sj): P(previsione pioggia|piove) = 0.9 P(previsione pioggia|non piove) = 0.2 P(previsione no pioggia|piove) = 0.1 P(previsione no pioggia|non piove) = 0.8 Le probabilità condizionate P(IEi| Sj) possono anche esse dedursi facilmente, e.g., verificando quante volte nel passato le previsioni (esiti indagine) erano state corrette Le difficoltà nella valutazione del EVSI consistono nel determinare: Le probabilità a priori P(IEi) che si verifichi un determinato esito IEi dall’indagine campionaria Le probabilità condizionate P(Sj|IEi) che accada l’evento Sj, i.e., che si realizzi lo stato Sj, dato che l’indagine campionaria ha dato esito IEi, i.e., P(Sj|IEi) sono le probabilità degli stati della natura condizionate agli esiti dell’indagine (a posteriori) Dai dati storici è però facile dedurre le probabilità a priori degli stati di natura P(Sj) e le probabilità a posteriori P(IEi| Sj) del realizzarsi di un esito IEi dato che si verifica lo stato Sj Dall’applicazione del teorema di Bayes è poi possibile dedurre le probabilità desiderate M.Paolucci, R.Pesenti M.Paolucci, R.Pesenti 71 72 D.A. – Decisioni in condizioni di rischio D.A. – Decisioni in condizioni di rischio Esempio: la scelta se prendere o meno l’ombrello Esempio: la scelta se prendere o meno l’ombrello piove, 0.75 Applicando Bayes si ottiene: • Probabilità a priori degli esiti dell’indagine P(IEi) = Σj P(IEi| Sj) P(Sj): ombrello non piove, 0.25 EVSI=3.25 • P(previsione pioggia) = 0.9 • 0.4 + 0.2 • 0.6 = 0,48 • P(previsione no pioggia) = 0.1 • 0.4 + 0.8 • 0.6 = 0,52 non ombrello previsioni pioggia, 0.48 • Probabilità condizionate P(Sj|IEi) = P(IEi| Sj) P(Sj)/P(IEi) • P(piove| previsione pioggia) = 0.9 • 0.4 / 0.48 = 0.75 • P(piove| previsione no pioggia) = 0.1 • 0.4 / 0.52 = 0.08 • P(non piove| previsione pioggia) = 0.2 • 0.6 / 0.48 = 0.25 • P(non piove| previsione no pioggia) = 0.8 • 0.6 / 0.52 = 0.92 EVSI=4.52 previsioni no pioggia, 0.52 -2 0.75 -10 0.25 7 0.08 5 0.92 -2 0.08 -10 0.92 7 EVSI = 4.52 – 0.80 = 3.72 SIE = EVSI/EVPI = 0.69 ombrello EVSI=5.69 M.Paolucci, R.Pesenti 5 non ombrello M.Paolucci, R.Pesenti 73 D.A. – Decisioni in condizioni di rischio 74 D.A. – Decisioni in condizioni di rischio Il valore atteso della informazione campionaria (Expected Value of Sample Il valore atteso della informazione campionaria (Expected Value of Sample Information, EVSI) – Riassunto formale Information, EVSI) • Si devono valutare p(IEi) le prob. a priori degli esiti dell’indagine • EVSI (valore monetario atteso con informazione campionaria) si valuta aggiornando le probabilità a priori degli stati della natura in base agli esiti p(Sj | IEh) le prob. degli stati condizionate agli esiti dell’indagine (a dell’indagine IEi m EVSI = ∑ p( IEi ) ⋅ EVSIi i =1 posteriori) n EV SI i = ∑ p ( S j IE i ) ⋅ Vij • Probabilità Totale j =1 m p ( IEi ) = ∑ p ( IEi S j ) ⋅ p ( S j ) i =1 • Teorema di Bayes dove EVSIi è il valore atteso della migliore decisione che si può prendere a p ( S j IE i ) = valle dell’esito IEi e Vij è il valore della migliore decisione che si può prendere a valle dell’esito IEi e della realizzazione dello stato Sj M.Paolucci, R.Pesenti p ( IE i S j ) ⋅ p ( S j ) p ( IE i ) M.Paolucci, R.Pesenti 75 76 D.A. – Decisioni in condizioni di rischio D.A. – Decisioni in condizioni di rischio Il valore atteso della informazione campionaria (Expected Value of Sample Il valore atteso della informazione campionaria (Expected Value of Sample Information, EVSI) • Si ottiene Information, EVSI) m n EV SI = ∑ p ( IE i ) ⋅ ∑ p ( S j IE i ) ⋅ Vij i =1 j =1 • Il valore atteso dell’informazione campionaria EVSI = EVSI - EV m n p ( IE i S j ) ⋅ p ( S j ) ⋅ Vij = ∑ p ( IE i ) ⋅ ∑ = p ( IE i ) i =1 j =1 m • Efficienza dell’informazione campionaria (Sample Information Efficiency, SIE) n = ∑ ∑ p ( IE i S j ) ⋅ p ( S j ) ⋅ Vij SIE = EVSI/EVPI i =1 j =1 0 ≤SIE ≤1 M.Paolucci, R.Pesenti M.Paolucci, R.Pesenti 77 D.A. – Decisioni in condizioni di rischio D.A. – Decisioni in condizioni di rischio Un esercizio • 78 Un esercizio Valutare 4 tipi di innovazione tecnologica di un prodotto a fronte di 3 possibili scenari futuri della domanda, le cui probabilità a priori sono • Valutare l’opportunità di eseguire o meno un test sul possibile scenario di mercato avendo informazioni storiche sulla probabilità degli esiti del test dati gli stati della natura pbassa = 0,1 pmedia = 0,5 palta = 0,4. Guadagni (utilità) Decisioni\Domanda Bassa Media Alta A 200 350 600 B 250 350 540 Test Mercato\Domanda Bassa Media Alta C 300 375 490 Favorevole 0.2 0.4 0.7 D 300 350 470 Invariato 0.2 0.3 0.2 Sfavorevole 0.6 0.3 0.1 p(Th/Sj) M.Paolucci, R.Pesenti M.Paolucci, R.Pesenti 79 80 D.A. – Decisioni in condizioni di incertezza D.A. – Decisioni in condizioni di incertezza Criterio MAXIMIN • Atteggiamento pessimista del DM: massimizza il payoff nel caso più sfavorevole Non sono disponibili le informazioni sulla probabilità degli stati futuri della natura f(v) = maxi minj Vij Criteri decisionali f(V): • MAXIMIN • Problemi: • MAXIMAX Scarso uso dell’informazione disponibile • Hurwicz Miopia (incapacità di valutare un compromesso) • Laplace (equiprobabilità) M.Paolucci, R.Pesenti M.Paolucci, R.Pesenti 81 D.A. – Decisioni in condizioni di incertezza 82 D.A. – Decisioni in condizioni di incertezza Criterio di Hurwicz Criterio MAXIMAX • Un compromesso tra MAXIMIN e MAXIMAX espresso da un parametro α (MAXIMAX) 0 ≤ α ≤ 1 (MAXIMIN) • Atteggiamento ottimista del DM: massimizza il payoff nel caso più favorevole f(v) = maxi maxj Vij f(v) = maxi (α minj Vij + (1- α) maxj Vij) • Problemi: Gli stessi del MAXIMIN M.Paolucci, R.Pesenti M.Paolucci, R.Pesenti 83 84 D.A. – Decisioni in condizioni di incertezza D.A. – Decisioni in condizioni di incertezza Criterio di Laplace (equiprobabilità) Esempio • Si considerano equiprobabili gli stati della natura e si sceglie secondo il massimo valore atteso • Il problema della selezione della tecnologia Guadagni (utilità) • si pone p(Sj) = 1/n ∀j Decisioni\Domanda Bassa Media Alta A 200 350 600 • si sceglie f(V) = maxi ∑j p(Sj)Vij B 250 350 540 C 300 375 490 D 300 350 470 • D è dominata da C !!! M.Paolucci, R.Pesenti M.Paolucci, R.Pesenti 85 86 D.A. – Decisioni in condizioni di incertezza D.A. – Decisioni in condizioni di incertezza Analisi di sensitività – Break Even Point Esempio • Il problema della selezione della tecnologia (si scelga, ad esempio, α = 0.4 per algoritmo di Hurwicz) • Nel caso di 2 eventi si può analizzare l’andamento della decisione in funzione della probabilità Ad esempio Guadagni (utilità) Dec.\Dom. Bassa Media Alta MAXIMIN MAXIMAX α=0.4 A 200 350 600 200 600 440 383 B 250 350 540 250 540 424 380 C 300 375 490 300 490 414 388 Stati della Natura Equip Decisioni S1 (p) S2 (1-p) A1 V11 V12 A2 V21 V22 A3 V31 V32 A4 V41 V42 EV(Ai) = pVi1 + (1-p)Vi2 M.Paolucci, R.Pesenti M.Paolucci, R.Pesenti 87 88 D.A. – Decisioni in condizioni di incertezza Analisi di sensitività – Break Even Point • Graficamente EV(Ai) = pVi1 + (1-p)Vi2 V22 V12 Break Even Point A2 A1 A4 Obiettivi Multipli V41 V11 V21 V42 V31 V32 p 0 1 M.Paolucci, R.Pesenti M.Paolucci, R.Pesenti 89 90 Obiettivi Multipli Esempio di riferimento I problemi reali, soprattutto in presenza di più decisori, presentano spesso criteri di valutazione delle soluzioni (obiettivi) multipli; Si consideri il seguente problema di programmazione lineare con due obiettivi spesso tali criteri sono discordi non è quindi possibile agire in modo che possano essere tutti soddisfatti al meglio; max z = 5x1 + 6x2 +3x3 max w = 10x2 2x1 + 4x2 + x3 ≤15 3x1 + 2x2 + 2x3 ≤23 x1 + 3x2 + x3 ≤ 18 xi ≥ 0 diversi approcci sono possibili per superare tale difficoltà: • combinazione pesata degli obiettivi, • approccio lessicografico (o disgiuntivo) • approccio congiuntivo, • approccio della marca ideale. la soluzione determinata dovrà comunque essere Pareto ottima. M.Paolucci, R.Pesenti M.Paolucci, R.Pesenti 91 92 Esempio di riferimento Combinazione pesata degli obiettivi Se si ottimizzano separatamente i due obiettivi con il simplesso si ottiene max z = 5x1 + 6x2 +3x3 2x1 + 4x2 + x3 ≤15 z* = 38 w= 0 3x1 + 2x2 + 2x3 ≤23 x1 + 3x2 + x3 ≤ 18 xi ≥ 0 Per ottenere un’unica soluzione si può usare la combinazione pesata degli obiettivi quando è possibile quantificare (ad esempio monetizzando) l’importanza relativa dei diversi obiettivi. E.g., si supponga che ottimizzare l’obiettivo z sia due volte più importante che ottimizzare w. Si giunge a max w = 10x2 2x1 + 4x2 + x3 ≤15 3x1 + 2x2 + 2x3 ≤23 z= 22,5 w* = 37,5 x1 + 3x2 + x3 ≤ 18 xi ≥ 0 alle due soluzioni corrispondono ovviamente diversi valori delle xi e quindi non può essere presa una decisione che soddisfi entrambe gli obiettivi, bisogna giungere ad un compromesso e scegliere uno dei punti della frontiera di Pareto. M.Paolucci, R.Pesenti max 2(5x1 + 6x2 +3x3) + 1(10x2) 2x1 + 4x2 + x3 ≤15 3x1 + 2x2 + 2x3 ≤23 x1 + 3x2 + x3 ≤ 18 xi ≥ 0 z* = 38 w= 11,66 In questo caso z non è diminuito rispetto all’ottimo, ma in generale ciò potrebbe avvenire. M.Paolucci, R.Pesenti 93 94 Approccio congiuntivo Approccio lessicografico Per ottenere un’unica soluzione si può usare l’approccio congiuntivo quando è possibile stabilire una soglia minima di soddisfacimento che deve essere rispettata da tutti gli obiettivi. In pratica tutti gli obiettivi vengono trasformati in vincoli. E.g., si supponga che sia z che w debbano valere almeno 25. Si può poi ottimizzare rispetto ad uno qualunque o ad una combinazione degli obiettivi, giungendo, e.g., a Per ottenere un’unica soluzione si può usare l’approccio lessicografico quando è possibile stabilire una precisa gerarchia di dominanze tra gli obiettivi. E.g., si supponga che ottimizzare l’obiettivo z sia più importante che ottimizzare w, se però ci sono soluzioni equivalenti si scelgono quelle che ottimizzano w. Si ottimizza quindi prima rispetto a z e si ottiene z* = 38, quindi si impone che tale condizione sia rispettata e si ottimizza rispetto a w, giungendo a max 10x2 2x1 + 4x2 + x3 ≤15 3x1 + 2x2 + 2x3 ≤23 x1 + 3x2 + x3 ≤ 18 5x1 + 6x2 +3x3 = 38 xi ≥ 0 z* = 38 max 5x1 + 6x2 +3x3 2x1 + 4x2 + x3 ≤15 3x1 + 2x2 + 2x3 ≤23 z = 30 w= 25 x1 + 3x2 + x3 ≤ 18 5x1 + 6x2 +3x3 ≥ 25 10 x2 ≥ 25 xi ≥ 0 In questo caso obiettivi sono diventati vincoli, col rilassamento lagrangiano vincoli diventano obiettivi. w= 11,66 M.Paolucci, R.Pesenti M.Paolucci, R.Pesenti 95 96 Approccio della marca ideale Obiettivi Multipli: esempio grafico I Per ottenere un’unica soluzione si può usare l’approccio della marca ideale quando è possibile stabilire i valori ideali da cui ci si vuole allontanare il meno possibile. E.g., i valori ottimi per il problema sono z*= 38 che w*= 37,5. Si può quindi minimizzare una norma giungendo a min ||38 – (5x1 + 6x2 +3x3)|| + ||37,5 – 10x2|| 2x1 + 4x2 + x3 ≤15 3x1 + 2x2 + 2x3 ≤23 z = 26,6 x1 + 3x2 + x3 ≤ 18 xi ≥ 0 Si consideri il seguente problema max z = x1 + 3x2 max w = 3x1 + x2 -x1 + x2 ≤4 x1 + x2 ≤8 2x1 + x2 ≤12 x1 ≤5 4 xi ≥ 0 w= 30,6 (2,6), soluzione ottima per z (5,2), soluzione ottima per w Se la norma scelta è quella 1, l’approccio equivale a quello della combinazione pesata degli obiettivi. Se la norma è infinito si giunge all’approccio lessicografico. Di solito si usa il quadrato della norma 2 (i risultati indicati sono riferiti a tale caso) 5 M.Paolucci, R.Pesenti M.Paolucci, R.Pesenti 97 Obiettivi Multipli: esempio grafico I 4 Obiettivi Multipli: esempio grafico II Si consideri il seguente problema max z = x1 + x2 max w = 3x1 + x2 -x1 + x2 ≤4 x1 + x2 ≤8 2x1 + x2 ≤12 x1 ≤5 4 xi ≥ 0 faccette (2,6) - (4,4) e (4,4) - (5,2), soluzioni pareto ottime soluzione ottima per 1/2 ≤a ≤1 5 combinazione conica (o, come in questo caso, convesso) delle funzioni obiettivo max a( x1 + 3x2) + b(3x1 + x2) e.g., con a, b ≥ 0, a + b = 1 4 98 faccetta (2,6) - (4,4), soluzioni ottime per z, z* = 8 soluzione ottima per 1/6 ≤a ≤ 1/2 (5,2), soluzione ottima per w, w* = 17 soluzione ottima per 0 ≤a ≤1/6 5 5 M.Paolucci, R.Pesenti M.Paolucci, R.Pesenti 99 100 Obiettivi Multipli: esempio grafico II Obiettivi Multipli: esempio grafico II faccetta (2,6) - (4,4), soluzioni ottime per z 4 (4,4), soluzione lessicografica, considerando prima la funzione obiettivo z faccetta (4,4) - (5,2), soluzioni pareto ottime (5,2), soluzione lessicografica, considerando prima la funzione obiettivo w 5 5 (5,2), soluzione ottima per funzione obiettivo w 5 M.Paolucci, R.Pesenti M.Paolucci, R.Pesenti 101 102 Obiettivi Multipli: esempio grafico II Esercizi 1. Valutare per punti la propria funzione di utilità tra gli 0 e i 10000 EUR. 2. Si stimi il valore di r per una funzione di utilità U(x) = a - b e-rx sapendo che il DM ritiene β la CME di una lotteria i cui premi sono distribuiti uniformemente tra γ e δ. insieme soluzioni per cui z = 7.5 (4.5,3), soluzione congiuntiva, imponendo che il valore dell’obiettivo z sia almeno 7.5 e massimizzando l’obiettivo w 3. I dati storici di una azienda indicano che nel passato recente sono stati effettuati gli seguenti investimenti riportati in tabella. Stimare la funzione di utilità del management aziendale con una funzione esponenziale a-be-rx 5 capitale investito A soluzione di distanza quadratica minima rispetto alla marca ideale A 0 198 261 299 1194 2499 1502 5 M.Paolucci, R.Pesenti valore finale probabilità investimento valore finale successo se non vi è se vi è investimento successo successo 0 0 0 0,28 2000 0 0,53 1300 0 0,72 1000 0 0,86 3000 0 0,95 5000 0 0,99 2500 0 M.Paolucci, R.Pesenti 103 104 Esercizi 3. Dato un capitale di 100 EUR si possono possono effettuare due tipi di “investimento”. Il primo investimento ha una probabilità di successo di 0,5 e, nel caso ciò accada, vi sarà un ritorno di 220 EUR, altrimenti si perde tutto. Il secondo investimento richiede di spezzare il capitale in due tranche da 50 EUR. Entrambe le tranche, ma in modo indipendente, sono investite in attività che hanno probabilità di successo di 0,5 e, nel caso ciò accada, hanno un ritorno di 110 EUR, altrimenti hanno ritorno nullo. Supponendo di essere obbligati a scegliere uno dei due tipi di investimento indicare quale si preferirebbe, nel caso in cui si sia avversi al rischio e nel caso in cui si sia propensi al rischio. Alla luce dei risultati ottenuti argomentare sul perché conviene diversificare il rischio nel caso si debba investire in attività in cui non si abbia il controllo sulle probabilità di successo. Viceversa argomentare sul quali debbano essere le condizioni che spingano una azienda a concentrarsi sul suo core business o viceversa diversificarsi. Nel secondo caso indicare inoltre quando all’azienda conviene diversificarsi orizzontalmente e quando conviene diversificarsi verticalmente. Presentare degli esempi numerici. 4. Svolgere gli esercizi proposti dal prof. Beasley alla pagina http://mscmga.ms.ic.ac.uk/jeb/or/decmore.html. Per determinare la scelta ottima utilizzare EV, ROI e la funzione di utilità determinata nell’esercizio 2. Commentare gli eventuali risultati discordi. M.Paolucci, R.Pesenti 105