La teoria dell’utilità attesa Enrico Saltari 1 La teoria dell’utilità attesa In un contesto di certezza esiste un legame biunivoco tra azioni e conseguenze: ad ogni azione corrisponde una e una sola conseguenza, e viceversa. Le azioni possono essere perciò ordinate sulla base dell’utilità delle conseguenze.esempio certezza1 esempio certezza2 In un contesto di incertezza a ciascuna azione corrispondono più conseguenze. La teoria dell’utilità attesa consente di ordinare le azioni quando vi è incertezza. esempio incertezza Essa si fonda su due elementi: 1. la probabilità attribuita a ciascuna conseguenza xi di veri…carsi: p (xi); 2. l’utilità assegnata alle conseguenze: U (xi): 2 L’utilità attesa di un’azione è data dalla media ponderata delle utilità delle conseguenze che discendono da quell’azione con un peso pari alla probabilità che hanno di veri…carsi: E [U (x)] = X U (xi)p(xi) Esempio Supponiamo che vi siano soltanto due conseguenze, x1 = 0 e x2 = 100, ciascuna avente la stessa probabilità di veri…carsi, p1 = p2 = 12 : La funzione di utilità p de…nita sulle conseguenze sia u (x) = x: Allora l’utilità attesa è E [U (x)] = p1u (x1) + p2u (x2) 1p 1p = 0+ 100 = 5 2 2 3 Il criterio dell’utilità attesa generalizza il criterio del valore atteso E ( x) = X xi p ( xi ) Esempio Come prima, supponiamo che vi siano soltanto due conseguenze, x1 = 0 e x2 = 100, ciascuna avente la stessa probabilità di veri…carsi, p1 = p2 = 12 : Allora il valore atteso è E (x) = p1x1 + p2x2 1 1 = 0+ 100 = 50 2 2 4 Un gioco è equo se il guadagno atteso è nullo, ovvero se il prezzo (x0) che si paga per partecipare al gioco è pari al valore atteso che ci aspetta di ottenere dal gioco E ( x ) = x0 Se invece valutiamo le conseguenze in termini di utilità, e non in termini del valore monetario, un gioco è equo se l’utilità che ricaviamo partecipando al gioco è pari all’utilità della somma che siamo disposti a pagare per parteciparvi E [U (x)] = U (x0) Esempio Come prima, supponiamo che vi siano soltanto due conseguenze, x1 = 0 e x2 = 100, ciascuna avente la stessa probabilità di veri…carsi, p1 = p2 = 21 : 5 Allora, con il criterio dell’utilità attesa il prezzo che siamo disposti a pagare è p E [U (x)] = 5 = U (x0) = x0 =) x0 = 25 mentre con il criterio del valore atteso è 50. Il paradosso di S. Pietroburgo mostra come le insu¢ cienze del criterio del valore atteso siano dovute alla valutazione della somma in termini monetari. Il criterio dell’utilità attesa rimuove questa insu¢ cienza valutando le somme vinte in termini di utilità –sicché la valutazione non è più lineare nei payof f (gli xi). L’utilità attesa continua a essere lineare nelle probabilità. 6 Lancio Esito 1 T 2 CT 3 CCT ::: ::: n CC : : : C}T | {z n 1 ::: ::: Probabilità 1 2 1 1 2 2 1 2 1 2 2 ::: 1 n 1 1 2 2 ::: 1 1 1 + + ::: = 1 2 2 P i U tilita attesa = ln (2) = ln (4) 2i Somma vinta Utilità 2 ln (2) 4 2 ln (2) 8 3 ln (2) ::: ::: 2n n ln (2) ::: ::: P 2i V alore atteso = =1 2i 7 Cosa a¤erma il teorema dell’utilità attesa Il teorema dell’utilità attesa a¤erma che, se il comportamento individuale si conforma a certi assiomi, allora dire che un’azione o una distribuzione di probabilità p è preferita ad un’altra distribuzione q equivale a dire che ha un’utilità attesa maggiore p q () X U ( xi ) p ( xi ) > X U ( xi ) q ( xi ) Due proprietà dell’utilità attesa 1. L’utilità attesa è additiva negli stati. L’utilità che si ottiene in uno stato non in‡uenza l’utilità che si ottiene se si veri…ca un altro stato: l’utilità dipende solo dalla conseguenza x che si veri…ca ma non dalle altre. 2. L’utilità attesa è lineare nelle probabilità. L’utilità attesa è una funzione lineare delle probabilità. 8 Cosa sono p e q Supponiamo che le distribuzioni abbiano solo due conseguenze, c1 e c2: Le distribuzioni p e q sono q p p1 p2 c1 c2 q1 q2 c1 c2 Gli assiomi dell’utilità attesa Gli assiomi su cui si fonda la teoria dell’utilità attesa sono i seguenti: Completezza e coerenza. Tutte le distribuzioni possono essere ordinate e in questo ordinamento non vi è contraddizione: p se p q oppure q p o entrambe; q e q r allora p r: 9 Monotonicità. Si preferiscono le distribuzioni che assegnano le conseguenze migliori con la probabilità più elevata: m (1 ) p (1 m ) p se e solo se ALF A 1 BET A m p m p 1 Continuità. Variando la probabilità assegnata alle conseguenze, mutano anche con continuità le preferenze: Esiste un r m tale che (1 ) p 10 Esempio Supponiamo che p = 0 e m = 1000: Qual è la probabilità l’individuo indi¤erente tra ottenere 250 euro con certezza, x partecipare a un gioco in cui può ottenere 0 o 1000 euro con 1 e ? Il gra…co mostra il caso di un individuo in cui questa è 21 . Perciò, u (x) = 0:5:Formalmente, 250 0 :5 1000 0 :5 che rende = 250; e probabilità probabilità 0 ovvero u (250) = 0:5u (1000) + 0:5u (0) = 0:5; ponendo u (1000) = 1 e u (0) = 0: Notare che il valore atteso del gioco è 500. r w La funzione di utilità in questo caso è u (w) = : La funzione ordinale 1000 p w viene “cardinalizzata” …ssando l’origine e l’unità di misura. 11 1. Quando w = 0; anche p w è uguale a 0. Nessuna modi…ca è necessaria. 2. Quando w = 1000; l’utilità deve essere pari a 1. Questo viene ottenuto normalizzando a 1 la ricchezza massima, dividendo cioè w per 1000. 1 0.8 0.6 0.4 0.2 0 125 250 375 500 625 750 875 1000 12 La funzione di utilità u (w) = r w 1000 13 Supponiamo invece che x = 500: Se la funzione di utilità è quella indicata allora la probabilità che rende l’individuo indi¤erente tra avere 500 per cert e partecipare alla lotteria è u (500) = s 500 = 0:707 1000 Supponiamo che un altro individuo consideri 125 euro con certezza equivalenti alla partecipazione al gioco precedente 125 0 :5 1000 0 :5 0 in termini di utilità possiamo scrivere u (125) = 0:5u (1000) + 0:5u (0) = 0:5 e quindi u (125) = 0:5 L’individuo ritiene equivalente partecipare a un gioco il cui valore atteso è 500 o avere con certezza 125 euro: è perciò più avverso al rischio dell’individuo prima visto. 14 w 1=3 La funzione di utilità in questo caso è u (w) = . 1000 1 0.8 0.6 0.4 0.2 0 125 250 375 500 625 750 875 1000 w 1=3 w 1=3 (in rosso) e u (w) = Le funzioni di utilità u (w) = 1000 1000 15 Indipendenza o sostituzione. Tra le distribuzioni di probabilità non esiste complementarità esempio indipendenza: p q () p (1 ) r q (1 ) r Riduzione. Ai …ni del giudizio di preferenza conta soltanto la probabilità totale assegnata alle conseguenze e non come essa si forma. Il teorema dell’utilità attesa Per dimostrare il teorema dell’utilità attesa, prendiamo in considerazione una distribuzione p che prevede solo due conseguenze certe, x1 e x2 : p = p1 x1 p2 x2 16 La dimostrazione richiede che E [U (p1 x1 p2 x2 )] = p1U ( x1) + p2U ( x2) L’utilità attesa ha due proprietà: 1) è additiva nell’utilità delle conseguenze e 2) lineare nelle probabilità. 1 : Assioma di continuità. Ciascuna delle due conseguenze può essere riscritta in termini di m (la conseguenza migliore) e p (la conseguenza peggiore) x1 x2 U ( x1 ) U ( x2 ) m m (1 (1 U (x1)) U (x2)) p p 2 : Assioma di indipendenza. Ciascuna delle conseguenze può essere sostituita nella distribuzione originaria p = p1 p2 x1 x2 p1 [U (x1) (1 U (x1)) p2 m p] p1 [U (x1) (1 U (x1)) m p] p2 [U (x2) (1 U (x2)) m p] x2 17 3 : Assioma di riduzione. La distribuzione ottenuta può essere scritta in termini delle probabilità totali di m e p p 2 X piU (xi) m 1 4 : Assioma di continuità. 0 @1 2 X 1 1 piU (xi)A p P2 1 piU (xi) rappresenta l’utilità attribuita a p E [U (p)] = 2 X piU (xi) 1 5 : Assioma di monotonicità. Tra due distribuzioni viene preferita quella che ha probabilità (utilità) più alta. 18 p1 ! U ( x1 ) ! m x1 1 ! U ( x1 ) p p U ( x2 ) ! ! m x2 p2 1 ! U ( x2 ) p 19 L’unicità della funzione di utilità Una distinzione importante tra funzioni di utilità 1. La funzione di utilità de…nita sulle conseguenze, U (x) ; 2. La funzione di utilità riguardante le azioni, E [U (x)] : Il teorema di unicità riguarda la prima e a¤erma che una funzione di utilità U (x) rappresenta le preferenze sulle azioni allo stesso modo di una funzione di utilità V (x) se e solo se fra le due esiste una relazione lineare: V (x) = a + bU (x) , con b > 0. Supponiamo che l’azione p sia preferita all’azione q – Ep (U ) > Eq (U ) – e che tra le due funzioni di utilità riguardanti le conseguenze esista una relazione lineare, V = a + bU . Allora Ep (V ) = Ep [a + bU ] = a + bEp (U ) > a + bEq (U ) = Eq (V ) 20 Per converso, supponiamo che U e V rappresentino le preferenze sulle azioni allo stesso modo, cioè Ep (U ) > Eq (U ) () Ep (V ) > Eq (V ) Allora, date tre conseguenze x y z per l’assioma di continuità y x (1 ) z In termini di utilità U e V U (y ) = U (x) + (1 ) U (z ) V (y ) = V (x) + (1 ) V (z ) (1) Ricavando U (y ) = U ( x) U (z ) V (y ) = V ( x) U (z ) V (z ) V (z ) 21 si vede che V ( x) V ( z ) (U (y ) U ( x) U ( z ) = a + bU (y ) V (y ) = U (z )) + V (z ) V X Z Y X-Z α(X-Z) U 22 Perché tra U (:) e V (:) esiste una relazione lineare Nel gra…co il vettore y è costituito dalla combinazione lineare degli altri due vettori y=z+ (x z ) = x + (1 )z Questa è l’equazione della retta, scritta in forma vettpriale, che passa per i punti z e x:Si noti che nel gra…co il vettore y ha coordinate (U (y ) ; V (y )) : Le coordinate dei vettori x e z vanno intese in modo analogo. Se scriviamo per esteso il vettore y come somma degli altri due vettori, otteniamo il sistema di equazioni (1). Esempio Un individuo a¤erma di scegliere le proprie azioni massimizzando la seguente funzione E (V ) = (1 + y1) 1 (1 + y2) 2 23 Possiamo considerarlo un individuo che massimizza l’utilità attesa? Poiché la scelta riguarda le azioni e non le conseguenze, possiamo adottare una trasformazione non lineare di E (V ) : Prendendo i logaritmi di ambo i lati, si ha 1 ln (1 + y1 ) + 2 ln (1 + y2 ) che ha le caratteristiche tipiche (additività, linearità nelle probabilità) dell’utilità attesa. 24 La scelta in condizioni di certezza A ogni azione corrisponde una e una sola conseguenza. Esempio a ! c = F (a ) 25 Insieme delle decisioni a2 Insieme delle conseguenze c(a 2) c(a 3) a3 a1 c(a 1) Esempio (l ) = p f (l ) w l p = p l w l , p = 2; w = 1 26 Insieme delle decisioni 11=1 12=4 Insieme delle conseguenze π(l 1)=1 π(l 2)=0 indietro 27 La scelta in condizioni di incertezza A ogni azione corrispondono più conseguenze. Di qui le di¢ coltà di ordinamento in base alle funzioni di utilità tradizionali. Esempio (a; s) ! c = F (a; s) 28 Insieme delle conseguenze Insieme delle decisioni s2 a1 s1 a2 c(a 1,s2) s2 c(a 2,s 2) c(a 1,s 1) s1 c(a 2,s1) 29 Esempio: Incertezza e pro…tto L’esempio che segue mostra nell’ambito della teoria dell’impresa che, in presenza di incertezza, il pro…tto non dipende solo dalle azioni poste in atto, il lavoro impiegato, ma anche dallo stato del mondo, nell’esempio dal valore dello shock, che si veri…ca. 2 stati: s1 = cattivo tempo; s2 = bel tempo: In‡uenzano il prodotto attraverso un disturbo moltiplicativo. (l; s) = p f (s; l) w l p = p s ( l w l , p = 2; w = 1; p p lp , s = s1 s l 2 l , s = s2 Prendiamo in considerazione quattro valori possibili del pro…tto corrispondenti ai due livelli di impiego di lavoro (1 e 4) che massimizzano il pro…tto per i due valori dello shock (1 e 2). E’ importante osservare che non esiste il livello ottimo di impiego di lavoro, perché il pro…tto dipende anche dallo shock. Per esempio, se 30 s = 1 conviene impiegare una quantità di lavoro pari a 1 (perché (1; 1) = 1) e non a 4 (perché (4; 1) = 0). Viceversa, se s = 2 conviene impiegare una quantità di lavoro pari a 4 (perché (4; 2) = 4) e non a 1 (perché (1; 2) = 3). Il gra…co successivo illustra l’andamento del pro…tto per tutti i valori di L e s. Alle stessi conclusioni si giunge se guardiamo all’uguaglianza tra prodotto mar- 31 d f (L) = 21 ginale del lavoro (indicato con dL w (s = 1; 2) e salario reale ( = 0:5). p l 1 2) nei due stati del mondo Non esiste perciò, come invece accade nel caso di certezza, un impiego ottimale di lavoro indipendentemente dallo stato del mondo. 32 Insieme delle conseguenze Insieme delle decisioni π(s 2,l2)=4 s2 11=1 π(s 2,l1)=3 s2 s1 π(s 1,l1)=1 12=4 s1 π(s 1,l2)=0 indietro 33 Due modi di guardare all’utilità attesa 1. Come scelta tra conseguenze che dipendono dallo stato, c = F (a; s) : Scegliendo un’azione, si sceglie una conseguenza per ciascuno stato del mondo. La conseguenza c viene interpretata come una variabile casuale, le cui realizzazioni sono “stato–contingenti”. L’utilità attesa è una funzione di utilità de…nita sui consumi contingenti E [U (c)] = E [U (c1; c2; ; cn)] .Nell’esempio della tabella, si sceglie tra due variabili casuali: c1 = c (a 1 ; s 1 ) ; c (a 1 ; s 2 ) a1 a2 e c2 = s1 c (a 1 ; s 1 ) c (a 2 ; s 1 ) c (a 2 ; s 1 ) c (a 2 ; s 2 ) : s2 c (a 1 ; s 2 ) c (a 2 ; s 2 ) 34 Insieme delle decisioni bene nello stato 2 Insieme delle conseguenze c(a 1,s 2) a1 c(a 2,s 2) a2 c(a 1,s 1) c(a 2,s 1) bene nello stato 1 2. Come scelta tra distribuzioni di probabilità Le conseguenze sono variabili casuali de…nite in questo caso da distribuzioni di probabilità. Scegliendo un’azione, l’individuo sceglie in e¤etti una distribuzione 35 di probabilità. L’utilità attesa è una funzione di utilità de…nita sulle probabilità. E [U (p)] = E [U (p1; p2; ; pn)] Il postulato di indipendenza a¤erma che è possibile ordinare le distribuzioni secondo le preferenze guardando alle singole parti che le compongono. Il giudizio dipende solo dalle parti delle distribuzioni che sono diverse. Esempio Supponiamo che le distribuzioni abbiano solo due conseguenze, c1 e c2: Se p e q sono valutate allo stesso modo dal consumatore q p p q () p1 p2 c1 c2 q1 q2 c1 c2 r è un’altra distribuzione de…nita in modo analogo. Allora per l’assioma di indipendenza le due distribuzioni che si ottengono combinando p e r da una parte 36 e q e r dall’altra sono anch’esse indi¤erenti. p p1 + (1 p2 + (1 (1 ) r1 ) r2 ) c1 c2 r q (1 q1 + (1 q2 + (1 ) r ) r1 ) r1 c1 c2 Il postulato di indipendenza garantisce inoltre che le curve di indi¤erenza siano delle rette parallele nello spazio delle probabilità. Esempio. Supponendo vi siano solo tre conseguenze (il supporto delle distribuzioni è costituito solo da tre conseguenze), si ha E (U ) = p1U1 + p2U2 + p3U3; con U1 < U2 < U3 Poiché p2 = 1 p1 p3; possiamo scrivere l’equazione di una curva di indi¤erenza, con E (U ) = k; come E (U ) = k = (U1 U2) p1 + (U3 U2) p3 + U2 37 da cui k p3 = U3 U2 U2 U1 U3 U2 p1 U2 p3 1 curva di indifferenza uti lità cre sce nte 1 p1 Le curve di indi¤erenza sono delle rette perché, dall’assioma di indipendenza, ogni distribuzione che si trova sul segmento che congiunge p con q , come 12 p 21 q , deve essere ritenuta indi¤erente. 38 p 1 q () 2 1 2 p q 1 2 1 2 q q=q p3 1 ½·p+½·q q p 1 p1 39 p3 1 ¼·p+¾ ·r ¼·q+¾·r r q p 1 p1 Le curve di indi¤erenza sono parallele perché, dall’assioma di indipendenza, ogni distribuzione che si trova sul segmento che congiunge r con p o con q , come 1 p 1 q , deve essere ritenuta indi¤erente. 2 2 p q () 1 4 p 3 4 r 1 4 q 3 4 r 40 Il paradosso di Allais Nel gioco proposto da Allais vi sono solo tre premi (conseguenze) 1 Premio 5 ml. 2 Premio 1 ml. 3 Premio 0 ml. Il gioco consiste in una scelta e¤ettuata in due stadi. I Stadio. La scelta viene e¤ettuata tra le due distribuzioni a e b; de…nite come b a 1ml. 1 5ml. 1ml. 0ml. 0.1 0.89 0.01 Dobbiamo cioè scegliere tra 1 milione per certo e 1 milione all’89% e 5 milioni al 10%. Quale scegliamo? 41 II Stadio. La scelta viene e¤ettuata tra le due distribuzioni c e d; de…nite come c 1ml. 0ml. 0.11 0.89 d 5ml. 0.1 0ml. 0.9 Dobbiamo cioè scegliere tra 1 milione all’11% e 5 milioni al10%. Quale scegliamo? Molti esperimenti mostrano che si sceglie l’opzione a nel primo caso (per non rischiare con l’1% di probabilità di non ottenere nulla). Si sceglie invece l’opzione d nel secondo caso perché si ritiene che non c’è grande di¤renza tra il 10 e l’11%, e ovviamente si preferisce avere la possibilità di avere 5 milioni piuttosto che 1. Secondo gli assiomi dell’utilità attesa questa scelta non è razionale. Le due scelte sono infatti identiche: la prima corrisponde alla seconda aumentata dell’89% di avere 1 milione in entrambe le opzioni. 42 Un’altra rappresentazione delle distribuzioni nel paradosso di Allais a b c d 0 1 0 1 0 1 10 1 5 1 5 11 99 1 1 0 0 Se poniamo i tre premi come esiti di una distribuzione di probabilità, x1 = 0; x2 = 1 e x3 = 5; allora le distribuzioni possono essere rappresentate come vettori p1 p2 p3 nel triangolo di Machina: a = 0 1 0 ; b = 0:01 0:89 0:1 c= 0:89 0:11 0 ;d= ; 0:9 0 0:1 Le quattro distribuzioni sono rappresentate nella …gura seguente. 43 p3 1 curve d'indifferenza 0.1 d b c a 0.01 0.9 1 p1 Si noti che se a viene preferito a b (come nella …gura), allora per il postulato di indipendenza c è preferito a d (vedi ancora la …gura): Una dimostrazione formale 44 è la seguente a b () U (1) > 0:1U (5) + 0:89U (1) + +0:01U (0) 0:11U (1) > 0:1U (5) + 0:01U (0) = 0:1U (5) + + (0:9 0:89) U (0) 0:11U (1) + 0:89U (0) > 0:1U (5) + 0:9U (0) () c d Tre tipi di reazioni al paradosso di Allais 1. (Savage) Normativa: gli errori vengono corretti. 2. Teoria del rimpianto (Regret T heory ). Si sceglie a rispetto a b perché altrimenti si rimpiangerebbe la possibilità di aver tralasciato una vincita certa di 1ml. 45 3. (Machina) Teoria del disappunto. Si consideri la seguente struttura delle preferenze. Viaggio a Venezia Film su Venezia Stare a casa Se con queste preferenze ci viene proposto di scegliere tra un gioco in cui si può avere il viaggio a Venezia con il 99% di probabilità oppure guardare un …lm su Venezia con l’1% di probabilità e un gioco in cui si può avere il viaggio a Venezia con il 99% di probabilità oppure stare a casa con l’1% di probabilità, la scelta cade sul primo gioco se si rispetta il postulato di indipendenza. Ma non è detto che questo sia l’esito se ci si aspetta che nel caso non si ottenga il viaggio a Venezia i gusti cambieranno: il disappunto di non aver ottenuto il viaggio a Venezia potrebbe essere tale da generare il ri…uto di guardare un …lm su Venezia. Sia nella teoria del rimpianto che quella del disappunto danno luogo a complementarità perché si preoccupano di ciò che sarebbe potuto accadere. 46