Teoria dei Giochi Anna Torre Almo Collegio Borromeo 10 maggio 2011 email: [email protected] sito web del corso:www-dimat.unipv.it/atorre/borromeo2011.html A. Torre Teoria dei giochi 2011-Almo Collegio Borromeo Giochi a informazione incompleta Nel caso in cui i giocatori sono due significa che le funzioni di utilità di entrambi sono conoscenza comune dei due. Questo fatto nei giochi concreti non è particolarmente realistico. Spetta ad Harsanyi l’aver formalizzato la situazione di informazione incompleta. Harsanyi, John C. [1968]: Games with incomplete information played by Bayesian players, Parts I, II and III, Management Science, 14, 159-182, 320-334, 486-502. A. Torre Teoria dei giochi 2011-Almo Collegio Borromeo Informazione incompleta Un gioco a informazione incompleta è un gioco in cui i giocatori non hanno conoscenza comune di tutti gli elementi del gioco. La mancanza di conoscenza si può riferire a vari elementi: per esempio i giocatori potrebbero non sapere le preferenze degli altri o addirittura potrebbero non sapere quanti sono gli altri giocatori o quante sono le strategie a disposizione degli altri giocatori o altre cose ancora. L’esempio è preso da Myerson, Roger B. [1991]: Game Theory: Analysis of Conflict, Harvard University Press, Cambridge (MA). A. Torre Teoria dei giochi 2011-Almo Collegio Borromeo Esempio II1 A HH I H A0 (1, 2) 0 B (0,4) H II2 A I H H A0 (1, 3) 0 B (0,1) B (0,1) (1, 3) B (0,4) (1, 2) Il giocatore II conosce le utilità del giocatore I mentre il giocatore I non sa se il giocatore II è del tipo II1 o II2 . Le utilità di II1 e II2 sono “rovesciate” in quanto per II1 la strategia A è dominante mentre per II2 è dominante la strategia B. A. Torre Teoria dei giochi 2011-Almo Collegio Borromeo I Tipi Insieme dei tipi dei giocatori. T1 = {I} T2 = {II1 , II2 } CI = {A0 , B0 } insieme delle azioni del primo giocatore CII = {A, B} insieme delle azioni del secondo giocatore. A. Torre Teoria dei giochi 2011-Almo Collegio Borromeo Funzioni di Utilità Cosa sono in questo caso le funzioni di utilità? Per il secondo giocatore le funzioni di utilità sono due: se il giocatore è di tipo 1 la funzione di utilità è UII1 : (CI × CII ) −→ R se e di tipo 2 è UII2 : (CI × CII ) −→ R A. Torre Teoria dei giochi 2011-Almo Collegio Borromeo Esempio Tutta l’informazione si raccoglie in un’unica funzione: UII : (CI × CII ) × TII −→ R Per il giocatore I la situazione è più semplice perchè il giocatore I può essere di un solo tipo, ma in ogni caso ha una: UI : (CI × CII ) × TI −→ R A. Torre Teoria dei giochi 2011-Almo Collegio Borromeo Azioni C = CI × CII azioni dei due giocatori T = TI × TII tipi possibili dei due giocatori uI e uII definite su C × T uI , uII : C × T −→ R funzioni di utilità Manca la distribuzione di probabilità soggettiva che i giocatori (bayesiani) assegnano a tutto ciò che non sanno. Il giocatore I deve avere una distribuzione di probabilità su TII . Se invece il giocatore I potesse essere di due tipi dovremmo richiedere che I1 abbia un distribuzione di probabilità pI1 su TII e lo stesso accada per il tipo I2 il quale avrà quindi pI2 su TII . pI : TI −→ ∆(TII )=distribuzioni di probabilità su TI pII : TII −→ ∆(TI )=distribuzioni di probabilità su TII A. Torre Teoria dei giochi 2011-Almo Collegio Borromeo Definizione Un gioco bayesiano a due giocatori è quindi: Γ = ((CI , CII ), (TI , TII ), (pI , pII ), (uI , uII )) A questo punto Harsany suppone che Γ sia conoscenza comune dei giocatori, che ogni giocatore sappia qual’è il suo vero tipo e il fatto che ciascuno sa qual’è il suo vero tipo sia conoscenza comune tra i giocatori. Allora una strategia pura per il giocatore I è una funzione sI : TI −→ CI mentre una strategia pura per il giocatore II è una funzione sII : TII −→ CII . A. Torre Teoria dei giochi 2011-Almo Collegio Borromeo EQUILIBRIO BAYESIANO Una strategia mista per il giocatore I è: sI : CI × TI −→ [0, 1], con Σc∈CI sI (c, t) = 1 ∀t ∈ TI Cioè per ogni possibile tipo t per il giocatore I individuiamo una distribuzione di probabilità su CI . Analogo discorso vale per il giocatore II che deve indicare una strategia mista sia nell’ipotesi in cui lui è II1 sia nell’ipotesi in cui lui è II2 : sII : CII × TII −→ [0, 1]. A. Torre Teoria dei giochi 2011-Almo Collegio Borromeo EQUILIBRIO BAYESIANO Una volta note le strategie si può calcolare il payoff atteso. Per poter calcolare il payoff atteso il giocatore deve dichiarare l’azione che sceglierà qualunque sia il tipo a cui lui appartiene. Il giocatore II che è quello che può essere di due tipi, anche se sa a che tipo appartiene deve dire anche cosa farebbe se fosse dell’altro tipo. La motivazione per cui questo è necessario e che anche se II sa di che tipo è, questo fatto non è conoscenza comune. Infatti al giocatore II interessa cosa farà il giocatore I ma ciò che I farà dipende da ciò che lui pensa che il giocatore II farà per ogni possibile tipo del giocatore II. Perciò anche se il giocatore II sa di che tipo è, per decidere cosa fare deve sapere cosa farebbero tutti gli altri suoi tipi. In questo esempio, poichè per ciascun tipo di II c’è una strategia dominante, la strategia di equilibrio per II sarà A per II1 e B per A. Torre Teoria dei giochi 2011-Almo Collegio Borromeo Equilibrio Bayesiano Supponiamo che I assegni probabilità 15 a II1 e 45 a II2 Quindi per il giocatore I è più probabile che II sia di tipo 2 e quindi sceglierà B’. L’equilibrio bayesiano è dunque: sI1 (A0 ) = 0 sI1 (B0 ) = 1 sII1 (A) = 1 sII1 (B) = 0 sII2 (A) = 0 sII2 (B) = 1 A. Torre Teoria dei giochi 2011-Almo Collegio Borromeo Manipolabilità Osserviamo che in questo gioco se fosse conoscenza comune il fatto che il tipo di II è II1 , l’equilibrio di Nash del gioco sarebbe (A0 , A), mentre se fosse conoscenza comune il fatto che il tipo di II è II2 , l’equilibrio sarebbe (B0 , B) Ma il giocatore II1 preferisce l’esito (B0 , B), mentre il giocatore II2 preferisce l’esito (A0 , A). Dunque anche se potesse, il giocatore II non avrebbe interesse a dichiarare il suo vero tipo e quindi se lo facesse è presumibile che mentirebbe. A. Torre Teoria dei giochi 2011-Almo Collegio Borromeo Rappresentazione di Harsanyi Vediamo ora come Harsanyi propone di rappresentare il gioco di cui ci siamo occupati all’inizio del paragrafo in modo da assimilarlo a un gioco a informazione completa ma imperfetta. Supponiamo che i belief siano consistenti, cioè che la natura selezioni i tipi (solo del giocatore II nell’esempio semplice che abbiamo considerato) individuando il giocatore II1 con probabilita p e il giocatore II2 con probabilita 1 − p. A. Torre Teoria dei giochi 2011-Almo Collegio Borromeo Rappresentazione di Harsanyi .6 .5 @ p @ 1-p @ @ @ @ II2 II1 @ @ 0 0 1, A0 2, A0 @1, B @2, B @ @ ................................................................................................................................. A A A A A A A A A A A A AB AB AB AB A A A A 1 0 0 1 1 0 0 1 2 4 1 3 3 1 4 2 A. Torre Teoria dei giochi 2011-Almo Collegio Borromeo Rappresentazione di Harsanyi Il diagramma rappresenta un gioco in forma estesa a informazione completa. L’idea di equilibrio bayesiano non è altro che l’idea di equilibrio di Nash applicata a questo gioco a informazione completa. Questa è l’idea di Harsanyi. Con questa rappresentazione è anche più facile capire cosa è una strategia per un gioco bayesiano: non è altro che una strategia in senso usuale per questo gioco a informazione completa anche se imperfetta. A. Torre Teoria dei giochi 2011-Almo Collegio Borromeo Vediamo un ulteriore esempio: [da Fudenberg - Tirole] Un’impresa (giocatore I), già operante sul mercato, deve decidere se costruire una nuova fabbrica (C, NC); un’altra (giocatore II) deve decidere se entrare sul mercato (E, NE). Il giocatore II non sa se la costruzione della nuova fabbrica per I avrà costo 3 oppure 0 e assegna ai due eventi probabilità p e 1 − p, rispettivamente; il costo è invece noto a I; i payoff sono riportati nelle seguenti tabelle: I3 /II C NC E 0, −1 2, 1 NE 2, 0 3, 0 A. Torre I0 /II C NC E 3, −1 2, 1 NE 5, 0 3, 0 Teoria dei giochi 2011-Almo Collegio Borromeo Il gioco bayesiano è rappresentato dalla quintupla: N = {I, II} CI = {C, NC}; CII = {E, NE} TI = {I3 , I0 }; TII = {II} pI3 (II) = pI0 (II) = 1; pII (I3 ) = p, pII (I0 ) = 1 − p uI ((C, E), (I3 , II)) = 0 uII ((C, E), (I3 , II)) = −1 uI ((NC, E), (I3 , II)) = 2 uII ((NC, E), (I3 , II)) = 1 uI ((C, NE), (I3 , II)) = 2 uII ((C, NE), (I3 , II)) = 0 uI ((NC, NE), (I3 , II)) = 3 uII ((NC, NE), (I3 , II)) = 0 uI ((C, E), (I0 , II)) = 3 uII ((C, E), (I0 , II)) = −1 uI ((NC, E), (I0 , II)) = 2 uII ((NC, E), (I0 , II)) = 1 uI ((C, NE), (I0 , II)) = 5 uII ((C, NE), (I0 , II)) = 0 uI ((NC, NE), (I0 , II)) = 3 uII ((NC, NE), (I0 , II)) = 0 A. Torre Teoria dei giochi 2011-Almo Collegio Borromeo Le strategie pure sono: ΣI = {sI1 , sI2 , sI3 , sI4 } con sI1 (I3 ) = C ΣII = {sII1 , sII2 } con sI1 (I0 ) = C sI2 (I3 ) = C sI3 (I3 ) = NC sI4 (I3 ) = NC sI2 (I0 ) = NC sI3 (I0 ) = C sI4 (I0 ) = NC sII1 (II) = E sII2 (II) = NE A. Torre Teoria dei giochi 2011-Almo Collegio Borromeo Si può osservare che la strategia NC è dominante per il giocatore I se il costo è 3 e quindi il giocatore II sceglierà E, mentre se il costo è 0 la strategia C è dominante per il giocatore I e quindi il giocatore II sceglierà NE. Si può allora dire che il giocatore II sceglierà E se p > 0.5 e sceglierà NE se p < 0.5. Se p = 0.5 il payoff atteso del giocatore II è nullo, qualunque sia la sua strategia. Se i possibili costi di costruzione fossero 3 e 1.5; i nuovi payoff dei giocatori sono riportati nelle seguenti tabelle: I3 /II C NC E 0, −1 2, 1 I1.5 /II C NC NE 2, 0 3, 0 A. Torre E 1.5, −1 2, 1 NE 3.5, 0 3, 0 Teoria dei giochi 2011-Almo Collegio Borromeo Se il costo del giocatore I è 3, la strategia NC è ancora dominante per I. Se il costo del giocatore I è 1.5 non ci sono strategie dominanti per nessun giocatore. Calcoliamo ora le strategie di miglior risposta dei due giocatori. Indichiamo con (x, 1 − x) la strategia mista del primo giocatore e con (y, 1 − y) la strategia mista del secondo giocatore. A. Torre Teoria dei giochi 2011-Almo Collegio Borromeo Se il giocatore I è di tipo 3 la miglior risposta è sempre NC, se invece il giocatore I è di tipo 1.5, egli confronta i payoff attesi delle strategie C e NC che sono rispettivamente 1.5y + 3.5(1 − y) = 3.5 − 2y e 2y + 3(1 − y) = 3 − y, per cui sceglierà C se 3.5 − 2y > 3 − y, cioè se y < 0.5. A. Torre Teoria dei giochi 2011-Almo Collegio Borromeo La strategia di miglior risposta di II dipende, oltre che dalla strategia, anche dal tipo di I; I sceglie (x, 1 − x) nel caso che sia di tipo 1.5, mentre nel caso in cui è di tipo 3 I sceglie NC; Il payoff atteso di II se gioca NE è 0, mentre il payoff atteso di II se gioca E è dato da 1(p) − 1(1 − p)(x) + 1(1 − p)(1 − x) = 1 − 2(1 − p)x. Il payoff atteso di E supera il payoff atteso di NE se 1 − 2(1 − p)x ≥ 0, cioè se x≤ 1 2(1 − p) A. Torre Teoria dei giochi 2011-Almo Collegio Borromeo Riassumendo le migliori risposte di I sono: giocare C (x = 1) se y < 0.5 indifferente se y = 0.5 giocare NC (x = 0) se y > 0.5 mentre le migliori risposte di II sono: 1 2(1 − p) 1 indifferente se x = 2(1 − p) 1 giocare NE (y = 0) se x > 2(1 − p) giocare E (y = 1) A. Torre se x < Teoria dei giochi 2011-Almo Collegio Borromeo x = 0, y = 1 è un equilibrio qualunque sia p infatti se II gioca E (y = 1) la miglior risposta di I è NC (x = 0), perchè y > 0.5 e viceversa se I gioca NC (x = 0) la miglior 1 risposta di II è giocare E (y = 1), perchè x ≤ ; 2(1 − p) x = 1, y = 0 è un equilibrio se p ≤ 0.5 infatti se II gioca NE (y = 0) la miglior risposta di I è C (x = 1), perchè y < 0.5 e viceversa se I gioca C (x = 1) la miglior risposta di II è giocare NE (y = 0) solo quando p ≤ 0.5 perchè 1 1 , altrimenti quando p > 0.5, >1; x> 2(1 − p) 2(1 − p) A. Torre Teoria dei giochi 2011-Almo Collegio Borromeo 1 , per ogni valore di p, y = 0.5 è un equilibrio in 2(1 − p) strategie miste. 1 Infatti se II gioca y = 0.5, la risposta x = è ottima 2(1 − p) 1 , la (qualunque risposta di I è ottima) e se I gioca x = 2(1 − p) risposta y = 0.5 è ottima (qualunque risposta di II è ottima). x= A. Torre Teoria dei giochi 2011-Almo Collegio Borromeo Il gioco della posta elettronica Questo esempio1 è interessante per mettere in evidenza come, nel caso in cui l’insieme degli stati del mondo è infinito, la conoscenza iterata fino al grado N non implica la conoscenza comune, per quanto sia grande N. Due giocatori I e II devono scegliere una azione tra A e B. Con probabilità p < 12 il gioco in cui sono coinvolti è Gb e con probabilità 1 − p è Ga . 1 Rubinstein Ariel (1989) “The electronic mail game: Strategic behavior under “almost common knowledge”, American Economic Review, 79, 385-391 A. Torre Teoria dei giochi 2011-Almo Collegio Borromeo Le utilità di I e II nei due casi sono le seguenti: Ga : I/II A B A M,M -L,1 B 1,-L 0,0 I/II A B A 0,0 -L,1 B 1,-L M,M Gb : dove si suppone che L > M > 1. A. Torre Teoria dei giochi 2011-Almo Collegio Borromeo (A, A) è l’equilibrio di Nash del primo gioco e (B, B) è l’equilibrio di Nash del secondo. Osserviamo che, anche se un giocatore è sicuro che il gioco sia Ga , è per lui rischioso scegliere la strategia A se non è certo che l’altro lo sappia. Consideriamo il gioco in vari casi di informazione per i due giocatori. Se supponiamo che sia conoscenza comune quale dei due giochi viene giocato, allora l’equilibrio si ottiene giocando da parte di ciascun giocatore la strategia : “Gioco A se il gioco è Ga , gioco B se il gioco è Gb ” e l’utilità ottenuta è M per ciascun giocatore. A. Torre Teoria dei giochi 2011-Almo Collegio Borromeo Supponiamo ora che sia noto solo al primo giocatore quale è il gioco. In questo caso si può vedere che l’unico equilibrio di Nash “bayesiano”2 consiste nel giocare A da parte di entrambi i giocatori e l’utilità attesa è (1 − p)M. Si supponga infine che i due giocatori possano comunicare tra loro ma che il gioco non diventi mai conoscenza comune. 2 Per la definizione di equilibrio bayesiano vedi per esempio Myerson “Game theory, Analysis of Conflict”, Harvard 1991 A. Torre Teoria dei giochi 2011-Almo Collegio Borromeo La comunicazione è la seguente: Se il gioco è Gb il computer di I invia automaticamente un messaggio a quello di II; Se il gioco è Ga nessun messaggio è inviato da I a II; Se un computer riceve un messaggio, invia automaticamente la conferma, questo non solo per il messaggio iniziale, ma anche per le successive conferme. A. Torre Teoria dei giochi 2011-Almo Collegio Borromeo La regola prevede che ogni computer invii conferme, perché esiste una piccola probabilità ε > 0 che un messaggio non giunga a destinazione. Se un messaggio non viene ricevuto, allora la comunicazione si interrompe. Alla fine della fase di invio ogni giocatore legge sullo schermo il numero di messaggi che il suo computer ha inviato. Se vogliamo discutere la conoscenza dei giocatori in questa situazione, è necessario specificare quali sono gli stati. A. Torre Teoria dei giochi 2011-Almo Collegio Borromeo Sia: Ω = {(QI , QII ) : QI = QII o QI = QII + 1 QI , QII ≥ 0} Allo stato (q, q) il computer di I ha inviato q messaggi, tutti sono arrivati al computer di II, il computer di II ha inviato q messaggi ma il suo q-esimo è stato smarrito. Allo stato (q + 1, q), il computer di I ha inviato q + 1 messaggi. Tutti sono arrivati al computer di II, tranne il q + 1-esimo che è stato smarrito. A. Torre Teoria dei giochi 2011-Almo Collegio Borromeo La partizione sullo stato del mondo HI = {{(0, 0)} , {(q, q) , (q, q − 1)} per ogni q > 0} HII = {{(q, q), (q + 1, q)} per ogni q ≥ 0} Indichiamo con G(QI , QII ) il gioco che si gioca nello stato (QI , QII ), cioè G(0, 0) = Ga e G(QI , QII ) = Gb altrimenti. A. Torre Teoria dei giochi 2011-Almo Collegio Borromeo I conosce il gioco in ogni caso mentre II lo conosce sempre tranne che in (0, 0) e in (1, 0). In hI (1, 1) = {(1, 1), (1, 0)} I sa che il gioco è Gb , ma non sa se II lo sa perché hII (1, 0) = {(1, 0), (0, 0)}. Allo stesso modo, in hII (1, 1) = {(1, 1), (2, 1)}, II sa che il gioco è Gb ma non sa se I sa che II sa che il gioco è Gb perché hI (1, 1) = {(1, 1), (1, 0)} e così via . Ad ogni stato (q, q) oppure (q, q + 1) corrisponde conoscenza iterata fino al livello q che il gioco è Gb , ma questo non è conoscenza comune. A. Torre Teoria dei giochi 2011-Almo Collegio Borromeo Se ε è piccolo, con probabilità elevata ogni giocatore vede un numero elevato sul suo schermo. Quando I vede 1 sullo schermo non può sapere se II sa che il gioco è Gb e quindi esita a giocare B. Ma se il numero sullo schermo è alto, può sembrare quasi conoscenza comune che il gioco sia Gb . La decisione è legata all’opinione di I su cosa farà II quando legge un numero alto sullo schermo. Si può osservare che la distribuzione di probabilità iniziale su Ω è comune ai due giocatori e deriva dal fatto che il gioco è Ga con probabilità 1 − p e Gb con probabilità p. Se vogliamo trovare gli equilibri di Nash bayesiani di questo gioco in questa situazione informativa, occorre fare un po’ di conti. Il risultato (non particolarmente difficile, ma un po’ noioso) è che non è cambiato nulla rispetto alla situazione in cui solo I è informato. L’equilibrio è ancora (A, A) e il valore atteso è (1 − p)M. A. Torre Teoria dei giochi 2011-Almo Collegio Borromeo Questo esempio sottolinea ancora una volta un aspetto paradossale, cioè sottolinea un contrasto tra l’intuizione e l’analisi della teoria dei giochi. Come può comportarsi un giocatore quando vede un numero alto (per esempio 20) sul suo schermo? È difficile pensare che quando L > M di poco e ε è piccolo un giocatore non scelga B. A. Torre Teoria dei giochi 2011-Almo Collegio Borromeo