MATEMATICA PER LO STUDIO DELLE INTERAZIONI STRATEGICHE: TEORIA DEI GIOCHI Anna TORRE ∗ ∗ Dipartimento di Matematica, Università di Pavia, Via Ferrata 1, 27100, Pavia, Italy. E-mail: [email protected] sito web www-dimat.unipv.it/atorre/borromeo.html GIOCHI A INFORMAZIONE INCOMPLETA 19-4-2006 Nella introduzione degli equilibri di Nash per un gioco in forma strategica abbiamo dato per scontato che nel giocare la propria strategia ogni giocatore sia a conoscenza non solo del gioco con tutte le sue regole, ma anche di tutte le funzioni di utilità dei giocatori e che tutto ciò sia conoscenza comune di tutti. In altre parole abbiamo supposto che ci fosse informazione completa. 1 Nel caso in cui i giocatori sono due, questo significa in particolare che le funzioni di utilità di entrambi sono conoscenza comune dei due. Questo fatto nei giochi concreti non è particolarmente realistico. Spetta ad Harsanyi l’aver formalizzato la situazione di informazione incompleta. ∗ ∗ Harsanyi, John C. [1968]: Games with incomplete information played by Bayesian players, Parts I, II and III, Management Science, 14, 159-182, 320334, 486-502. 2 Un gioco a informazione incompleta è un gioco in cui i giocatori non hanno conoscenza comune di tutti gli elementi del gioco. La mancanza di conoscenza si può riferire a vari elementi: per esempio i giocatori potrebbero non sapere le preferenze degli altri o addirittura potrebbero non sapere quanti sono gli altri giocatori o quante sono le strategie a disposizione degli altri giocatori o altre cose ancora. Come al solito userò un esempio molto semplice e molto paticolare per illustrare la situazione ∗ ∗ L’esempio è preso da Myerson, Roger B. [1991]: Game Theory: Analysis of Conflict, Harvard University Press, Cambridge (MA). 3 Consideriamo le seguenti bimatrici: I/II1 A’ B’ A 1,2 0,4 B 0,1 1,3 I/II2 A’ B’ A 1,3 0,1 B 0,4 1,2 Il giocatore II conosce perfettamente le utilità del giocatore I mentre il giocatore I non sa se il giocatore II è del tipo II1 o II2. Tra le altre cose le utilità di II1 e II2 sono in qualche modo rovesciate in quanto per II1 la strategia A è dominante mentre per II2 è dominante la strategia B. 4 Se vogliamo formalizzare questa situazione possiamo pensare di introdurre l’insieme dei tipi di giocatori. In questo caso T1 = {I} mentre T2 = {II1, II2} CI = {A0, B 0} l’insieme delle azioni del primo giocatore CII = {a, b} l’insieme delle azioni del secondo giocatore. 5 Cosa sono in questo caso le funzioni di utilità? Per il secondo giocatore le funzioni di utilità sono due: se il giocatore è di tipo 1 la funzione di utilità è UII1 : (CI × CII ) −→ R se e di tipo 2 è UII2 : (CI × CII ) −→ R 6 Raccogliamo tutta l’informazione in un’unica funzione: UII : (CI × CII ) × TII −→ R Per il giocatore I nel nostro caso la situazione è più semplice perchè il giocatore I può essere di un solo tipo, ma in ogni caso avrà una: UI : (CI × CII ) × TI −→ R 7 Ricapitolando: C = CI × CII azioni dei due giocatori T = TI × TII tipi possibili dei due giocatori Per motivi di compattezza di notazioni pensiamo uI e uII definite su C × T uI , uII : C × T −→ R funzioni di utilità Manca ancora un ingrediente e cioè la distribuzione di probabilità soggettiva che i giocatori (bayesiani) assegnano a tutto ciò che non sanno. Nel nostro esempio il giocatore I deve avere una distribuzione di probabilità su TII . 8 Se invece il giocatore I potesse essere di due tipi dovremmo richiedere che I1 abbia un distribuzione di probabilità pI1 su TII e lo stesso accada per il tipo I2 il quale avrà quindi pI2 su TII . Quindi in definitiva avremo: pI : TI −→ ∆(TII )=distribuzioni di probabilità su TI e analogamente pII : TII −→ ∆(TI )=distribuzioni di probabilità su TII 9 Un gioco bayesiano a due giocatori è quindi: Γ = ((CI , CII ), (TI , TII ), (pI , pII ), (uI , uII )) Cosa si intende per strategia in un gioco bayesiano? A questo punto Harsany suppone che Γ sia conoscenza comune dei giocatori, che ogni giocatore sappia qual’è il suo vero tipo e il fatto che ciascuno sa qual’è il suo vero tipo sia conoscenza comune tra i giocatori. 10 Allora una strategia pura per il giocatore I è una funzione sI : TI −→ CI mentre una strategia pura per il giocatore II è una funzione sII : TII −→ CII . 11 EQUILIBRIO BAYESIANO Cerchiamo ora di estendere il concetto di equilibrio di Nash al contesto Bayesiano. Per prima cosa occorre capire cosa è in questo caso una strategia mista. Essa è per il giocatore I: sI : CI × TI −→ [0, 1], con Σc∈CI sI (c, t) = 1 ∀t ∈ TI Cioè per ogni possibile tipo t per il giocatore I individuiamo una distribuzione di probabilità su CI . Analogo discorso vale per il giocatore II che nel nostro caso deve indicare una strategia mista sia nell’ipotesi in cui lui è II1 sia nell’ipotesi in cui lui è II2: sII : CII × TII −→ [0, 1]. 12 Una volta note le strategie miste siamo in grado di calcolare il payoff atteso. Osserviamo che per poter calcolare il payoff atteso il giocatore deve dichiarare l’azione che sceglierà qualunque sia il tipo a cui lui appartiene. In altre parole nel nostro caso il giocatore II che è quello che può essere di due tipi, anche se sa a che tipo appartiene deve dire anche cosa farebbe se fosse dell’altro tipo. La motivazione per cui questo è necessario e che anche se II sa di che tipo è, questo fatto non è conoscenza comune. 13 Per essere più espliciti, al giocatore II interessa cosa farà il giocatore I ma ciò che I farà dipende da ciò che lui pensa che il giocatore II farà per ogni possibile tipo del giocatore II. Perciò anche se il giocatore II sa di che tipo è, per decidere cosa fare deve sapere cosa farebbero tutti gli altri suoi tipi. Nell’esempio che stiamo studiando, poichè per ciascun tipo di II c’è una strategia dominante, la strategia di equilibrio per II sarà A per II1 e B per II2 L’analisi per I è semplificata dal fatto che i suoi payoff sono o 0 o 1. Ovviamente I preferisce gli esiti (A0, A) oppure (B 0, B) 14 4 a II Supponiamo che I assegni probabilità 1 a II e 1 2 5 5 Quindi per il giocatore I è più probabile che II sia di tipo 2 e quindi sceglierà B’. L’equilibrio bayesiano è dunque: sI1 (A0) = 0 sI1 (B 0) = 1 sII1 (A) = 1 sII1 (B) = 0 sII2 (A) = 0 sII2 (B) = 1 15 Osserviamo che in questo gioco se fosse conoscenza comune il fatto che il tipo di II è II1, l’equilibrio di Nash del gioco sarebbe (A0, A), mentre se fosse conoscenza comune il fatto che il tipo di II è II2, l’equilibrio sarebbe (B 0, B) Ma il giocatore II1 preferisce l’esito (B 0, B), mentre il giocatore II2 preferisce l’esito (A0, A). Dunque anche se potesse, il giocatore II non avrebbe interesse a dichiarare il suo vero tipo e quindi se lo facesse è presumibile che mentirebbe. 16 CONSISTENZA DEI BELIEF I belief di un gioco bayesiano sono descritti da pI : TI −→ ∆(TII ) e pII : TII −→ ∆(TI ) . 17 Un modo di rappresentare un possibile gioco bayesiano è quello di immaginare che la coppia dei giocatori sia estratta a sorte da una popolazione di coppie di giocatori con caratteristiche diverse in cui sia noto però: • il numero totale delle coppie • il numero di coppie di ogni tipo • le caratteristiche di queste coppie In altre parole questo significa avere una distribuzione di probabilità su TI × TII . 18 Se per esempio TI = {I1, I2} e TII = {II1, II2, II3}, questo vuol dire poter descrivere la frequenza delle coppie con una tabella del tipo: \ I \II I1 I2 II1 p1 p4 II2 p2 p5 II3 p3 p6 dove p1 + p2 + ... + p6 = 1, cioè una distribuzione di probabilità su TI × TII . Facciamo un esempio concreto: 19 \ I \II I1 I2 II1 0.2 0.1 II2 0.3 0.1 II3 0.1 0.2 20 Da questa tabella possiamo dedurre per esempio la probabilità su TII del giocatore I1, cioè la probabilità dei vari tipi del giocatore II condizionata dal fatto che I è in realtà I1 e analogamente se I è I2. Si ha 0.2 p(II1|I1) = 0.6 p(II2|I1) = 0.3 0.6 p(II3|I1) = 0.1 0.6 0.1 p(II1|I2) = 0.4 p(II2|I2) = 0.1 0.4 p(II3|I2) = 0.2 0.4 e in modo analogo si possono descrivere tutte le varie probabilità assegnate dai tipi del giocatore II ai tipi del giocatore I. 21 In altre parole è stato possibile dalla tabella dedurre pI : TI −→ ∆(TII ) e pII : TII −→ ∆(TI ) . 22 Naturalmente a questo punto è naturale chiedersi se questo è l’unico modo di costruire pI e pII . La risposta in generale è no, ma se è possibile costruire pI e pII da una tabella come quella sopra, allora: i belief si dicono consistenti. 23 Facciamo un esempio di belief inconsistenti: p(II1|I1) = 1 p(I1|II1) = 0 p(II2|I1) = 0 p(I2|II1) = 1 p(II1|I2) = 0 p(I1|II2) = 1 p(II2|I2) = 1 p(I2|II2) = 0 Se i belief fossero consistenti avremmo una tabella \ I \II I1 I2 II1 p1 p3 II2 p2 p4 24 con: p1 p1 +p2 = 1 p2 p1 +p2 = 0 p3 p3 +p4 = 0 p4 p3 +p4 = 1 p1 p1 +p3 = 0 p3 p1 +p3 = 1 p2 p2 +p4 = 1 p4 p2 +p4 = 0 e questo sistema non ha soluzioni. 2 Infatti p p+p = 0 implica p2 = 0 e questo è incompatibile con il 1 2 2 fatto che p p+p = 1 cioè non è consistente il fatto che I1 pensi 2 4 che II2 è impossibile con il fatto che II2 pensi che I1 è certo. 25 La teoria dei giochi bayesiani si è però occupata essenzialmente del caso consistente per due ragioni: per prima cosa si tratta di un caso importante, si tratta in un certo senso di belief oggettivi. In secondo luogo (vedi Aumann) l’idea di belief inconsistenti cozza contro l’ipotesi che la struttura del gioco sia conoscenza comune dei due gocatori. 26 Rappresentazione di Harsanyi Vediamo ora come Harsanyi propone di rappresentare il gioco di cui ci siamo occupati all’inizio del paragrafo in modo da assimilarlo a un gioco a informazione completa ma imperfetta. Supponiamo che i belief siano consistenti, che equivale a supporre che la natura selezioni i tipi (solo del giocatore II nell’esempio semplice che abbiamo considerato) individuando il giocatore II1 con probabilita p e il giocatore II2 con probabilita 1 − p. 27 .5 .6 @ p 1-p @ @ @ II1 1, A0 @ @II 2 0 @ @ 0 1, @ B 2, A @ 2, B 0 @ @ ....................................................................................... A A A A A 1 2 A A A A B A 0 0 4 1 A A A A B A 1 1 3 3 A A A A B A 0 0 1 4 B 1 2 28 Osserviamo che il diagramma rappresenta un gioco in forma estesa a informazione completa. Allora l’idea di equilibrio bayesiano non è altro che l’idea di equilibrio di Nash applicata a questo gioco a informazione completa. Questa è l’idea di Harsanyi. Tra l’altro con questa rappresentazione è anche più facile capire cosa è una strategia per un gioco bayesiano: non è altro che una strategia in senso usuale per questo gioco a informazione completa anche se imperfetta. Molti dei giochi bayesiani che vengono studiati nella teoria dei giochi applicata hanno beliefs consistenti. In un modello consistente le differenze nei beliefs dei giocatori sono riconducibili a differenze nell’informazione, mentre l’idea di beliefs inconsistenti rappresenta differenze di opinione che non possono essere dedotte da differenze nell’osservazione e sono invece assunte a priori. 29 Naturalmente è possibile immaginare giochi con beliefs inconsistenti. Per esempio in una gara sportiva se è conoscenza comune che ciascuno pensa che vincerà la gara con probabilità 2 3, allora questi belief non possono essere consistenti con una distribuzione di probabilità comune. In un modello consistente ci possono essere differenze nei beliefs ma queste non possono essere conoscenza comune. (Aumann 1976) 30 Vediamo un ulteriore esempio: [da Fudenberg - Tirole] Un’impresa (giocatore I), già operante sul mercato, deve decidere se costruire una nuova fabbrica (C, NC); un’altra (giocatore II) deve decidere se entrare sul mercato (E, NE). Il giocatore II non sa se la costruzione della nuova fabbrica per I avrà costo 3 oppure 0 e assegna ai due eventi probabilità p e 1 − p, rispettivamente; il costo è invece noto a I; i payoff sono riportati nelle seguenti tabelle: I3/II E NE C 0, −1 2, 0 NC 2, 1 3, 0 I0/II E NE C 3, −1 5, 0 NC 2, 1 3, 0 31 Il gioco bayesiano è rappresentato dalla quintupla: N = {I, II} CI = {C, N C}; CII = {E, N E} TI = {I3, I0}; TII = {II} pI3 (II) = pI0 (II) = 1; pII (I3) = p, pII (I0) = 1 − p uI ((C, E), (I3, II)) = 0 uII ((C, E), (I3, II)) = −1 uI ((N C, E), (I3, II)) = 2 uII ((N C, E), (I3, II)) = 1 uI ((C, N E), (I3, II)) = 2 uII ((C, N E), (I3, II)) = 0 uI ((N C, N E), (I3, II)) = 3 uII ((N C, N E), (I3, II)) = 0 uI ((C, E), (I0, II)) = 3 uII ((C, E), (I0, II)) = −1 uI ((N C, E), (I0, II)) = 2 uII ((N C, E), (I0, II)) = 1 uI ((C, N E), (I0, II)) = 5 uII ((C, N E), (I0, II)) = 0 uI ((N C, N E), (I0, II)) = 3 uII ((N C, N E), (I0, II)) = 0 32 Le strategie pure sono: ΣI = {sI1, sI2, sI3, sI4} con II ΣII = {sII 1 , s2 } con sI1(I3) = C sI2(I3) = C sI3(I3) = N C sI4(I3) = N C sI1(I0) = C sI2(I0) = N C sI3(I0) = C sI4(I0) = N C sII 1 (II) = E sII 2 (II) = N E 33 Si può osservare che la strategia NC è dominante per il giocatore I se il costo è 3 e quindi il giocatore II sceglierà E, mentre se il costo è 0 la strategia C è dominante per il giocatore I e quindi il giocatore II sceglierà NE. Si può allora dire che il giocatore II sceglierà E se p > 0.5 e sceglierà NE se p < 0.5. Se p = 0.5 il payoff atteso del giocatore II è nullo, qualunque sia la sua strategia. Se i possibili costi di costruzione fossero 3 e 1.5; i nuovi payoff dei giocatori sono riportati nelle seguenti tabelle: I3/II E NE C 0, −1 2, 0 NC 2, 1 3, 0 I1.5/II E NE C 1.5, −1 3.5, 0 NC 2, 1 3, 0 34 Se il costo del giocatore I è 3, la strategia NC è ancora dominante per I. Se il costo del giocatore I è 1.5 non ci sono strategie dominanti per nessun giocatore. Calcoliamo ora le strategie di miglior risposta dei due giocatori. Indichiamo con (x, 1 − x) la strategia mista del primo giocatore e con (y, 1 − y) la strategia mista del secondo giocatore. 35 Se il giocatore I è di tipo 3 la miglior risposta è sempre NC, se invece il giocatore I è di tipo 1.5, egli confronta i payoff attesi delle strategie C e NC che sono rispettivamente 1.5y + 3.5(1 − y) = 3.5 − 2y e 2y + 3(1 − y) = 3 − y, per cui sceglierà C se 3.5 − 2y > 3 − y, cioè se y < 0.5. 36 La strategia di miglior risposta di II dipende, oltre che dalla strategia, anche dal tipo di I; I sceglie (x, 1 − x) nel caso che sia di tipo 1.5, mentre nel caso in cui è di tipo 3 I sceglie NC; Il payoff atteso di II se gioca NE è 0, mentre il payoff atteso di II se gioca E è dato da 1(p) − 1(1 − p)(x) + 1(1 − p)(1 − x) = 1 − 2(1 − p)x. Il payoff atteso di E supera il payoff atteso di NE se 1−2(1−p)x ≥ 0, cioè se 1 x≤ 2(1 − p) 37 Riassumendo le migliori risposte di I sono: giocare C (x = 1) se y < 0.5 indif f erente se y = 0.5 giocare N C (x = 0) se y > 0.5 mentre le migliori risposte di II sono: 1 giocare E (y = 1) se x < 2(1 − p) 1 indif f erente se x = 2(1 − p) 1 giocare N E (y = 0) se x > 2(1 − p) 38 • x = 0, y = 1 è un equilibrio qualunque sia p infatti se II gioca E (y = 1) la miglior risposta di I è NC (x = 0), perchè y > 0.5 e viceversa se I gioca NC (x = 0) la miglior risposta di II è giocare E (y = 1), perchè x ≤ 1 ; 2(1 − p) • x = 1, y = 0 è un equilibrio se p ≤ 0.5 infatti se II gioca NE (y = 0) la miglior risposta di I è C (x = 1), perchè y < 0.5 e viceversa se I gioca C (x = 1) la miglior risposta di II è giocare NE (y = 0) solo quando p ≤ 0.5 1 1 perchè x > , altrimenti quando p > 0.5, >1 2(1 − p) 2(1 − p) ; 39 1 • x= , per ogni valore di p, y = 0.5 è un equilibrio in 2(1 − p) strategie miste. 1 è ottima 2(1 − p) 1 (qualunque risposta di I è ottima) e se I gioca x = , 2(1 − p) la risposta y = 0.5 è ottima (qualunque risposta di II è ottima). Infatti se II gioca y = 0.5, la risposta x = 40 Il gioco della posta elettronica Questo esempio∗ è interessante per mettere in evidenza come, nel caso in cui l’insieme degli stati del mondo è infinito, la conoscenza iterata fino al grado N non implica la conoscenza comune, per quanto sia grande N. Due giocatori I e II devono scegliere una azione tra A e B. Con probabilità p < 1 2 il gioco in cui sono coinvolti è Gb e con probabilità 1 − p è Ga. ∗ Rubinstein Ariel (1989) “The electronic mail game: Strategic behavior under “almost common knowledge”, American Economic Review, 79, 385-391 41 Le utilità di I e II nei due casi sono le seguenti: Ga: I/II A B A M,M -L,1 B3 1,-L 0,0 I/II A B A 0,0 -L,1 B3 1,-L M,M Gb: dove si suppone che L > M > 1. 42 (A, A) è l’equilibrio di Nash del primo gioco e (B, B) è l’equilibrio di Nash del secondo. Osserviamo che, anche se un giocatore è sicuro che il gioco sia Ga, è per lui rischioso scegliere la strategia A se non è certo che l’altro lo sappia. Consideriamo il gioco in vari casi di informazione per i due giocatori. Se supponiamo che sia conoscenza comune quale dei due giochi viene giocato, allora l’equilibrio si ottiene giocando da parte di ciascun giocatore la strategia : “Gioco A se il gioco è Ga, gioco B se il gioco è Gb” e l’utilità ottenuta è M per ciascun giocatore. 43 Supponiamo ora che sia noto solo al primo giocatore quale è il gioco. In questo caso si può vedere che l’unico equilibrio di Nash “bayesiano”∗ consiste nel giocare A da parte di entrambi i giocatori e l’utilità attesa è (1 − p)M . Si supponga infine che i due giocatori possano comunicare tra loro ma che il gioco non diventi mai conoscenza comune. ∗ Per la definizione di equilibrio bayesiano vedi per esempio Myerson “Game theory, Analysis of Conflict”, Harvard 1991 44 La comunicazione è la seguente: Se il gioco è Gb il computer di I invia automaticamente un messaggio a quello di II; Se il gioco è Ga nessun messaggio è inviato da I a II; Se un computer riceve un messaggio, invia automaticamente la conferma, questo non solo per il messaggio iniziale, ma anche per le successive conferme. 45 La regola prevede che ogni computer invii conferme, perché esiste una piccola probabilità ε > 0 che un messaggio non giunga a destinazione. Se un messaggio non viene ricevuto, allora la comunicazione si interrompe. Alla fine della fase di invio ogni giocatore legge sullo schermo il numero di messaggi che il suo computer ha inviato. Se vogliamo discutere la conoscenza dei giocatori in questa situazione, è necessario specificare quali sono gli stati. 46 Sia: Ω = {(QI , QII ) : QI = QII o QI = QII + 1 QI , QII ≥ 0} Allo stato (q, q) il computer di I ha inviato q messaggi, tutti sono arrivati al computer di II, il computer di II ha inviato q messaggi ma il suo q-esimo è stato smarrito. Allo stato (q +1, q), il computer di I ha inviato q + 1 messaggi. Tutti sono arrivati al computer di II, tranne il q + 1-esimo che è stato smarrito. 47 La partizione sullo stato del mondo HI = {{(0, 0)} , {(q, q) , (q, q − 1)} per ogni q > 0} HII = {{(q, q), (q + 1, q)} per ogni q ≥ 0} Indichiamo con G(QI , QII ) il gioco che si gioca nello stato (QI , QII ), cioè G(0, 0) = Ga e G(QI , QII ) = Gb altrimenti. 48 I conosce il gioco in ogni caso mentre II lo conosce sempre tranne che in (0, 0) e in (1, 0). In hI (1, 1) = {(1, 1), (1, 0)} I sa che il gioco è Gb, ma non sa se II lo sa perché hII (1, 0) = {(1, 0), (0, 0)}. Allo stesso modo, in hII (1, 1) = {(1, 1), (2, 1)}, II sa che il gioco è Gb ma non sa se I sa che II sa che il gioco è Gb perché hI (1, 1) = {(1, 1), (1, 0)} e cosı̀ via . Ad ogni stato (q, q) oppure (q, q + 1) corrisponde conoscenza iterata fino al livello q che il gioco è Gb, ma questo non è conoscenza comune. 49 Se ε è piccolo, con probabilità elevata ogni giocatore vede un numero elevato sul suo schermo. Quando I vede 1 sullo schermo non può sapere se II sa che il gioco è Gb e quindi esita a giocare B. Ma se il numero sullo schermo è alto, può sembrare quasi conoscenza comune che il gioco sia Gb. La decisione è legata all’opinione di I su cosa farà II quando legge un numero alto sullo schermo. Si può osservare che la distribuzione di probabilità iniziale su Ω è comune ai due giocatori e deriva dal fatto che il gioco è Ga con probabilità 1 − p e Gb con probabilità p. Se vogliamo trovare gli equilibri di Nash bayesiani di questo gioco in questa situazione informativa, occorre fare un po’ di conti. Il risultato (non particolarmente difficile, ma un po’ noioso) è che non è cambiato nulla rispetto alla situazione in cui solo I è informato. L’equilibrio è ancora (A, A) e il valore atteso è (1 − p)M . 50 Questo esempio sottolinea ancora una volta un aspetto paradossale, cioè sottolinea un contrasto tra l’intuizione e l’analisi della teoria dei giochi. Come può comportarsi un giocatore quando vede un numero alto (per esempio 20) sul suo schermo? È difficile pensare che quando L > M di poco e ε è piccolo un giocatore non scelga B. 51