Teoria dei Giochi
Anna Torre
Almo Collegio Borromeo 10 maggio 2011
email: [email protected]
sito web del corso:www-dimat.unipv.it/atorre/borromeo2011.html
A. Torre
Teoria dei giochi 2011-Almo Collegio Borromeo
Giochi a informazione incompleta
Nel caso in cui i giocatori sono due significa che le funzioni di utilità di
entrambi sono conoscenza comune dei due.
Questo fatto nei giochi concreti non è particolarmente realistico.
Spetta ad Harsanyi l’aver formalizzato la situazione di
informazione incompleta.
Harsanyi, John C. [1968]: Games with incomplete information played
by Bayesian players, Parts I, II and III, Management Science, 14,
159-182, 320-334, 486-502.
A. Torre
Teoria dei giochi 2011-Almo Collegio Borromeo
Informazione incompleta
Un gioco a informazione incompleta è un gioco in cui i
giocatori non hanno conoscenza comune di tutti gli elementi
del gioco.
La mancanza di conoscenza si può riferire a vari elementi: per
esempio i giocatori potrebbero non sapere le preferenze degli
altri o addirittura potrebbero non sapere quanti sono gli altri
giocatori o quante sono le strategie a disposizione degli altri
giocatori o altre cose ancora.
L’esempio è preso da Myerson, Roger B. [1991]: Game Theory:
Analysis of Conflict, Harvard University Press, Cambridge (MA).
A. Torre
Teoria dei giochi 2011-Almo Collegio Borromeo
Esempio
II1 A
HH
I H
A0
(1, 2)
0
B
(0,4)
H II2 A
I H
H
A0
(1, 3)
0
B
(0,1)
B
(0,1)
(1, 3)
B
(0,4)
(1, 2)
Il giocatore II conosce le utilità del giocatore I mentre il giocatore I
non sa se il giocatore II è del tipo II1 o II2 .
Le utilità di II1 e II2 sono “rovesciate” in quanto per II1 la strategia A è
dominante mentre per II2 è dominante la strategia B.
A. Torre
Teoria dei giochi 2011-Almo Collegio Borromeo
I Tipi
Insieme dei tipi dei giocatori.
T1 = {I} T2 = {II1 , II2 }
CI = {A0 , B0 } insieme delle azioni del primo giocatore
CII = {A, B} insieme delle azioni del secondo giocatore.
A. Torre
Teoria dei giochi 2011-Almo Collegio Borromeo
Funzioni di Utilità
Cosa sono in questo caso le funzioni di utilità?
Per il secondo giocatore le funzioni di utilità sono due: se il giocatore
è di tipo 1 la funzione di utilità è
UII1 : (CI × CII ) −→ R
se e di tipo 2 è
UII2 : (CI × CII ) −→ R
A. Torre
Teoria dei giochi 2011-Almo Collegio Borromeo
Esempio
Tutta l’informazione si raccoglie in un’unica funzione:
UII : (CI × CII ) × TII −→ R
Per il giocatore I la situazione è più semplice perchè il giocatore I può
essere di un solo tipo, ma in ogni caso ha una:
UI : (CI × CII ) × TI −→ R
A. Torre
Teoria dei giochi 2011-Almo Collegio Borromeo
Azioni
C = CI × CII azioni dei due giocatori
T = TI × TII tipi possibili dei due giocatori
uI e uII definite su C × T
uI , uII : C × T −→ R funzioni di utilità
Manca la distribuzione di probabilità soggettiva che i giocatori
(bayesiani) assegnano a tutto ciò che non sanno.
Il giocatore I deve avere una distribuzione di probabilità su TII .
Se invece il giocatore I potesse essere di due tipi dovremmo
richiedere che I1 abbia un distribuzione di probabilità pI1 su TII e
lo stesso accada per il tipo I2 il quale avrà quindi pI2 su TII .
pI : TI −→ ∆(TII )=distribuzioni di probabilità su TI
pII : TII −→ ∆(TI )=distribuzioni di probabilità su TII
A. Torre
Teoria dei giochi 2011-Almo Collegio Borromeo
Definizione
Un gioco bayesiano a due giocatori è quindi:
Γ = ((CI , CII ), (TI , TII ), (pI , pII ), (uI , uII ))
A questo punto Harsany suppone che Γ sia conoscenza comune dei
giocatori, che ogni giocatore sappia qual’è il suo vero tipo e il fatto
che ciascuno sa qual’è il suo vero tipo sia conoscenza comune tra i
giocatori. Allora una strategia pura per il giocatore I è una funzione
sI : TI −→ CI
mentre una strategia pura per il giocatore II è una funzione
sII : TII −→ CII .
A. Torre
Teoria dei giochi 2011-Almo Collegio Borromeo
EQUILIBRIO BAYESIANO
Una strategia mista per il giocatore I è:
sI : CI × TI −→ [0, 1], con Σc∈CI sI (c, t) = 1 ∀t ∈ TI
Cioè per ogni possibile tipo t per il giocatore I individuiamo una
distribuzione di probabilità su CI .
Analogo discorso vale per il giocatore II che deve indicare una
strategia mista sia nell’ipotesi in cui lui è II1 sia nell’ipotesi in cui lui è
II2 :
sII : CII × TII −→ [0, 1].
A. Torre
Teoria dei giochi 2011-Almo Collegio Borromeo
EQUILIBRIO BAYESIANO
Una volta note le strategie si può calcolare il payoff atteso.
Per poter calcolare il payoff atteso il giocatore deve dichiarare
l’azione che sceglierà qualunque sia il tipo a cui lui appartiene.
Il giocatore II che è quello che può essere di due tipi, anche se
sa a che tipo appartiene deve dire anche cosa farebbe se fosse
dell’altro tipo.
La motivazione per cui questo è necessario e che anche se II sa
di che tipo è, questo fatto non è conoscenza comune. Infatti al
giocatore II interessa cosa farà il giocatore I ma ciò che I farà
dipende da ciò che lui pensa che il giocatore II farà per ogni
possibile tipo del giocatore II. Perciò anche se il giocatore II sa
di che tipo è, per decidere cosa fare deve sapere cosa farebbero
tutti gli altri suoi tipi.
In questo esempio, poichè per ciascun tipo di II c’è una strategia
dominante, la strategia di equilibrio per II sarà A per II1 e B per
A. Torre
Teoria dei giochi 2011-Almo Collegio Borromeo
Equilibrio Bayesiano
Supponiamo che I assegni probabilità 15 a II1 e 45 a II2
Quindi per il giocatore I è più probabile che II sia di tipo 2 e quindi
sceglierà B’.
L’equilibrio bayesiano è dunque:
sI1 (A0 ) = 0
sI1 (B0 ) = 1
sII1 (A) = 1
sII1 (B) = 0
sII2 (A) = 0
sII2 (B) = 1
A. Torre
Teoria dei giochi 2011-Almo Collegio Borromeo
Manipolabilità
Osserviamo che in questo gioco se fosse conoscenza comune il fatto
che il tipo di II è II1 , l’equilibrio di Nash del gioco sarebbe (A0 , A),
mentre se fosse conoscenza comune il fatto che il tipo di II è II2 ,
l’equilibrio sarebbe (B0 , B) Ma il giocatore II1 preferisce l’esito (B0 , B),
mentre il giocatore II2 preferisce l’esito (A0 , A). Dunque anche se
potesse, il giocatore II non avrebbe interesse a dichiarare il suo vero
tipo e quindi se lo facesse è presumibile che mentirebbe.
A. Torre
Teoria dei giochi 2011-Almo Collegio Borromeo
Rappresentazione di Harsanyi
Vediamo ora come Harsanyi propone di rappresentare il gioco di cui
ci siamo occupati all’inizio del paragrafo in modo da assimilarlo a un
gioco a informazione completa ma imperfetta. Supponiamo che i
belief siano consistenti, cioè che la natura selezioni i tipi (solo del
giocatore II nell’esempio semplice che abbiamo considerato)
individuando il giocatore II1 con probabilita p e il giocatore II2 con
probabilita 1 − p.
A. Torre
Teoria dei giochi 2011-Almo Collegio Borromeo
Rappresentazione di Harsanyi
.6
.5
@
p
@
1-p
@
@
@
@ II2
II1
@
@
0
0
1, A0
2, A0
@1, B
@2, B
@
@
.................................................................................................................................
A
A
A
A
A
A
A
A
A
A
A
A
AB
AB
AB
AB
A
A
A
A
1
0
0
1
1
0
0
1
2
4
1
3
3
1
4
2
A. Torre
Teoria dei giochi 2011-Almo Collegio Borromeo
Rappresentazione di Harsanyi
Il diagramma rappresenta un gioco in forma estesa a informazione
completa.
L’idea di equilibrio bayesiano non è altro che l’idea di equilibrio di
Nash applicata a questo gioco a informazione completa.
Questa è l’idea di Harsanyi.
Con questa rappresentazione è anche più facile capire cosa è una
strategia per un gioco bayesiano: non è altro che una strategia in
senso usuale per questo gioco a informazione completa anche se
imperfetta.
A. Torre
Teoria dei giochi 2011-Almo Collegio Borromeo
Vediamo un ulteriore esempio:
[da Fudenberg - Tirole] Un’impresa (giocatore I), già operante sul
mercato, deve decidere se costruire una nuova fabbrica (C, NC);
un’altra (giocatore II) deve decidere se entrare sul mercato (E, NE). Il
giocatore II non sa se la costruzione della nuova fabbrica per I avrà
costo 3 oppure 0 e assegna ai due eventi probabilità p e 1 − p,
rispettivamente; il costo è invece noto a I; i payoff sono riportati nelle
seguenti tabelle:
I3 /II
C
NC
E
0, −1
2, 1
NE
2, 0
3, 0
A. Torre
I0 /II
C
NC
E
3, −1
2, 1
NE
5, 0
3, 0
Teoria dei giochi 2011-Almo Collegio Borromeo
Il gioco bayesiano è rappresentato dalla quintupla:
N = {I, II}
CI = {C, NC}; CII = {E, NE}
TI = {I3 , I0 }; TII = {II}
pI3 (II) = pI0 (II) = 1; pII (I3 ) = p, pII (I0 ) = 1 − p
uI ((C, E), (I3 , II)) = 0
uII ((C, E), (I3 , II)) = −1
uI ((NC, E), (I3 , II)) = 2
uII ((NC, E), (I3 , II)) = 1
uI ((C, NE), (I3 , II)) = 2
uII ((C, NE), (I3 , II)) = 0
uI ((NC, NE), (I3 , II)) = 3
uII ((NC, NE), (I3 , II)) = 0
uI ((C, E), (I0 , II)) = 3
uII ((C, E), (I0 , II)) = −1
uI ((NC, E), (I0 , II)) = 2
uII ((NC, E), (I0 , II)) = 1
uI ((C, NE), (I0 , II)) = 5
uII ((C, NE), (I0 , II)) = 0
uI ((NC, NE), (I0 , II)) = 3
uII ((NC, NE), (I0 , II)) = 0
A. Torre
Teoria dei giochi 2011-Almo Collegio Borromeo
Le strategie pure sono:
ΣI = {sI1 , sI2 , sI3 , sI4 } con sI1 (I3 ) = C
ΣII = {sII1 , sII2 } con
sI1 (I0 ) = C
sI2 (I3 ) = C
sI3 (I3 ) = NC
sI4 (I3 ) = NC
sI2 (I0 ) = NC
sI3 (I0 ) = C
sI4 (I0 ) = NC
sII1 (II) = E
sII2 (II) = NE
A. Torre
Teoria dei giochi 2011-Almo Collegio Borromeo
Si può osservare che la strategia NC è dominante per il giocatore I
se il costo è 3 e quindi il giocatore II sceglierà E, mentre se il costo è
0 la strategia C è dominante per il giocatore I e quindi il giocatore II
sceglierà NE. Si può allora dire che il giocatore II sceglierà E se
p > 0.5 e sceglierà NE se p < 0.5. Se p = 0.5 il payoff atteso del
giocatore II è nullo, qualunque sia la sua strategia.
Se i possibili costi di costruzione fossero 3 e 1.5; i nuovi payoff dei
giocatori sono riportati nelle seguenti tabelle:
I3 /II
C
NC
E
0, −1
2, 1
I1.5 /II
C
NC
NE
2, 0
3, 0
A. Torre
E
1.5, −1
2, 1
NE
3.5, 0
3, 0
Teoria dei giochi 2011-Almo Collegio Borromeo
Se il costo del giocatore I è 3, la strategia NC è ancora dominante
per I.
Se il costo del giocatore I è 1.5 non ci sono strategie dominanti per
nessun giocatore.
Calcoliamo ora le strategie di miglior risposta dei due giocatori.
Indichiamo con (x, 1 − x) la strategia mista del primo giocatore e con
(y, 1 − y) la strategia mista del secondo giocatore.
A. Torre
Teoria dei giochi 2011-Almo Collegio Borromeo
Se il giocatore I è di tipo 3 la miglior risposta è sempre NC, se invece
il giocatore I è di tipo 1.5, egli confronta i payoff attesi delle strategie
C e NC che sono rispettivamente
1.5y + 3.5(1 − y) = 3.5 − 2y e 2y + 3(1 − y) = 3 − y,
per cui sceglierà C se
3.5 − 2y > 3 − y, cioè se y < 0.5.
A. Torre
Teoria dei giochi 2011-Almo Collegio Borromeo
La strategia di miglior risposta di II dipende, oltre che dalla strategia,
anche dal tipo di I;
I sceglie (x, 1 − x) nel caso che sia di tipo 1.5, mentre nel caso in cui è
di tipo 3 I sceglie NC;
Il payoff atteso di II se gioca NE è 0, mentre il payoff atteso di II se
gioca E è dato da
1(p) − 1(1 − p)(x) + 1(1 − p)(1 − x) = 1 − 2(1 − p)x.
Il payoff atteso di E supera il payoff atteso di NE se 1 − 2(1 − p)x ≥ 0,
cioè se
x≤
1
2(1 − p)
A. Torre
Teoria dei giochi 2011-Almo Collegio Borromeo
Riassumendo le migliori risposte di I sono:
giocare C (x = 1)
se y < 0.5
indifferente
se y = 0.5
giocare NC (x = 0) se y > 0.5
mentre le migliori risposte di II sono:
1
2(1 − p)
1
indifferente
se x =
2(1 − p)
1
giocare NE (y = 0) se x >
2(1 − p)
giocare E (y = 1)
A. Torre
se x <
Teoria dei giochi 2011-Almo Collegio Borromeo
x = 0, y = 1 è un equilibrio qualunque sia p
infatti se II gioca E (y = 1) la miglior risposta di I è NC (x = 0),
perchè y > 0.5 e viceversa se I gioca NC (x = 0) la miglior
1
risposta di II è giocare E (y = 1), perchè x ≤
;
2(1 − p)
x = 1, y = 0 è un equilibrio se p ≤ 0.5
infatti se II gioca NE (y = 0) la miglior risposta di I è C (x = 1),
perchè y < 0.5 e viceversa se I gioca C (x = 1) la miglior risposta
di II è giocare NE (y = 0) solo quando p ≤ 0.5 perchè
1
1
, altrimenti quando p > 0.5,
>1;
x>
2(1 − p)
2(1 − p)
A. Torre
Teoria dei giochi 2011-Almo Collegio Borromeo
1
, per ogni valore di p, y = 0.5 è un equilibrio in
2(1 − p)
strategie miste.
1
Infatti se II gioca y = 0.5, la risposta x =
è ottima
2(1 − p)
1
, la
(qualunque risposta di I è ottima) e se I gioca x =
2(1 − p)
risposta y = 0.5 è ottima (qualunque risposta di II è ottima).
x=
A. Torre
Teoria dei giochi 2011-Almo Collegio Borromeo
Il gioco della posta elettronica
Questo esempio1 è interessante per mettere in evidenza come, nel
caso in cui l’insieme degli stati del mondo è infinito, la conoscenza
iterata fino al grado N non implica la conoscenza comune, per quanto
sia grande N.
Due giocatori I e II devono scegliere una azione tra A e B.
Con probabilità p < 12 il gioco in cui sono coinvolti è Gb e con
probabilità 1 − p è Ga .
1 Rubinstein Ariel (1989) “The electronic mail game: Strategic behavior under
“almost common knowledge”, American Economic Review, 79, 385-391
A. Torre
Teoria dei giochi 2011-Almo Collegio Borromeo
Le utilità di I e II nei due casi sono le seguenti:
Ga :
I/II
A
B
A
M,M
-L,1
B
1,-L
0,0
I/II
A
B
A
0,0
-L,1
B
1,-L
M,M
Gb :
dove si suppone che L > M > 1.
A. Torre
Teoria dei giochi 2011-Almo Collegio Borromeo
(A, A) è l’equilibrio di Nash del primo gioco e (B, B) è l’equilibrio di
Nash del secondo. Osserviamo che, anche se un giocatore è sicuro
che il gioco sia Ga , è per lui rischioso scegliere la strategia A se non è
certo che l’altro lo sappia. Consideriamo il gioco in vari casi di
informazione per i due giocatori.
Se supponiamo che sia conoscenza comune quale dei due
giochi viene giocato, allora l’equilibrio si ottiene giocando da
parte di ciascun giocatore la strategia :
“Gioco A se il gioco è Ga , gioco B se il gioco è Gb ” e l’utilità
ottenuta è M per ciascun giocatore.
A. Torre
Teoria dei giochi 2011-Almo Collegio Borromeo
Supponiamo ora che sia noto solo al primo giocatore quale è il
gioco. In questo caso si può vedere che l’unico equilibrio di Nash
“bayesiano”2 consiste nel giocare A da parte di entrambi i
giocatori e l’utilità attesa è (1 − p)M.
Si supponga infine che i due giocatori possano comunicare tra
loro ma che il gioco non diventi mai conoscenza comune.
2 Per la definizione di equilibrio bayesiano vedi per esempio Myerson “Game theory,
Analysis of Conflict”, Harvard 1991
A. Torre
Teoria dei giochi 2011-Almo Collegio Borromeo
La comunicazione è la seguente:
Se il gioco è Gb il computer di I invia automaticamente un
messaggio a quello di II;
Se il gioco è Ga nessun messaggio è inviato da I a II;
Se un computer riceve un messaggio, invia automaticamente la
conferma, questo non solo per il messaggio iniziale, ma anche
per le successive conferme.
A. Torre
Teoria dei giochi 2011-Almo Collegio Borromeo
La regola prevede che ogni computer invii conferme, perché esiste
una piccola probabilità ε > 0 che un messaggio non giunga a
destinazione. Se un messaggio non viene ricevuto, allora la
comunicazione si interrompe. Alla fine della fase di invio ogni
giocatore legge sullo schermo il numero di messaggi che il suo
computer ha inviato.
Se vogliamo discutere la conoscenza dei giocatori in questa
situazione, è necessario specificare quali sono gli stati.
A. Torre
Teoria dei giochi 2011-Almo Collegio Borromeo
Sia:
Ω = {(QI , QII ) : QI = QII o QI = QII + 1 QI , QII ≥ 0}
Allo stato (q, q) il computer di I ha inviato q messaggi, tutti sono
arrivati al computer di II, il computer di II ha inviato q messaggi ma il
suo q-esimo è stato smarrito. Allo stato (q + 1, q), il computer di I ha
inviato q + 1 messaggi. Tutti sono arrivati al computer di II, tranne il
q + 1-esimo che è stato smarrito.
A. Torre
Teoria dei giochi 2011-Almo Collegio Borromeo
La partizione sullo stato del mondo
HI = {{(0, 0)} , {(q, q) , (q, q − 1)} per ogni q > 0}
HII = {{(q, q), (q + 1, q)} per ogni q ≥ 0}
Indichiamo con G(QI , QII ) il gioco che si gioca nello stato (QI , QII ),
cioè
G(0, 0) = Ga e G(QI , QII ) = Gb altrimenti.
A. Torre
Teoria dei giochi 2011-Almo Collegio Borromeo
I conosce il gioco in ogni caso mentre II lo conosce sempre tranne
che in (0, 0) e in (1, 0).
In hI (1, 1) = {(1, 1), (1, 0)} I sa che il gioco è Gb , ma non sa se II lo sa
perché hII (1, 0) = {(1, 0), (0, 0)}.
Allo stesso modo, in hII (1, 1) = {(1, 1), (2, 1)}, II sa che il gioco è Gb
ma non sa se I sa che II sa che il gioco è Gb perché
hI (1, 1) = {(1, 1), (1, 0)} e così via . Ad ogni stato (q, q) oppure
(q, q + 1) corrisponde conoscenza iterata fino al livello q che il gioco è
Gb , ma questo non è conoscenza comune.
A. Torre
Teoria dei giochi 2011-Almo Collegio Borromeo
Se ε è piccolo, con probabilità elevata ogni giocatore vede un numero
elevato sul suo schermo. Quando I vede 1 sullo schermo non può
sapere se II sa che il gioco è Gb e quindi esita a giocare B. Ma se il
numero sullo schermo è alto, può sembrare quasi conoscenza
comune che il gioco sia Gb . La decisione è legata all’opinione di I su
cosa farà II quando legge un numero alto sullo schermo. Si può
osservare che la distribuzione di probabilità iniziale su Ω è comune ai
due giocatori e deriva dal fatto che il gioco è Ga con probabilità 1 − p
e Gb con probabilità p.
Se vogliamo trovare gli equilibri di Nash bayesiani di questo gioco in
questa situazione informativa, occorre fare un po’ di conti. Il risultato
(non particolarmente difficile, ma un po’ noioso) è che non è
cambiato nulla rispetto alla situazione in cui solo I è informato.
L’equilibrio è ancora (A, A) e il valore atteso è (1 − p)M.
A. Torre
Teoria dei giochi 2011-Almo Collegio Borromeo
Questo esempio sottolinea ancora una volta un aspetto paradossale,
cioè sottolinea un contrasto tra l’intuizione e l’analisi della teoria dei
giochi. Come può comportarsi un giocatore quando vede un numero
alto (per esempio 20) sul suo schermo? È difficile pensare che
quando L > M di poco e ε è piccolo un giocatore non scelga B.
A. Torre
Teoria dei giochi 2011-Almo Collegio Borromeo