Equilibrio Correlato Molti giochi si presentano con equilibri multipli

Equilibrio Correlato
Molti giochi si presentano con equilibri multipli contrapposti. Casi tipici sono la battaglia dei sessi e
il gioco del pollo. In questi giochi l’equilibrio di Nash preferito da un giocatore risulta essere quello
meno preferito dall’altro giocatore.
Nel primo gioco del pollo, l’equilibrio (X,B) è certamente favorevole al giocatore II mentre
l’equilibrio (Y,A) è preferito dal giocatore I. In questi giochi, quindi, rimane problematica la
decisione dei due giocatori se non ci sono indizi esterni al gioco. L’idea di Aumann per risolvere
questo tipo di impasse è quella di introdurre un random devise indipendente (un agente, una
macchina, un congegno, capace di attribuire una distribuzione di probabilità tra i due equilibri) e lo
fa proponendo un gioco che assomiglia alla battaglia tra i sessi ma che permette di prefigurare
diversi random devise:
Questo gioco ha tre equilibri di Nash, due in strategie pure (X,A) e (Y,B) ed uno in strategie miste:
I : 5q  3q  1  q 
II : 4  3 p  5  5 p 
1
;
2
p
1
2
L’equilibrio in strategie miste ha un esito di payoff pari a 2.5 per entrambi i giocatori (inserendo la
probabilità di equilibrio nei payoff relativi). Anche le strategie miste costituiscono un random
devise, tuttavia esso è una randomizzazione indipendente dei due giocatori. Quindi, l’idea è di
utilizzare un meccanismo di randomizzazione che produca una situazione anche più efficiente. I due
giocatori si possono mettere d’accordo nel tirare una moneta e scegliere, ad esempio, che si
converga su l’equilibrio (X,A) se è testa e su (Y,B) se è croce. In altri termini si implementa la
strategia correlata:
1
1
( X , A)  (Y , B)
2
2
Dato che entrambe le alternative sono degli equilibri di Nash, il loro “coordinamento random” è
anch’esso un equilibrio. Attenzione, nessuno dei giocatori è forzato a randomizzare, ma questo
piano tra i due giocatori è self-enforcing. Nessun giocatore può deviare in maniera unilaterale da
questo piano guadagnandoci. Inoltre, il payoff atteso nell’usare questo meccanismo, che è pari a 3
per ogni giocatore, è superiore a quello ottenuto dalla randomizzazione indipendente delle strategie
(strategie miste):
1
1
 5   1  3 giocatore I
2
2
1
1
 1   5  3 giocatore II
2
2
Si noti che una probabilità positiva è attribuita solo agli equilibri di Nash, e quindi lo qualifica come
equilibrio. La correlazione delle strategie permette un “accordo” auto-sostenibile.
Questo concetto di equilibrio correlato porta anche a riflettere sul ruolo dell’informazione. In questo
caso una informazione diretta (diretta tra i giocatori) porta ad una soluzione ex-ante più efficiente e
permette di risolvere un’impasse considerevole sulla scelta degli equilibri contrapposti.
L’esempio riportato da Aumann ci indica, comunque, che la situazione più efficiente del gioco
(Y,A) non può essere raggiunta con questo semplice schema di randomizzazione. Del resto, questa
soluzione non è un equilibrio e, quindi, è fuori dalla portata di un “accordo” casuale sui due
equilibri del gioco. Tuttavia, una domanda che potrebbe emergere è se esista un qualche
meccanismo casuale (meccanismo di coordinamento) che sia in grado di portare i giocatori su
questa soluzione, uscendo dalla dicotomia dei due equilibri di Nash (X,B) e (Y,B). A prima vista
sembra impossibile, specie se il “meccanismo di coordinamento” invia segnali di gioco di strategia
ad ogni giocatore che siano conoscenza comune. Vedremo, invece, che se il random devise non è
diretto (ossia interviene un mediatore o una macchina o un congegno esterno) e se i segnali di
strategia inviati da questo random devise non sono conoscenza comune tra i giocatori, la soluzione
più efficiente (Y,A) può essere raggiunta.
Assumiamo, ad esempio, l’utilizzo di una macchina o una persona che aiuti i giocatori a comunicare
e che chiameremo mediatore. In questo caso vediamo se esiste un piano self-enforcing capace di
generare un migliore payoff atteso. Quindi, il mediatore può prendere in considerazione non
soltanto i due equilibri (X,A) (Y,B) ma anche la soluzione efficiente (Y,A). Infatti, il mediatore può
raccomandare ai due giocatori la seguente distribuzione iniziale per le loro strategie: 1/3; 1/3; 1/3.
In altri termini, ogni coppia di strategie (X,A), (Y,B) e (Y,A) è consigliata con una probabilità di
1/3. Randomizzando, in questo caso i giocatori ottengono:
1
1
1
 ( X , A)   (Y , A)  (Y , B)
3
3
3
1
1
1
 (5,1)   (4,4)  (1,5) 
3
3
3
1.666  1.333  0.333  3.332 giocatore I
0.333  1.333  1.666  3.332 giocatore II
Quindi si è passati da un payoff atteso di 2.5 (random devise indipendente- strategie miste) ad uno
di 3 (random devise- comunicazione diretta) ed infine a uno di 3.332 (random devisecomunicazione mediata). Questa randomizzazione guidata può costituire un “accordo”.
Ora i giocatori partono con questo accordo ex-ante, che poi aggiornano con il segnale inviato dal
mediatore. Quale sarà l’esito dipende dalla soluzione ottenuta dal random devise e quindi dal
mediatore. Quest’ultimo può randomizzare con qualsiasi devise, ovviamente non può usare una
moneta ma può usare un dado e abbinare, ad esempio, i numeri 1,2 a (X,A), i numeri 3,4 a (Y,A) e,
infine i numeri 5,6 a (Y,B).
A questo punto, l’assunzione cruciale è che ogni giocatore conosca solo la propria strategia
suggerita dal mediatore (non quello che il mediatore segnala agli altri giocatori). Anche se il
mediatore non ha forza di imposizione, esiste un EN del gioco trasformato, con comunicazione
mediata, nel quale entrambi i giocatori obbediscono al mediatore. Vediamo come il mediatore può
raggiungere la soluzione più efficiente (Y,A).
Il segnale che il mediatore invia ad ogni giocatore segue la seguente logica: se al giocatore I, il
mediatore indica Y, questo giocatore può pensare che a II il mediatore abbia suggerito di giocare A
o B con analoga probabilità. Perché? Ciò avviene perché se il segnale suggerito è Y allora
l’equilibrio (X,A) è escluso. In questo caso il payoff atteso dal giocare I con Y sarebbe analogo a
quello ottenuto giocando X (2.5 per entrambi le strategie: 5/2 con X e 4/2+1/2 con Y). Quindi I non
ha difficoltà ad accogliere il segnale del mediatore. Se al giocatore I il mediatore suggerisce X,
allora saprebbe che a II è stato detto di giocare A, per cui la sua migliore risposta è proprio X.
Quindi, il giocatore I sarà sempre disponibile a obbedire alle indicazioni del mediatore se anche II è
disponibile. Lo stesso ragionamento, ovviamente, vale per il giocatore II. Ciò che è importante è
che nessuno dei due giocatori ha un motivo per deviare in maniera unilaterale.
Occorre fare attenzione, come abbiamo accennato l’implementazione di questa strategia correlata,
senza l’ausilio di alcun contratto, richiede che ogni giocatore ottenga diverse informazioni parziali
riguardo la randomizzazione del mediatore. Ad esempio, se il giocatore I era a conoscenza che il
mediatore segnalava a II di optare per A, non sarebbe stato più disponibile a scegliere Y come
suggerimento. Queste strategie correlate non possono essere implementate senza una sorta di
comunicazione mediata e noise.
Il meccanismo è conoscenza comune, e non può essere altrimenti visto che sostituisce un “accordo”,
ma l’informazione di ogni giocatore non riguarda l’esito del random device ma solo la sua strategia.
Se l’esito del meccanismo è, ad esempio, (X,A), allora il segnale che riceve il giocatore I è soltanto
X mentre quello del giocatore II è solo A.
Questo concetto fa emergere alcuni aspetti interessanti della comunicazione-informazione. Con una
comunicazione diretta tra i giocatori, dove tutti osservano tutto (il meccanismo è pubblicamente
osservabile), l’unico “accordo” self-enforcing che possono raggiungere senza un contratto vero e
proprio, è la randomizzazione tra gli equilibri di Nash del gioco originale. Con la comunicazioneinformazione mediata si può raggiungere una soluzione più efficiente ma i segnali del mediatore
non devono essere conoscenza comune. Come dire, non è sempre vero che più si è informati e
meglio è.
Quindi l’equilibrio correlato comporta una serie di implicazioni: i) può essere utile nei problemi
degli equilibri multipli con esiti divergenti per i giocatori (cioè preferiti in maniera opposta dai
giocatori coinvolti); ii) consente un miglioramento dei risultati attesi per entrambi i giocatori e può
quindi fungere da “contratto”; iii) può comportare il raggiungimento di una soluzione più efficiente;
iv) pone alcune questioni interessanti sull’informazione (sulla rinuncia di una parte
dell’informazione). Un’ottima analisi degli equilibri correlati è nei volumi di Myerson (1991) e
Vega-Redondo (2003).