Nash Equilibrium e sue motivazioni

Teoria dei Giochi
Dr. Giuseppe Rose
Università degli Studi della Calabria
Corso di Laurea Magistrale in Economia Applicata
a.a 2011/2012
Handout 3
1
L’equilibrio di Nash (NE) con strategie pure
De…nizione 1 Un pro…lo di strategie s = (si ; s i ) 2 Si S i è un equilibrio
| {z }
n
i )i=1
di Nash del gioco G = (Si ;
i (si ; s i )
S
se per ogni i :
i (si ; s i )
per ogni si 2 Si :
(1)
Possiamo dare un ulteriore de…nizione di NE:
Si consideri il giocatore i che sta giocando una strategia s i : De…niamo
l’insieme delle migliori risposte (best response) come l’insieme delle migliori
strategie che il giocatore i può giocare posto che il giocatore i sta giocando
s i:
Bi (s i ) = fsi 2 Si :
0
i (si ; s i )
i (si ; s i )
per ogni s0i 2 Si g :
(2)
De…nizione 2 Un NE è un pro…lo di strategie s = (si ; s i ) 2 S tale che:
si 2 Bi (s i ) per ogni i:
(3)
Un NE è l’intersezione delle best response di tutti i giocatori.
1.1
Esempio: Il modello di Cournot
Ci sono due imprese (i e j) che devono decidere la quantità di uno stesso
bene da immettere sul mercato (rispettivamente qi e qj con qi + qj = Q).
Entrambe le imprese producono ad un costo unitario (quindi costo marginale costante) pari a c.
La funzione di domanda del mercato è data da P (Q) = a
i (qi ; qj )
= qi (P (Q)
c)
1
Q; con a > c:
E’utile ricordare che se una delle due imprese operasse in regime di monopolio, la quantità che massimizza i pro…tti è data da:
max Q[P (Q)
c]
max Q[a
c]
Q
Q
m
@
a
Q
=@Q = 0
Q
c
Q=0
a+c
c
and P =
:
2
2
Individuiamo ora il NE del duopolio descritto sopra. Noi dobbiamo trovare
l’insieme delle best response per l’impresa i dato qj :
Qm =
a
Bi (qj ):
Il payo¤ (pro…tto) dell’impresa i è funzione delle strategie giocate dai due
giocatori:
i (qi ; qj )
= qi (a
qi
qj
c):
Fissiamo la strategia dell’impresa j: Fissiamo qj : Qual’è la best response
per l’impresa i dato qj ?
= qi (a
max
qi
a
qi
@ i =@qi
qj c qi
qi
qj
c):
= 0
= 0
La soluzione è data da:
qi =
a
qj
2
c
(4)
+
Questa è la funzione di reazione dell’impresa i: ci indica sempre la
migliore risposta che i può dare data la scelta di j: Si tratta
dell’insieme delle migliori strategie ovvero dell’insieme delle best
response Bi (qj ) = qi .
2
Se e¤ettuiamo lo stesso procedimento per l’impresa j …ssando qi troveremo
la funzione di reazione, ovvero la best response, dell’impresa j :
qi c
:
(5)
2
Sostituendo qj in Bi (qj ) troviamo Bi (qj ) ovvero la strategia del giocatore i
che, secondo la nostra de…nizione, può far parte di un pro…lo di strategie s che
costituisce un NE:
Bj (qi ) = qj =
qi =
a
a
a qi c
2
c
(6)
2
qi = Bi (qj ) =
a
c
c
c
(7)
3
La strategia del giocatore i, espressa dalla relazione (7), rappresenta una
strategia (si ) che può costituire un NE. Se facciamo la stessa cosa per l’impresa
j sostituendo qi in Bj (qi ) troviamo Bj (qi ):
qj =
a
a qj
2
2
qj = Bj (qi ) =
a
c
3
:
(8)
Avremo quindi che il pro…lo di strategie:
qi = qj =
a
c
3
rappresenta un equilibrio di Nash.
2
Osservazioni
In un gioco in forma normale un NE si individua vedendo se le migliori risposte
dei giocatori coincidono. Esempio 1:
Giocatore 1
A1
B1
C1
Giocatore 2
A2
B2
2, 3
1, 5
4, 1
7, 2
100, 2 -8, 4
C2
10, 1
3, 4
5, 5
Non c’è NE in questo gioco.
Nel gioco seguente invece, abbiamo che il pro…lo di strategie (A1,B2) è un
NE:
3
Giocatore 1
A1
B1
C1
Giocatore 2
A2
B2
2, 3
8, 5
4, 1
7, 2
100, 2 -8, 4
C2
10, 1
3, 4
5, 5
Un NE non può coinvolgere strategie strettamente dominate, ma può coinvolgere strategie dominate in senso debole. Esempio:
Giocatore 1
A1
B1
Giocatore 2
A2
B2
2, 2
1, 2
2, 1
3, 3
In questo gioco abbiamo due NE: (A1, A2) (B1, B2). Il primo di questi
due coinvolge due strategie dominate in senso debole. Gli equilibri di Nash che
coinvolgono strategie strettamente dominate, non sono stabili. Il concetto della
stabilità non verrà analizzato da noi in dettaglio. intuitivamente, un equilibrio
non è stabile se questo cessa di essere un equilibrio se si considera la possibilità
che i giocatori commettano degli errori nell’istante in cui decidono la strategia
da attuare. Gli equilibri stabili sono detti trembling hand resistent, ovvero sono
equilibri che rimangono anche se il gioco può essere disturbato da un errore di
un giocatore. Questo ra¢ namento del concetto di NE è dovuto a Selten, premio
Nobel per l’economia.
3
Motivazioni sul NE
In questa sessione cerchiamo di spiegare perchè due giocatori dovrebbero giungere ad un NE in un gioco. Si consideri il seguente gioco:
Giocatore 1
A1
B1
C1
Giocatore 2
A2
B2
1, 0
0, 1
0, 1
1, 0
-1, -1 -1, -1
C2
-1, -1
-1, -1
1, 1
Si può facilmente vedere come l’unico NE di questo gioco sia rappresentato
dal seguente pro…lo di strategie: (C1, C2).
Partiamo dalla seguente considerazione: nel gioco sopra indicato, come in
qualsiasi altro gioco, ogni risultato è raggiungibile data la "congettura" che
un giocatore formula riguardo a ciò che farà l’altro giocatore. Consideriamo il
pro…lo di strategie (A1,A2). E’ possibile che si raggiunga tale risultato? La
risposta è si. E’ su¢ ciente che il giocatore 1 sia convinto che il giocatore 2
giocherà A2 ed egli muoverà A1. Quindi "la congettura" (belief ) che il giocatore
1 deve formulare riguardo al giocatore 2 è che questo gioca A2. Indichiamo
f e cioè il giocatore 1 gioca A1 se i suoi beliefs sul
questa situazione con (A1, A2)
giocatore 2 gli fanno credere che questi giocherà A2. Dall’altra parte, cosa può
4
spingere il giocatore 2 a giocare A2? Egli gioca A2 se è convinto che il giocatore
1 giocherà B1. A¢ nche il giocatore 2 scelga A2 i suoi beliefs devono essere tali
che egli pensi che il giocatore 1 giocherà B1. Tale situazione può essere indicata
f Con tali beliefs di entrambi i giocatori è possibile che si raggiunga
con (A2, B1).
il risultato …nale (A1, A2).
Indichiamo tali strategie e beliefs di seguito:
f
(A1, A2)
f
(A2, B1)
(9)
(10)
E’evidente come le aspettative di due giocatori identici sullo stesso gioco
siano diverse. Nell’equilibrio di Nash le aspettative dei due giocatori
sul risultato del gioco coincidono. Infatti, utilizzando lo stesso argomento
precedente, il giocatore 1 gioca C1 solo se egli è convinto che il giocatore 2 giochi
f Per ciò che riguarda il giocatore 2, egli giocherà C2 solo
C2 ovvero (C1; C2).
f Se indichiamo
se è convinto che il giocatore 2 giocherà C1, ovvero (C2; C1).
tali strategie e beliefs di seguito:
f
(C1; C2)
f
(C2; C1)
vediamo che solo nell’equilibrio di Nash i due giocatori hanno la stessa idea
di come verrà giocato il gioco.
I risultati diversi dall’equilibrio di Nash (ad esempio il risultato (A1, A2) discusso un attimo fa) non possono essere esclusi neanche sotto l’ipotesi di common
knowldge della razionalità. Diamo un intuizione di tale risultato. Consideriamo
il giocatore 1.
Egli gioca A1 perchè crede che il giocatore 2 giocherà A2. Questo vuol dire
che il giocatore 1 crede che il giocatore 2 crede che il giocatore 1 giocherà B1.
Quindi il giocatore 1 crede che il giocatore 2 crede che il giocatore 1 crede che il
giocatore 2 giocherà B2. Quindi, se 1 crede che 2 crede che 1 crede che 2 crede
che 1 giocherà A1; il giocatore 1 con common knowldge della razionalità può
f e giocare A1.
continuare ad avere i beliefs A2
La stessa cosa può essere discussa dal punto di vista del giocatore 2. Egli
giocherà A2 se crede che il giocatore 1 giocherà B1. Quindi il giocatore 2 crede
che 1 crede che 2 giocherà B2. Quindi il giocatore 2 crede che 1 crede che 2
crede che 1 giocherà A1. Quindi 2 crede che 1 crede che 2 crede che 1 crede che
2 giocherà A2.
A¢ nchè si possa de…nire il NE come un possibile equilibrio di un gioco è
necessario che ci sia razionalità dei giocatori più common knowldge più beliefs
unici e corretti (rationality, common knowldge e common and correct beliefs).
L’ipotesi che i giocatori abbiano common beliefs è in realtà molto forte.
Per sostenerla sono state presentate diverse argomentazioni nella letteratura.
Vediamone qualcuna.
5
3.1
Eductive Method (metodo della deduzione)
I giocatori sono iper-razionali e mettendosi nei panni l’uno dell’altro riescono a
venire a capo di common beliefs, seguendo ragionamenti simili a quelli presentati
sopra. In realtà, come abbiamo visto, non è detto che alla …ne di tale processo
si giunga a dei common beliefs neanche se si usa la common knowldge della
razionalità.
3.2
Pre-play comunication (comunicazione pre-partita)
La comunicazione pre-partita (cheap-talk) si basa sull’idea che se i due giocatori
hanno un interesse comune (situazioni non di con‡itto) possono farsi un cenno o
dirsi qualcosa per coordinarsi nelle strategie. Si consideri ad esempio il seguente
gioco:
Giocatore 1
A1
B1
Giocatore 2
A2
B2
1000, 1000
0, 0
0, 0
50, 50
In questo caso abbiamo due NE. I due giocatori possono guardarsi un attimo
e farsi un segno o comunicare a parole qualcosa e il coordinamento su uno dei
due equilibri di Nash è fatto. Ma in realtà bisogna capire che cosa io associo a
ciò che mi viene detto dal giocatore che comunica con me. Tale motivazione per
i common beliefs non è dunque così ovvia.
3.3
Focal Point (punto focale)
Tale spiegazione si basa sul fatto che sono le caratteristiche stesse del gioco che
portano i giocatori ad avere le stesse aspettative. Tale aspetto è molto di¢ cile da
modellare nella teoria dei giochi. Vediamo un argomento proposto da Schelling
(premio Nobel insieme ad Aumann):
Due giocatori devo scegliere ognuno 4 città tra le seguenti 8:
Roma
Londra
Parigi
Bucarest
Praga
Madrid
Mosca
Tirana
Se i due giocatori stanno giocando questo gioco prima del 1989 e sono uno a
Mosca ed uno a New York trovano nel Muro di Berlino il punto focale per avere
common beliefs.
6
3.4
Learning and Evolution (Apprendimento ed evoluzione)
Per spiegare tale motivazione riguardo alla presenza di common beliefs è utile
riferirci al modello di Cournot discusso in precedenza.
a qj c
Le due best response functions o le curve di reazione (Bi (qj ) =
ed
2
a qi c
)
possono
essere
disegnate
gra…camente
in
un
sistema
di
assi
Bj (qi ) =
2
cartesiani (qi qj ). Il concetto di evoluzione e apprendimento consiste nel fatto
che da qualsiasi livello di qj o qi si inizi il gioco, utilizzando i percorsi delle best
response functions si arriva necessariamente all’equilibrio di Nash. Questo ci
dice che l’evoluzione del gioco porta all’equilibrio di Nash. (Si faccia riferimento
ai gra…ci disegnati durante le lezioni)
4
Approfondimento sul modello di Cournot
In precedenza abbiamo analizzato l’equilibrio di Cournot utilizzando il concetto
di NE. In pratica, come per il gioco del dilemma del prigioniero (che come
è facile vedere (fatelo) presenta un solo NE che coincide con quello di risolto
applicando l’eliminazione di strategie dominate in senso stretto) anche il modello
di Cournot con due imprese può essere risolto applicando la cancellazione iterata
delle strategie strettamente dominate. L’equilibrio a cui si giunge è uguale a
quello di Nash. Vediamolo.
La prima cosa che possiamo dimostrare è che qualsiasi quantità qj venga
messa sul mercato dall’impresa j, l’impresa i non metterà mai sul mercato una
quantità più grande di quella prodotta in monopolio (Qm = a 2 c ). Dimostriamo
quindi che mettere sul mercato una quantità qi = Qm + x (con x > 0) è una
strategia strettamente dominata da qi = Qm :
Se qi = Qm il pro…tto dell’impresa i è data da:
m
i (Q ; qj )
=
a
ovvero:
m
i (Q ; qj )
c
a
(a
2 |
a
qj
}
2
{z
P (Q)
c a
(
c)
(11)
c
qj ):
2
2
Se qi = Qm + x, i pro…tti per l’impresa i sono dati da:
m
i (Q
+ x; qj ) = (
=
c
a
c
2
+ x)(a
ovvero:
7
a
c
2
x
(12)
qj
c)
(13)
m
i (Q
+ x; qj )
=
(
a
c
2
a
=
2
+ x)(
c a
(
a
c
x
qj ) + x
2
a
c a c
(
2
{z
| 2
=
c
2
m
i (Q ;qj )
qj )
a
c
x
2
qj )
}
x(qj + x):
c
a
a
c
2
+ x( x
qj )
(14)
>0
L’ultima relazione ci indica che il pro…tto dell’impresa i che produce una
quantità maggiore di quella di monopolio è sempre inferiore al pro…tto che essa
fa producendo la quantità di monopolio, qualsiasi sia la quantità qj (ovvero per
ogni possibile strategia dell’impresa j).
A questo punto, se supponiamo RAT2 possiamo dire che l’impresa i sa che
l’impresa j non produrrà mai una quantità superiore a quella di monopolio.
Se l’impresa j produce la quantità di monopolio, cosa conviene fare all’impresa
i? Utilizzando il concetto di best response possiamo ricavare che all’impresa i
conviene produrre qi = a 4 c se qj = Qm : In realtà tale risultato può essere generalizzato dimostrando che l’impresa i non produrrà mai una quantità inferiore
a a 4 c qualsiasi sia la quantità qj : Come prima, valutiamo il pro…tto dell’impresa
i con qi = a 4 c :
i(
a
c
4
; qj ) =
a
4
(a
c
qj
4
c)
ovvero
c
a c 3(a c)
; qj ) =
(
qj ):
4
4
4
Vediamo ora qual’è il pro…tto con qi = a 4 c x con x > 0 :
i(
i(
a
c
a
x; qj ) = (
4
a
c
x)(a
4
a
c
4
+x
(15)
qj
c)
(16)
ovvero:
i(
a
c
4
Riordinando avremo:
i(
a
c
4
x; qj )
=
(
x; qj ) = (
a
=
i(
=
i(
c
4
a
x)(
c
4
a
c
4
a
; qj )
; qj )
c
4
3(a
x)(
c)
4
x(
3(a
3(a
c)
4
qj ) + x(
c)
4
a c
x(
+x
2
+x
a
a
4
c
)
4
c
+x
qj ):
x(
(17)
3(a
c)
4
)
x(x
qj )
qj ):
a c
2
Poichè qj
2 (RAT ) avremo che il pro…tto che immettere sul mercato
a c
una quantità qi < 4 è una strategia strettamente dominata sotto l’ipotesi
8
qj )
di RAT2 : Questo vale anche per l’impresa j: A questo punto cosa abbiamo
ottenuto? Non stiamo facendo altro che ridurre l’insieme delle strategie possibili
per le due imprese. All’inizio, infatti, l’insieme di scelta per l’impresa i era:
qi 2 [0; 1):
(18)
Dopo l’applicazione iterativa dell’eliminazione delle strategie strettamente
dominate (sotto l’ipotesi di RAT2 ) tale intervallo si è ridotto per le due imprese
a:
qi
2 [
qj
2 [
a
4
a
4
c a
;
c a
;
c
2
c
2
]
(19)
]:
(20)
Se portiamo avanti tale processo e valutiamo la best response quando qj =
la migliore risposta per l’impresa i è giocare qi = 34 ( a 2 c ): Come prima,
si può generalizzare dimostrando che per l’impresa i; mettere sul mercato una
quantità maggiore di qi = 34 ( a 2 c ) è una strategia strettamente dominata per
ogni qj (sotto l’ipotesi di RAT3 ). Per cui stiamo ulteriormente riducendo
l’insieme delle strategie:
a c
4
qi
qj
c 3 a c
; (
)]
4 2
a c 3 a c
2 [
; (
)]
4
4 2
2 [
a
4
(21)
(22)
Continuando questo processo per in…niti stadi di cancellazione ed assumendo
RAT1 si individua l’unica strategia dominante che è data da:
qi
=
qj
=
a
c
(23)
3
a
c
3
:
(24)
Tale pro…lo di strategie coincide con il NE del modello di Cournot. Lo stesso
ragionamento può essere fatto gra…camente utilizzando le curve di reazione.
(Vedi esercizi)
4.1
Osservazioni sul modello di Cournot, soluzione con
strategie dominate e NE
1. Il modello di Cournot si può risolvere applicando la cancellazione iterativa
delle strategie strettamente dominate solo se ci sono due imprese. In
presenza di più imprese il gioco non è dominant solvable. Con n > 2
imprese il gioco presenta un unico equilibrio di Nash.
9
2. Il ragionamento basato sulla RAT1 porta nel caso di Cournot ad un equilibrio di Nash con common beliefs. Questa è una situazione particolare
dove il metodo dell’astrazione è valido solo perchè le best response function
sono lineari.
Possiamo concludere che in alcuni casi motivare gli equilibri di Nash come
equilibri e¤ettivamente raggiungibili in un processo di interazione strategica non
richiede ipotesi forti come i common beliefs, semplicemente perchè l’equilibrio
di Nash può rappresentare l’equilibrio che si raggiunge applicando il concetto
di strategie dominanti. In altre situazioni, però, è importante ricordare che
quando ci si riferisce ad un equilibrio di Nash e si vuole sostenere che questo
è un equilibrio del processo di interazione si sta supponendo che valga l’ipotesi
(forte) di common beliefs.
5
Esercizi
1) Considerando le curve di reazione descritte nell’analisi del modello di Cournot,
fornire una discussione gra…ca della cancellazione delle strategie strettamente
dominate in presenza di RAT1 :
2) Si consideri una situazione in cui due individui possono costituire una
società che può o¤rire un guadagno di 100 euro. Prima di costituire la società, i
due devono decidere come dividere tale guadagno. La situazione è la seguente.
I due fanno una proposta simultanea su quanto vogliono dei 100 euro. Se le
loro richieste sommate superano 100, allora vuol dire che non c’è accordo e la
società non viene costituita e i due non hanno nessun guadagno. Se le due
richieste sommano meno di cento, ognuno prende la sua parte ed il resto va in
bene…cenza.
a) Quali sono le strategie strettamente dominate?
b) Quali sono le strategie dominate in senso debole?
c) Quali sono gli equilibri di Nash in strategie pure in questo gioco?
10