Giochi dinamici - Università degli studi di Bergamo

Economia Industriale
(teoria dei giochi)
Concetti di soluzione in giochi
dinamici a informazione
perfetta in strategie pure
(LEZIONE 4)
Valerio Sterzi
Università di Bergamo
Facoltà di ingegneria
1
Cosa si intende per..
•
soluzione di un gioco?
Per soluzione di un gioco si intende un meccanismo “oggettivo” che, sotto alcune ipotesi, dà un modo
“ovvio” di giocare.
•
gioco dinamico?
Un gioco è quando un giocatore sceglie un’azione dopo aver osservato alcune mosse dei propri
avversari.
•
informazione perfetta?
Si ha informazione perfetta quando i giocatori sono sempre a conoscenza delle mosse che hanno fatto
gli avversari che sono stati chiamati a giocare in una fase precedente. In altre parole i giocatori
sanno sempre dove si trovano al momento di scegliere. (E ancora, per capirci meglio, quando ciascun
insieme informativo è composto da un nodo decisionale singolo –singleton)
•
strategia pura?
Per strategia pura si intende una regola che assegna una mossa ad ogni stato informativo. Una
strategia mista è invece una distribuzione di probabilità sulle strategie pure.
2
Agenda
1.
Credibilità nelle strategie
2.
Principio di razionalità sequenziale
3.
Induzione a ritroso
4.
Equilibrio perfetto nei sottogiochi
5.
Teorema di esistenza
6.
Il valore del vincolo
7.
Il modello di Stackelberg
3
Credibilità delle strategie (1)
Un possibile modo per approcciare i giochi
dinamici è semplicemente quello di
derivare la rappresentazione in forma
normale e applicare i concetti di soluzione
della seconda lezione (strategie
dominanti, eliminazione iterata delle
strategie strettamente dominate,
equilibrio di Nash..)
Problema: le strategie di equilibrio così
trovate sono tutte credibili?
credibili
4
Credibilità delle strategie (2)
• Il concetto di equilibrio di Nash non è sufficiente ad
individuare ed eliminare le strategie non credibili.
• Esempio (1): the predation game
Ci sono due imprese, un incumbent (I) e un potenziale
entrante (E). Il potenziale entrante muove per primo e
ha a disposizione due possibili strategie: rimanere
fuori dal mercato (OUT) o entrare (IN). In
quest’ultimo caso, I viene chiamato a giocare e ha a
disposizione due strategie: assumere un
atteggiamento aggressivo, attraverso per esempio una
guerra di prezzo, (A), oppure assumere un
atteggiamento pacifico (P).
5
the predation game …
Gioco in forma estesa (albero del gioco)
P
[2, 1]
Incumbent
in
Entrant
A
out
[-3, -2]
[0, 3]
6
… the predation game …
Gioco in forma normale
Incumbent
A, se E “In”
P, se E “In”
Out
0,3
0,3
In
-3, -2
2, 1
Entrant
7
… the predation game
Esaminando il gioco in forma normale
troviamo due equilibri di Nash, (Out, A se E
“In”) e (In, P se E “In”).
Ad uno sguardo più attento vediamo però
che il primo equilibrio non è una ragionevole
predizione del gioco: se il potenziale entrante
dovesse scegliere di entrare (E) l’Incumbent
troverà ottimale scegliere sempre un
atteggiamento pacifico (P), quindi la
strategia A se E ”In” non è credibile.
8
Principio di razionalità sequenziale (PRS)
Il PRS afferma che la strategia di un giocatore dovrebbe specificare
azioni ottimali per ogni nodo nel gioco ad albero.
Nell’esempio del predation game la strategia di I, A se E “In” non
rispetta il PRS, infatti una volta che l’entrante ha scelto “In”, la
strategia ottimale per l’Incumbent è quello di adottare un
comportamento pacifico (P).
Un concetto di soluzione che ci aiuta a tener conto delle sole
strategie che rispettano il PRS è quello di induzione a ritroso.
9
Induzione a ritroso
Partiamo dal determinare le azioni ottimali nel nodo
decisionale finale dell’albero. Dal momento che il nodo
finale non richiede ulteriori interazioni strategiche tra i
giocatori, la determinazione del comportamento
ottimale si esaurisce in un semplice problema
decisionale a livello di singolo individuo. Il giocatore
chiamato a muovere per ultimo sceglierà l’azione a cui è
associato un pay-off più elevato. Una volta individuata
l’azione “massimizzante”, è possibile ridurre il gioco
eliminando il sottogioco appena risolto. A questo punto
il procedimento appena descritto viene ripetuto per il
giocatore che viene chiamato a giocare per penultimo, e
così via..
10
Sottogioco ed equilibrio perfetto nei
sottogiochi
Sottogioco :
parte di un gioco dinamico che presenta le seguenti caratteristiche: (1) ha origine
da un insieme di informazione che contiene un solo nodo, (2) contiene tutti i nodi
decisionali successivi fino ai nodi finali (è chiuso nella sua successione), (3) non
contiene alcun insieme informativo che presenta come suoi elementi nodi
decisionali non successivi al nodo iniziale del sottogioco.
In particolare, il gioco iniziale stesso è uno dei suoi sottogiochi.
Æ (Colombo, 2003): Un sottogioco è una parte del gioco in forma estesa che inizia
con un “singleton” e contiene tutti i nodi che seguono.
Equilibrio perfetto nei sottogiochi
Un equilibrio perfetto nei sottogiochi è un vettore di strategie di equilibrio che
hanno la caratteristica di costituire un equilibrio di Nash di ciascun sottogioco.
11
Esempio 2 …
Considerate il seguente gioco in forma estesa a tre
giocatori:
Giocatore 1
L
R
Giocatore 3
l
Giocatore 2
r
a
b
Giocatore 3
2
0
1
-1
5
6
l
3
1
2
Giocatore 3
r
l
5
4
4
0
-1
7
r
-2
2
0
12
… esempio 2 …
Partiamo dal giocatore 3: se dovesse essere
chiamato a giocare dopo il giocatore 2, e
quest’ultimo dovesse scegliere a, il giocatore 3
sceglierebbe r, se il giocatore 2 dovesse scegliere b
allora il giocatore 3 sceglierebbe l.
Se il giocatore 1 dovesse scegliere nel primo nodo L,
allora il gioco finirebbe di nuovo con la mossa dl
giocatore 3, il quale sceglierebbe l’azione r.
13
… esempio 2 …
La forma ridotta del gioco sarà la seguente:
Giocatore 1
L
R
Giocatore 2
-1
5
6
a
5
4
4
b
0
-1
7
14
… esempio 2
A questo punto vediamo che il giocatore 2, se chiamato a
giocare (ovvero se il giocatore uno dovesse scegliere R),
sceglierà a (ottenendo un pay-off di 7 anziché di -4).
Il giocatore uno a questo punto si troverebbe di fronte a
due possibili pay-off associati alle due possibili azioni: se
dovesse scegliere L otterrebbe -1, in caso di R otterrebbe
invece 4.
La procedura per induzione a ritroso dunque identifica
il profilo di strategie (“R”, “a se R”, “r se L, r se R e se a,
l se R e se b”). Tale equilibrio è detto perfetto nei
sottogiochi.
15
Esercizi consigliati
ƒ Esercizio 22, pag.239 (FM)
ƒ Esercizio 23, pag.241 (FM)
ƒ Identificate tutti gli equilibri di Nash del gioco
dinamico a tre giocatori appena visto
16
Teorema di esistenza
Ogni gioco finito a info perfetta ha (almeno) un
equilibrio di Nash perfetto nei sottogiochi (in
strategie pure).
17
Il valore del vincolo
I giochi sequenziali consentono di evidenziare il
grande valore del vincolo, dove quest’ultimo consente
di sfruttare il vantaggio iniziale della prima mossa in
modo tale da modificare la situazione strategica.
18
Esempio 3 …
Vediamo un’ applicazione analizzando un tipico gioco di
entrata.
E
in
out
I
a
ΠE = -20
ΠI = -20
ΠE = 0
ΠI = 40
p
ΠE = 10
ΠI = 20
19
… esempio 3 …
L’impresa entrante (E) deve decidere se entrare nel mercato (in)
oppure rimanerne fuori (out). Il monopolista che attualmente opera
sul mercato (I, Incumbent) osserva se l’entrata avviene, e in caso
positivo, decide se ostacolarla attraverso un atteggiamento
aggressivo (a) oppure accomodarla avendo un atteggiamento
pacifico (p). Se l’entrata non avviene l’Incumbent ottiene i profitti di
monopolio (40), ma se l’entrata avviene la strategia a non
costituisce un’opzione credibile.
L’equilibrio perfetto nei sottogiochi è {(In, p se In}.
20
… esempio 3 …
In questo gioco quindi l’entrata avviene e il
monopolista subisce una perdita di 20 (40-20).
Esiste però un modo per migliorare la
situazione dal punto di vista dell’Incumbent:
quest’ultimo potrebbe, attraverso un’ azione v
scrivere un contratto non rinegoziabile in cui
si impegna in caso di entrata a scegliere la
strategia a.
Ovviamente il vincolarsi può implicare un
costo per il monopolista, e il massimo valore
che può assumere il vincolo è ovviamente di
20.
21
… esempio 3…
L’albero del gioco diventa:
I
v
E
nv
E
out
out
in
I
a
ΠE = -20
ΠI = -20
in
ΠE = 0
ΠI = 40 (-V)
p
ΠE = 10
ΠI = -25
ΠE = 0
ΠI = 40
I
a
ΠE = -20
ΠI = -20
p
ΠE = 10
ΠI = 20
22
… esempio 3
Se il vincolarsi ha un costo basso (v <20), il nuovo equilibrio perfetto nei
sottogiochi è {(v, a se In se v, p se In se nv), (out se v, in se nv)}.
Questo esempio illustra come un vincolo credibile possa possedere un
notevole valore strategico. Nel nostro caso il valore del vincolo è pari a
20.
Se il vincolo è credibile allora ha lo stesso impatto di una modifica
dell’ordine delle mosse.
Altri esempi di vincoli strategici, frequenti nel campo dell’economia
industriale, sono gli investimenti in riduzione dei costi e/o della capacità
produttiva, lo sviluppo di nuovi prodotti: sono tutti cambiamenti che
influenzano la natura della futura competizione.
23
Modello di Stackelberg …
Nel modello di Cournot sono presenti due imprese che
simultaneamente competono sulle quantità. Nel modello di
Stackelberg (1934) invece operano sempre due imprese, ma una
(leader) può stabilire la quantità da produrre prima dell’altra
(follower). Il gioco non sarà più quindi statico come nel modello di
Cournot, ma rientrerà nella categoria dei giochi dinamici.
Seguendo il metodo dell’induzione a ritroso, andiamo a
determinare la quantità di produzione ottimale per l’impresa che
sceglie per ultima, ovvero la follower, e solo successivamente
andremo a calcolare la quantità ottimale per la leader, che terrà
conto ovviamente dell’azione-reazione della follower.
24
… modello di Stackelberg …
Supponiamo di trovarci in un mercato con prodotto omogeneo e
che le due imprese fronteggino la medesima curva di domanda
(inversa) di mercato:
p = a – bQ, dove Q è la quantità totale prodotta dalle due imprese
(Q = q1 + q2). Solo per chiarezza nell’esposizione, l’impresa leader
è denotata con il pedice 1, la follower con 2.
Infine supponiamo che le funzioni di costo siano lineari e
identiche per le due imprese, in modo tale che i costi marginali
siano costanti e pari a c.
25
… modello di Stackelberg …
Poiché il gioco è a informazione perfetta si può
ricavare l’esito con l’induzione a ritroso.
Partiamo quindi dall’impresa 2, la quale dovrà
massimizzare i propri profitti tenendo conto della
quantità decisa nel primo stadio dall’impresa 1.
Max Π2 (.)  a − bq 1  q 2  − cq 2
Foc:
q 2  R2 q 1  
a − c − bq 1
2b
26
… modello di Stackelberg …
Nel primo stadio deve decidere l’impresa leader,
tenendo conto della funzione di reazione dell’impresa
follower; in altri termini l’impresa uno sceglierà la
quantità ottima che:
Max Π1(.)  a − bq 1  R2 q 1  − cq 1 
Foc:
q ∗1 
a − bq 1 
a − c − bq 1
 − c q1
2b
a−c
2b
27
… modello di Stackelberg …
Sostituendo il valore ottimale per l’impresa
monopolista nella funzione di reazione dell’impresa
leader ne otterremo la quantità ottima:
q ∗2  a − c
4b
Infine sostituendo i valori di q ∗1 e q ∗2 otterremo i
rispettivi valori di equilibrio dei profitti.
28
Bibliografia
• Colombo, F. (2003), Introduzione alla teoria dei giochi, Carrocci
Editore;
• Mas-Colell A., Whinston M.D., and Green J.R. (1995),
Microeconomic Theory, Oxford University Press;
• Femminis G., Martini G. (1999), Razionalità individuale e
decisioni strategiche, Giappichelli editore;
• Osborne, M.J.,Rubenstein A. (1994), A course in game theory,
The Mit Press;
29