Lezione 18 Obiettivi della lezione Cos`è la SOLUZIONE di un gioco

Mario Gilli
Obiettivi della lezione
Lezione 18
• Descrivere e applicare diversi metodi di
scelta strategica
• Spiegare e applicare il concetto di equilibrio
di Nash
• Riconoscere minacce non credibili in giochi
a più stadi
Teoria dei giochi
PARTE II
1
Cos’è la SOLUZIONE di un
gioco?
2
Come definire la soluzione di un
gioco?
• Se desideriamo prevedere l’esito
verosimile di una situazione di interazione
strategica dobbiamo prevedere il
comportamento dei giocatori, cioè
dobbiamo individuare la SOLUZIONE del
gioco.
• La soluzione di un gioco è un modello di
comportamento dei giocatori che soddisfa
delle condizioni di “plausibilità”.
• Solitamente gli economisti usano l’IPOTESI DI
RAZIONALITA’.
• Problema: come definire la razionalità in
situazioni di interazione strategica?
Ricordiamo la definizione di teoria dei giochi:
i giocatori sono razionali e intelligenti
Il problema è formalizzare razionalità E
intelligenza.
3
4
Comportamento strategico - 1
Comportamento strategico - 2
• Risposta ottima: una strategia che porta al
payoff massimo di un giocatore per un dato
possibile profilo di strategie degli altri giocatori
• Strategia dominante: l’unica risposta ottima di
un giocatore indipendentemente dalle scelte
degli altri giocatori
– Quando un giocatore ha una strategia
dominante, non deve congetturare la
scelta degli altri giocatori
• Strategia dominata: strategia che assicura un
payoff minore indipendentemente dalle scelte
degli altri giocatori
• Eliminazione strategie dominate: eliminazione
per ciascun giocatore delle strategie dominate
• Eliminazione iterata delle strategie dominate:
applicazione della eliminazione delle strategie
dominate al gioco ottenuto eliminando le
strategie dominate
5
Lezione 18
6
1
Mario Gilli
Applicazione dell’ipotesi di
razionalità nei GFN
Risposte ottime in un gioco 2 x 2
Player B
L
R
• Per ogni giocatore ricerco la strategia che
massimizza la vincita PER OGNI
POSSIBILE SCELTA DEGLI ALTRI,
• In altre parole cerco le RISPOSTE
OTTIME in funzione di tutte le possibili
strategie altrui.
U
(3,9)
(1,8)
D
(0,0)
(2,1)
Player A
8
7
L’equilibrio in strategie dominanti
Una strategia dominante è una strategia che garantisce vincite
almeno pari a quelle di qualsiasi altra strategia,
indipendentemente da quello che fanno gli altri giocatori.
Il dilemma del prigioniero
2
Una strategia strettamente dominante è la migliore strategia
indipendentemente da quello che fanno gli altri giocatori.
1
Non c’è ragione
i
perché
h i giocatori
i
i non usino
i la
l loro
l
strategia
i
dominante, SE ne hanno una (spesso non esistono strategie
dominanti)
Non confesso
Quindi quando ogni giocatore ha strategie dominanti, l’unico
equilibrio ragionevole è che ogni giocatore usi la propria
strategia dominante.
Confesso
Un equilibrio in strategie dominanti è il risultato in un gioco
in cui ogni giocatore segue una strategia dominante.
9
Strategie ottime per il
giocatore 1
Non confesso
Confesso
0, -20
-20, 0
-5, -5
I numeri sono gli anni di prigione
10
2
Non confesso
-1, -1
0, -20
1
Confesso
-20, 0
Non confesso
Confesso
-5, -5
11
Lezione 18
-1, -1
Confesso
Strategie ottime per il
giocatore 2
2
1
Non confesso
Non confesso
-1, -1
0, -20
Confesso
-20, 0
-5, -5
12
2
Mario Gilli
La soluzione per strategie dominanti:
Pareto inefficiente
2
1
Non confesso
Confesso
Non confesso
-1, -1
0, -20
Confesso
-20, 0
-5, -5
14
13
15
16
La matrice delle vincite per la
battaglia dei networks
Network 2
Network 1
17
Lezione 18
Sitcom
Sports
Si
Sitcom
55%, 45%
52%, 48%
Sports
50%, 50%
45%, 55%
18
3
Mario Gilli
Le risposte ottime di 1 nella battaglia
dei networks
Network 2
Network 1
Si
Sitcom
Le risposte ottime di 2 nella battaglia
dei networks
Network 2
Sitcom
Sports
55%, 45%
52%, 48%
Network 1
Si
Sitcom
Sitcom
55%, 45%
Sports
52%, 48%
Sono
evidenziate
le risposte
ottime di 2
Sports
50%, 50%
45%, 55%
Sono evidenziate le risposte ottime di 1
Sports
Network 1
45%, 55%
19
La soluzione nella battaglia dei
networks
Network 2
50%, 50%
20
La matrice delle vincite per il gioco
dei vantaggi competitivi
Tutte le risposte ottime sono evidenziate
Impresa 2
Impresa 1
Sitcom
Sports
Si
Sitcom
55%, 45%
52%, 48%
Nuova
Tecnologia
T
l i
Sports
50%, 50%
45%, 55%
Status quo
Nuova
Tecnologia
Status quo
0, 0
a, -a
-a, a
0, 0
21
Strategie di risposta ottima per
l’impresa 1
Impresa 2
Impresa 1
Nuova
T
Tecnologia
l i
Status quo
Nuova
Tecnologia
Strategie di risposta ottima per
l’impresa 2
Impresa 2
Impresa 1
Status quo
0, 0
a, -a
-a, a
0, 0
Nuova
T
Tecnologia
l i
Status quo
23
Lezione 18
22
Nuova
Tecnologia
Status quo
0, 0
a, -a
-a, a
0, 0
24
4
Mario Gilli
La soluzione nel gioco dei vantaggi
competitivi
Impresa 2
Impresa 1
Nuova
T
Tecnologia
l i
Status quo
Nuova
Tecnologia
Strategie dominate
• Strategia dominata: strategia che assicura un
payoff minore indipendentemente dalle scelte
degli altri giocatori
Status quo
0, 0
a, -a
-a, a
0, 0
• Eliminazione strategie dominate: eliminazione
per ciascun giocatore delle strategie dominate
26
25
Strategie dominate nel dilemma del prigioniero
• La dominanza debole
•
•
Y
C
NC
C -5 , -5 0 , -20
X
NC -20 , 0 -1 , -1
Consideriamo il gioco della figura seguente:
A domina debolmente B, cioè rispetto a D A è strettamente
migliore di B, mentre rispetto a S A è esattamente uguale a B
Possiamo concludere che la riga 2 non sarà scelta?
Possiamo iterare tale ragionamento?
Questo ragionamento è meno convincente di quello basato
sul precedente tipo di dominanza (dominanza stretta).
stretta)
•
•
•
Y
C
NC
C -5 , -5 0 , -20
X
NC -20 , 0 -1 , -1
S
A
1
B
NB: NC è dominata per entrambi i giocatori, quindi devo
27
eliminarla per entrambi
L’eliminazione iterativa
delle strategie dominate
2
D
3; 0
2; 1
3; 4
0; 0
La risposta è empirica:
la dominanza debole, in
alcuni giochi, non
funziona tanto bene
quanto la dominanza
stretta, e una
dominanza debole
iterata può funzionare
piuttosto male .
28
Eliminazione iterata delle strategie
dominate nel gioco del nipote del rettore
• Non sempre è ovvio quale strategia verrà scelta; piuttosto,
spesso conviene pensare a quali strategie non verranno
giocate di sicuro
• Una strategia è dominata se esiste una qualche altra
strategia che porta a payoff strettamente maggiori per
qualsiasi
l i i scelta
lt effettuata
ff tt t dagli
d li altri
lt i giocatori
i
t i
– Nessun giocatore razionale sceglie una strategia dominata
• Le strategie dominate sono irrilevanti e possono quindi
essere rimosse dal gioco, in modo da semplificare il gioco
• Rimuoviamo quindi le strategie dominate finché non ne
rimane più nessuna: in alcuni casi, questo è sufficiente per
risolvere il gioco, anche se nessuno dei giocatori ha una
strategia dominante
29
11-29
Lezione 18
30
5
Mario Gilli
Come giocare l’asta al ribasso
Eliminazione iterata delle
strategie debolmente dominate
Scelta di uno studente a caso
Scelta
0
1
2
3
(0,0)
(0,0)
(0,0)
(0,0)
(0,0)
(0.5,0.5)
(1,0)
(1,0)
(0,0)
(0,1)
(1,1)
(2,0)
(0,0)
(0,0)
(0,2)
(1.5,1.5)
0
di uno
studente
2
3
31
Come è stata effettivamente giocata
l’asta al ribasso
1
Problema: come giocare il Beauty Contest?
Non ci sono strategie dominate
Scelta di uno studente a caso
0
Scelta
0
di uno
studente
0%
1
Scelta media degli studenti
2
3
0%
0%
0%
1
0%
24%
26.5%
0%
2
0%
26.5%
12%
5.5%
3
0%
5.5%
0%
0%
32
La
1
mia
2
scelta
33
1
2
3
4
(1,1)
(0,0)
(0,0)
(0,0)
(0,0)
(1,1)
(0,0)
(0,0)
(0,0)
(0,0)
(1,1)
(0,0)
(0,0)
(0,0)
(0,0)
(1,1)
3
4
34
L’equilibrio di Nash
L’equilibrio di Nash è il concetto di soluzione più
ampiamente utilizzato nelle applicazioni della teoria dei giochi
all’economia.
Consideriamo un gioco con due giocatori, X and Y; una coppia
di strategie formano un equilibrio di Nash se:
i) la strategia scelta da X è ottimale data la strategia
effettivamente scelta da Y
E
ii) la strategia scelta da Y è ottimale data la strategia
effettivamente scelta da X
In generale, in un equilibrio di Nash la strategia scelta da ogni
giocatore è la sua risposta ottimale alle strategie
effettivamente scelte dagli altri giocatori.
35
Lezione 18
Nei giochi simultanei con informazione imperfetta, i giocatori
non possono osservare direttamente le mosse dei rivali.
Quindi ogni giocatore forma delle congetture su quello che gli
altri faranno, e reagisce di conseguenza scegliendo la sua
risposta migliore alle congetture che si è formata.
In un equilibrio
q
di Nash, q
queste congetture
g
sono corrette: la
strategia di ogni giocatore si rivela come la migliore risposta
alle reali mosse dei rivali.
In altre parole, in un equilibrio di Nash i giocatori formano
congetture reciprocamente corrette.
Quindi i giocatori non hanno incentivi per deviare
unilateralmente dall’equilibrio una volta che le mosse dei
rivali sono diventate osservabili.
36
6
Mario Gilli
Un concetto di equilibrio come
soluzione: l’equilibrio di Nash
Dato un gioco in forma strategica, un
profilo di strategie s* ∈ S è un equilibrio
di Nash in strategie pure se per tutti i
giocatori
i
t ii
ui ( s ) ≥ ui ( s , si )
*
*
−i
per ogni si ∈ Si
dove s−*i = ( s1* ,..., si*−1 , si*+1 ,..., sn* )
Y
C
NC
C -5 , -5 0 , -20
X
NC -20 , 0 -1 , -1
Se X sceglie C, la miglior risposta
per Y è giocare C (-5 > -20)
Quindi {C,C} non è solo un equilibrio in strategie dominanti, ma
è anche un equilibrio di Nash per il dilemma del prigioniero.
37
NB: tutti gli equilibri in strategie dominanti sono equilibri di
Nash (per definizione), ma non viceversa.
38
Un altro esempio: l’adozione di
un sistema di videoregistrazione
Y
C
NC
C -5 , -5 0 , -20
X
NC -20 , 0 -1 , -1
L’equilibrio di Nash e il dilemma del prigioniero
Y
C
NC
Se Y sceglie C, la miglior risposta
C -5 , -5 0 , -20
per X è giocare C (-5 > -20)
X
NC -20 , 0 -1 , -1
Se Y sceglie NC, la miglior risposta
per X è giocare C (0 > -1)
2
1
Y
Beta
C
NC
C -5 , -5 0 , -20
X
NC -20 , 0 -1 , -1
Beta
VHS
1, 1
0, 0
0, 0
1, 1
Se X sceglie C, la miglior risposta
per Y è giocare C (-5 > -20)
VHS
In questo caso, le congetture non sono corrette! Quindi {C,C}
è l’unico equilibrio di Nash per questo gioco.
39
Strategie di risposta ottima
per 1
Strategie di risposta ottima
per 2
2
2
1
Beta
VHS
Beta
VHS
1, 1
0, 0
0, 0
1, 1
1
Beta
VHS
41
Lezione 18
40
Beta
VHS
1, 1
0, 0
0, 0
1, 1
42
7
Mario Gilli
La soluzione: due equilibri
La ricerca di un accordo
2
Direttore
1
Beta
VHS
Star
Beta
VHS
Si
1, 1
0, 0
Si
0, 0
1, 1
No
No
$15M, $15M
0, 0
0, 0
0, 0
43
Le strategie ottime della
Star
44
Le strategie ottime per il
Direttore
Direttore
Star
Direttore
Si
Si
No
$15M, $15M
0, 0
Star
No
Si
0, 0
Si
0, 0
No
No
$15M, $15M
0, 0
0, 0
0, 0
45
46
La soluzione: due equilibri Pareto
ordinabili
Player B
Direttore
Star
L
Si
Si
No
$15M, $15M
0, 0
U
(3,9)
(1,8)
D
(0,0)
(2,1)
Pl
Player
A
0, 0
(U,L) e (D,R)
Sono entrambi equilibri Nash
0, 0
47
Lezione 18
R
No
48
8
Mario Gilli
Come giocare il Beauty Contest
Come è stato effettivamente giocato
il Beauty Contest
Scelta media degli studenti
Mia
Scelta media degli studenti
1
2
3
4
(1,1)
(0,0)
(0,0)
(0,0)
(0,0)
(1,1)
(0,0)
(0,0)
3
Mia
1
2
scelta
scelta
(0,0)
(0,0)
(1,1)
(0,0)
(0,0)
(0,0)
(0,0)
(1,1)
3
4
NB: è definito come un profilo di strategie, non
come un prodotto cartesiano, come abbiamo
visto nel caso precedente. Questo dipende dal
fatto che stiamo considerando un concetto di
equilibrio.
• Tre INTERPRETAZIONI:
1. Equilibrio di Nash come soluzione eduttiva
2. Equilibrio di Nash come punto di equilibrio di un
processo dinamico (implicito)
3. Equilibrio di Nash come equilibrio di aspettative
razionali.
• Qual è il significato dell’equilibrio
di Nash? (2)
2. Il gioco delle città
•
•
Due partecipanti giocano sulla base di un elenco di 11 città degli Stati
Uniti: Atlanta, Boston, Chicago, Denver, Los Angeles, New York,
Philadelphia, Phoenix, San Francisco, San Diego e Seattle.
Un giocatore deve scrivere il suo nome su un biglietto e poi elencare
alcune di queste città, includendovi obbligatoriamente Boston.
L’altro deve scrivere il suo nome su un altro biglietto ed elencare alcune di
queste città,
città includendovi obbligatoriamente San Francisco
Francisco.
Ciascuno può scrivere quante città desidera e ottiene € 0,50 per ogni città
che compare solo sul suo biglietto e perde € 1,50 per ogni città che
compare su entrambi i biglietti.
Soluzione
–
In questo gioco ci si può coordinare in 512 modi
–
Ciononostante, un numero significativo di volte gli studenti MBA di
Stanford riescono a coordinarsi in un modo specifico: usano il
Mississippi come criterio in base al quale suddividere le città, pertanto
il giocatore con Boston sceglie Atlanta, Chicago, New York e
Philadelphia, mentre il giocatore con San Francisco sceglie Denver,
Los Angeles, Phoenix, San Diego e Seattle.
53
Lezione 18
50%
3
44%
4
6%
50
• Vediamo due esempi:
1. Il gioco dei numeri
•
•
•
51
•
2
• Qual è il significato dell’equilibrio di
Nash? (1)
•
•
0%
49
INTERPRETAZIONI
DELL’EQUILIBRIO DI NASH
•
1
Un numero qualsiasi di partecipanti, ciascuno dei quali deve
simultaneamente e indipendentemente scrivere su un biglietto uno di due
numeri, il 5 o il 3.
Ogni giocatore ottiene €5 se tutti hanno scelto il 5; ottiene € 3 a
prescindere dalle scelte altrui se ha scelto il 3 e ottiene - € 4 se ha scelto il
5 mentre qualcun altro ha scelto il 3.
Soluzione:
–
La maggior parte delle volte due giocatori che si conoscono bene
scelgono entrambi il 5
–
Quando il numero dei giocatori aumenta, il metodo di gioco non è più
ovvio: tutti vorrebbero coordinarsi per scegliere il 5, ma nessuno può
essere certo che qualcuno non voglia giocare la strategia sicura 3.
–
Quando abbiamo 15 o 20 giocatori, diventa ovvio che è troppo
rischioso provare a giocare tutti il 5, pertanto tutti scelgono il 3.
52
• Qual è il significato dell’equilibrio
di Nash? (3)
•
•
•
1.
2.
Questi esempi suggeriscono che in determinate
situazioni alcuni giochi possono rientrare nella categoria
dei giochi che presentano “chiare strategie da scegliere
e da aspettarsi”, mentre altri ne sono esclusi.
Quali condizioni devono essere soddisfatte affinché un
Q
dato gioco effettuato in certe condizioni da determinati
partecipanti possa essere inserito in questa categoria?
Non vi sono risposte esatte, ma si possono individuare
chiaramente alcuni fattori:
Innanzitutto è utile che tutti i partecipanti condividano la
stessa conoscenza delle regole dell’incontro.
Alcuni giochi possono essere “risolti” in modo logico.
54
9
Mario Gilli
• Qual è il significato dell’equilibrio di
Nash? (5)
• Qual è il significato
dell’equilibrio di Nash? (4)
3.
4.
5
5.
6.
7.
8.
È utile che le parti si consultino prima di scegliere le proprie
strategie.
Se i partecipanti hanno una lunga storia di interazioni reciproche
e se conoscono il loro rivale, la prevedibilità del gioco
generalmente aumenta. Tuttavia le ripetute interazioni possono
essere fuorvianti, come vedremo.
Un piccolo numero di partecipanti può costituire un vantaggio se
tali partecipanti si conoscono. In alcuni incontri, invece, possono
risultare utili i grandi numeri, a condizione che tutti conoscano le
reazioni generali della popolazione.
In alcune situazioni si possono applicare le convenzioni sociali.
A volte possiamo applicare vaghi principi di buonsenso comune,
definiti criteri di punto focale
Per i manager i fattori più pertinenti ed efficaci sono i ruoli e le
convenzioni sociali, che comprendono le norme aziendali e
professionali, la comunicazione diretta e l’esperienza diretta.
•
•
•
•
•
•
E l’equilibrio di Nash?
Nelle analisi dei giochi, l’equilibrio di Nash è utilizzato in
questo modo: ci domandiamo se esista qualche motivo per
ritenere che i partecipanti abbiano un’idea di come il gioco
verrà giocato.
Se la risposta è affermativa, ci aspettiamo che i giocatori
scelgano qualche equilibrio di Nash
Nash.
Se ciascun partecipante può prevedere la mossa dell’altro,
ciascuno massimizzerà il proprio premio sulla base di tali
previsioni.
Poiché tali condizioni si suppongono valide per tutti i
partecipanti, il metodo di gioco previsto deve essere tale da
escludere che un partecipante, conoscendo le mosse altrui,
voglia deviarvi.
Cioè il metodo di gioco previsto costituirà un equilibrio di
Nash.
55
• Qual è il significato dell’equilibrio
di Nash? (6)
Abbiamo scritto un equilibrio di Nash, per due
motivi:
1. molti giochi presentano più equilibri di Nash
2. il ragionamento esposto riguarda le percezioni dei
giocatori, che devono avere una chiara idea di come
giocare,
i
ma glili osservatori
t i esterni
t i non
necessariamente devono sapere quale sarà
l’equilibrio scelto.
• A meno che i partecipanti della situazione
rappresentata abbiano, per qualche ragione, una
concezione chiara e condivisa del modo in cui
ciascuno agisce, non ha alcun senso avviare
un’analisi dell’equilibrio di Nash.
56
• L’equilibrio di Nash e la dominanza
•
•
•
Abbiamo visto due metodi di analisi dei giochi in forma
strategica: uno basato sulla dominanza, compresa la
dominanza debole e quella iterata, e uno basato
sull’equilibrio di Nash.
Qual è il nesso tra i due metodi?
– Una strategia che viene eliminata per dominanza
stretta iterata non può mai far parte di un equilibrio di
Nash.
– Se eliminiamo alcune strategie per dominanza iterata,
impiegando in alcuni passaggi anche la dominanza
debole, tra le strategie che non vengono eliminate
esiste un equilibrio di Nash per l’intero gioco.
57
58
Equilibri di Nash in giochi con scelte
perfettamente divisibili
Equilibri di Nash in giochi con scelte
perfettamente divisibili
• Il concetto dell’equilibrio di Nash si applica anche alle
decisioni strategiche relative a quantità perfettamente
divisibili
• Il concetto dell’equilibrio di Nash si applica anche alle
decisioni strategiche relative a quantità perfettamente
divisibili
• Determiniamo le funzioni di miglior risposta di ciascun
giocatore
• Determiniamo le funzioni di miglior risposta di ciascun
giocatore
• La funzione di miglior risposta mostra le relazione fra la
scelta di un giocatore e la miglior risposta dell’altro
• La funzione di miglior risposta mostra le relazione fra la
scelta di un giocatore e la miglior risposta dell’altro
• Una combinazione di giocate rappresenta un equilibrio
di Nash se queste soddisfano simultaneamente le
funzioni di miglior risposta
• Una combinazione di giocate rappresenta un equilibrio
di Nash se queste soddisfano simultaneamente le
funzioni di miglior risposta
59
Lezione 18
60
10
Mario Gilli
Figura 11.10:
Free Riding nei gruppi
Figura 11.10:
Free Riding nei gruppi
• La retta di colore celeste
rappresenta la relazione tra
le ore di lavoro di Salvatore
e la risposta ottima di
Elisabetta
• La retta di colore grigio
chiaro rappresenta la
relazione tra le ore di lavoro
di Elisabetta e la risposta
ottima di Salvatore
• La funzione di risposta
ottima mostra le relazione
fra la scelta di un giocatore
e la miglior risposta dell’altro
• Il punto N è un equilibrio di
Nash, poiché giace sia sulla
retta di colore grigio che
sulla retta di colore celeste
• In questo equilibrio di Nash,
Salvatore ed Elisabetta
dedicano 8 ore alla ricerca
61
62
• L’induzione a ritroso nei
giochi in forma estesa a
informazione perfetta
SOLUZIONI NEI GIOCHI IN
FORMA ESTESA
•
•
Un’analisi dei giochi generali in forma estesa,
dove intervengono le mosse della natura e gli
insiemi di informazioni, può risultare piuttosto
difficile.
I giochi a informazione perfetta possono
invece essere analizzati in modo semplice con
l’induzione a ritroso.
63
64
•
ESEMPIO: (1)
Paul
ESEMPIO: primo stadioa
John
Y
1;3;2;2
Paul
Y
Paul
c
George
4;4;4;2
B
l
Ringo
k
A
4;4;4;2
k
x
2;6;6;1
y
b
X
c
George
A
a
Paul
b
X
John
1;3;2;2
B
3;4;2;1
x
2;5;4;0
1;2;5;3
3;4;2;1
l
Ringo
2;6;6;1
y
6;8;6;1
65
Lezione 18
2;5;4;0
1;2;5;3
6;8;6;1
IIniziamo
i i
con un nodo
d dove
d
la
l scelta
lt del
d l giocatore
i
t
termina
t
i il
gioco.
• Se Paul inizia con la scelta X, George con A ottiene 2, con B 4:
sceglierà B con un vettore delle vincite (2; 5; 4; 0).
• Se Paul sceglie Y e John risponde con c, Ringo può scegliere x,
guadagnando 3, o y, guadagnando 1: sceglierà x con un vettore
delle vincite (1;2, 5;3).
• Se Paul sceglie Y e John risponde con b, Paul sceglie tra k,
guadagnando 4, e l, guadagnando 2: sceglierà k con un vettore
delle vincite (4; 4; 4; 2).
66
11
Mario Gilli
•
ESEMPIO: secondo stadio
a
Paul
John
Y
1;3;2;2
Paul
4;4;4;2
k
x
k
b
Ringo
x
1;2;5;3
2;5;4;0
Troviamo ora i nodi che siano seguiti da nodi terminali o
già valutati:
• se Paul sceglie Y, John sceglie tra a, guadagnando 3;
oppure b, ripassando il turno a Paul, che abbiamo
deciso che termina il gioco con k e quindi 4 per John;
oppure c, passando il turno a Ringo, che abbiamo
deciso che giunge a 2 per John:
• la scelta migliore per John è b.
4;4;4;2
Paul
c
B
1;2;5;3
2;5;4;0
Y
George
Ringo
B
John
X
c
George
ESEMPIO: terzo stadio
Paul
b
X
•
Siamo ora pronti a immaginare come Paul dovrebbe
iniziare il gioco:
• è più soddisfatto con Y,
• in quanto prevede che John risponderà con b e poi
Paul sceglierà k, portando al vettore (4; 4; 4; 2).
67
•
ESEMPIO: conclusioni
1;3;2;2
Paul
John
Y
Paul
4;4;4;2
k
• L’equilibrio di Nash nei giochi in
forma estesa
•
b
X
c
George
A
a
68
B
3;4;2;1
x
1253
1;2;5;3
2;5;4;0
•
l
Ringo
2;6;6;1
y
6861
6;8;6;1
•
•Equilibrio del gioco Yk,b,B,x
•Sentiero di equilibrio Ybk
•Azioni di equilibrio mai giocate B x
•
69
• Qual è il nesso tra l’induzione a
ritroso e gli equilibri di Nash? (1)
•
•
Qual è il nesso tra l’induzione a
ritroso e gli equilibri di Nash? (2)
ESEMPIO: B dovrebbe sfidare A?
Se lo sfida, A dovrebbe scegliere tra le vincite 1 e
−1, pertanto A si arrenderebbe
Sembra che B possa tranquillamente lanciare la
sfida.
•
A
combatte
Il concetto di equilibrio di Nash si può applicare a
tutti i giochi in forma estesa.
La definizione di base mantiene la sua validità: un
equilibrio di Nash è un profilo di strategie, tale che
nessun giocatore può migliorare la sua vincita
(attesa) con una deviazione unilaterale (ossia
cambiando la sua strategia)
strategia).
La difficoltà di applicazione di questa definizione
risiede nella verifica volta ad assicurare che nessun
giocatore possa migliorare la sua vincita cambiando
strategia.
Nei giochi in forma estesa l’insieme di strategie
può essere molto complesso, perché specifica le
azioni per ogni insieme di informazione degli altri
giocatori.
70
-2;-1
•
•
•
•
•
Riformuliamo il gioco in forma strategica
Il profilo sfida-resa è un equilibrio di Nash. L’induzione a ritroso ha
portato a un equilibrio di Nash.
Ma anche il profilo non sfida-combattimento è un equilibrio di Nash.
Tale minaccia tuttavia non è credibile: se B scopre che A sta
bluffando e lo sfida, A combatterà veramente?
Questo equilibrio di Nash implica una strategia dominata
debolmente.
combatte
Sfida A
Non combatte
B
1;1
Sfida A
0;2
Non sfida A
A
Si arrende
-2; -1
1; 1
0; 2
0; 2
B
Non sfida A
71
Lezione 18
72
12
Mario Gilli
• L’equilibrio di Nash inconsistente con
l’induzione a ritroso
• Qual è il nesso tra l’induzione a
ritroso e gli equilibri di Nash? (3)
•
•
Se A combatte, allora B non dovrebbe sfidarlo
perché 0 > -2, se B non sfida A, allora A è
indifferente tra combattere o no perché in ogni caso
ottiene 2. Quindi (combatte, non sfida) è un NE
A
combatte
•
-2;-1
•
Sfida A
Non combatte
B
1;1
•
Non sfida A
0;2
Questo esempio illustra un principio generale:
quando si converte un gioco in forma estesa in
un gioco in forma strategica, spesso si passa da
un’unica “soluzione” per induzione a ritroso a
più equilibri di Nash.
La soluzione ottenuta per induzione a ritroso è un
equilibrio di Nash.
Gli altri equilibri di Nash implicano l’uso di strategie
che potrebbero essere eliminate per dominanza
debole iterata.
73
74
• E l’induzione a ritroso nei giochi in
forma estesa più complessi?
Gioco dell’entrata
•
• 2 imprese: X e Y
• Y monopolista di un mercato; X decide se entrare o no
•
•
•
Nei giochi in forma estesa generali adottiamo
l’analisi dell’equilibrio di Nash.
Tuttavia, come abbiamo constatato, alcuni equilibri
di Nash sono basati su minacce non credibili.
Nei giochi a informazione perfetta, l’induzione a
ritroso ci aiuta a individuare questi equilibri con
minaccia non credibile.
Sarebbe quindi ideale poter applicare una tecnica
simile nei giochi in forma estesa di tipo generale.
• Se X entra, allora Y può produrre poco o tanto.
• Se Y produce poco entrambe hanno profitto 1
• Se
S Y produce
d
t t entrambe
tanto
t
b avranno profitti
fitti -1
1
• Se X non entra avrà profitti nulli e Y può sempre
produrre poco o tanto, ma resta monopolista
• Se Y produce poco avrà profitto 2
• Se Y produce tanto avrà profitto 3
75
76
Gioco in forma estesa
Gioco dell’entrata
Azioni
tanto
-1, -1
X ENTRA o NON ENTRA
Y produrre POCO o TANTO
entra
Strategie
Impresa X
ENTRA o NON ENTRA (coincide con azioni)
X
poco
1, 1
tanto
0, 3
Non entra
Impresa Y
Produrre POCO sia se X ENTRA, sia se X NON ENTRA
Produrre POCO se X ENTRA, TANTO se X NON ENTRA
Produrre TANTO sia se X ENTRA, sia se X NON ENTRA
Produrre TANTO se X ENTRA, POCO se X NON ENTRA
Y
poco
77
Lezione 18
Y
0, 2
78
13
Mario Gilli
Gioco in forma strategica
Y
X
Poco,
poco
Poco,
tanto
1,1
1,1
Entra
Tanto,
poco
Equilibri di Nash nel gioco d’entrata
Y
(ii)
(iii)
(iv)
1 , 1 -1 , -1 -1 , -1
0,3 0,2 0,3
(i)
E 1,1
X
NE 0 , 2
tanto,
tanto
-1,-1 -1,-1
Se Y gioca (i), X gioca E; se X gioca E, Y gioca (i) o (ii)
Se Y gioca (ii), X gioca E; se X gioca E, Y gioca (i) o (ii)
Non
entra
0,2
0,3
0,2
Se Y gioca (iii), X gioca NE; se X gioca NE, Y gioca (ii) o (iv)
0,3
Se Y gioca (iv), X gioca NE; se X gioca NE, Y gioca (ii) o (iv)
NB: { E , (i) }, { E , (ii) }, e { NE , (iv) } sono equilibri di Nash.
79
Equilibrio 1
Y
(ii)
(iii)
(iv)
1 , 1 -1 , -1 -1 , -1
0,3 0,2 0,3
(i)
E 1,1
X
NE 0 , 2
80
tanto
entra
Y
Consideriamo i tre equilibri di Nash:
1) { E ; P se E , P se NE } ; risultato: (1,1)
X
3) { NE ; T se E , T se NE } ; risultato : (0,3)
1, 1
tanto
0, 3
Y
poco
NB: i primi due equilibri generano lo STESSO risultato,
perché le strategie di Y sono diverse solo in un nodo
decisionale che NON è raggiunto nell’effettivo svolgimento
del gioco.
81
Equilibrio 2
0, 2
82
Equilibrio 3
tanto
Y
X
-1, -1
tanto
entra
poco
1, 1
tanto
0, 3
Y
X
Non entra
-1, -1
poco
1, 1
tanto
0, 3
Non entra
Y
Y
poco
poco
0, 2
83
Lezione 18
poco
Non entra
2) { E ; P se E , T se NE } ; risultato : (1,1)
entra
-1, -1
0, 2
84
14
Mario Gilli
Perfezione nei sottogiochi
Problemi con gli equilibri di Nash
Equilibrio di Nash: ogni giocatore deve agire
ottimamente date le strategie altrui, cioè
ogni giocatore gioca una risposta ottima
alle strategie degli altri giocatori.
Problema: la condizione di ottimizzazione
è posta solo all’inizio del gioco.Perciò
qualche equilibrio di Nash nei giochi
dinamici può coinvolgere minacce non
credibili.
(Selten, 1965)
• Applica una nozione di comportamento
razionale (in particolare l’equilibrio di
Nash) ogni volta che si fronteggia una
situazione strategica ben definita.
• La nozione di sottogioco proprio modella
l’idea di “una situazione strategica ben
definita”.
85
Notiamo che l’equilibrio di Nash perfetto nei sottogiochi genera
un risultato, (1,1), che non è il miglior risultato possibile per Y.
Se Y sceglie “P se E, T se
NE”, X sceglie E
Y
E
86
L’equilibrio di Nash {NE ; T se E , T se NE} genera un risultato
molto migliore dal punto di vista di Y: (0,3)
T
( −1 , −1 )
P
(1,1)
Questo equilibrio di Nash è basato su una minaccia non
credibile, dato che Y non sceglierebbe mai T se X decidesse di
entrare.
In questo
sottogioco,
Y sceglie P
Cosa succederebbe se Y si impegnasse a scegliere T
indipendentemente da quello che fa X?
X
Y
( 0 , 3 )
T
NE
Y
( 0 , 2 )
P
In questo
sottogioco,
Y sceglie T
E
X
NE
{E;P se E, T se NE} è l’equilibrio di Nash perfetto nei sottogiochi
( −1 , −1 )
(T )
(T )
( 0 , 3 )
Se X prende sul serio
la minaccia, sceglie
NE, e Y ottiene il suo
massimo profitto.
Y
87
88
Riepilogo
Un equilibrio di Nash che soddisfi il principio di razionalità
sequenziale, cioè che definisca solamente strategie credibili, è
noto come equilibrio di Nash perfetto nei sottogiochi.
Forma estesa o forma normale?
In un equilibrio di Nash perfetto nei sottogiochi, ogni volta che
un agente è chiamato a scegliere, l’azione definita dalla sua
strategia si rivela essere il comportamento ottimale date le
strategie dei suoi avversari.
Per trovare l’equilibrio di Nash perfetto nei sottogiochi di un
gioco sequenziale si utilizza la rappresentazione del gioco in
forma estesa e si risolve usando l’induzione retrograda.
Quindi {E; P se E , T se NE} è l’unico equilibrio di Nash
perfetto nei sottogiochi del gioco d’entrata.
Per trovare tutti gli equilibri di Nash di giochi simultanei o
sequenziali si utilizza la rappresentazione del gioco in forma
normale.
Gli altri due equilibri di Nash
{E ; P se E , T se NE } , { NE ; T se E , T se NE }
sono chiaramente basati su minacce non credibili: Y non
sceglierebbe MAI “P se NE” o “T se E”!
89
Lezione 18
90
15
Mario Gilli
Alcuni esempi
2
a
A 5,9
1
B 10 , 6
Consideriamo il seguente gioco:
Giocatori: due giocatori, 1 e 2
Azioni: A o B per il giocatore 1, e a o b per il giocatore 2
b
4,8
0,1
Strategie: A o B per il giocatore 1, e a o b per il giocatore 2
Dato che strategie = azioni,
azioni il gioco è un gioco simultaneo con
informazione imperfetta.
1)) C’è q
qualche strategia
g dominante?
Sì, a è dominante per il giocatore 2
Vincite:
2
a
A 5,9
1
B 10 , 6
b
4,8
0,1
2) Ci sono equilibri di Nash?
Sì, { B , a } è un equilibrio di Nash
91
92
Forma estesa:
2
1
a
(5, 9)
b
(4,8)
a
( 10 , 6 )
b
(0, 1)
A
4) Elenchiamo tutte le strategie dei nostri giocatori
Giocatore 1:
A
B
B
2
3) Supponiamo
S
i
che
h il giocatore
i
2 sia
i in
i grado
d di osservare le
l
mosse di 1; cambia la struttura del gioco?
2
1
a
(5, 9)
b
(4,8)
a
( 10 , 6 )
b
(0, 1)
A
5) Forma normale:
2
(i)
A 5,9
1
B 10 , 6
B
2
(ii)
5,9
0,1
(iv)
4,8
0,1
1
A
(iv)
4,8
0,1
a
(5, 9)
b
(4,8)
a
( 10 , 6 )
b
(0, 1)
B
2
6)) C’è q
qualche strategia
g dominante?
8) C
C’èè qualche equilibrio di Nash perfetto nei sottogiochi?
Sì, (i) è dominante (ma non strettamente) per il giocatore 2
Sì, {B, a se A,a se B} è l’equilibrio di Nash perfetto nei sottogiochi
7) Ci sono equilibri di Nash?
Sì, { B , (i) }, { A , (ii) }, e { B , (iii) } sono equilibri di Nash
Notiamo che { B , (i) } e { B , (iii) } generano lo stesso risultato.
95
Lezione 18
(iii)
4,8
10 , 6
94
2
(iii)
4,8
10 , 6
(ii)
5,9
0,1
93
2
(i)
A 5,9
1
B 10 , 6
Giocatore 2
(i) a se A, a se B
(ii) a se A, b se B
(iii) b se A, a se B
(iv) b se A, b se B
9) Se il giocatore 2 potesse impegnarsi a giocare una strategia,
cosa farebbe?
Si impegnerebbe a giocare { a se A, b se B }: questo
indurrebbe il giocatore 1 a scegliere A, e genererebbe il payoff
massimo per il giocatore 2.
96
16