(Microsoft PowerPoint - 03 Teoria dei giochi [modalit\340

$(Microsoft PowerPoint - 03 Teoria dei giochi [modalit\340$

INTRODUZIONE
ALLA TEORIA DEI GIOCHI
NELLE SCIENZE ECONOMICHE
E SOCIALI
Massimiliano FERRARA
• “Mediterranea” University of Reggio Calabria Department of Law
and Economics
• Bocconi University- ICRIOS - Department of Management and
Technology
Teoria dei giochi
a) Cosa è un gioco
b) Come lo si rappresenta
c) Come ci si ragiona sopra
c1) giochi in forma normale
c2) giochi in forma strategica
1
Cosa è un gioco?
• COME COMPORTARSI IN SITUAZIONI DI
INTERAZIONE STRATEGICA
• INTERAZIONE STRATEGICA: DEFINIZIONE
• AGENTI RAZIONALI
• FUNZIONI OBIETTIVO (PROFITTI) : PER L’AGENTE i
ABBIAMO πi
• VARIABILI DI SCELTA xi
2
Interazione strategica
ABBIAMO ASSENZA DI INTERAZIONE
STRATEGICA QUANDO πi DIPENDE SOLO DA xi
ABBIAMO INTERAZIONE STRATEGICA QUANDO πi
DIPENDE ANCHE DA xj (con j ≠ i)
COME ANALIZZARLA? La teoria dei giochi
(VON NEUMANN - NASH - SCHELLING -SELTEN)
3
Esempi
• LA POLITICA MILITARE DELLA NATO
• LA SCELTA DEL PREZZO DI UN’IMPRESA
• COME VESTIRSI A UNA FESTA
• COME PASSARE UN POMERIGGIO
problema generale:
• la mia scelta ottimale dipende da quello che scelgono
altri soggetti
• la loro scelta (ottimale) dipende dalla mia
• .... come se ne esce ?
4
Teoria dei giochi
a) Cosa è un gioco
b) Come lo si rappresenta
c) Come ci si ragiona sopra
c1) giochi in forma normale
c2) giochi in forma strategica
5
Rappresentazione dei giochi : la matrice dei payoff
SE CI INTERESSANO SOLO I PAYOFF, IN FORMA
“NORMALE” ⇒ LA MATRICE DEI PAYOFF
(ES. MOSSE SIMULTANEE)
Giocatore 2
Strategia C
Strategia D
Strategia A
Payoff 1, Payoff 2
con A-C
Payoff 1, Payoff 2
con A-D
Strategia B
Payoff 1, Payoff 2
con B-C
Payoff 1, Payoff 2
con B-D
Giocatore 1
6
Rappresentazione dei giochi : l’albero del gioco
• SE INTERESSA ANCHE L’ORDINE DELLE MOSSE, IN
FORMA “STRATEGICA” ⇒ L’ALBERO DEL GIOCO
• (ES. MOSSE EFETUATE IN TEMPI DIVERSI, QUANDO
LA MOSSA PRECEDENTE E’ NOTA E DEFINITIVA)
• UTILE QUANDO I GIOCATORI DECIDONO IN MODO
ASINCRONO
• ANCHE QUANDO I GIOCATORI DECIDONO PIU’
VARIABILI IN MOMENTI DIVERSI
7
L’albero del gioco: una scelta per ogni giocatore
Questi si
chiamano “nodi”
Il giocatore 1 decide per primo:
Mossa A
Mossa B
Giocatore 1 decide: A o B
Giocatore 2 osserva la mossa (A) e decide
CoD
C
Payoff 1,2 con A-C
D
Payoff 1, 2 con A-D
Giocatore 2 osserva la mossa (B) e decide
CoD
C
Payoff 1, 2 con B-C
D
Payoff 1, 2 con B-D
8
L’albero del gioco
• In ogni nodo un giocatore sa cosa è
successo fino ad allora e deve
effettuare una scelta
• Ciò che è successo prima è un dato: ciò
che rileva in ogni nodo è quello che
segue ⇒ GUARDARE AVANTI
• Da ogni nodo parte un “sottogioco”
9
L’albero del gioco: ogni giocatore ha più scelte, da
effettuare in sequenza
Questi sono i
“nodi”
I giocatori hanno due variabili strategiche,
che decidono in sequenza.
Ma a ogni stadio abbiamo decisioni simultanee
Giocatore 1 decide la sua prima
variabile strategica
Giocatore 2 decide la sua prima
variabile strategica
Giocatore 1 osserva le mosse sulla prima variabile
e decide la sua seconda variabile
Giocatore 2 osserva le mosse sulla prima variabile
e decide la sua seconda variabile
Payoff 1, 2 date le strategie decise ai due stadi
10
L’albero del gioco: lo stesso gioco potrebbe
essere giocato più volte di seguito
I giocatori fronteggiano lo stesso gioco
che devono giocare più volte.
A ogni stadio abbiamo decisioni simultanee
Giocatore 1 decide per la prima volta la sua
variabile strategica
Giocatore 2 per la prima volta la sua
variabile strategica
Payoff 1, 2 al primo stadio del gioco
Giocatore 1 osserva il risultato del primo stadio
e decide come giocare il secondo
Giocatore 2 osserva il risultato del primo stadio
e decide come giocare il secondo
Payoff 1, 2 al secondo stadio del gioco
• Questo si chiama “gioco ripetuto” (2 volte, ma in
generale n volte) o “supergioco”
11
Teoria dei giochi
a) Cosa è un gioco
b) Come lo si rappresenta
c) Come ci si ragiona sopra
c1) giochi in forma normale
c2) giochi in forma strategica
12
Giochi in forma normale: il dilemma dei
prigionieri
Perfetta informazione su obiettivi e possibilità dell’altro
Decidono senza conoscere la decisione dell’altro
[⇒ come se fossero decisioni simultanee]
One-shot [non c’è futuro]
Prigioniero 2
Confessa
Confessa
Non confessa
-10, -10
0, -15
-15, 0
-2, -2
Prigioniero 1
Non confessa
13
Strategie dominanti e dominate
Qualche volta abbiamo
a) strategie che - qualunque sia la scelta dell’altro - ci
danno un payoff superiore a quello di tutte le altre
⇒ parliamo di strategie dominanti
b) strategie che - qualunque sia la scelta dell’altro - ci
danno un payoff inferiore ad almeno un’altra strategia
⇒ parliamo di strategie dominate
Con 2 strategie, se una è dominante l’altra è dominata
14
Strategie dominanti
Se esiste una strategia dominante, LA SI DEVE
GIOCARE
Se esiste una strategia (strettamente) dominata, LA
SI PUO’ ANCHE CANCELLARE
Nel dilemma dei prigionieri, confessare è strategia
dominante
15
Esempi di giochi (I)
I
L
M
A
8, 5
6, 2
B
5, 9
19, 6
C
4, 8
12, 10
(eliminazione di strategie dominate)
16
L’equilibrio di Nash (1/3)
Spesso non esiste una strategia dominante...
Dati n giocatori e πi (xi ; xj)
abbiamo un
EQUILIBRIO DI NASH (x*1, x*2, ... , x*n) quando
x*1 massimizza il profitto π1 dati (x*2, ... , x*n)
x*2 massimizza il profitto π2 dati (x*1, x*3, ... , x*n)
ecc. – fino al giocatore n
17
L’equilibrio di Nash (2/3)
Ovvero (x*1, x*2, ... , x*n) è definito come soluzione
di un sistema di n equazioni simultanee
∂π 1
= 0
∂x1
∂π 2
= 0
∂x2
ecc. fino al giocatore n
Ciascuna condizione di ottimo potrebbe dipendere da
tutte le variabili xi (sono funzioni!)
18
L’equilibrio di Nash (3/3)
“DATO” quello che fanno gli altri
– comunque non lo controllo
– la mia scelta ottima è funzione di quanto fanno
gli altri, la cui scelta entra come un parametro
nella mia condizione di ottimo
INTUIZIONE: assenza di rimpianto
19
Un esempio economico
Consideriamo due imprese e la loro strategia di
prezzo o di pubblicità:
strategia
aggressiva
strategia
accomodante
strategia aggressiva
2, 2
15, 0
strategia
accomodante
0, 15
8, 8
Una coppia di strategie dominanti è sempre
un equilibrio di Nash
20
Esempi di giochi (II)
II
L
M
A
8, 5
6, 2
B
5, 9
19, 6
C
6, 8
12, 10
[cambia solo il payoff nel caso (C, L)]
21
Esempi di giochi (III)
III
L
M
A
8, 5
6, 2
B
15, 9
10, 6
C
6, 8
12, 10
• Possiamo avere molteplicità di equilibri
22
Teoria dei giochi
a) Cosa è un gioco
b) Come lo si rappresenta
c) Come ci si ragiona sopra
c1) giochi in forma normale
c2) giochi in forma strategica
23
Come ragionare sui giochi sequenziali
Non basta più ragionare su quello che fa l’altro
(equilibrio di Nash): occorre valutare chi fa cosa
QUANDO ( e sapendo che cosa)
⇒ Equilibrio perfetto (“Subgame-perfect”):
Da ogni nodo decisionale parte un “sottogioco”.
L’equilibrio perfetto è una sequenza di equilibri di
Nash per ciascuno dei sottogiochi.
In pratica...
24
Il principio di backward induction
• Partiamo dall’ultimo stadio del gioco e
cerchiamo di capire: “dato che siamo qui,
ovvero date le scelte precedenti, quale è
ORA la strategia migliore?”
• E poi risaliamo (un processo logico
“all’indietro”): dato che sappiamo che allo
stadio successivo avverranno certe cose, a
questo stadio cosa conviene fare?
25
Un gioco in forma normale
2
C
D
A
10, 8
12,6
B
7,2
11,3
1
Equilibrio di Nash?
Cosa succede se uno dei giocatori decide prima dell’altro?
26
Ragionare all’indietro: le scelte dei giocatori nel gioco
visto in precedenza
Mossa B
Il giocatore 1 decide per primo:
Mossa A
Giocatore 1 decide: A o B
Giocatore 2 osserva la mossa (A) e decide
CoD
C
10, 8
Giocatore 2 osserva la mossa (B) e decide
CoD
D
12, 6
C
D
7, 2
11, 3
All’ultimo stadio, il giocatore 2 cosa sceglie?
Anticipando la decisione del giocatore 2, il giocatore 1 sceglie...
Se il giocatore 2 potesse vincolarsi a una scelta, cosa sceglierebbe?
27
Il problema centrale: la credibilità
delle mosse (ovvero degli annunci)
La credibilità delle mosse al primo stadio
• Se si potesse tornare indietro, potrebbe convenire...
• ma allora…
E’ credibile un annuncio (minacce-promesse) su cosa
faremo nel futuro?
E’ credibile solo se
– non avremo scelta (vincolo tecnologico o contrattuale)
– dichiariamo di seguire una strategia che - date le mosse
precedenti - massimizzerà il nostro utile (convenienza)
28
Un gioco tra imprese
Campagna
pubblicitaria
Leader di
mercato
Nessuna
pubblicità
Satellite
Pubblicità
“accomodante”
1, -1
Pubblicità
aggressiva
0, 0
-100, -100
• Equilibrio: entrambe faranno pubblicità, in modo
“normale” - il satellite ci perde
29
Come evitare di perderci?
Campagna
pubblicitaria
Leader di
mercato
Nessuna
pubblicità
Satellite
Pubblicità
aggressiva
0, 0
-100, -100
• Vincolarsi a un tipo di pubblicità aggressivo: eliminare una
strategia può migliorare l’equilibrio
30
Lezione generale
Un modo di migliorare la propria posizione può essere
limitare proprie strategie possibili:
–
–
–
–
–
attraversare un fiume con l’esercito
interrogare un sospetto di reato
l’incrocio tra due camion su una strada di montagna
comportarsi in modo aggressivo con un concorrente
...
Legarsi le mani (impegno credibile) può avere un
costo diretto ma un grande valore strategico
Da bilanciare con il valore della flessibilità...
31
Giochi ripetuti
Gioco “costitutivo”: mosse simultanee, perfetta
informazione (es: dilemma dei prigionieri)
Ripetuto n volte (es.: 2 volte)
Strategia: una sequenza di decisioni, una per ogni stadio
del gioco
32
Equilibrio nei giochi ripetuti
Cerchiamo una sequenza di equilibri di Nash
Equilibrio “banale”: sequenza di equilibri uguali a quello
del gioco “costitutivo”
Esistono equilibri diversi? Se esistono, allora la
ripetizione “fa differenza”
33
Dilemma dei prigionieri
ripetuto un numero finito di volte (1/2)
Possiamo partire dall’ultimo stadio e ragionare
“all’indietro”
Come è fatto l’equilibrio all’ultimo stadio?
Prigioniero 2
Confessa
Confessa
Non confessa
10, 10
0, 15
15, 0
2, 2
Prigioniero 1
Non confessa
34
Dilemma dei prigionieri
ripetuto un numero finito di volte (2/2)
Cosa posso fare allo stadio n-1 per migliorare tale
risultato?
Questo risultato è indipendente da quanto è avvenuto in
precedenza: conta solo il futuro
… nulla
⇒
Non esistono equilibri diversi da una sequenza di
equilibri di Nash del gioco costitutivo
• chain-store paradox
35
Dilemma dei prigionieri
ripetuto un numero infinito di volte
Non esiste un ultimo stadio da cui ragionare
“all’indietro”… quindi?
Strategia trigger (del grilletto):
- comincio non confessando e comunico alla
controparte che
a) non confesserò fin quando l’altro continua a non
confessare
b) se l’altro confessa una volta, da lì in poi
confesserò sempre
36
La credibilità della strategia trigger
“Non confessare” è un equilibrio?
Se entrambi adottano una strategia trigger:
- se confesso, risparmio oggi qualche anno di galera,
ma da lì in poi l’altro confesserà sempre
- se non confesso rinuncio a uscire di galera oggi, ma so
che nel futuro l’altro non confesserà
TRADE-OFF tra rinuncia oggi e guadagni futuri
Se i benefici futuri sono abbastanza importanti, non
confessare è un equilibrio
37
La strategia tit-for-tat
La strategia trigger può sembrare un po’ estrema
Strategia alternativa: tit-for-tat (pan per focaccia)
- comincio non confessando e comunico che mi
comporterò nel periodo t come l’altro si comporta in t-1
⇒ se l’altro “devia” per n periodi, lo punisco n periodi
Sono tutti equilibri sostenuti da minacce credibili
Richiedono che il futuro “conti abbastanza”
38
Il folk theorem (1/2)
Ogni coppia di payoff superiori a quelli ottenibili
nell’equilibrio del gioco costitutivo (πC) possono essere
sostenuti nel supergioco da una coppia di strategie
Con due strategie possibili (confesso o no) è facile
Con un numero infinito di strategie (es.: p∈[0,p’])
possiamo avere infiniti equilibri
39
Payoff del giocatore 2
Il folk theorem (2/2)
Ogni punto in alto e a destra del punto di
incontro può essere sostenuto come
equilibrio da una coppia di strategie
πC
πC
Payoff del giocatore 1
Un po’ troppi equilibri...
40