Equilibri di Nash in teoria dei giochi

Equilibri di Nash in teoria dei giochi
Alessio Porretta
Universita’ di Roma Tor Vergata
A. Porretta
Equilibri di Nash in teoria dei giochi
Gli elementi tipici di un gioco:
-un numero di agenti (o giocatori): 1, . . . , N
-Un insieme di strategie Qi per l’i-esimo agente.
oss: Qi può essere un insieme discreto (es. la scelta è binaria: si’ oppure
no) ma anche un insieme continuo, es. tutte le volte che Qi è un insieme
numerico di grandezze continue (per esempio, la strategia è una velocità,
una percentuale, etc...)
A. Porretta
Equilibri di Nash in teoria dei giochi
Gli elementi tipici di un gioco:
-un numero di agenti (o giocatori): 1, . . . , N
-Un insieme di strategie Qi per l’i-esimo agente.
oss: Qi può essere un insieme discreto (es. la scelta è binaria: si’ oppure
no) ma anche un insieme continuo, es. tutte le volte che Qi è un insieme
numerico di grandezze continue (per esempio, la strategia è una velocità,
una percentuale, etc...)
-una funzione di utilità (cosiddetto pay-off) da ottimizzare, per ciascun
agente:
Ji (α1 , . . . , αN )
dipendente dalle strategie αi di tutti gli agenti
A. Porretta
Equilibri di Nash in teoria dei giochi
Equilibrio di Nash
La nozione di equilibrio introdotta da J. Nash (1949):
un insieme di strategie è un equilibrio (di Nash) se nessun giocatore ha
interesse a cambiare la strategia a meno che non la cambi anche qualcun
altro
A. Porretta
Equilibri di Nash in teoria dei giochi
Equilibrio di Nash
La nozione di equilibrio introdotta da J. Nash (1949):
un insieme di strategie è un equilibrio (di Nash) se nessun giocatore ha
interesse a cambiare la strategia a meno che non la cambi anche qualcun
altro
Tradotto in linguaggio matematico:
α = (α1 , . . . , αN )
è un equilibrio di Nash se
Ji (α1 , . . . , αi−1 , αi , αi+1 , . . . , αN ) ≥ Ji (α1 , . . . , αi−1 , β, αi+1 , . . . , αN )
∀β ∈ Qi ,
∀i = 1...N
Ovvero: tenendo ferme le scelte degli altri, nessuno cambierebbe la sua.
A. Porretta
Equilibri di Nash in teoria dei giochi
Il dilemma del prigioniero
Due complici che hanno commesso un crimine
sono detenuti in celle separate e vengono interrogati simultaneamente. Gli
investigatori hanno poche prove e possono incriminarli solo per piccoli reati, ma
se uno collabora, denunciando l’altro, avrà dei vantaggi.
A. Porretta
Equilibri di Nash in teoria dei giochi
Il dilemma del prigioniero
Due complici che hanno commesso un crimine
sono detenuti in celle separate e vengono interrogati simultaneamente. Gli
investigatori hanno poche prove e possono incriminarli solo per piccoli reati, ma
se uno collabora, denunciando l’altro, avrà dei vantaggi.
Ciascun prigioniero fronteggia il seguente dilemma:
• se denuncia il compare, e l’altro non parla, può essere rilasciato.
• se entrambi denunciassero l’altro, avranno uno sconto di pena (diciamo 5
anni l’uno)
• se entrambi tacciono, avranno un’accusa per piccoli reati (diciamo 1 anno
ciascuno)
• se lui tace ma l’altro lo denucia, avra’ l’intera pena di 10 anni.
Tale situazione si può schematizzare nella seguente matrice:
A. Porretta
Equilibri di Nash in teoria dei giochi
Giocatore 2
Giocatore 1
Denuncia
Non denuncia
Denuncia
Non denuncia
5,5
10,0
0,10
1,1
A. Porretta
Equilibri di Nash in teoria dei giochi
Giocatore 2
Giocatore 1
Denuncia
Non denuncia
Denuncia
Non denuncia
5,5
10,0
0,10
1,1
In questo gioco c’è un unico equilibrio di Nash: la scelta in cui entrambi
tradiscono
A. Porretta
Equilibri di Nash in teoria dei giochi
Giocatore 2
Giocatore 1
Denuncia
Non denuncia
Denuncia
Non denuncia
5,5
10,0
0,10
1,1
In questo gioco c’è un unico equilibrio di Nash: la scelta in cui entrambi
tradiscono
Giocatore 2
Denuncia
Giocatore 1
Denuncia
Non denuncia
Non denuncia
5,5
10,0
A. Porretta
Equilibri di Nash in teoria dei giochi
Giocatore 2
Giocatore 1
Denuncia
Non denuncia
Denuncia
Non denuncia
5,5
10,0
0,10
1,1
Questo esempio mostra che l’equilibrio di Nash non è necessariamente la
migliore soluzione possibile né individualmente né collettivamente.
A. Porretta
Equilibri di Nash in teoria dei giochi
Giocatore 2
Giocatore 1
Denuncia
Non denuncia
Denuncia
Non denuncia
5,5
10,0
0,10
1,1
Questo esempio mostra che l’equilibrio di Nash non è necessariamente la
migliore soluzione possibile né individualmente né collettivamente.
Esiste una soluzione migliore per entrambi: quello che gli economisti
chiamano un (equilibrio) ottimo di Pareto: la strategia migliore per tutti.
In altri termini: in un equilibrio di Pareto, qualunque giocatore cambi
strategia ve ne sarà almeno uno che dovrà peggiorare.
Si parla di equilibrio efficiente; in questo caso la situazione in cui entrambi
tacciono: (1, 1).
A. Porretta
Equilibri di Nash in teoria dei giochi
The “chicken game”: il gioco del codardo
Due individui si sfidano per mostrare chi è piu’ coraggioso, guidando a tutta
velocità verso una scogliera (Gioventù bruciata !!). Mentre il precipizio si
avvicina, affrontano un atroce dilemma:
- se uno si butta troppo presto, prima che l’altro lo faccia, sarà bollato come
codardo
-se entrambi si buttano insieme, prima del baratro, salvano la pelle. ma non
possono dire di aver vinto.
-se entrambi aspettano troppo, può essere tardi: si rischia la morte.
A. Porretta
Equilibri di Nash in teoria dei giochi
Due macchine all’incrocio
Vi propongo una variante più frequente nella nostra quotidianità: cosa accade
quando due macchine giungono a un incrocio senza semaforo ?
A. Porretta
Equilibri di Nash in teoria dei giochi
Due macchine all’incrocio
Vi propongo una variante più frequente nella nostra quotidianità: cosa accade
quando due macchine giungono a un incrocio senza semaforo ?
Due macchine giungono contemporanamente a un incrocio (senza semaforo,
senza precedenze... insomma un tipico incrocio a Roma). Può succedere che
A. Porretta
Equilibri di Nash in teoria dei giochi
Due macchine all’incrocio
Vi propongo una variante più frequente nella nostra quotidianità: cosa accade
quando due macchine giungono a un incrocio senza semaforo ?
Due macchine giungono contemporanamente a un incrocio (senza semaforo,
senza precedenze... insomma un tipico incrocio a Roma). Può succedere che
• uno decide di fermarsi e l’altro decide di passare: uno solo sarà contento,
diciamo (0, 1) oppure (1, 0).
• entrambi decidono di passare, e ci sarà un incidente: (−1, −1).
• entrambi si fermano: niente incidente, ma uno sgradevole stallo, e tempo
perso...: (0, 0)
Tale situazione si può schematizzare nella seguente matrice:
A. Porretta
Equilibri di Nash in teoria dei giochi
Giocatore 2
passa
Giocatore 1
passa
si ferma
si ferma
-1,-1
0,1
1,0
0,0
In questo gioco ci sono due equilibri di Nash: (0, 1) oppure (1, 0).
Entrambi lasciano uno dei due insoddisfatto...
A. Porretta
Equilibri di Nash in teoria dei giochi
Giocatore 2
passa
Giocatore 1
passa
si ferma
si ferma
-1,-1
0,1
1,0
0,0
In questo gioco ci sono due equilibri di Nash: (0, 1) oppure (1, 0).
Entrambi lasciano uno dei due insoddisfatto...
A. Porretta
Equilibri di Nash in teoria dei giochi
Riassunto:
gli equilibri di Nash sono soluzioni che possono crearsi nell’incertezza
delle decisioni degli altri.
Mostrano la complessita’ del meccanismo decisionale.
A volte non sono ottimali per nessuno, dando senso all’importanza
di fare accordi; a volte non lo sono per qualcuno, mostrando la
necessita’ di un compromesso; spesso ce ne sono piu’ di uno,
mostrando la difficolta’ di previsione su quello che accadrà.
A. Porretta
Equilibri di Nash in teoria dei giochi
Oss. sugli esempi precedenti:
Si trattava di situazioni simmetriche: i giocatori erano interscambiabili
Matematicamente, la trattazione del gioco segue questo iter:
- definire gli insiemi di strategie possibili del singolo
- comprendere il valore associato a ogni possibile scelta collettiva
- dedurre da questo la strategia effettiva dei giocatori
A. Porretta
Equilibri di Nash in teoria dei giochi
Oss. sugli esempi precedenti:
Si trattava di situazioni simmetriche: i giocatori erano interscambiabili
Matematicamente, la trattazione del gioco segue questo iter:
- definire gli insiemi di strategie possibili del singolo
- comprendere il valore associato a ogni possibile scelta collettiva
- dedurre da questo la strategia effettiva dei giocatori
Si osservi due punti chiave:
(i) dedurre le strategie dalle aspettative future
(ii) ciascuno ottimizza ipotizzando le scelte degli altri
A. Porretta
Equilibri di Nash in teoria dei giochi
Giochi differenziali
In molte situazioni,
la strategia agisce su una dinamica da cui dipendono poi i
costi/benefici/obiettivi...
(es. meccanismi preda/cacciatore: si sceglie una velocità che influenza le
rispettive posizioni)
A. Porretta
Equilibri di Nash in teoria dei giochi
Giochi differenziali
In molte situazioni,
la strategia agisce su una dinamica da cui dipendono poi i
costi/benefici/obiettivi...
(es. meccanismi preda/cacciatore: si sceglie una velocità che influenza le
rispettive posizioni)
gli obiettivi sono definiti non solo all’istante finale ma lungo tutto un arco
di tempo
A. Porretta
Equilibri di Nash in teoria dei giochi
Es: meccanismi di produzione di risorse esauribili (es. petrolio):
Per ciascun produttore i indichiamo
Ri (t) = riserva esistente
qi (t) = quantità prodotta ;
una dinamica naturale lega queste due quantità :
dRi
= −qi (t)
dt
A. Porretta
Equilibri di Nash in teoria dei giochi
Es: meccanismi di produzione di risorse esauribili (es. petrolio):
Per ciascun produttore i indichiamo
Ri (t) = riserva esistente
qi (t) = quantità prodotta ;
una dinamica naturale lega queste due quantità :
dRi
= −qi (t)
dt
Gli obiettivi possono essere i guadagni nel periodo
Z
T
{p(t, R(t))qi (t) − C (qi (t))} dt
max
0
dove C (q) sono costi di produzione e p l’evoluzione dei prezzi.
Punto chiave: p dipende anche da R(t) = (R1 , . . . , RN ) (i prezzi
dipendono dalle riserve esistenti)
A. Porretta
Equilibri di Nash in teoria dei giochi
Nei giochi differenziali, gli elementi tipici sono dunque:
Un numero di agenti (o giocatori) i = 1, . . . , N.
Una dinamica (deterministica o stocastica) che determina lo stato Xti
dell’i-esimo agente al tempo t. Es:
dXti = αti dt ( + σ dBti )
Una strategia di scelta individuale αti (una funzione, o una variabile
aleatoria) che possa influenzare tale dinamica.
A. Porretta
Equilibri di Nash in teoria dei giochi
Nei giochi differenziali, gli elementi tipici sono dunque:
Un numero di agenti (o giocatori) i = 1, . . . , N.
Una dinamica (deterministica o stocastica) che determina lo stato Xti
dell’i-esimo agente al tempo t. Es:
dXti = αti dt ( + σ dBti )
Una strategia di scelta individuale αti (una funzione, o una variabile
aleatoria) che possa influenzare tale dinamica.
Una funzione di utilità (da ottimizzare) nel tempo (τ, T ):
Z T
J i (α) =
Li (t, Xti , αti , αt−i , Xt−i )dt + V i (XTi , XT−i )
τ
dove αt−i e Xt−i sono le strategie e gli stati degli altri N − 1 giocatori.
Gli equilibri di Nash sono definiti in modo analogo a prima.
A. Porretta
Equilibri di Nash in teoria dei giochi
Per l’i-esimo giocatore, la funzione valore:
u i (τ, x) = inf J i (α) , quando Xτi = x
α
rappresenta la migliore aspettativa che si ha partendo dalla
condizione x al tempo τ .
A. Porretta
Equilibri di Nash in teoria dei giochi
Per l’i-esimo giocatore, la funzione valore:
u i (τ, x) = inf J i (α) , quando Xτi = x
α
rappresenta la migliore aspettativa che si ha partendo dalla
condizione x al tempo τ .
Matematicamente, la funzione valore risolve un’equazione
differenziale. Risolvere tale equazione è fondamentale: infatti la
strategia ottima è deducibile come feedback a partire dalla funzione
valore
A. Porretta
Equilibri di Nash in teoria dei giochi
La teoria dei Mean Field Games (2006 –...)
Pb: Come gestire situazioni di massa ? Ovvero cosa accade con un
numero molto grande di agenti razionali ?
A. Porretta
Equilibri di Nash in teoria dei giochi
Negli ultimi anni, sono state sviluppate nuove idee e metodi per trattare
situazioni in cui
(a) si ha un numero molto grande di agenti indistinguibili tra loro
(b) il singolo ha un microscopico impatto sulle strategie degli altri
Ma d’altra parte, le strategie dipendono da quello che fa la massa degli
altri giocatori
A. Porretta
Equilibri di Nash in teoria dei giochi
Negli ultimi anni, sono state sviluppate nuove idee e metodi per trattare
situazioni in cui
(a) si ha un numero molto grande di agenti indistinguibili tra loro
(b) il singolo ha un microscopico impatto sulle strategie degli altri
Ma d’altra parte, le strategie dipendono da quello che fa la massa degli
altri giocatori
Applicazioni tipiche:
- economia o finanza (numeri molto elevati di piccoli agenti finanziari)
- dinamiche di consumi di massa (“reti intelligenti”, es. per consumi
elettrici etc...)
- dinamiche sociali (gruppi numerosi di individui razionali, es: meccanismi
di voto, movimenti di una folla, dinamiche di conformismo/antagonismo
in gruppi estesi)
A. Porretta
Equilibri di Nash in teoria dei giochi
Microscopico → Macroscopico.
Nella teoria dei mean field games, viene mutuato un paradigma
ampiamente usato nella meccanica statistica:
in sistemi con un numero molto grande di particelle risulta impossibile
gestire le mutue interazioni (regolate dalla legge di Newton) o anche
semplicemente misurare posizione & velocità delle singole particelle.
L’approccio della meccanica statistica consiste nell’individuare grandezze
macroscopiche, es. energia, entropia definite in termini di medie
statistiche
A. Porretta
Equilibri di Nash in teoria dei giochi
Microscopico → Macroscopico.
Nella teoria dei mean field games, viene mutuato un paradigma
ampiamente usato nella meccanica statistica:
in sistemi con un numero molto grande di particelle risulta impossibile
gestire le mutue interazioni (regolate dalla legge di Newton) o anche
semplicemente misurare posizione & velocità delle singole particelle.
L’approccio della meccanica statistica consiste nell’individuare grandezze
macroscopiche, es. energia, entropia definite in termini di medie
statistiche
Si parla di teorie di campo medio: una volta specificato in che modo ogni
particella microscopica contribuisce alla formazione del campo (es.
definizione dell’energia, o dell’entropia), si studia l’evoluzione di
grandezze macroscopiche per descrivere il fenomeno.
A. Porretta
Equilibri di Nash in teoria dei giochi
In analogia, nella teoria dei Giochi di campo medio (Mean Field Games):
gli agenti sono nella sostanza simili tra loro: hanno simili margini di
scelta, simili dinamiche, simili obiettivi.
Matematicamente si traduce in ipotesi di simmetria: gli insiemi delle
strategie Qi sono gli stessi, costi/benefici sono analoghi, permutare gli
agenti non cambia il gioco...
A. Porretta
Equilibri di Nash in teoria dei giochi
In analogia, nella teoria dei Giochi di campo medio (Mean Field Games):
gli agenti sono nella sostanza simili tra loro: hanno simili margini di
scelta, simili dinamiche, simili obiettivi.
Matematicamente si traduce in ipotesi di simmetria: gli insiemi delle
strategie Qi sono gli stessi, costi/benefici sono analoghi, permutare gli
agenti non cambia il gioco...
le interazioni reciproche individuali sono sostituite dall’interazione
del singolo con la massa
Ma c’è una differenza fondamentale con la meccanica statistica: ora
le particelle sono agenti razionali con meccanismi di scelta. Non si
tratta solo di interazioni individuo-massa bensi’ di interazioni
strategiche.
Oltre a descrivere un fenomeno di massa, si vuole anche descrivere il
perché ciò avviene, ovvero i meccanismi decisionali che sottendono
un certo fenomeno
A. Porretta
Equilibri di Nash in teoria dei giochi
La peculiarità del modello è accoppiare decisioni strategiche e evoluzione
della situazione collettiva. Le strategie vengono prese anticipando
un’ipotesi di situazione collettiva; ma nel frattempo, le strategie
contribuiscono a modificare tale situazione.
A. Porretta
Equilibri di Nash in teoria dei giochi
La peculiarità del modello è accoppiare decisioni strategiche e evoluzione
della situazione collettiva. Le strategie vengono prese anticipando
un’ipotesi di situazione collettiva; ma nel frattempo, le strategie
contribuiscono a modificare tale situazione.
sistemi di equazioni con struttura forward-backward nel tempo:
-un’equazione determina le strategie ottimali partendo da un aspettativa
futura (meccanismo backward)
-un’altra equazione segue l’evoluzione nel tempo degli agenti
(meccanismo forward)
A. Porretta
Equilibri di Nash in teoria dei giochi
La peculiarità del modello è accoppiare decisioni strategiche e evoluzione
della situazione collettiva. Le strategie vengono prese anticipando
un’ipotesi di situazione collettiva; ma nel frattempo, le strategie
contribuiscono a modificare tale situazione.
sistemi di equazioni con struttura forward-backward nel tempo:
-un’equazione determina le strategie ottimali partendo da un aspettativa
futura (meccanismo backward)
-un’altra equazione segue l’evoluzione nel tempo degli agenti
(meccanismo forward)
Tuttavia l’una dipende dall’altra ! Se esiste, la soluzione è tipicamente
indice di un equilibrio tra aspettative dei singoli e comportamento
collettivo: il limite per N → ∞ degli equilibri di Nash.
A. Porretta
Equilibri di Nash in teoria dei giochi
Un esempio modello: a che ora si comincia ?
In una riunione con molti partecipanti, l’orario d’inizio fissato è T ∗ , ma la
riunione avrà effettivamente inizio al tempo T quando sarà raggiunto un
quorum adeguato, es. 80% dei partecipanti.
Ciascun partecipante ha una dinamica
dXti = αti dt + σ dBti
controllata attraverso la strategia αti , la quale produce un tempo di arrivo τ i ;
allo scopo di ottimizzare (anche con differenti pesi):

i

il tempo d’attesa dall’inizio effettivo (T − τ )+
i
il tempo di ritardo sull’inizio effettivo (τ − T )+


il tempo di ritardo sull’inizio previsto (τ i − T ∗ )+
Tuttavia, il tempo effettivo T dipende da quanti partecipanti sono arrivati !
A. Porretta
Equilibri di Nash in teoria dei giochi
Nell’approccio di campo medio, le grandezze macroscopiche sono:
-m(t, x) (distribuzione di probabilità dei partecipanti che si trovano in x
al tempo t - non ancora arrivati)
- u(t, x), funzione valore del generico partecipante che si trovasse in x al
tempo t.
• La strategia di ogni partecipante dipende dalla propria dinamica e dalla
evoluzione della massa m.
• L’evoluzione di m dipende dalle strategie dei partecipanti
A. Porretta
Equilibri di Nash in teoria dei giochi
Nell’approccio di campo medio, le grandezze macroscopiche sono:
-m(t, x) (distribuzione di probabilità dei partecipanti che si trovano in x
al tempo t - non ancora arrivati)
- u(t, x), funzione valore del generico partecipante che si trovasse in x al
tempo t.
• La strategia di ogni partecipante dipende dalla propria dinamica e dalla
evoluzione della massa m.
• L’evoluzione di m dipende dalle strategie dei partecipanti
Matematicamente: ci saranno due equazioni differenziali accoppiate, una
determina la strategia e l’ottimizzazione dei singoli, una determina
l’evoluzione dello stato collettivo !
A. Porretta
Equilibri di Nash in teoria dei giochi
Si osservi il tipico meccanismo forward-backward dei MFG:
i partecipanti presuppongono una distribuzione (temporale) m̄ e un
tempo effettivo T (m̄) conseguente a questa ipotesi sugli arrivi degli altri.
Costruiscono le loro strategie supponendo questa situazione futura,
attraverso il valore atteso u.
Le strategie determinano le dinamiche, e queste producono una reale
distribuzione m.
Una soluzione è rappresentata da un punto fisso: m = m̄, che esprime un
equilibrio tra anticipazioni razionali e comportamenti individuali.
A. Porretta
Equilibri di Nash in teoria dei giochi
La risoluzione matematica di simili modelli richiede strumenti molto
raffinati.
Alcuni tipici risultati della teoria:
In alcuni casi il sistema limite ammette un unico equilibrio
(semplificazione del gioco ! ) ottenuto come limite di equilibri di
Nash nel gioco a N giocatori.
(tale equilibrio può essere interpretato come un ottimo di Pareto)
questo equilibrio fornisce un “quasi ” equilibrio di Nash per il gioco a
N giocatori, se N è grande.
il modello macroscopico consente di costruire buone
approssimazioni di equilibri di Nash.
A. Porretta
Equilibri di Nash in teoria dei giochi
La risoluzione matematica di simili modelli richiede strumenti molto
raffinati.
Alcuni tipici risultati della teoria:
In alcuni casi il sistema limite ammette un unico equilibrio
(semplificazione del gioco ! ) ottenuto come limite di equilibri di
Nash nel gioco a N giocatori.
(tale equilibrio può essere interpretato come un ottimo di Pareto)
questo equilibrio fornisce un “quasi ” equilibrio di Nash per il gioco a
N giocatori, se N è grande.
il modello macroscopico consente di costruire buone
approssimazioni di equilibri di Nash.
Il sistema macroscopico può ammettere buone simulazioni numeriche
al computer. Fornisce un modello gestibile per molte potenziali
applicazioni.
A. Porretta
Equilibri di Nash in teoria dei giochi
Grazie dell’attenzione....
...E in bocca al lupo per le vostre scelte !!!
A. Porretta
Equilibri di Nash in teoria dei giochi