Equilibri di Nash in teoria dei giochi Alessio Porretta Universita’ di Roma Tor Vergata A. Porretta Equilibri di Nash in teoria dei giochi Gli elementi tipici di un gioco: -un numero di agenti (o giocatori): 1, . . . , N -Un insieme di strategie Qi per l’i-esimo agente. oss: Qi può essere un insieme discreto (es. la scelta è binaria: si’ oppure no) ma anche un insieme continuo, es. tutte le volte che Qi è un insieme numerico di grandezze continue (per esempio, la strategia è una velocità, una percentuale, etc...) A. Porretta Equilibri di Nash in teoria dei giochi Gli elementi tipici di un gioco: -un numero di agenti (o giocatori): 1, . . . , N -Un insieme di strategie Qi per l’i-esimo agente. oss: Qi può essere un insieme discreto (es. la scelta è binaria: si’ oppure no) ma anche un insieme continuo, es. tutte le volte che Qi è un insieme numerico di grandezze continue (per esempio, la strategia è una velocità, una percentuale, etc...) -una funzione di utilità (cosiddetto pay-off) da ottimizzare, per ciascun agente: Ji (α1 , . . . , αN ) dipendente dalle strategie αi di tutti gli agenti A. Porretta Equilibri di Nash in teoria dei giochi Equilibrio di Nash La nozione di equilibrio introdotta da J. Nash (1949): un insieme di strategie è un equilibrio (di Nash) se nessun giocatore ha interesse a cambiare la strategia a meno che non la cambi anche qualcun altro A. Porretta Equilibri di Nash in teoria dei giochi Equilibrio di Nash La nozione di equilibrio introdotta da J. Nash (1949): un insieme di strategie è un equilibrio (di Nash) se nessun giocatore ha interesse a cambiare la strategia a meno che non la cambi anche qualcun altro Tradotto in linguaggio matematico: α = (α1 , . . . , αN ) è un equilibrio di Nash se Ji (α1 , . . . , αi−1 , αi , αi+1 , . . . , αN ) ≥ Ji (α1 , . . . , αi−1 , β, αi+1 , . . . , αN ) ∀β ∈ Qi , ∀i = 1...N Ovvero: tenendo ferme le scelte degli altri, nessuno cambierebbe la sua. A. Porretta Equilibri di Nash in teoria dei giochi Il dilemma del prigioniero Due complici che hanno commesso un crimine sono detenuti in celle separate e vengono interrogati simultaneamente. Gli investigatori hanno poche prove e possono incriminarli solo per piccoli reati, ma se uno collabora, denunciando l’altro, avrà dei vantaggi. A. Porretta Equilibri di Nash in teoria dei giochi Il dilemma del prigioniero Due complici che hanno commesso un crimine sono detenuti in celle separate e vengono interrogati simultaneamente. Gli investigatori hanno poche prove e possono incriminarli solo per piccoli reati, ma se uno collabora, denunciando l’altro, avrà dei vantaggi. Ciascun prigioniero fronteggia il seguente dilemma: • se denuncia il compare, e l’altro non parla, può essere rilasciato. • se entrambi denunciassero l’altro, avranno uno sconto di pena (diciamo 5 anni l’uno) • se entrambi tacciono, avranno un’accusa per piccoli reati (diciamo 1 anno ciascuno) • se lui tace ma l’altro lo denucia, avra’ l’intera pena di 10 anni. Tale situazione si può schematizzare nella seguente matrice: A. Porretta Equilibri di Nash in teoria dei giochi Giocatore 2 Giocatore 1 Denuncia Non denuncia Denuncia Non denuncia 5,5 10,0 0,10 1,1 A. Porretta Equilibri di Nash in teoria dei giochi Giocatore 2 Giocatore 1 Denuncia Non denuncia Denuncia Non denuncia 5,5 10,0 0,10 1,1 In questo gioco c’è un unico equilibrio di Nash: la scelta in cui entrambi tradiscono A. Porretta Equilibri di Nash in teoria dei giochi Giocatore 2 Giocatore 1 Denuncia Non denuncia Denuncia Non denuncia 5,5 10,0 0,10 1,1 In questo gioco c’è un unico equilibrio di Nash: la scelta in cui entrambi tradiscono Giocatore 2 Denuncia Giocatore 1 Denuncia Non denuncia Non denuncia 5,5 10,0 A. Porretta Equilibri di Nash in teoria dei giochi Giocatore 2 Giocatore 1 Denuncia Non denuncia Denuncia Non denuncia 5,5 10,0 0,10 1,1 Questo esempio mostra che l’equilibrio di Nash non è necessariamente la migliore soluzione possibile né individualmente né collettivamente. A. Porretta Equilibri di Nash in teoria dei giochi Giocatore 2 Giocatore 1 Denuncia Non denuncia Denuncia Non denuncia 5,5 10,0 0,10 1,1 Questo esempio mostra che l’equilibrio di Nash non è necessariamente la migliore soluzione possibile né individualmente né collettivamente. Esiste una soluzione migliore per entrambi: quello che gli economisti chiamano un (equilibrio) ottimo di Pareto: la strategia migliore per tutti. In altri termini: in un equilibrio di Pareto, qualunque giocatore cambi strategia ve ne sarà almeno uno che dovrà peggiorare. Si parla di equilibrio efficiente; in questo caso la situazione in cui entrambi tacciono: (1, 1). A. Porretta Equilibri di Nash in teoria dei giochi The “chicken game”: il gioco del codardo Due individui si sfidano per mostrare chi è piu’ coraggioso, guidando a tutta velocità verso una scogliera (Gioventù bruciata !!). Mentre il precipizio si avvicina, affrontano un atroce dilemma: - se uno si butta troppo presto, prima che l’altro lo faccia, sarà bollato come codardo -se entrambi si buttano insieme, prima del baratro, salvano la pelle. ma non possono dire di aver vinto. -se entrambi aspettano troppo, può essere tardi: si rischia la morte. A. Porretta Equilibri di Nash in teoria dei giochi Due macchine all’incrocio Vi propongo una variante più frequente nella nostra quotidianità: cosa accade quando due macchine giungono a un incrocio senza semaforo ? A. Porretta Equilibri di Nash in teoria dei giochi Due macchine all’incrocio Vi propongo una variante più frequente nella nostra quotidianità: cosa accade quando due macchine giungono a un incrocio senza semaforo ? Due macchine giungono contemporanamente a un incrocio (senza semaforo, senza precedenze... insomma un tipico incrocio a Roma). Può succedere che A. Porretta Equilibri di Nash in teoria dei giochi Due macchine all’incrocio Vi propongo una variante più frequente nella nostra quotidianità: cosa accade quando due macchine giungono a un incrocio senza semaforo ? Due macchine giungono contemporanamente a un incrocio (senza semaforo, senza precedenze... insomma un tipico incrocio a Roma). Può succedere che • uno decide di fermarsi e l’altro decide di passare: uno solo sarà contento, diciamo (0, 1) oppure (1, 0). • entrambi decidono di passare, e ci sarà un incidente: (−1, −1). • entrambi si fermano: niente incidente, ma uno sgradevole stallo, e tempo perso...: (0, 0) Tale situazione si può schematizzare nella seguente matrice: A. Porretta Equilibri di Nash in teoria dei giochi Giocatore 2 passa Giocatore 1 passa si ferma si ferma -1,-1 0,1 1,0 0,0 In questo gioco ci sono due equilibri di Nash: (0, 1) oppure (1, 0). Entrambi lasciano uno dei due insoddisfatto... A. Porretta Equilibri di Nash in teoria dei giochi Giocatore 2 passa Giocatore 1 passa si ferma si ferma -1,-1 0,1 1,0 0,0 In questo gioco ci sono due equilibri di Nash: (0, 1) oppure (1, 0). Entrambi lasciano uno dei due insoddisfatto... A. Porretta Equilibri di Nash in teoria dei giochi Riassunto: gli equilibri di Nash sono soluzioni che possono crearsi nell’incertezza delle decisioni degli altri. Mostrano la complessita’ del meccanismo decisionale. A volte non sono ottimali per nessuno, dando senso all’importanza di fare accordi; a volte non lo sono per qualcuno, mostrando la necessita’ di un compromesso; spesso ce ne sono piu’ di uno, mostrando la difficolta’ di previsione su quello che accadrà. A. Porretta Equilibri di Nash in teoria dei giochi Oss. sugli esempi precedenti: Si trattava di situazioni simmetriche: i giocatori erano interscambiabili Matematicamente, la trattazione del gioco segue questo iter: - definire gli insiemi di strategie possibili del singolo - comprendere il valore associato a ogni possibile scelta collettiva - dedurre da questo la strategia effettiva dei giocatori A. Porretta Equilibri di Nash in teoria dei giochi Oss. sugli esempi precedenti: Si trattava di situazioni simmetriche: i giocatori erano interscambiabili Matematicamente, la trattazione del gioco segue questo iter: - definire gli insiemi di strategie possibili del singolo - comprendere il valore associato a ogni possibile scelta collettiva - dedurre da questo la strategia effettiva dei giocatori Si osservi due punti chiave: (i) dedurre le strategie dalle aspettative future (ii) ciascuno ottimizza ipotizzando le scelte degli altri A. Porretta Equilibri di Nash in teoria dei giochi Giochi differenziali In molte situazioni, la strategia agisce su una dinamica da cui dipendono poi i costi/benefici/obiettivi... (es. meccanismi preda/cacciatore: si sceglie una velocità che influenza le rispettive posizioni) A. Porretta Equilibri di Nash in teoria dei giochi Giochi differenziali In molte situazioni, la strategia agisce su una dinamica da cui dipendono poi i costi/benefici/obiettivi... (es. meccanismi preda/cacciatore: si sceglie una velocità che influenza le rispettive posizioni) gli obiettivi sono definiti non solo all’istante finale ma lungo tutto un arco di tempo A. Porretta Equilibri di Nash in teoria dei giochi Es: meccanismi di produzione di risorse esauribili (es. petrolio): Per ciascun produttore i indichiamo Ri (t) = riserva esistente qi (t) = quantità prodotta ; una dinamica naturale lega queste due quantità : dRi = −qi (t) dt A. Porretta Equilibri di Nash in teoria dei giochi Es: meccanismi di produzione di risorse esauribili (es. petrolio): Per ciascun produttore i indichiamo Ri (t) = riserva esistente qi (t) = quantità prodotta ; una dinamica naturale lega queste due quantità : dRi = −qi (t) dt Gli obiettivi possono essere i guadagni nel periodo Z T {p(t, R(t))qi (t) − C (qi (t))} dt max 0 dove C (q) sono costi di produzione e p l’evoluzione dei prezzi. Punto chiave: p dipende anche da R(t) = (R1 , . . . , RN ) (i prezzi dipendono dalle riserve esistenti) A. Porretta Equilibri di Nash in teoria dei giochi Nei giochi differenziali, gli elementi tipici sono dunque: Un numero di agenti (o giocatori) i = 1, . . . , N. Una dinamica (deterministica o stocastica) che determina lo stato Xti dell’i-esimo agente al tempo t. Es: dXti = αti dt ( + σ dBti ) Una strategia di scelta individuale αti (una funzione, o una variabile aleatoria) che possa influenzare tale dinamica. A. Porretta Equilibri di Nash in teoria dei giochi Nei giochi differenziali, gli elementi tipici sono dunque: Un numero di agenti (o giocatori) i = 1, . . . , N. Una dinamica (deterministica o stocastica) che determina lo stato Xti dell’i-esimo agente al tempo t. Es: dXti = αti dt ( + σ dBti ) Una strategia di scelta individuale αti (una funzione, o una variabile aleatoria) che possa influenzare tale dinamica. Una funzione di utilità (da ottimizzare) nel tempo (τ, T ): Z T J i (α) = Li (t, Xti , αti , αt−i , Xt−i )dt + V i (XTi , XT−i ) τ dove αt−i e Xt−i sono le strategie e gli stati degli altri N − 1 giocatori. Gli equilibri di Nash sono definiti in modo analogo a prima. A. Porretta Equilibri di Nash in teoria dei giochi Per l’i-esimo giocatore, la funzione valore: u i (τ, x) = inf J i (α) , quando Xτi = x α rappresenta la migliore aspettativa che si ha partendo dalla condizione x al tempo τ . A. Porretta Equilibri di Nash in teoria dei giochi Per l’i-esimo giocatore, la funzione valore: u i (τ, x) = inf J i (α) , quando Xτi = x α rappresenta la migliore aspettativa che si ha partendo dalla condizione x al tempo τ . Matematicamente, la funzione valore risolve un’equazione differenziale. Risolvere tale equazione è fondamentale: infatti la strategia ottima è deducibile come feedback a partire dalla funzione valore A. Porretta Equilibri di Nash in teoria dei giochi La teoria dei Mean Field Games (2006 –...) Pb: Come gestire situazioni di massa ? Ovvero cosa accade con un numero molto grande di agenti razionali ? A. Porretta Equilibri di Nash in teoria dei giochi Negli ultimi anni, sono state sviluppate nuove idee e metodi per trattare situazioni in cui (a) si ha un numero molto grande di agenti indistinguibili tra loro (b) il singolo ha un microscopico impatto sulle strategie degli altri Ma d’altra parte, le strategie dipendono da quello che fa la massa degli altri giocatori A. Porretta Equilibri di Nash in teoria dei giochi Negli ultimi anni, sono state sviluppate nuove idee e metodi per trattare situazioni in cui (a) si ha un numero molto grande di agenti indistinguibili tra loro (b) il singolo ha un microscopico impatto sulle strategie degli altri Ma d’altra parte, le strategie dipendono da quello che fa la massa degli altri giocatori Applicazioni tipiche: - economia o finanza (numeri molto elevati di piccoli agenti finanziari) - dinamiche di consumi di massa (“reti intelligenti”, es. per consumi elettrici etc...) - dinamiche sociali (gruppi numerosi di individui razionali, es: meccanismi di voto, movimenti di una folla, dinamiche di conformismo/antagonismo in gruppi estesi) A. Porretta Equilibri di Nash in teoria dei giochi Microscopico → Macroscopico. Nella teoria dei mean field games, viene mutuato un paradigma ampiamente usato nella meccanica statistica: in sistemi con un numero molto grande di particelle risulta impossibile gestire le mutue interazioni (regolate dalla legge di Newton) o anche semplicemente misurare posizione & velocità delle singole particelle. L’approccio della meccanica statistica consiste nell’individuare grandezze macroscopiche, es. energia, entropia definite in termini di medie statistiche A. Porretta Equilibri di Nash in teoria dei giochi Microscopico → Macroscopico. Nella teoria dei mean field games, viene mutuato un paradigma ampiamente usato nella meccanica statistica: in sistemi con un numero molto grande di particelle risulta impossibile gestire le mutue interazioni (regolate dalla legge di Newton) o anche semplicemente misurare posizione & velocità delle singole particelle. L’approccio della meccanica statistica consiste nell’individuare grandezze macroscopiche, es. energia, entropia definite in termini di medie statistiche Si parla di teorie di campo medio: una volta specificato in che modo ogni particella microscopica contribuisce alla formazione del campo (es. definizione dell’energia, o dell’entropia), si studia l’evoluzione di grandezze macroscopiche per descrivere il fenomeno. A. Porretta Equilibri di Nash in teoria dei giochi In analogia, nella teoria dei Giochi di campo medio (Mean Field Games): gli agenti sono nella sostanza simili tra loro: hanno simili margini di scelta, simili dinamiche, simili obiettivi. Matematicamente si traduce in ipotesi di simmetria: gli insiemi delle strategie Qi sono gli stessi, costi/benefici sono analoghi, permutare gli agenti non cambia il gioco... A. Porretta Equilibri di Nash in teoria dei giochi In analogia, nella teoria dei Giochi di campo medio (Mean Field Games): gli agenti sono nella sostanza simili tra loro: hanno simili margini di scelta, simili dinamiche, simili obiettivi. Matematicamente si traduce in ipotesi di simmetria: gli insiemi delle strategie Qi sono gli stessi, costi/benefici sono analoghi, permutare gli agenti non cambia il gioco... le interazioni reciproche individuali sono sostituite dall’interazione del singolo con la massa Ma c’è una differenza fondamentale con la meccanica statistica: ora le particelle sono agenti razionali con meccanismi di scelta. Non si tratta solo di interazioni individuo-massa bensi’ di interazioni strategiche. Oltre a descrivere un fenomeno di massa, si vuole anche descrivere il perché ciò avviene, ovvero i meccanismi decisionali che sottendono un certo fenomeno A. Porretta Equilibri di Nash in teoria dei giochi La peculiarità del modello è accoppiare decisioni strategiche e evoluzione della situazione collettiva. Le strategie vengono prese anticipando un’ipotesi di situazione collettiva; ma nel frattempo, le strategie contribuiscono a modificare tale situazione. A. Porretta Equilibri di Nash in teoria dei giochi La peculiarità del modello è accoppiare decisioni strategiche e evoluzione della situazione collettiva. Le strategie vengono prese anticipando un’ipotesi di situazione collettiva; ma nel frattempo, le strategie contribuiscono a modificare tale situazione. sistemi di equazioni con struttura forward-backward nel tempo: -un’equazione determina le strategie ottimali partendo da un aspettativa futura (meccanismo backward) -un’altra equazione segue l’evoluzione nel tempo degli agenti (meccanismo forward) A. Porretta Equilibri di Nash in teoria dei giochi La peculiarità del modello è accoppiare decisioni strategiche e evoluzione della situazione collettiva. Le strategie vengono prese anticipando un’ipotesi di situazione collettiva; ma nel frattempo, le strategie contribuiscono a modificare tale situazione. sistemi di equazioni con struttura forward-backward nel tempo: -un’equazione determina le strategie ottimali partendo da un aspettativa futura (meccanismo backward) -un’altra equazione segue l’evoluzione nel tempo degli agenti (meccanismo forward) Tuttavia l’una dipende dall’altra ! Se esiste, la soluzione è tipicamente indice di un equilibrio tra aspettative dei singoli e comportamento collettivo: il limite per N → ∞ degli equilibri di Nash. A. Porretta Equilibri di Nash in teoria dei giochi Un esempio modello: a che ora si comincia ? In una riunione con molti partecipanti, l’orario d’inizio fissato è T ∗ , ma la riunione avrà effettivamente inizio al tempo T quando sarà raggiunto un quorum adeguato, es. 80% dei partecipanti. Ciascun partecipante ha una dinamica dXti = αti dt + σ dBti controllata attraverso la strategia αti , la quale produce un tempo di arrivo τ i ; allo scopo di ottimizzare (anche con differenti pesi): i il tempo d’attesa dall’inizio effettivo (T − τ )+ i il tempo di ritardo sull’inizio effettivo (τ − T )+ il tempo di ritardo sull’inizio previsto (τ i − T ∗ )+ Tuttavia, il tempo effettivo T dipende da quanti partecipanti sono arrivati ! A. Porretta Equilibri di Nash in teoria dei giochi Nell’approccio di campo medio, le grandezze macroscopiche sono: -m(t, x) (distribuzione di probabilità dei partecipanti che si trovano in x al tempo t - non ancora arrivati) - u(t, x), funzione valore del generico partecipante che si trovasse in x al tempo t. • La strategia di ogni partecipante dipende dalla propria dinamica e dalla evoluzione della massa m. • L’evoluzione di m dipende dalle strategie dei partecipanti A. Porretta Equilibri di Nash in teoria dei giochi Nell’approccio di campo medio, le grandezze macroscopiche sono: -m(t, x) (distribuzione di probabilità dei partecipanti che si trovano in x al tempo t - non ancora arrivati) - u(t, x), funzione valore del generico partecipante che si trovasse in x al tempo t. • La strategia di ogni partecipante dipende dalla propria dinamica e dalla evoluzione della massa m. • L’evoluzione di m dipende dalle strategie dei partecipanti Matematicamente: ci saranno due equazioni differenziali accoppiate, una determina la strategia e l’ottimizzazione dei singoli, una determina l’evoluzione dello stato collettivo ! A. Porretta Equilibri di Nash in teoria dei giochi Si osservi il tipico meccanismo forward-backward dei MFG: i partecipanti presuppongono una distribuzione (temporale) m̄ e un tempo effettivo T (m̄) conseguente a questa ipotesi sugli arrivi degli altri. Costruiscono le loro strategie supponendo questa situazione futura, attraverso il valore atteso u. Le strategie determinano le dinamiche, e queste producono una reale distribuzione m. Una soluzione è rappresentata da un punto fisso: m = m̄, che esprime un equilibrio tra anticipazioni razionali e comportamenti individuali. A. Porretta Equilibri di Nash in teoria dei giochi La risoluzione matematica di simili modelli richiede strumenti molto raffinati. Alcuni tipici risultati della teoria: In alcuni casi il sistema limite ammette un unico equilibrio (semplificazione del gioco ! ) ottenuto come limite di equilibri di Nash nel gioco a N giocatori. (tale equilibrio può essere interpretato come un ottimo di Pareto) questo equilibrio fornisce un “quasi ” equilibrio di Nash per il gioco a N giocatori, se N è grande. il modello macroscopico consente di costruire buone approssimazioni di equilibri di Nash. A. Porretta Equilibri di Nash in teoria dei giochi La risoluzione matematica di simili modelli richiede strumenti molto raffinati. Alcuni tipici risultati della teoria: In alcuni casi il sistema limite ammette un unico equilibrio (semplificazione del gioco ! ) ottenuto come limite di equilibri di Nash nel gioco a N giocatori. (tale equilibrio può essere interpretato come un ottimo di Pareto) questo equilibrio fornisce un “quasi ” equilibrio di Nash per il gioco a N giocatori, se N è grande. il modello macroscopico consente di costruire buone approssimazioni di equilibri di Nash. Il sistema macroscopico può ammettere buone simulazioni numeriche al computer. Fornisce un modello gestibile per molte potenziali applicazioni. A. Porretta Equilibri di Nash in teoria dei giochi Grazie dell’attenzione.... ...E in bocca al lupo per le vostre scelte !!! A. Porretta Equilibri di Nash in teoria dei giochi