Gli uni e gli altri. Strategie in contesti di massa Alessio Porretta Universita’ di Roma Tor Vergata A. Porretta Gli uni e gli altri. Strategie in contesti di massa Gli elementi tipici di un gioco: -un numero di agenti (o giocatori): 1, . . . , N -Un insieme di strategie Qi per l’i-esimo agente. oss: Qi può essere un insieme discreto (es. la scelta è binaria: si’ oppure no) ma anche un insieme continuo, es. tutte le volte che Qi è un insieme numerico di grandezze continue (per esempio, la strategia è una velocità, una percentuale, etc...) -una funzione di utilità (cosiddetto pay-off) da ottimizzare, per ciascun agente: Ji (α1 , . . . , αN ) dipendente dalle strategie αi di tutti gli agenti A. Porretta Gli uni e gli altri. Strategie in contesti di massa Equilibrio di Nash La nozione di equilibrio introdotta da J. Nash (1949): un insieme di strategie è un equilibrio (di Nash) se nessun giocatore ha interesse a cambiare la strategia a meno che non la cambi anche qualcun altro Tradotto in linguaggio matematico: α = (α1 , . . . , αN ) è un equilibrio di Nash se Ji (α1 , . . . , αi−1 , αi , αi+1 , . . . , αN ) ≥ Ji (α1 , . . . , αi−1 , β, αi+1 , . . . , αN ) ∀β ∈ Qi , ∀i = 1...N Ovvero: tenendo ferme le scelte degli altri, nessuno cambierebbe la sua. A. Porretta Gli uni e gli altri. Strategie in contesti di massa Il dilemma del prigioniero Due complici che hanno commesso un crimine sono detenuti in celle separate e vengono interrogati simultaneamente. Gli investigatori hanno poche prove e possono incriminarli solo per piccoli reati, ma se uno collabora, denunciando l’altro, avrà dei vantaggi. Ciascun prigioniero fronteggia il seguente dilemma: • se denuncia il compare, e l’altro non parla, può essere rilasciato. • se entrambi denunciassero l’altro, avranno uno sconto di pena (diciamo 5 anni l’uno) • se entrambi tacciono, avranno un’accusa per piccoli reati (diciamo 1 anno ciascuno) • se lui tace ma l’altro lo denucia, avra’ l’intera pena di 10 anni. Tale situazione si può schematizzare nella seguente matrice: A. Porretta Gli uni e gli altri. Strategie in contesti di massa Giocatore 2 Giocatore 1 Denuncia Non denuncia Denuncia Non denuncia 5,5 10,0 0,10 1,1 In questo gioco c’è un unico equilibrio di Nash: la scelta in cui entrambi tradiscono Giocatore 2 Denuncia Giocatore 1 Denuncia Non denuncia Non denuncia 5,5 10,0 Giocatore 2 Denuncia Giocatore 1 Denuncia 5,5 Non denuncia 0,10 Non denuncia A. Porretta Gli uni e gli altri. Strategie in contesti di massa Giocatore 2 Giocatore 1 Denuncia Non denuncia Denuncia Non denuncia 5,5 10,0 0,10 1,1 Questo esempio mostra che l’equilibrio di Nash non è necessariamente la migliore soluzione possibile né individualmente né collettivamente. Esiste una soluzione migliore per entrambi: quello che gli economisti chiamano un (equilibrio) ottimo di Pareto: la strategia migliore per tutti. In altri termini: in un equilibrio di Pareto, qualunque giocatore cambi strategia ve ne sarà almeno uno che dovrà peggiorare. Si parla di equilibrio efficiente; in questo caso la situazione in cui entrambi tacciono: (1, 1). A. Porretta Gli uni e gli altri. Strategie in contesti di massa La caccia al cervo [d’apres JJ Rousseau] Due uomini vanno a caccia e decidono separatamente se andar dietro a un cervo o a una lepre. Sanno che il cervo potrà essere cacciato solo se saranno in due, ma non sanno cosa l’altro sceglierà di fare. Il loro schema strategie-guadagno può essere il seguente: • se entrambi decidono di cacciare il cervo, avranno il massimo risultato (diciamo (10, 10)). • se uno decide di cacciare il cervo, tuttavia rischia di restare solo e non aver nulla alla fine. • scegliendo di cacciare la lepre, avranno un risultato sicuro anche se non ottimale (diciamo (1, 1)). Tale situazione si può schematizzare nella seguente matrice: A. Porretta Gli uni e gli altri. Strategie in contesti di massa Giocatore 2 cervo Giocatore 1 cervo lepre 10,10 1,0 lepre 0,1 1,1 In questo gioco ci sono due equilibri di Nash: la scelta cooperativa (in cui si coordinano per cacciare il cervo (10, 10)) ma anche quella individualista (in cui entrambi cacciano una lepre (1, 1)). In questo esempio lo studio degli equilibri di Nash suggerisce una politica di accordo tra i giocatori. A. Porretta Gli uni e gli altri. Strategie in contesti di massa The “chicken game”: il gioco del codardo Due individui si sfidano per mostrare chi è piu’ coraggioso, guidando a tutta velocità verso una scogliera (Gioventù bruciata !!). Mentre il precipizio si avvicina, affrontano un atroce dilemma: - se uno si butta troppo presto, prima che l’altro lo faccia, sarà bollato come codardo -se entrambi si buttano insieme, prima del baratro, salvano la pelle. ma non possono dire di aver vinto. -se entrambi aspettano troppo, può essere tardi: si rischia la morte. A. Porretta Gli uni e gli altri. Strategie in contesti di massa Due macchine all’incrocio Vi propongo una variante più frequente nella nostra quotidianità: cosa accade quando due macchine giungono a un incrocio senza semaforo ? Due macchine giungono contemporanamente a un incrocio (senza semaforo, senza precedenze... insomma un normale incrocio a Roma). Può succedere che • uno decide di fermarsi e l’altro decide di passare: uno solo sarà contento, diciamo (0, 1) oppure (1, 0). • entrambi decidono di passare, e ci sarà un incidente: (−1, −1). • entrambi si fermano: niente incidente, ma uno sgradevole stallo, e tempo perso...: (0, 0) Tale situazione si può schematizzare nella seguente matrice: A. Porretta Gli uni e gli altri. Strategie in contesti di massa Giocatore 2 passa Giocatore 1 passa si ferma -1,-1 0,1 si ferma 1,0 0,0 In questo gioco ci sono due equilibri di Nash: (0, 1) oppure (1, 0). Entrambi lasciano uno dei due insoddisfatto... In questo esempio lo studio degli equilibri di Nash suggerisce un intervento regolatore esterno: un semaforo ! Riassunto: gli equilibri di Nash sono soluzioni che possono crearsi nell’incertezza delle decisioni degli altri. Mostrano la complessita’ del meccanismo decisionale. A volte non sono ottimali per nessuno, dando senso all’importanza di fare accordi; a volte non lo sono per qualcuno, mostrando la necessita’ di un compromesso; spesso ce ne sono piu’ di uno, mostrando la difficolta’ di previsione su quello che accadrà. A. Porretta Gli uni e gli altri. Strategie in contesti di massa Oss. sugli esempi precedenti: Si trattava di situazioni simmetriche: i giocatori erano interscambiabili Matematicamente, la trattazione del gioco segue questo iter: - definire gli insiemi di strategie possibili del singolo - comprendere il valore associato a ogni possibile scelta collettiva - dedurre da questo la strategia effettiva dei giocatori Si osservi la natura del fenomeno: dedurre le strategie dalle aspettative future. A. Porretta Gli uni e gli altri. Strategie in contesti di massa Giochi differenziali In molte situazioni, la strategia agisce su una dinamica da cui dipendono poi i costi/benefici/obiettivi... (es. meccanismi preda/cacciatore: si sceglie una velocità che influenza le rispettive posizioni) gli obiettivi sono definiti non solo all’istante finale ma lungo tutto un arco di tempo A. Porretta Gli uni e gli altri. Strategie in contesti di massa Es: meccanismi di produzione di risorse esauribili (es. petrolio): q(t) = quantità prodotta ; R(t) = riserva esistente una dinamica naturale lega queste due quantità : dR = −q(t) dt Gli obiettivi possono essere i guadagni nel periodo Z T max {p(t, R(t))q(t) − C (q(t))} dt 0 dove C (q) sono costi di produzione e p l’evoluzione dei prezzi. oss: p dipende anche da R(t) (i prezzi dipendono dalle riserve esistenti) A. Porretta Gli uni e gli altri. Strategie in contesti di massa Nei giochi differenziali, gli elementi tipici sono dunque: Un numero di agenti (o giocatori) i = 1, . . . , N. Una dinamica (deterministica o stocastica) che determina lo stato Xti dell’i-esimo agente al tempo t. Es: dXti = αti dt ( + σ dBti ) Una strategia di scelta individuale αti (una funzione, o una variabile aleatoria) che possa influenzare tale dinamica. Una funzione di utilità (da ottimizzare) nel tempo (τ, T ): Z T i J (α) = Li (t, Xti , αti , αt−i , Xt−i )dt + V i (XTi , XT−i ) τ αt−i dove e giocatori. Xt−i sono le strategie e gli stati degli altri N − 1 Gli equilibri di Nash sono definiti in modo analogo a prima. A. Porretta Gli uni e gli altri. Strategie in contesti di massa Per l’i-esimo giocatore, la funzione valore: u i (τ, x) = inf J i (α) , quando Xτi = x α rappresenta la migliore aspettativa che si ha partendo dalla condizione x al tempo τ . Matematicamente, la funzione valore risolve un’equazione differenziale. Risolvere tale equazione è fondamentale: infatti la strategia ottima è deducibile come feedback a partire dalla funzione valore A. Porretta Gli uni e gli altri. Strategie in contesti di massa Mean Field Games Pb: Come gestire situazioni di massa ? Ovvero cosa accade con un numero molto grande di agenti razionali ? Negli ultimi anni, sono state sviluppate nuove idee e metodi per trattare giochi in cui (a) si ha un numero molto grande di agenti indistinguibili tra loro (b) il singolo ha un microscopico impatto sulle strategie degli altri Ma d’altra parte, le strategie dipendono da quello che fa la massa degli altri giocatori Situazioni tipiche: -nella finanza (numeri molto elevati di piccoli agenti finanziari) -nelle dinamiche di consumi di massa (“reti intelligenti”, es. per consumi elettrici etc...) -nelle dinamiche sociali (gruppi numerosi di individui razionali, es: meccanismi di voto, movimenti di una folla, dinamiche di conformismo/antagonismo in gruppi estesi) Microscopico → Macroscopico. Nella teoria dei giochi a campo medio, viene mutuato un paradigma ampiamente usato nella meccanica statistica: in sistemi con un numero molto grande di particelle risulta impossibile gestire le mutue interazioni (regolate dalla legge di Newton) o anche semplicemente misurare posizione & velocità delle singole particelle. L’approccio della meccanica statistica consiste nell’individuare grandezze macroscopiche, es. energia, entropia definite in termini di medie statistiche Si parla di teorie di campo medio: una volta specificato in che modo ogni particella microscopica contribuisce alla formazione del campo (es. definizione dell’energia, o dell’entropia), si studia l’evoluzione di grandezze macroscopiche per descrivere il fenomeno. In analogia, nella teoria dei Giochi di campo medio (Mean Field Games): gli agenti sono nella sostanza simili tra loro: hanno simili margini di scelta, simili dinamiche, simili obiettivi. Matematicamente si traduce in ipotesi di simmetria: gli insiemi delle strategie Qi sono gli stessi, costi/benefici sono analoghi, permutare gli agenti non cambia il gioco... le interazioni reciproche individuali sono sostituite dall’interazione del singolo con un campo medio che in questo caso è una media sullo stato degli agenti. Ma c’è una differenza fondamentale con la meccanica statistica: ora le particelle sono agenti razionali con meccanismi di scelta. Non si tratta solo di interazioni individuo-massa bensi’ di interazioni strategiche. Oltre a descrivere un fenomeno di massa, si vuole anche descrivere il perché ciò avviene, ovvero i meccanismi decisionali che sottendono un certo fenomeno (potenziale applicazione in biologia,etc...) La peculiarità del modello è nell’accoppiamento tra decisioni strategiche e evoluzione della situazione collettiva. Le strategia vengono prese anticipando un’ipotesi di situazione collettiva; ma una volta attuate, le strategie contribuiscono a modificare tale situazione. Matematicamente, il sistema derivato nel limite di campo medio ha una struttura forward-backward nel tempo: -un’equazione determina le strategie ottimali partendo da un aspettativa futura (meccanismo backward) -un’altra equazione segue l’evoluzione nel tempo degli agenti (meccanismo forward) Tuttavia l’una dipende dall’altra ! La soluzione è tipicamente indice di un equilibrio tra decisioni collettive e mutamento delle condizioni individuali: il limite per N → ∞ degli equilibri di Nash. Un esempio modello: a che ora si comincia ? In una riunione con molti partecipanti, l’orario d’inizio fissato è T ∗ , ma la riunione avrà effettivamente inizio al tempo T quando sarà raggiunto un quorum adeguato, es. 80% dei partecipanti. Ciascun partecipante ha una dinamica dXti = αti dt + σ dBti controllata attraverso la strategia αti , la quale produce un tempo di arrivo τ i ; allo scopo di ottimizzare (anche con differenti pesi): 8 i > <il tempo d’attesa dall’inizio effettivo (T − τ )+ i il tempo di ritardo sull’inizio effettivo (τ − T )+ > : il tempo di ritardo sull’inizio previsto (τ i − T ∗ )+ Tuttavia, il tempo effettivo T dipende da quanti partecipanti sono arrivati ! Nell’approccio di campo medio (agenti indistinguibili), le grandezze macroscopiche che descrivono il fenomeno sono: -m(t, x) (distribuzione di probabilità dei partecipanti che si trovano in x al tempo t - non ancora arrivati) - u(t, x), funzione valore del generico partecipante che si trovasse in x al tempo t. • La strategia di ogni partecipante dipende quindi dalla propria dinamica e dal campo medio m. • L’evoluzione di m dipende dalle strategie dei partecipanti (m è distribuzione di probabilità associata al generico stato Xt ) Ora ci saranno due equazioni differenziali accoppiate, una per la strategia, una per il campo medio ! Si osservi il tipico meccanismo forward-backward dei MFG: i partecipanti presuppongono una distribuzione (temporale) m̄ e un tempo effettivo T (m̄) conseguente a questa ipotesi sugli arrivi degli altri. Costruiscono le loro strategie supponendo questa situazione futura, attraverso il valore atteso u. Le strategie determinano le dinamiche, e queste producono una reale distribuzione m. Una soluzione è rappresentata da un punto fisso: m = m̄, che esprime un equilibrio tra anticipazioni razionali e comportamenti individuali. La risoluzione matematica di simili modelli richiede strumenti molto raffinati. Alcuni tipici risultati della teoria: In alcuni casi il sistema limite ammette un unico equilibrio (semplificazione del gioco ! ) ottenuto come limite di equilibri di Nash nel gioco a N giocatori. (tale equilibrio può essere interpretato come un ottimo di Pareto) Inoltre, questo equilibrio fornisce un’ “quasi ” equilibrio di Nash per il gioco a N giocatori, se N è grande. Ovvero il modello macroscopico consente di costruire buone approssimazioni di equilibri di Nash. Il sistema macroscopico può ammettere buone simulazioni numeriche al computer. Fornisce un modello gestibile per molte potenziali applicazioni. Grazie dell’attenzione.... ...E in bocca al lupo per le vostre scelte !!!