Gli uni e gli altri. Strategie in contesti di massa

Gli uni e gli altri.
Strategie in contesti di massa
Alessio Porretta
Universita’ di Roma Tor Vergata
A. Porretta
Gli uni e gli altri. Strategie in contesti di massa
Gli elementi tipici di un gioco:
-un numero di agenti (o giocatori): 1, . . . , N
-Un insieme di strategie Qi per l’i-esimo agente.
oss: Qi può essere un insieme discreto (es. la scelta è binaria:
si’ oppure no) ma anche un insieme continuo, es. tutte le volte
che Qi è un insieme numerico di grandezze continue (per
esempio, la strategia è una velocità, una percentuale, etc...)
-una funzione di utilità (cosiddetto pay-off) da ottimizzare, per
ciascun agente:
Ji (α1 , . . . , αN )
dipendente dalle strategie αi di tutti gli agenti
A. Porretta
Gli uni e gli altri. Strategie in contesti di massa
Equilibrio di Nash
La nozione di equilibrio introdotta da J. Nash (1949):
un insieme di strategie è un equilibrio (di Nash) se nessun
giocatore ha interesse a cambiare la strategia a meno che non
la cambi anche qualcun altro
Tradotto in linguaggio matematico:
α = (α1 , . . . , αN )
è un equilibrio di Nash se
Ji (α1 , . . . , αi−1 , αi , αi+1 , . . . , αN ) ≥ Ji (α1 , . . . , αi−1 , β, αi+1 , . . . , αN )
∀β ∈ Qi ,
∀i = 1...N
Ovvero: tenendo ferme le scelte degli altri, nessuno cambierebbe la
sua.
A. Porretta
Gli uni e gli altri. Strategie in contesti di massa
Il dilemma del prigioniero
Due complici che hanno commesso un crimine sono detenuti in
celle separate e vengono interrogati simultaneamente. Gli
investigatori hanno poche prove e possono incriminarli solo per
piccoli reati, ma se uno collabora, denunciando l’altro, avrà dei
vantaggi.
Ciascun prigioniero fronteggia il seguente dilemma:
• se denuncia il compare, e l’altro non parla, può essere rilasciato.
• se entrambi denunciassero l’altro, avranno uno sconto di pena
(diciamo 5 anni l’uno)
• se entrambi tacciono, avranno un’accusa per piccoli reati
(diciamo 1 anno ciascuno)
• se lui tace ma l’altro lo denucia, avra’ l’intera pena di 10 anni.
Tale situazione si può schematizzare nella seguente matrice:
A. Porretta
Gli uni e gli altri. Strategie in contesti di massa
Giocatore 2
Giocatore 1
Denuncia
Non denuncia
Denuncia
Non denuncia
5,5
10,0
0,10
1,1
In questo gioco c’è un unico equilibrio di Nash: la scelta in
cui entrambi tradiscono
Giocatore 2
Denuncia
Giocatore 1
Denuncia
Non denuncia
Non denuncia
5,5
10,0
Giocatore 2
Denuncia
Giocatore 1
Denuncia
5,5
Non denuncia
0,10
Non denuncia
A. Porretta
Gli uni e gli altri. Strategie in contesti di massa
Giocatore 2
Giocatore 1
Denuncia
Non denuncia
Denuncia
Non denuncia
5,5
10,0
0,10
1,1
Questo esempio mostra che l’equilibrio di Nash non è
necessariamente la migliore soluzione possibile né
individualmente né collettivamente.
Esiste una soluzione migliore per entrambi: quello che gli
economisti chiamano un (equilibrio) ottimo di Pareto: la
strategia migliore per tutti.
In altri termini: in un equilibrio di Pareto, qualunque giocatore
cambi strategia ve ne sarà almeno uno che dovrà peggiorare.
Si parla di equilibrio efficiente; in questo caso la situazione in
cui entrambi tacciono: (1, 1).
A. Porretta
Gli uni e gli altri. Strategie in contesti di massa
La caccia al cervo [d’apres JJ Rousseau]
Due uomini vanno a caccia e decidono separatamente se andar
dietro a un cervo o a una lepre. Sanno che il cervo potrà essere
cacciato solo se saranno in due, ma non sanno cosa l’altro sceglierà
di fare.
Il loro schema strategie-guadagno può essere il seguente:
• se entrambi decidono di cacciare il cervo, avranno il massimo
risultato (diciamo (10, 10)).
• se uno decide di cacciare il cervo, tuttavia rischia di restare solo e
non aver nulla alla fine.
• scegliendo di cacciare la lepre, avranno un risultato sicuro anche
se non ottimale (diciamo (1, 1)).
Tale situazione si può schematizzare nella seguente matrice:
A. Porretta
Gli uni e gli altri. Strategie in contesti di massa
Giocatore 2
cervo
Giocatore 1
cervo
lepre
10,10
1,0
lepre
0,1
1,1
In questo gioco ci sono due equilibri di Nash: la scelta
cooperativa (in cui si coordinano per cacciare il cervo
(10, 10)) ma anche quella individualista (in cui entrambi
cacciano una lepre (1, 1)).
In questo esempio lo studio degli equilibri di Nash suggerisce
una politica di accordo tra i giocatori.
A. Porretta
Gli uni e gli altri. Strategie in contesti di massa
The “chicken game”: il gioco del codardo
Due individui si sfidano per mostrare chi è piu’ coraggioso,
guidando a tutta velocità verso una scogliera (Gioventù bruciata
!!). Mentre il precipizio si avvicina, affrontano un atroce dilemma:
- se uno si butta troppo presto, prima che l’altro lo faccia, sarà
bollato come codardo
-se entrambi si buttano insieme, prima del baratro, salvano la pelle.
ma non possono dire di aver vinto.
-se entrambi aspettano troppo, può essere tardi: si rischia la
morte.
A. Porretta
Gli uni e gli altri. Strategie in contesti di massa
Due macchine all’incrocio
Vi propongo una variante più frequente nella nostra quotidianità:
cosa accade quando due macchine giungono a un incrocio senza
semaforo ?
Due macchine giungono contemporanamente a un incrocio (senza
semaforo, senza precedenze... insomma un normale incrocio a
Roma). Può succedere che
• uno decide di fermarsi e l’altro decide di passare: uno solo sarà
contento, diciamo (0, 1) oppure (1, 0).
• entrambi decidono di passare, e ci sarà un incidente: (−1, −1).
• entrambi si fermano: niente incidente, ma uno sgradevole stallo,
e tempo perso...: (0, 0)
Tale situazione si può schematizzare nella seguente matrice:
A. Porretta
Gli uni e gli altri. Strategie in contesti di massa
Giocatore 2
passa
Giocatore 1
passa
si ferma
-1,-1
0,1
si ferma
1,0
0,0
In questo gioco ci sono due equilibri di Nash: (0, 1) oppure
(1, 0). Entrambi lasciano uno dei due insoddisfatto...
In questo esempio lo studio degli equilibri di Nash suggerisce
un intervento regolatore esterno: un semaforo !
Riassunto: gli equilibri di Nash sono soluzioni che possono crearsi
nell’incertezza delle decisioni degli altri. Mostrano la complessita’
del meccanismo decisionale. A volte non sono ottimali per nessuno,
dando senso all’importanza di fare accordi; a volte non lo sono per
qualcuno, mostrando la necessita’ di un compromesso; spesso ce ne
sono piu’ di uno, mostrando la difficolta’ di previsione su quello che
accadrà.
A. Porretta
Gli uni e gli altri. Strategie in contesti di massa
Oss. sugli esempi precedenti:
Si trattava di situazioni simmetriche: i giocatori erano
interscambiabili
Matematicamente, la trattazione del gioco segue questo iter:
- definire gli insiemi di strategie possibili del singolo
- comprendere il valore associato a ogni possibile scelta
collettiva
- dedurre da questo la strategia effettiva dei giocatori
Si osservi la natura del fenomeno: dedurre le strategie dalle
aspettative future.
A. Porretta
Gli uni e gli altri. Strategie in contesti di massa
Giochi differenziali
In molte situazioni,
la strategia agisce su una dinamica da cui dipendono poi i
costi/benefici/obiettivi...
(es. meccanismi preda/cacciatore: si sceglie una velocità che
influenza le rispettive posizioni)
gli obiettivi sono definiti non solo all’istante finale ma lungo
tutto un arco di tempo
A. Porretta
Gli uni e gli altri. Strategie in contesti di massa
Es: meccanismi di produzione di risorse esauribili (es. petrolio):
q(t) = quantità prodotta ;
R(t) = riserva esistente
una dinamica naturale lega queste due quantità :
dR
= −q(t)
dt
Gli obiettivi possono essere i guadagni nel periodo
Z T
max
{p(t, R(t))q(t) − C (q(t))} dt
0
dove C (q) sono costi di produzione e p l’evoluzione dei prezzi.
oss: p dipende anche da R(t) (i prezzi dipendono dalle riserve
esistenti)
A. Porretta
Gli uni e gli altri. Strategie in contesti di massa
Nei giochi differenziali, gli elementi tipici sono dunque:
Un numero di agenti (o giocatori) i = 1, . . . , N.
Una dinamica (deterministica o stocastica) che determina lo
stato Xti dell’i-esimo agente al tempo t. Es:
dXti = αti dt ( + σ dBti )
Una strategia di scelta individuale αti (una funzione, o una
variabile aleatoria) che possa influenzare tale dinamica.
Una funzione di utilità (da ottimizzare) nel tempo (τ, T ):
Z T
i
J (α) =
Li (t, Xti , αti , αt−i , Xt−i )dt + V i (XTi , XT−i )
τ
αt−i
dove
e
giocatori.
Xt−i
sono le strategie e gli stati degli altri N − 1
Gli equilibri di Nash sono definiti in modo analogo a prima.
A. Porretta
Gli uni e gli altri. Strategie in contesti di massa
Per l’i-esimo giocatore, la funzione valore:
u i (τ, x) = inf J i (α) , quando Xτi = x
α
rappresenta la migliore aspettativa che si ha partendo dalla
condizione x al tempo τ .
Matematicamente, la funzione valore risolve un’equazione
differenziale. Risolvere tale equazione è fondamentale: infatti
la strategia ottima è deducibile come feedback a partire dalla
funzione valore
A. Porretta
Gli uni e gli altri. Strategie in contesti di massa
Mean Field Games
Pb: Come gestire situazioni di massa ? Ovvero cosa accade con un
numero molto grande di agenti razionali ?
Negli ultimi anni, sono state sviluppate nuove idee e metodi per trattare
giochi in cui
(a) si ha un numero molto grande di agenti indistinguibili tra loro
(b) il singolo ha un microscopico impatto sulle strategie degli altri
Ma d’altra parte, le strategie dipendono da quello che fa la massa degli
altri giocatori
Situazioni tipiche:
-nella finanza (numeri molto elevati di piccoli agenti finanziari)
-nelle dinamiche di consumi di massa (“reti intelligenti”, es. per consumi
elettrici etc...)
-nelle dinamiche sociali (gruppi numerosi di individui razionali, es:
meccanismi di voto, movimenti di una folla, dinamiche di
conformismo/antagonismo in gruppi estesi)
Microscopico → Macroscopico.
Nella teoria dei giochi a campo medio, viene mutuato un paradigma
ampiamente usato nella meccanica statistica:
in sistemi con un numero molto grande di particelle risulta impossibile
gestire le mutue interazioni (regolate dalla legge di Newton) o anche
semplicemente misurare posizione & velocità delle singole particelle.
L’approccio della meccanica statistica consiste nell’individuare grandezze
macroscopiche, es. energia, entropia definite in termini di medie
statistiche
Si parla di teorie di campo medio: una volta specificato in che modo ogni
particella microscopica contribuisce alla formazione del campo (es.
definizione dell’energia, o dell’entropia), si studia l’evoluzione di
grandezze macroscopiche per descrivere il fenomeno.
In analogia, nella teoria dei Giochi di campo medio (Mean Field Games):
gli agenti sono nella sostanza simili tra loro: hanno simili margini di
scelta, simili dinamiche, simili obiettivi.
Matematicamente si traduce in ipotesi di simmetria: gli insiemi delle
strategie Qi sono gli stessi, costi/benefici sono analoghi, permutare gli
agenti non cambia il gioco...
le interazioni reciproche individuali sono sostituite dall’interazione
del singolo con un campo medio che in questo caso è una media
sullo stato degli agenti.
Ma c’è una differenza fondamentale con la meccanica statistica: ora
le particelle sono agenti razionali con meccanismi di scelta. Non si
tratta solo di interazioni individuo-massa bensi’ di interazioni
strategiche.
Oltre a descrivere un fenomeno di massa, si vuole anche descrivere il
perché ciò avviene, ovvero i meccanismi decisionali che sottendono
un certo fenomeno (potenziale applicazione in biologia,etc...)
La peculiarità del modello è nell’accoppiamento tra decisioni strategiche e
evoluzione della situazione collettiva. Le strategia vengono prese
anticipando un’ipotesi di situazione collettiva; ma una volta attuate, le
strategie contribuiscono a modificare tale situazione.
Matematicamente, il sistema derivato nel limite di campo medio ha una
struttura forward-backward nel tempo:
-un’equazione determina le strategie ottimali partendo da un aspettativa
futura (meccanismo backward)
-un’altra equazione segue l’evoluzione nel tempo degli agenti
(meccanismo forward)
Tuttavia l’una dipende dall’altra ! La soluzione è tipicamente indice di un
equilibrio tra decisioni collettive e mutamento delle condizioni individuali:
il limite per N → ∞ degli equilibri di Nash.
Un esempio modello: a che ora si comincia ?
In una riunione con molti partecipanti, l’orario d’inizio fissato è T ∗ , ma la
riunione avrà effettivamente inizio al tempo T quando sarà raggiunto un
quorum adeguato, es. 80% dei partecipanti.
Ciascun partecipante ha una dinamica
dXti = αti dt + σ dBti
controllata attraverso la strategia αti , la quale produce un tempo di arrivo τ i ;
allo scopo di ottimizzare (anche con differenti pesi):
8
i
>
<il tempo d’attesa dall’inizio effettivo (T − τ )+
i
il tempo di ritardo sull’inizio effettivo (τ − T )+
>
:
il tempo di ritardo sull’inizio previsto (τ i − T ∗ )+
Tuttavia, il tempo effettivo T dipende da quanti partecipanti sono arrivati !
Nell’approccio di campo medio (agenti indistinguibili), le grandezze
macroscopiche che descrivono il fenomeno sono:
-m(t, x) (distribuzione di probabilità dei partecipanti che si trovano in x
al tempo t - non ancora arrivati)
- u(t, x), funzione valore del generico partecipante che si trovasse in x al
tempo t.
• La strategia di ogni partecipante dipende quindi dalla propria dinamica
e dal campo medio m.
• L’evoluzione di m dipende dalle strategie dei partecipanti (m è
distribuzione di probabilità associata al generico stato Xt )
Ora ci saranno due equazioni differenziali accoppiate, una per la
strategia, una per il campo medio !
Si osservi il tipico meccanismo forward-backward dei MFG:
i partecipanti presuppongono una distribuzione (temporale) m̄ e un
tempo effettivo T (m̄) conseguente a questa ipotesi sugli arrivi degli altri.
Costruiscono le loro strategie supponendo questa situazione futura,
attraverso il valore atteso u.
Le strategie determinano le dinamiche, e queste producono una reale
distribuzione m.
Una soluzione è rappresentata da un punto fisso: m = m̄, che esprime un
equilibrio tra anticipazioni razionali e comportamenti individuali.
La risoluzione matematica di simili modelli richiede strumenti molto
raffinati.
Alcuni tipici risultati della teoria:
In alcuni casi il sistema limite ammette un unico equilibrio
(semplificazione del gioco ! ) ottenuto come limite di equilibri di
Nash nel gioco a N giocatori.
(tale equilibrio può essere interpretato come un ottimo di Pareto)
Inoltre, questo equilibrio fornisce un’ “quasi ” equilibrio di Nash per il
gioco a N giocatori, se N è grande. Ovvero il modello macroscopico
consente di costruire buone approssimazioni di equilibri di Nash.
Il sistema macroscopico può ammettere buone simulazioni numeriche
al computer. Fornisce un modello gestibile per molte potenziali
applicazioni.
Grazie dell’attenzione....
...E in bocca al lupo per le vostre scelte !!!