Vob!jouspev{jpof!jogpsnbmf!bmmb! Ufpsjb!efj!Hjpdij!f!bmmf!tvf! bqqmjdb{jpoj!bj!Tjtufnj! Bvup.Dpogjhvsbouj Prof. Enzo Baccarelli, Dipartimento di Scienza e Tecnica dell’Informazione e della Comunicazione (INFO-COM) Università “La Sapienza” Organizzazione della Presentazione • • • • • Perché la Teoria dei Giochi Cosa è un Gioco I Giochi Strategici e Non-cooperativi Equilibrio in regime di competizione: l’equilibrio di Nash Classificazione dei punti di equilibrio di Nash: Dominanza di Pareto • Sistemi Auto-Configuranti e Teoria dei Giochi • Evoluzione dello stato di un sistema Auto-Configurante verso l’equilibrio di Nash • Esempio di una rete di nodi interagenti Perché la Teoria dei Giochi - Un esempio celebre (1/6) • “…supponiamo che due cacciatori si appostino per cacciare un cervo e che entrambi siano consapevoli di dover rimanere al loro posto al fine del buon esito della caccia. Comunque, se dovesse accadere che una lepre transiti improvvisamente vicino a uno dei due cacciatori, è verosimile ritenere che il cacciatore che avvista la lepre abbandoni la sua postazione e si metta ad inseguirla. E’ altresì ragionevole ritenere che una volta che abbia catturato la lepre, egli non si curi del fatto che la sua azione possa aver lasciato l’altro cacciatore privo di alcuna preda…” Rousseau, dal “Discorso sull’Origine e la base della uguaglianza tra gli uomini” Perché la Teoria dei Giochiil Gioco dei cacciatori (2/6) Riassumendo, • Due cacciatori devono decidere simultaneamente se cacciare un cervo o una lepre. • Se decidono entrambi per la lepre, ciascuno porterà a casa una lepre. In ogni caso ogni cacciatore preferirebbe portare a casa mezzo cervo. • Se uno dei due decide per la lepre mentre l’altro opta per il cervo, chi avrà deciso per la lepre la porterà a casa, mentre chi ha optato per il cervo non porterà a casa nulla. Perché la Teoria dei GiochiRappresentazione schematica del il Gioco dei Cacciatori (3/6) Cacciatore 2 Cervo Lepre Cervo (10,10) (0,5) Lepre (5,0) (5,5) Cacciatore 1 • • I numeri in ciascuna casella misurano il grado di soddisfazione (o profitto) acquisito dai due cacciatori Le soluzioni del gioco che sembrerebbero più ragionevoli sono (cervo, cervo) e (lepre, lepre) Perché la Teoria dei GiochiGli ingredienti del Gioco dei cacciatori (4/6) Gli ingredienti di base del gioco di Rosseau sono tre 1. 2. 3. I due cacciatori (i giocatori del gioco) Le azioni che i cacciatori possono intraprendere (cacciare il cervo o cacciare la lepre) Le misure del grado di soddisfazione acquisito da ciascun cacciatore in corrispondenza di ciascuna delle quattro possibili conclusioni del gioco. Perché la Teoria dei Giochi (5/6) • • 1. 2. La Teoria dei Giochi è un insieme di modelli analitici sviluppato allo scopo di aiutarci a descrivere e comprendere i fenomeni che osserviamo quando più Decisori (giocatori) interagiscono (liberamente o forzatamente) fra di loro al fine di conseguire ciascuno un proprio specifico obiettivo. Due sono le assunzioni di base circa il comportamento individuale dei giocatori: Ciascun giocatore agisce in modo da conseguire un suo ben definitivo obiettivo (ciascun giocatore agisce in maniera razionale) Nel prendere una decisione al fine di conseguire l’obiettivo prefissato, ciascun giocatore tiene conto delle decisioni che gli altri giocatori hanno già preso o che è verosimile che prendano in futuro (ciascun giocatore interagisce con tutti gli altri giocatori e agisce in maniera strategica al fine di conseguire il proprio obiettivo) Perché la Teoria dei Giochi (6/6) I modelli analitici della Teoria dei Giochi costituiscono rappresentazioni formali di situazioni reali in cui più decisori (giocatori) interagiscono e competono al fine di conseguire obiettivi contrastanti o più semplicemente differenti. Possibili campi di applicazioni della Teoria dei Giochi sono: 1.Le scienze sociali (descrizioni di competizioni politiche) 2.Le scienze economiche (descrizione di oligopoli e di competizioni economiche) 3.Le scienze ingegneristiche (condivisione ottima di una risorsa a disposizione di più richiedenti; gestioni di reti su larga scala) 4.Le scienze demografiche e naturali (descrizioni di eco-sistemi in cui più specie coesistono e competono per la sopravvivenza) 5.Le scienze mediche (interazione tra cellule, organizzazione di dati genomici) 6.Le scienze fisiche (transizioni di fase nella fisica statica e nella meccanica statistica) 7.Le scienze biologiche (auto-organizzazione ed evoluzione dei sistemi biologici complessi, come le colonne di formiche) Che cosa è un Gioco Le Regole del Gioco (1/8) • • • 1. 2. 3. • • Il Gioco è una descrizione dei meccanismi che regolano l’interazione tra più giocatori. Un Gioco non specifica le azione che, di volta in volta, i giocatori intraprenderanno effettivamente ma solo l’insieme delle possibili azioni. La descrizione dei meccanismi di interazione (regole del gioco) comprende: La specificazione dell’obiettivo che ciascun giocatore si prefigge di conseguire La specificazione dei vincoli sulle azioni (decisioni) che ciascun giocatore può prendere La specificazione degli effetti dell’azione di ciascun giocatore sul comportamento di tutti gli altri giocatori. Un gioco si considera assegnato quando sono specificate le sue regole Tutti i giocatori che prendono parte al Gioco conoscono le regole del gioco Che cosa è un GiocoSoluzioni e Stati Stabili (2/8) • • • • Una soluzione del Gioco è la descrizione sistematica di un insieme di azioni che i giocatori partecipanti al Gioco possono prendere. Non tutte le soluzioni ammissibili “a priori” per un gioco rendono “soddisfatti” tutti i giocatori. Quando esiste, uno stato-stabile del gioco è una particolare soluzione che soddisfa tutti i Giocatori. Supposto che la soluzione raggiunta dal gioco sia uno stato-stabile, nessun giocatore ha interesse a perturbare il Gioco così da abbandonare lo stato-stabile. Che cosa è un GiocoPunto di equilibrio di un gioco (3/8) • • Uno stato stabile rappresenta sempre un punto di equilibrio del gioco. Lo scopo principale della Teoria dei Giochi è quello di individuare l’insieme dei punti di equilibrio di un gioco. Che cosa è un GiocoClassificazione (4/8) Tipi di Giochi Strategici Oppure Estensivi Cooperativi Oppure Non cooperativi Con Informazione perfetta Oppure Con Informatione imperfetta Che cosa è un GiocoClassificazione (5/8) • • Un Gioco è strategico (ovvero, senza memoria) quando ciascun giocatore sceglie l’azione corrente sulla sola base delle azioni correntemente scelte dagli altri giocatori Un Gioco è estensivo (ovvero, con memoria) quando ciascun giocatore sceglie l’azione corrente sulla base delle proprie azioni passate e sulla base delle azioni passate e correnti di tutti gli altri giocatori. Che cosa è un GiocoClassificazione (6/8) • • Un Gioco è non-cooperativo quando ciascun giocatore sceglie la propria azione tenendo conto di quelle degli altri Giocatori ma al solo scopo di massimizzare il proprio profitto individuale. In un Gioco cooperativo, l’insieme dei giocatori è suddiviso in sotto-insiemi, noti come coalizioni. Ciascun giocatore sceglie la propria azione tenendo conto di quelle degli altri Giocatori ma allo scopo di massimizzare il profitto della coalizione alla quale appartiene. Che cosa è un GiocoClassificazione (7/8) • • Un Gioco è detto con informazione perfetta quando, ad ogni istante t0, ciascun giocatore conosce esattamente le azioni intraprese da tutti gli altri Giocatori sino all’istante t0. Un Gioco è detto con informazione imperfetta quando almeno un giocatore non conosce con esattezza le azioni già intraprese dagli altri giocatori. Che cosa è un GiocoClasse dei Giochi di Interesse (8/8) • • Nel seguito della presentazione ci occuperemo della descrizione formale e delle proprietà evolutive di una particolare classe di Giochi, ossia dei Giochi strategici, non cooperativi e con perfetta informazione. I Giochi strategici, non-cooperativi e con perfetta informazione sono quelli che meglio descrivono il comportamento della maggior parte dei sistemi autoconfiguranti. Giochi strategici e non cooperativiDefinizione formale (1/8) • 1. 2. 3. Un Gioco strategico, non cooperativo e con perfetta informazione è un modello per la descrizione dell’interazione tra più giocatori in cui: Le azioni intraprese dai giocatori in ciascuna ripetizione del Gioco non dipendono dalle azioni prese nelle ripetizioni precedenti (Gioco strategico) Ogni giocatore sceglie l’azione che massimizza la propria utilità, ossia l’azione che gli è più conveniente (non cooperativo) Ogni giocatore conosce gli insiemi della azioni a disposizione di tutti gli altri giocatori (perfetta informazione) Definizione formale (2/8) Formalmente, un Gioco def G = < N ; Ag , g ∈ N ; u g (.), g ∈ N > strategico, non-cooperativo con perfetta informazione è definito da 1. 2. 3. def Un insieme finito N = {0,1,..., N } che rappresenta l’insieme degli (N+1) giocatori che partecipano al gioco; Per ciascun giocatore g∈N , un insieme Ag (spazio delle azioni g-esime) di elementi ciascuno dei quali ag ∈ Ag rappresenta una azione che può prendere il giocatore g-esimo. Ag è l’insieme delle azioni ammissibili per il giocatore g-esimo. Per ciascun giocatore g∈N , una funzione reale e scalare u g : A0 × ... × Ag × ... × AN ⎯⎯ →ℜ che costituisce la funzione di utilità del giocatore g-esimo. Significato della Funzione di Utilità (3/8) • Indichiamo con def A = A0 × A1 × ... × Ag × ... × AN lo spazio delle azioni di tutti i giocatori; def • Indichiamo con a = (a0 , a1 ,..., ag ,...aN ) ∈ A un profilo di azione, ossia una (N+1)-pla ordinata di azioni degli N+1 giocatori. ¾ Allora, il valore u g ( a0 , a1 ,..., ag ,...aN ) = u g ( a ) della funzione di utilità del giocatore g-esimo in corrispondenza del profilo d’azione a costituisce la misura del profitto (o del guadagno) che il giocatore g-esimo consegue quando il giocatore 0-esimo sceglie l’azione a0 , il giocatore g-esimo sceglie l’azione ag, …, e il giocatore N-esimo sceglie l’azione aN. • Il valore assunto da u g (.) dipende non solo dall’azione agscelta dal giocatore g-esimo ma anche dalle azioni a0 ...aN scelte da tutti gli altri giocatori che partecipano al gioco. Comportamento Razionale dei Giocatori (4/8) E’ assunto che ciascun giocatore scelga l’azione da compiere in modo razionale, ossia in modo da massimizzare il valore assunto dalla propria funzione di utilità. Indichiamo con def A− g = A0 × ... × Ag −1 × Ag +1 × ... × AN lo spazio delle azioni di tutti i giocatori escluso il g-esimo. Indichiamo con def a − g = (a0 ,..., ag −1 , ag +1 ,..., aN ) ∈ A− g uno dei profili d’azione di tutti i giocatori escluso il g-esimo. Comportamento Razionale dei Giocatori (5/8) Definizione Per definizione, il giocatore g-esimo si comporta in maniera razionale se, in corrispondenza ad ogni prefissato profilo di azione a − g dei • restanti giocatori, il giocatore g-esimo sceglie l’azione a g ∈ Ag che massimizza la propria funzione di utilità, ossia l’azione ag• che soddisfa alla seguente relazione: • g u g (a , a − g ) ≥ u g (ag , a − g ), per ogni ag ∈ Ag Comportamento Razionale: Significato (6/8) • Assumere che il giocatore g-esimo si comporta razionalmente significa assumere che, in corrispondenza ad ogni fissato insieme di azioni a − g scelte dai restanti • giocatori, il giocatore g-esimo sceglie l’azione ag che massimizza la sua funzione di utilità, ossia che massimizza il profitto acquisito. • Quindi ag• rappresenta la miglior risposta che il giocatore g-esimo può dare in corrispondenza al profilo d’azione a − g scelto da tutti gli altri giocatori. • • Poiché per ogni fissato a − g potrebbero esistere più azioni a g ∈ Ag che massimizzano l’utilità del g-esimo giocatore, indicheremo con def Bg = {ag• ∈ Ag : u g (ag• , a − g ) ≥ u g (ag′ , a − g ), ∀ag′ ∈ Ag } l’insieme delle migliori risposte del giocatore g-esimo al profilo d’azione a − g dei restanti giocatori. Ovviamente, Bg = Bg (a − g ) varia al variare di a − g . Giochi strategici e non cooperativiRappresentazione in forma Tabellare (7/8) • Consideriamo un gioco strategico e non cooperativo costituito da due giocatori (N ={0,1}) ciascuno dei quali può espletare solo due azioni, ossia def A0 = spazio delle azioni del giocatore 0-esimo = {destra, sinistra}={D, S} def A0 = spazio delle azioni del giocatore 1-esimo = {testa, croce}={T, C} • Indichiamo con u0 (T , D) = w0 ; u0 (T , S ) = x0 ; u0 (C , D) = y0 ; u0 (C , S ) = z0 ; u1 (T , D) = w1 ; u1 (T , S ) = x1 ; u1 (C , D) = y1 ; u1 (C , S ) = z1 ; i valori assunti dalle funzioni di utilità dei due giocatori Giochi strategici e non cooperativiRappresentazione in forma Tabellare (8/8) • Il suddetto Gioco può essere compiutamente rappresentato mediante la seguente tabella • Le azioni del giocatore 0-esimo (1esimo) sono identificate con le righe (colonne) della matrice • La coppia di numeri all’incrocio della riga r-esima e della colonna cesima rappresentano i valori (u0,u1) assunti dalle funzioni di utilità dei due giocatori quando il giocatoreriga sceglie l’azione r e il giocatorecolonna sceglie l’azione c, con le prima componente della coppia rappresentate il valore della funzione di utilità del giocatore riga. a1 D S T w0,w1 x0,x1 C y0,y1 z0,z1 a0 L’equilibrio di Nash: Definizione (1/12) Come già anticipato, non tutte le soluzioni di un Gioco soddisfano tutti i giocatori che partecipano al gioco. • In maniera informale, possiamo dire che un punto di equilibrio di def * Nash a = (a0* ...a*N ) di un gioco G è una soluzione del Gioco che rende soddisfatti tutti i giocatori che partecipano al Gioco. • Formalmente, vale la seguente definizione: DEFINIZIONE DI EQUILIBRIO DI NASH Assegnato un gioco G strategico, non cooperativo e con perfetta def informazione, un equilibrio di Nash a* = (a0* ...a*N ) del suddetto Gioco è un profilo d’azione che per ogni giocatore soddisfa alla seguente relazione: * −g * −g u g (a , a ) ≥ u g (ag , a ), per tutte le ag ∈ Ag * g L’equilibrio di Nash: Significato (2/12) * def * * • Un equilibrio Nash a = (a0 ...aN ) di G è un insieme di (N+1) azioni (una per giocatore) tale che nessun giocatore può incrementare il valore della propria funzione di utilità deviando da a*g quando tutti i restanti def * giocatori perseverano nelle azioni di equilibrio a − g = (a0* ,..., a*g −1 , a*g +1 ,..., a*N ) . • Ciò implica che quando la soluzione del Gioco G è un punto di * equilibrio Nash a = (a0* ...a*N ) allora tutti i giocatori sono soddisfatti dai valori {u g (a ), g ∈ N } assunti dalle proprie funzioni di utilità. • A sua volta, ciò implica che nessun giocatore ha interesse a perturbare lo stato (soluzione) del Gioco quando esso è un punto di equilibrio Nash. • Ciò significa che un punto di equilibrio Nash rappresenta sempre uno stato stazionario del gioco. Condizioni di esistenza (3/12) Non tutti i Giochi ammettono l’esistenza di almeno un punto di equilibrio Nash. Proprietà1 (Condizione di Esistenza) Un gioco ammette almeno un punto a* = (a0* ...a*N ) di equilibrio Nash se sono soddisfatte le seguenti tre condizioni: 1. Lo spazio delle azioni Ag di ogni giocatore è un insieme chiuso e limitato. 2. Ciascuna funzione di utilità ug ( a0 , a1 ,..., ag ,...aN ) = ug ( a ) è continua nei suoi argomenti. 3. Ciascuna funzione di utilità ug ( a0 , a1 ,..., ag ,...aN ) = ug ( a ) è funzione concava nella variabile ag per ogni assegnato a − g . Esempio di funzione di utilità concava (4/12) Consideriamo un gioco G costituito da due giocatori (N ={0,1}) con spazio delle azioni A0=A1=[-1,1] Assumiamo che la funzione di utilità del giocatore 0-esimo sia pari a u0 (a0 , a1 ) = −a02 + a12 , a0 ∈ [−1,1] u0 (a0 , a1 ) a12 -1 1 a0 La funzione u (a , a ) è concava in a0 per ogni assegnato a1 0 0 1 L’equilibrio di Nash Calcolo dei punti di equilibrio (5/12) • Assegnato un gioco G, ricordiamo che l’insieme Bg = {ag• ∈ Ag : u g (ag• , a − g ) ≥ u g (ag′ , a − g ), ∀ag′ ∈ Ag } costituisce l’insieme delle migliori azioni che può esercitare il giocatore g-esimo in risposta la profilo d’azione a − g = (a0 ,..., ag −1 , ag +1 ,..., aN ) ∈ A− g scelto da tutti i restanti giocatori. Proprietà 2 (Proprietà caratterizzante un equilibrio Nash) Assegnato un Gioco G, un profilo d’azione a* = (a0* ...a*N ) è un punto di equilibrio Nash del Gioco se e solo se per ogni giocatore soddisfa alla seguente relazione: * a*g ∈ Bg (a − g ), per ogni g ∈ N L’equilibrio di Nash Calcolo dei punti di equilibrio (6/12) • Implicazione: Assegnato un gioco G, è possibile calcolare tutti i suoi punti di equilibrio Nash come segue: 1. Per ogni giocatore, si calcola il corrispondente insieme Bg (a − g ) 2. Si risolve il sistema costituito costituito dalle N+1 equazioni * a*g = Bg (a − g ), per ogni g ∈ N rispetto alle (N+1) incognite (a0* ,..., a*g ,..., a*N ) Esempio di calcolo (7/12) • Consideriamo un Gioco G con due giocatori (N ={0,1}) e supponiamo che A0=A1=[0,1] (spazio delle azioni dei due giocatori) B0 (a1 ) = a12 , 0 ≤ a1 ≤ 1, (miglior risposta del 0-esimo giocatore all'azione dell' 1-esimo giocatore) B1 (a0 ) = a0 , 0 ≤ a0 ≤ 1, (miglior risposta del 1-esimo giocatore all'azione dello 0-esimo giocatore) • In virtù della Proprietà 2, un profilo d’azionea* = (a0* ...a*N ) è un punto di equilibrio Nash se e solo se soddisfa al seguente sistema di due equazioni in due incognite Il sistema ammette come soluzioni ⎧⎪a = (a ) ⎨ * ⎪⎩ a0 = a * 0 * 2 1 * 1 a0* = a1* = 0, e a0* = a1* = 1 Quindi il gioco ammette come punti di equilibrio Nash: (0,0) (1,1) L’equilibrio di Nash: Unicità (8/12) Come visto precedentemente, un Gioco G può avere più punti di equilibrio. Quando il Gioco ammette un solo punto di equilibrio Nash? • Indichiamo con ⎡ B0 (a −0 ) ⎤ def B (a ) = ⎢⎢ ... ⎥⎥ , a ∈ A ⎢⎣ BN (a − N ) ⎥⎦ il vettore (N+1)-dimensionale delle migliori risposte dei giocatori. Definizione (Funzione Vettoriale Standard) La funzione vettoriale B(a) definita precedentemente è detta standard se sono soddisfatte le seguenti tre proprietà 1) B (a) > 0, per ogni a ∈ A 2) B(a ′) ≥ B(a ′′) quando a ′ > a ′′ 3) B(ca ) < cB(a ), per ogni c>1 (positività) (monotonicità) (scalabilità) L’equilibrio di Nash Condizioni di Unicità (9/12) • Assegnato un Gioco G, supponiamo che ammetta almeno un punto di equilibrio Nash Proprietà 3 (Condizioni di Unicità) Il punto di equilibrio Nash è l’unico punto di equilibrio del Gioco se il vettore delle migliori risposte è una funzione standard. Condizioni per la raggiungibilità dell’equilibrio (10/12) Assegnato un gioco G strategico e non cooperativo, supponiamo che 1. Ammetta almeno un punto di equilibrio Nash; 2. Il gioco G viene giocato (ossia ripetuto) più volte dai giocatori che ne fanno parte; 3. Tutti i giocatori si comportano sempre in maniera razionale (cioè scelgono l’azione che massimizza la propria funzione di utilità) ¾ Il problema della raggiungibilità def Indicato con * * * a (k ) = (a0 (k ),..., aN (k )), k = 0,1, 2,.... il profilo d’azione scelto dai giocatori nella k-esima ripetizione del gioco, sotto quali condizioni {a* (k )}tende al punto di equilibrio Nash per k → ∞? Condizioni per la raggiungibilità dell’equilibrio (11/12) Proprietà 4 (Condizione di Raggiungibilità dell’equilibrio Nash) * Condizione sufficiente affinché la sequenza dei profili a (k ), k = 0,1, 2,.... converga per k → ∞ al punto di equilibrio Nash a partire da un qualsivoglia profilo iniziale a* (0) è che il vettore delle migliori risposte B (a ) sia una funzione standard. L’equilibrio di Nash: Conclusioni (12/12) Quando le funzioni di utilità sono concave e il vettore delle migliori risposte è una funzione standard, allora: Il gioco ammette uno ed un solo equilibrio di Nash. Quando il gioco è giocato in maniera razionale e ripetuto più volte, la sequenza delle soluzioni generate dalle ripetizioni del gioco converge sempre all’equilibrio di Nash. Classificazione dei punti di equilibrio Nash – Dominanza di Pareto (1/1) Supponiamo che un Gioco G abbia P≥2 punti di equilibrio Nash. Quale tra questi punti di equilibrio è il migliore? Definizione (Dominanza di Pareto) * Assegnato un Gioco G, un suo punto a di equilibrio Nash è detto essere Pareto * dominante se non esiste alcun altro punto di equilibrio Nash b che soddisfa alle seguente relazione * * u g (b ) > u g (a ), per ogni g ∈ N Significato – Quando esiste, un punto di equilibrio Pareto-dominante massimizza la funzione di utilità di ciascuno dei giocatori rispetto a tutti gli altri punti di equilibrio del gioco. In questo senso, un punto di equilibrio Pareto-dominante può essere considerato il miglior punto di equilibrio del gioco. ◊ Alcuni esempi di Giochi Strategici (1/5) • Nelle prossime slides presenteremo alcuni esempi classici di Giochi Strategici e non cooperativi. • I Giochi considerati sono molto semplici: ciascun Gioco è composto da due giocatori e ciascun giocatore ha solo due possibili azioni. Quindi, ciascun Gioco verrà rappresentato tramite una tabella con due righe e due colonne. • Comunque, pur nella loro semplicità, i Giochi presentati catturano l’essenza di un tipo di interazione strategica che è tipica di sistemi (Giochi) più complessi. La Battaglia dei Sessi (2/5) • Renzo e Lucia vogliono uscire insieme per andare o allo stadio o a teatro. • Il loro interesse principale è uscire insieme, ma Renzo preferirebbe andare allo Stadio, mentre Lucia preferirebbe andare a Teatro. Dopo aver stabilito i valori della funzione di utilità, il Gioco può essere così descritto Lucia Stadio Teatro Stadio (2,1) (0,0) Teatro (0,0) (1,2) Renzo 9Il Gioco modella una situazione in cui i giocatori vogliono coordinare le loro azioni ma hanno interessi contrastanti 9Il Gioco ha due equilibri Nash: (Stadio, Stadio) e (Teatro Teatro) 9Nessuno dei due è Pareto-Dominante La Tregua dei Sessi (3/5) • Renzo e Lucia vogliono uscire insieme per andare o al cinema o al circo. • Il loro interesse principale è uscire insieme. • In questo caso le preferenze non sono contrastanti perché entrambi hanno come maggior interesse andare al cinema. Quindi, dopo aver stabilito i valori della funzione di utilità il gioco può essere così descritto Lucia Cinema Circo Cinema (3,3) (0,0) Circo (0,0) (1,1) Renzo 9Il Gioco modella una situazione in cui i giocatori vogliono coordinare le loro azioni e non hanno interessi contrastanti 9Il gioco ha due equilibri Nash: (Cinema, Cinema) e (Circo, Circo). 9Solo l’equilibrio (Cinema, Cinema) è Pareto-Dominante Il Dilemma del Prigioniero (4/5) • Alice e Bob sono sospettati di omicidio e sono messi in celle separate. • Se ognuno accusa l’altro, entrambi riceveranno una condanna di soli 3 anni. • Se solo uno dei due accusa, l’accusatore uscirà di prigione e l’accusato riceverà 8 anni di condanna. • Se nessuno dei due accusa, entrambi riceveranno 1 anno di condanna. • La tabella riporta le funzioni di utilità Alice Non accusa Accusa Non accusa (30,30) (0,40) Accusa (40,0) (10,10) Bob 9Questo è un gioco in cui la cooperazione arreca guadagno ad entrambi i giocatori ma ciascun giocatore ha anche un incentivo ad agire come “battitore” libero. 9L’unico equilibrio di Nash è (accusa, accusa) Il Gioco delle Scelte congruenti (5/5) • Alice e Bob possono scegliere Testa o Croce stando in due stanze separate. • Se le loro scelte differiscono Alice paga a Bob 100 $ • Se le scelte concordano, Bob paga ad Alice 100 $ • La funzione di utilità è proporzionale al denaro che ciascuno riceve Alice Testa Croce Testa (1,-1) (-1,1) Croce (-1,1) (1,-1) Bob 9Un gioco come questo dove le funzioni di utilità (gli interessi) dei giocatori assumono valori opposti è detto “strettamente competitivo” o a “somma zero”. 9Il Gioco non ammette equilibrio di Nash Sistemi Auto-Configuranti (1/4) Un sistema Auto-Configurante S è costituito da un insieme di elementi (i nodi del sistema) che: • Interagiscono tra di loro – ciascun nodo misura localmente le azioni che gli altri nodi stanno esercitando su di esso e reagisce in modo da conseguire un ben specifico obiettivo. • Sono privi di un controllore centrale – non v’è alcuna autorità centrale che possa imporre la propria volontà. Tutti gli elementi agiscono in regime ugualitario. In questo senso il sistema è di tipo “distribuito”. • Mediante interazione reciproca, fanno evolvere autonomamente lo stato del sistema verso un punto di equilibrio stabile che rappresenta la configurazione di regime del sistema. Sistemi Auto-ConfigurantiCosa sono? (1/2) Proprietà Fondamentale di un sistema Auto-Configurante • Un sistema Auto-Configurante è in grado di evolvere verso uno stato (ossia una configurazione) stabile in maniera autonoma (ossia, senza l’intervento di un controllore centrale esterno). Sistemi Auto-Configuranti (2/2) 4 2 1 3 Conclusioni La Teoria dei Giochi fornisce un modello per descrivere le interazioni in sistemi costituiti da più decisori. L’equilibrio Nash (quando esiste) costituisce lo stato stabile al quale tende il gioco. I sistemi auto-configuranti sono costituiti da elementi che interagiscono in regime di uguaglianza. I sistemi auto-configuranti sono modellabili come giochi che evolvono autonomamente verso lo stato di equilibrio Nash. Riferimenti 1. M.J.Osborne, A.Rubinstein, A course in Game Theory, MIT Press, 2002. 2. D.Fudenberg, J.Tirole, Game Theory, MIT PRESS, 1991. 3. L.A.Petrosjan, N.A.Zankevich, Game Theory, WSP Comp., 1996. 4. K.G.Binmore, Fun and Games, Lex., 1992. 5. J.W.Friedman, Game Theory with applications to Economics, 2nd Ed., Oxford Press, 1990. 6. J.M.Smith, Evolution and the Theory of Games, Cambridge Press, 1982. 7. H.Moulin, Game Theory for the Social Sciences, new York Un. Press, 1986. 8. V.Neumann, O.Morgenstern, Theory of Games and Economic Behavious, J.Wiley, 1944.