Teoria dei Giochi Dr. Giuseppe Rose Università degli Studi della Calabria Corso di Laurea Magistrale in Economia Applicata a.a 2011/2012 Handout 3 1 L’equilibrio di Nash (NE) con strategie pure De…nizione 1 Un pro…lo di strategie s = (si ; s i ) 2 Si S i è un equilibrio | {z } n i )i=1 di Nash del gioco G = (Si ; i (si ; s i ) S se per ogni i : i (si ; s i ) per ogni si 2 Si : (1) Possiamo dare un ulteriore de…nizione di NE: Si consideri il giocatore i che sta giocando una strategia s i : De…niamo l’insieme delle migliori risposte (best response) come l’insieme delle migliori strategie che il giocatore i può giocare posto che il giocatore i sta giocando s i: Bi (s i ) = fsi 2 Si : 0 i (si ; s i ) i (si ; s i ) per ogni s0i 2 Si g : (2) De…nizione 2 Un NE è un pro…lo di strategie s = (si ; s i ) 2 S tale che: si 2 Bi (s i ) per ogni i: (3) Un NE è l’intersezione delle best response di tutti i giocatori. 1.1 Esempio: Il modello di Cournot Ci sono due imprese (i e j) che devono decidere la quantità di uno stesso bene da immettere sul mercato (rispettivamente qi e qj con qi + qj = Q). Entrambe le imprese producono ad un costo unitario (quindi costo marginale costante) pari a c. La funzione di domanda del mercato è data da P (Q) = a i (qi ; qj ) = qi (P (Q) c) 1 Q; con a > c: E’utile ricordare che se una delle due imprese operasse in regime di monopolio, la quantità che massimizza i pro…tti è data da: max Q[P (Q) c] max Q[a c] Q Q m @ a Q =@Q = 0 Q c Q=0 a+c c and P = : 2 2 Individuiamo ora il NE del duopolio descritto sopra. Noi dobbiamo trovare l’insieme delle best response per l’impresa i dato qj : Qm = a Bi (qj ): Il payo¤ (pro…tto) dell’impresa i è funzione delle strategie giocate dai due giocatori: i (qi ; qj ) = qi (a qi qj c): Fissiamo la strategia dell’impresa j: Fissiamo qj : Qual’è la best response per l’impresa i dato qj ? = qi (a max qi a qi @ i =@qi qj c qi qi qj c): = 0 = 0 La soluzione è data da: qi = a qj 2 c (4) + Questa è la funzione di reazione dell’impresa i: ci indica sempre la migliore risposta che i può dare data la scelta di j: Si tratta dell’insieme delle migliori strategie ovvero dell’insieme delle best response Bi (qj ) = qi . 2 Se e¤ettuiamo lo stesso procedimento per l’impresa j …ssando qi troveremo la funzione di reazione, ovvero la best response, dell’impresa j : qi c : (5) 2 Sostituendo qj in Bi (qj ) troviamo Bi (qj ) ovvero la strategia del giocatore i che, secondo la nostra de…nizione, può far parte di un pro…lo di strategie s che costituisce un NE: Bj (qi ) = qj = qi = a a a qi c 2 c (6) 2 qi = Bi (qj ) = a c c c (7) 3 La strategia del giocatore i, espressa dalla relazione (7), rappresenta una strategia (si ) che può costituire un NE. Se facciamo la stessa cosa per l’impresa j sostituendo qi in Bj (qi ) troviamo Bj (qi ): qj = a a qj 2 2 qj = Bj (qi ) = a c 3 : (8) Avremo quindi che il pro…lo di strategie: qi = qj = a c 3 rappresenta un equilibrio di Nash. 2 Osservazioni In un gioco in forma normale un NE si individua vedendo se le migliori risposte dei giocatori coincidono. Esempio 1: Giocatore 1 A1 B1 C1 Giocatore 2 A2 B2 2, 3 1, 5 4, 1 7, 2 100, 2 -8, 4 C2 10, 1 3, 4 5, 5 Non c’è NE in questo gioco. Nel gioco seguente invece, abbiamo che il pro…lo di strategie (A1,B2) è un NE: 3 Giocatore 1 A1 B1 C1 Giocatore 2 A2 B2 2, 3 8, 5 4, 1 7, 2 100, 2 -8, 4 C2 10, 1 3, 4 5, 5 Un NE non può coinvolgere strategie strettamente dominate, ma può coinvolgere strategie dominate in senso debole. Esempio: Giocatore 1 A1 B1 Giocatore 2 A2 B2 2, 2 1, 2 2, 1 3, 3 In questo gioco abbiamo due NE: (A1, A2) (B1, B2). Il primo di questi due coinvolge due strategie dominate in senso debole. Gli equilibri di Nash che coinvolgono strategie strettamente dominate, non sono stabili. Il concetto della stabilità non verrà analizzato da noi in dettaglio. intuitivamente, un equilibrio non è stabile se questo cessa di essere un equilibrio se si considera la possibilità che i giocatori commettano degli errori nell’istante in cui decidono la strategia da attuare. Gli equilibri stabili sono detti trembling hand resistent, ovvero sono equilibri che rimangono anche se il gioco può essere disturbato da un errore di un giocatore. Questo ra¢ namento del concetto di NE è dovuto a Selten, premio Nobel per l’economia. 3 Motivazioni sul NE In questa sessione cerchiamo di spiegare perchè due giocatori dovrebbero giungere ad un NE in un gioco. Si consideri il seguente gioco: Giocatore 1 A1 B1 C1 Giocatore 2 A2 B2 1, 0 0, 1 0, 1 1, 0 -1, -1 -1, -1 C2 -1, -1 -1, -1 1, 1 Si può facilmente vedere come l’unico NE di questo gioco sia rappresentato dal seguente pro…lo di strategie: (C1, C2). Partiamo dalla seguente considerazione: nel gioco sopra indicato, come in qualsiasi altro gioco, ogni risultato è raggiungibile data la "congettura" che un giocatore formula riguardo a ciò che farà l’altro giocatore. Consideriamo il pro…lo di strategie (A1,A2). E’ possibile che si raggiunga tale risultato? La risposta è si. E’ su¢ ciente che il giocatore 1 sia convinto che il giocatore 2 giocherà A2 ed egli muoverà A1. Quindi "la congettura" (belief ) che il giocatore 1 deve formulare riguardo al giocatore 2 è che questo gioca A2. Indichiamo f e cioè il giocatore 1 gioca A1 se i suoi beliefs sul questa situazione con (A1, A2) giocatore 2 gli fanno credere che questi giocherà A2. Dall’altra parte, cosa può 4 spingere il giocatore 2 a giocare A2? Egli gioca A2 se è convinto che il giocatore 1 giocherà B1. A¢ nche il giocatore 2 scelga A2 i suoi beliefs devono essere tali che egli pensi che il giocatore 1 giocherà B1. Tale situazione può essere indicata f Con tali beliefs di entrambi i giocatori è possibile che si raggiunga con (A2, B1). il risultato …nale (A1, A2). Indichiamo tali strategie e beliefs di seguito: f (A1, A2) f (A2, B1) (9) (10) E’evidente come le aspettative di due giocatori identici sullo stesso gioco siano diverse. Nell’equilibrio di Nash le aspettative dei due giocatori sul risultato del gioco coincidono. Infatti, utilizzando lo stesso argomento precedente, il giocatore 1 gioca C1 solo se egli è convinto che il giocatore 2 giochi f Per ciò che riguarda il giocatore 2, egli giocherà C2 solo C2 ovvero (C1; C2). f Se indichiamo se è convinto che il giocatore 2 giocherà C1, ovvero (C2; C1). tali strategie e beliefs di seguito: f (C1; C2) f (C2; C1) vediamo che solo nell’equilibrio di Nash i due giocatori hanno la stessa idea di come verrà giocato il gioco. I risultati diversi dall’equilibrio di Nash (ad esempio il risultato (A1, A2) discusso un attimo fa) non possono essere esclusi neanche sotto l’ipotesi di common knowldge della razionalità. Diamo un intuizione di tale risultato. Consideriamo il giocatore 1. Egli gioca A1 perchè crede che il giocatore 2 giocherà A2. Questo vuol dire che il giocatore 1 crede che il giocatore 2 crede che il giocatore 1 giocherà B1. Quindi il giocatore 1 crede che il giocatore 2 crede che il giocatore 1 crede che il giocatore 2 giocherà B2. Quindi, se 1 crede che 2 crede che 1 crede che 2 crede che 1 giocherà A1; il giocatore 1 con common knowldge della razionalità può f e giocare A1. continuare ad avere i beliefs A2 La stessa cosa può essere discussa dal punto di vista del giocatore 2. Egli giocherà A2 se crede che il giocatore 1 giocherà B1. Quindi il giocatore 2 crede che 1 crede che 2 giocherà B2. Quindi il giocatore 2 crede che 1 crede che 2 crede che 1 giocherà A1. Quindi 2 crede che 1 crede che 2 crede che 1 crede che 2 giocherà A2. A¢ nchè si possa de…nire il NE come un possibile equilibrio di un gioco è necessario che ci sia razionalità dei giocatori più common knowldge più beliefs unici e corretti (rationality, common knowldge e common and correct beliefs). L’ipotesi che i giocatori abbiano common beliefs è in realtà molto forte. Per sostenerla sono state presentate diverse argomentazioni nella letteratura. Vediamone qualcuna. 5 3.1 Eductive Method (metodo della deduzione) I giocatori sono iper-razionali e mettendosi nei panni l’uno dell’altro riescono a venire a capo di common beliefs, seguendo ragionamenti simili a quelli presentati sopra. In realtà, come abbiamo visto, non è detto che alla …ne di tale processo si giunga a dei common beliefs neanche se si usa la common knowldge della razionalità. 3.2 Pre-play comunication (comunicazione pre-partita) La comunicazione pre-partita (cheap-talk) si basa sull’idea che se i due giocatori hanno un interesse comune (situazioni non di con‡itto) possono farsi un cenno o dirsi qualcosa per coordinarsi nelle strategie. Si consideri ad esempio il seguente gioco: Giocatore 1 A1 B1 Giocatore 2 A2 B2 1000, 1000 0, 0 0, 0 50, 50 In questo caso abbiamo due NE. I due giocatori possono guardarsi un attimo e farsi un segno o comunicare a parole qualcosa e il coordinamento su uno dei due equilibri di Nash è fatto. Ma in realtà bisogna capire che cosa io associo a ciò che mi viene detto dal giocatore che comunica con me. Tale motivazione per i common beliefs non è dunque così ovvia. 3.3 Focal Point (punto focale) Tale spiegazione si basa sul fatto che sono le caratteristiche stesse del gioco che portano i giocatori ad avere le stesse aspettative. Tale aspetto è molto di¢ cile da modellare nella teoria dei giochi. Vediamo un argomento proposto da Schelling (premio Nobel insieme ad Aumann): Due giocatori devo scegliere ognuno 4 città tra le seguenti 8: Roma Londra Parigi Bucarest Praga Madrid Mosca Tirana Se i due giocatori stanno giocando questo gioco prima del 1989 e sono uno a Mosca ed uno a New York trovano nel Muro di Berlino il punto focale per avere common beliefs. 6 3.4 Learning and Evolution (Apprendimento ed evoluzione) Per spiegare tale motivazione riguardo alla presenza di common beliefs è utile riferirci al modello di Cournot discusso in precedenza. a qj c Le due best response functions o le curve di reazione (Bi (qj ) = ed 2 a qi c ) possono essere disegnate gra…camente in un sistema di assi Bj (qi ) = 2 cartesiani (qi qj ). Il concetto di evoluzione e apprendimento consiste nel fatto che da qualsiasi livello di qj o qi si inizi il gioco, utilizzando i percorsi delle best response functions si arriva necessariamente all’equilibrio di Nash. Questo ci dice che l’evoluzione del gioco porta all’equilibrio di Nash. (Si faccia riferimento ai gra…ci disegnati durante le lezioni) 4 Approfondimento sul modello di Cournot In precedenza abbiamo analizzato l’equilibrio di Cournot utilizzando il concetto di NE. In pratica, come per il gioco del dilemma del prigioniero (che come è facile vedere (fatelo) presenta un solo NE che coincide con quello di risolto applicando l’eliminazione di strategie dominate in senso stretto) anche il modello di Cournot con due imprese può essere risolto applicando la cancellazione iterata delle strategie strettamente dominate. L’equilibrio a cui si giunge è uguale a quello di Nash. Vediamolo. La prima cosa che possiamo dimostrare è che qualsiasi quantità qj venga messa sul mercato dall’impresa j, l’impresa i non metterà mai sul mercato una quantità più grande di quella prodotta in monopolio (Qm = a 2 c ). Dimostriamo quindi che mettere sul mercato una quantità qi = Qm + x (con x > 0) è una strategia strettamente dominata da qi = Qm : Se qi = Qm il pro…tto dell’impresa i è data da: m i (Q ; qj ) = a ovvero: m i (Q ; qj ) c a (a 2 | a qj } 2 {z P (Q) c a ( c) (11) c qj ): 2 2 Se qi = Qm + x, i pro…tti per l’impresa i sono dati da: m i (Q + x; qj ) = ( = c a c 2 + x)(a ovvero: 7 a c 2 x (12) qj c) (13) m i (Q + x; qj ) = ( a c 2 a = 2 + x)( c a ( a c x qj ) + x 2 a c a c ( 2 {z | 2 = c 2 m i (Q ;qj ) qj ) a c x 2 qj ) } x(qj + x): c a a c 2 + x( x qj ) (14) >0 L’ultima relazione ci indica che il pro…tto dell’impresa i che produce una quantità maggiore di quella di monopolio è sempre inferiore al pro…tto che essa fa producendo la quantità di monopolio, qualsiasi sia la quantità qj (ovvero per ogni possibile strategia dell’impresa j). A questo punto, se supponiamo RAT2 possiamo dire che l’impresa i sa che l’impresa j non produrrà mai una quantità superiore a quella di monopolio. Se l’impresa j produce la quantità di monopolio, cosa conviene fare all’impresa i? Utilizzando il concetto di best response possiamo ricavare che all’impresa i conviene produrre qi = a 4 c se qj = Qm : In realtà tale risultato può essere generalizzato dimostrando che l’impresa i non produrrà mai una quantità inferiore a a 4 c qualsiasi sia la quantità qj : Come prima, valutiamo il pro…tto dell’impresa i con qi = a 4 c : i( a c 4 ; qj ) = a 4 (a c qj 4 c) ovvero c a c 3(a c) ; qj ) = ( qj ): 4 4 4 Vediamo ora qual’è il pro…tto con qi = a 4 c x con x > 0 : i( i( a c a x; qj ) = ( 4 a c x)(a 4 a c 4 +x (15) qj c) (16) ovvero: i( a c 4 Riordinando avremo: i( a c 4 x; qj ) = ( x; qj ) = ( a = i( = i( c 4 a x)( c 4 a c 4 a ; qj ) ; qj ) c 4 3(a x)( c) 4 x( 3(a 3(a c) 4 qj ) + x( c) 4 a c x( +x 2 +x a a 4 c ) 4 c +x qj ): x( (17) 3(a c) 4 ) x(x qj ) qj ): a c 2 Poichè qj 2 (RAT ) avremo che il pro…tto che immettere sul mercato a c una quantità qi < 4 è una strategia strettamente dominata sotto l’ipotesi 8 qj ) di RAT2 : Questo vale anche per l’impresa j: A questo punto cosa abbiamo ottenuto? Non stiamo facendo altro che ridurre l’insieme delle strategie possibili per le due imprese. All’inizio, infatti, l’insieme di scelta per l’impresa i era: qi 2 [0; 1): (18) Dopo l’applicazione iterativa dell’eliminazione delle strategie strettamente dominate (sotto l’ipotesi di RAT2 ) tale intervallo si è ridotto per le due imprese a: qi 2 [ qj 2 [ a 4 a 4 c a ; c a ; c 2 c 2 ] (19) ]: (20) Se portiamo avanti tale processo e valutiamo la best response quando qj = la migliore risposta per l’impresa i è giocare qi = 34 ( a 2 c ): Come prima, si può generalizzare dimostrando che per l’impresa i; mettere sul mercato una quantità maggiore di qi = 34 ( a 2 c ) è una strategia strettamente dominata per ogni qj (sotto l’ipotesi di RAT3 ). Per cui stiamo ulteriormente riducendo l’insieme delle strategie: a c 4 qi qj c 3 a c ; ( )] 4 2 a c 3 a c 2 [ ; ( )] 4 4 2 2 [ a 4 (21) (22) Continuando questo processo per in…niti stadi di cancellazione ed assumendo RAT1 si individua l’unica strategia dominante che è data da: qi = qj = a c (23) 3 a c 3 : (24) Tale pro…lo di strategie coincide con il NE del modello di Cournot. Lo stesso ragionamento può essere fatto gra…camente utilizzando le curve di reazione. (Vedi esercizi) 4.1 Osservazioni sul modello di Cournot, soluzione con strategie dominate e NE 1. Il modello di Cournot si può risolvere applicando la cancellazione iterativa delle strategie strettamente dominate solo se ci sono due imprese. In presenza di più imprese il gioco non è dominant solvable. Con n > 2 imprese il gioco presenta un unico equilibrio di Nash. 9 2. Il ragionamento basato sulla RAT1 porta nel caso di Cournot ad un equilibrio di Nash con common beliefs. Questa è una situazione particolare dove il metodo dell’astrazione è valido solo perchè le best response function sono lineari. Possiamo concludere che in alcuni casi motivare gli equilibri di Nash come equilibri e¤ettivamente raggiungibili in un processo di interazione strategica non richiede ipotesi forti come i common beliefs, semplicemente perchè l’equilibrio di Nash può rappresentare l’equilibrio che si raggiunge applicando il concetto di strategie dominanti. In altre situazioni, però, è importante ricordare che quando ci si riferisce ad un equilibrio di Nash e si vuole sostenere che questo è un equilibrio del processo di interazione si sta supponendo che valga l’ipotesi (forte) di common beliefs. 5 Esercizi 1) Considerando le curve di reazione descritte nell’analisi del modello di Cournot, fornire una discussione gra…ca della cancellazione delle strategie strettamente dominate in presenza di RAT1 : 2) Si consideri una situazione in cui due individui possono costituire una società che può o¤rire un guadagno di 100 euro. Prima di costituire la società, i due devono decidere come dividere tale guadagno. La situazione è la seguente. I due fanno una proposta simultanea su quanto vogliono dei 100 euro. Se le loro richieste sommate superano 100, allora vuol dire che non c’è accordo e la società non viene costituita e i due non hanno nessun guadagno. Se le due richieste sommano meno di cento, ognuno prende la sua parte ed il resto va in bene…cenza. a) Quali sono le strategie strettamente dominate? b) Quali sono le strategie dominate in senso debole? c) Quali sono gli equilibri di Nash in strategie pure in questo gioco? 10