Corso di Teoria dei Giochi Laurea specialistica in Economia Applicata Docente: Giovanni D’Orio E-mail: [email protected] Giochi dinamici ad informazione completa Teoria dei giochi - D'Orio - seconda parte 1 Panoramica dei giochi dinamici ad informazione completa Giochi dinamici ad informazione completa Rappresentazione in forma estensiva (o estesa) Giochi dinamici ad informazione completa e perfetta Albero del gioco Equilibrio di Nash perfetto nei sottogiochi Backward induction (Induzione all’indietro) Applicazioni Giochi dinamici ad informazione completa ed imperfetta Altre applicazioni Giochi ripetuti Teoria dei giochi - D'Orio - seconda parte 2 Gioco dell’entrata sul mercato Un monopolista già sul mercato (incumbent) è posto di fronte ad una possibile entrata sul mercato di un challenger. Il challenger può scegliere se entrare (enter) o restare fuori (stay out). Se il challenger entra, il monopolista (incumbent) può scegliere se cooperare (accommodate) o se combatterlo (fight). I payoffs del gioco sono conoscenza comune. Challenger In Out Incumbent A 2, 1 1, 2 F 0, 0 Il primo numero è il payoff del challenger. Il secondo numero è il payoff dell’incumbent. Teoria dei giochi - D'Orio - seconda parte 3 Matching pennies a mosse sequenziali Player 1 Ognuno dei due giocatori ha un penny. Player 1 sceglie per primo se giocare Head o Tail. Dopo aver osservato la scelta del giocatore 1, il giocatore 2 sceglie se giocare Head o Tail Entrambi conoscono le regole seguenti: H T Player 2 H Se i due pennies sono -1, 1 uguali allora il giocatore 2 vince il penny del giocatore 1. Negli altri casi vince il giocatore 1. Teoria dei giochi - D'Orio - seconda parte Player 2 T H T 1, -1 1, -1 -1, 1 4 Giochi dinamici ad informazione perfetta (o a mosse sequenziali) Un insieme di giocatori Chi muove quando e quali scelte sono disponibili? Cosa sanno i giocatori quando muovono? I payoff dei giocatori sono determinati dalle proprie scelte. Tutte le scelte possibili sono conoscenza comune dei due giocatori. Teoria dei giochi - D'Orio - seconda parte 5 Definizione: rappresentazione in forma estensiva (o estesa) La forma estesa di un gioco specifica: I giocatori del gioco Quando ogni giocatore deve muovere Cosa può fare ogni giocatore quando è il suo turno Cosa conosce ogni giocatore quando è il suo turno il payoff ricevuto da ogni giocatore per ogni combinazione mosse che potrebbe essere scelta dai giocatori Teoria dei giochi - D'Orio - seconda parte 6 Giochi dinamici ad informazione completa e perfetta Informazione perfetta Tutte le mosse precedenti sono osservabili prima che venga scelta la prossima mossa. Un giocatore sa Chi ha mosso e Cosa ha fatto prima che esso prenda una decisione Teoria dei giochi - D'Orio - seconda parte 7 Albero del gioco Un albero di un gioco ha un insieme di nodi e un insieme di segmenti tali che x0 Un sentiero da x0 a x4 un nodo x2 x1 Ogni segmento collega due nodi (questi due nodi sono detti x4 adiacenti) x5 Per ogni coppia di nodi, c’è un sentiero x7 unico che collega Un segmento di questi due nodi connessione fra i nodi x3 x6 x8 x1 e x5 Teoria dei giochi - D'Orio - seconda parte 8 Albero del gioco Un sentiero è una sequenza di Un sentiero nodi distinti y1, y2, y3, ..., yn-1, yn da x0 a x4 tale che yi e yi+1 sono adiacenti, per i=1, 2, ..., n-1. Diremo che questo sentiero va da y1 a yn. Possiamo anche utilizzare la sequenza dei segmenti fra i due nodi per denotare il sentiero. x0 x2 x1 La lunghezza di un sentiero è caratterizzato dal numero segmenti in esso contenuti. dei x4 Esempio 1: x0, x2, x3, x7 è un sentiero di dimensione 3. Esempio 2: x4, x1, x0, x2, x6 è un sentiero di dimensione 4 Teoria dei giochi - D'Orio - seconda parte x3 x5 x6 x7 x8 9 Albero del gioco C’è un nodo speciale x0 chiamato la radice dell’albero che rappresenta l’inizio del gioco. I nodi adiacenti a x0 sono successori di x0. I successori di x0 sono x1, x2 Per ogni due nodi adiacenti, il nodo che è connesso alla radice da un sentiero più lungo è un successore dell’altro nodo. Esempio 3: x7 è un successore di x3 perché essi sono adiacenti e il sentiero da x7 a x0 is è più lungo rispetto al sentiero da x3 a x0 x0 x2 x1 x4 Teoria dei giochi - D'Orio - seconda parte x3 x5 x6 x7 x8 10 Albero del gioco Se un nodo x è un successore del nodo y allora y è chiamato predecessore di x. In un albero, ogni nodo diverso dalla radice ha un predecessore unico. Ogni nodo che non ha successori è chiamato nodo terminale. Potrebbe essere la fine del gioco Esempio 4: x4, x5, x6, x7, x8 sono nodi terminali x0 x2 x1 x4 Teoria dei giochi - D'Orio - seconda parte x3 x5 x6 x7 x8 11 Albero del gioco Player 1 Ogni nodo diverso dai nodi terminali rappresenta qualche giocatore. Player 2 Per un nodo diverso da un terminale, I segmenti H che lo collegano con i successori rappresentano le azioni -1, 1 disponibili per il giocatore rappresentato in quel nodo. Teoria dei giochi - D'Orio - seconda parte H T Player 2 T H T 1, -1 1, -1 -1, 1 12 Albero del gioco Player 1 Un sentiero dalla radice ad un nodo terminale rappresenta una sequenza completa di Player 2 mosse che determinano H i payoffs al nodo terminale -1, 1 Teoria dei giochi - D'Orio - seconda parte H T Player 2 T H T 1, -1 1, -1 -1, 1 13 Strategia La strategia di un giocatore è un piano di azioni completo. La strategia (o il piano completo di azioni) specifica una azione possibile per il giocatore in qualsiasi contingenza esso potrebbe essere chiamato in azione. Teoria dei giochi - D'Orio - seconda parte 14 Gioco dell’entrata nel mercato Strategie del Challenger In Out Strategie dell’Incumbent Accommodate (se il challenger gioca In) Fight (se il challenger gioca In) Payoffs Rappresentazione in forma Normale Incumbent Accommodate Challenger Fight In 2 , 1 0 , 0 Out 1 , 2 1 , 2 Teoria dei giochi - D'Orio - seconda parte 15 Strategie e payoff In un albero, la strategia di un giocatore è rappresentata da un insieme di segmenti. Una combinazione di strategie (insiemi dei segmenti), una per ogni giocatore, sviluppa un sentiero dalla radice al nodo terminale, il quale determina i payoffs di tutti i giocatori. Teoria dei giochi - D'Orio - seconda parte 16 Matching pennies a mosse sequenziali Strategie del giocatore 1 Head Tail Strategie del giocatore 2 H se player 1 gioca H, H se player 1 gioca T H se player 1 gioca H, T se player 1 gioca T T se player 1 gioca H, H se player 1 gioca T T se player 1 gioca H, T se player 1 gioca T Le strategie del giocatore 2 sono denotate rispettivamente da HH, HT, TH e TT. Teoria dei giochi - D'Orio - seconda parte 17 Matching pennies a mosse sequenziali I payoffs Rappresentazione in forma Normale Player 2 Player 1 H HH -1 , 1 T 1 , -1 HT -1 , 1 TH 1 , -1 -1 , 1 , -1 1 Teoria dei giochi - D'Orio - seconda parte TT 1 , -1 -1 , 1 18 Equilibrio di Nash L’insieme degli equilibri di Nash in un gioco dinamico ad informazione completa è l’insieme degli equilibri di Nash nella sua forma normale. Come trovare l’equilibrio di Nash in un gioco dinamico ad informazione completa Costruite la forma normale del gioco dinamico ad informazione completa Trovate l’equilibrio di Nash nella forma normale. Teoria dei giochi - D'Orio - seconda parte 19 Equilibrio di Nash nel gioco dell’entrata nel mercato Due equilibri di Nash ( In, Accommodate ) ( Out, Fight ) Ha senso considerare il secondo equilibrio ( Out, Fight )? Minacce non credibili Incumbent Accommodate Challenger Fight In 2 , 1 0 , 0 Out 1 , 2 1 , 2 Teoria dei giochi - D'Orio - seconda parte 20 Rimozione degli equilibri di Nash non ragionevole L’equilibrio di Nash perfetto nei sottogiochi è una “raffinazione” dell’equilibrio di Nash Questo processo di “refinement” può eliminare equilibri di Nash non ragionevoli oppure minacce non credibili Teoria dei giochi - D'Orio - seconda parte 21 Riassunto Giochi dinamici ad informazione completa e perfetta Rappresentazione dei giochi in forma estesa Albero del gioco Prossimo argomento Sottogioco Equilibrio di Nash perfetto nei sottogiochi Backward induction (induzione all’indietro) Teoria dei giochi - D'Orio - seconda parte 22 Strategia e payoff Una strategia per un Una strategia per il giocatore 1: H Player 1 giocatore è un piano di H T azione completo. Specifica una azione Player 2 Player 2 fattibile in ogni contingenza nella H T H T quale il giocatore potrebbe essere -1, 1 1, -1 1, -1 -1, 1 chiamato in azione. Specifica cosa fa il Una strategia per il giocatore 2: H se il giocatore 1 giocatore ad ogni nodo gioca H, T se il giocatore 2 gioca T (scritta HT) specifico Il payoff del giocatore 1 è -1 e il payoff del giocatore 2 è 1 se il giocatore 1 gioca H e il giocatore 2 gioca HT Teoria dei giochi - D'Orio - seconda parte 23 Gioco dell’entrata nel mercato Strategie del Challenger Challenger In In Out Strategie dell’Incumbent Incumbent Accommodate A Fight Payoffs Rappresentazione in forma normale 2, 1 Out F 1, 2 0, 0 Incumbent Accommodate Challenger Fight In 2 , 1 0 , 0 Out 1 , 2 1 , 2 Teoria dei giochi - D'Orio - seconda parte 24 Equilibrio di Nash nel gioco dell’entrata nel mercato Challenger Due equilibri di Nash ( In, Accommodate ) ( Out, Fight ) In Out Incumbent Ha senso il secondo A equilibrio? Minacce non credibili 2, 1 1, 2 F 0, 0 Incumbent Accommodate Challenger Fight In 2 , 1 0 , 0 Out 1 , 2 1 , 2 Teoria dei giochi - D'Orio - seconda parte 25 Rimozione degli NE non credibili SNE (equilibrio di Nash nei sottogiochi) è un equilibrio di Nash “raffinato” Può eliminare NE che non hanno senso o minacce non credibili Dobbiamo però definire prima i sottogiochi Teoria dei giochi - D'Orio - seconda parte 26 Sottogioco Player 1 Un sottogioco in un gioco ad albero comincia in un nodo non terminale e include tutti i nodi e segmenti che seguono il nodo non terminale Player 2 Un sottogioco che comincia ad H un nodo non terminale x può essere ottenuto come segue: Rimuovete i segmenti che collegano x e i suoi predecessori La parte connessa che contiene x è il sottogioco -1, 1 H T Player 2 T H T 1, -1 1, -1 -1, 1 Teoria dei giochi - D'Orio - seconda parte Un sottogioco 27 Sottogiochi: esempi Player 2 2 1 E Player 1 C D Player 1 G Player 2 E F 3, 1 H 2, 0 F 1, 2 0, 0 Player 1 G 1, 2 H 3, 1 Player 1 G 0, 0 1, 2 Teoria dei giochi - D'Orio - seconda parte 3 H 0, 0 28 Equilibrio di Nash perfetto nei sottogiochi (SNE) Un equilibrio di Nash equilibrium of a dynamic gadi un gioco dinamico è perfetto nei sottogiochi se le strategie del NE costituiscono un NE in ogni sottogioco del gioco stesso. SNE è un NE. Teoria dei giochi - D'Orio - seconda parte 29 Gioco dell’entrata nel mercato Due equilibri di Nash ( In, Accommodate ) è un SNE. ( Out, Fight ) non è un SNE perché non costituisce un NE nel sottogioco che comincia dall’Incumbent. Challenger Incumbent In Out A 1, 2 2, 1 F Incumbent A 2, 1 F 0, 0 0, 0 Accommodate è il NE di questo sottogioco. Teoria dei giochi - D'Orio - seconda parte 30 Ricerca del SNE: backward induction Cominciate (al contrario) dai sottogiochi più piccoli Muovete all’indietro fino a raggiungere la radice Challenger In Out Incumbent A 2, 1 1, 2 F Il primo numero è il payoff del challenger. 0, 0 Il secondo numero è il payoff dell’incumbent. Teoria dei giochi - D'Orio - seconda parte 31 Ricerca del SNE: backward induction Player 1 C D Player 2 E F 2, 0 Player 1 G 1, 2 H 3, 1 0, 0 SNE (DG, E) Il giocatore 1 gioca D, e gioca G se il giocatore 2 gioca E Il giocatore 2 gioca E se il giocatore 1 gioca C Teoria dei giochi - D'Orio - seconda parte 32 Esistenza del SNE Ogni gioco dinamico finito ad informazione perfetta e completa ha un SNE che può essere ricavato per backward induction. Teoria dei giochi - D'Orio - seconda parte 33 Contrattazione sequenziale (2.1.D del Gibbons) I giocatori 1 e 2 stanno contrattando su un dollaro. La sequenza è come segue: All’inizio del primo periodo, il giocatore 1 propone di prendere una quota s1 del dollaro, lasciando 1-s1 al giocatore 2. Il giocatore 2 o accetta l’offerta o la rifiuta (in questo caso il gioco passa al secondo stadio) All’inizio del secondo stadio, il giocatore 2 propone al giocatore 1 di prendersi una quota s2 del dollaro, lasciando 1-s2 al giocatore 2. Il giocatore 1 o accetta l’offerta o la rifiuta (in questo caso il gioco passa al terzo stadio) All’inizio del terzo periodo, il giocatore 1 riceve una quota s del dollaro, lasciando 1-s al giocatore 2, dove 0<s <1. I giocatori sono impazienti. Essi scontano i payoff di un tasso di sconto pari a , dove 0< <1 Teoria dei giochi - D'Orio - seconda parte 34 Contrattazione sequenziale (2.1.D del Gibbons) Player 1 propone un’offerta ( s1 , 1-s1 ) Periodo 1 Player 2 accetta s1 , 1-s1 rifiuta Player 2 Periodo 2 Propone un’offerta ( s2 , 1-s2 ) Player 1 accetta s2 , 1-s2 rifiuta Periodo 3 s , 1-s Teoria dei giochi - D'Orio - seconda parte 35 Soluzione del gioco di contrattazione con la backward induction Periodo 2: Il giocatore 1 accetta s2 se e solo se s2 s. (assumiamo che l’offerta verrà accettata se si è indifferenti) Il giocatore 2 si trova di fronte a queste due opzioni: (1) offre s2 = s al giocatore 1, lasciando 1-s2 = 1-s per se stesso a questo periodo, oppure (2) offre s2 < s al giocatore 1 (e il giocatore 1 rifiuterà), e riceve 1-s al prossimo periodo. Il calore scontato di questa somma è (1-s) Dato che (1-s)<1-s, il giocatore 2 dovrebbe proporre un’offerta (s2* , 1-s2* ), dove s2* = s. Il giocatore 1 la accetterà. Teoria dei giochi - D'Orio - seconda parte 36 Contrattazione sequenziale (2.1.D del Gibbons) Player 1 propone un offerta ( s1 , 1-s1 ) Periodo 1 Player 2 accetta rifiuta Player 2 Periodo 2 s1 , 1-s1 s , 1- s Propone un’offerta ( s2 , 1-s2 ) Player 1 accetta s2 , 1-s2 rifiuta Periodo 3 s , 1-s Teoria dei giochi - D'Orio - seconda parte 37 Soluzione del gioco di contrattazione con la backward induction Periodo 1: Il giocatore 2 accetta 1-s1 se e solo se 1-s1 (1-s2*)= (1- s) o s1 1-(1-s2*), dove s2* = s. Il giocatore 1 ha due opzioni: (1) offre 1-s1 = (1-s2*)=(1- s) al giocatore 2, tenendosi s1 = 1-(1-s2*)=1-+s per se stesso in questo periodo, oppure (2) offre 1-s1 < (1-s2*) al giocatore 2 (il giocatore 2 rifiuterà), e riceve s2* = s il prossimo periodo. Il suo valore scontato sarà però s Dato che s < 1-+s, il giocatore 1 dovrà proporre un’offerta (s1* , 1-s1* ), dove s1* = 1-+s Teoria dei giochi - D'Orio - seconda parte 38 Riassunto SNE Backward induction Prossimo argomento Il Modello del duopolio di Stackelberg Salari e occupazione in una impresa sindacalizzata Teoria dei giochi - D'Orio - seconda parte 39 Backward induction: esempio Player 1 C Player 2 E 2, 1 D Player 2 F 3, 0 G 0, 2 H 1, 3 SNE (C, EH). Il giocatore 1 gioca C; Il giocatore 2 gioca E se il giocatore 1 gioca C, gioca H se il giocatore 1 gioca D. Teoria dei giochi - D'Orio - seconda parte 40 SNE multipli: esempio Player 1 C Player 2 F D Player 2 G 0, 1 E 1, 0 H 1, 1 Player 2 I 2, 1 J 2, 2 K 1, 3 SNE (D, FHK). Il giocatore 1 gioca D Il giocatore 2 gioca F se il giocatore 1 gioca C, gioca H se il giocatore 1 gioca D, gioca K se il giocatore 1 gioca E. Teoria dei giochi - D'Orio - seconda parte 41 SNE multipli: esempio Player 1 C Player 2 F D Player 2 G 0, 1 E 1, 0 H 1, 1 Player 2 I 2, 1 J 2, 2 K 1, 3 SNE (E, FHK). Il giocatore 1 gioca E; Il giocatore 2 gioca F se il giocatore 1 gioca C, gioca H se il giocatore 1 gioca D, gioca K se il giocatore 1 gioca E. Teoria dei giochi - D'Orio - seconda parte 42 SNE multipli: esempio Player 1 C Player 2 F D Player 2 G 0, 1 E 1, 0 H 1, 1 Player 2 I 2, 1 J 2, 2 K 1, 3 SNE (D, FIK). Il giocatore 1 gioca D; Il giocatore 2 gioca F se il giocatore 1 gioca C, gioca I se il giocatore 1 gioca D, gioca K se il giocatore 1 gioca E. Teoria dei giochi - D'Orio - seconda parte 43 Il modello di duopolio alla Stackelberg Un prodotto omogeneo è prodotto solo da due imprese: firm 1 and firm 2. Le quantità sono indicate rispettivamente come q1 e q2. La sequenza di questo gioco è come segue: Firm 1 sceglie una quantità q1 0. Firm 2 osserva q1 e quindi sceglie una quantità q2 0. Il prezzo di mercato è P(Q)=a –Q, dove a è una costante e Q=q1+q2. Il costo dell’impresa i di produrre la quantità qi è Ci(qi)=cqi. Le funzioni di Payoff sono : u1(q1, q2)=q1(a–(q1+q2)–c) u2(q1, q2)=q2(a–(q1+q2)–c) Teoria dei giochi - D'Orio - seconda parte 44 Il modello di duopolio alla Stackelberg Trovare, per backward induction, il SNE Prima risolviamo il problema dell’impresa 2 per ogni q1 0 in modo da ottenre la funzione di risposta ottima dell’impresa 2 a q1 . Vale a dire, risolviamo tutti i sottogiochi che cominciano dalla mossa dell’impresa 2. Fatto ciò, risolviamo il problema dell’impresa 1. Vale a dire, risolviamo il sottogioco che ha inizio dalla mossa dell’impresa 1 Teoria dei giochi - D'Orio - seconda parte 45 Il modello di duopolio alla Stackelberg Risolvere il problema dell’impresa 2 per ogni q1 0 in modo da ottenere la risposta ottima dell’impresa 2 a ogni q1. Max u2(q1, q2)=q2(a–(q1+q2)–c) s. a 0 q2 +∞ FOC: a – 2q2 – q1 – c = 0 La risposta ottima dell’impresa 2 sarà, R2(q1) = (a – q1 – c)/2 se q1 a– c = 0 se q1 > a– c Teoria dei giochi - D'Orio - seconda parte 46 Il modello di duopolio alla Stackelberg Risolvere il problema dell’impresa 1. Notate che l’impresa 1 può risolvere anche il problema dell’impresa 2 (common knowledge). Vale a dire, l’impresa 1 conosce la risposta ottima dell’impresa 2 a ogni quantità 1 q1. Quindi, il problema dell’impresa 1 sarà: Max u1(q1, R2(q1))=q1(a–(q1+R2(q1))–c) s. a 0 q1 +∞ Vale a dire, Max u1(q1, R2(q1))=q1(a–q1–c)/2 s. a 0 q1 +∞ FOC: (a – 2q1 – c)/2 = 0 q1 = (a – c)/2 Teoria dei giochi - D'Orio - seconda parte 47 Il modello di duopolio alla Stackelberg Equilibrio di Nash perfetto nei sottogiochi ( (a – c)/2, R2(q1) ), dove R2(q1) = (a – q1 – c)/2 se q1 a– c = 0 if q1 > a– c Vale a dire, l’impresa 1 sceglie una quantità (a – c)/2, l’impresa 2 sceglie una quantità R2(q1) se l’impresa 1 sceglierà una quantità q1. Il risultato della backward induction è ( (a – c)/2, (a – c)/4 ). L’impresa 1 sceglie una quantità (a – c)/2, l’impresa 2 sceglie una quantità (a – c)/4. Teoria dei giochi - D'Orio - seconda parte 48 Il modello di duopolio alla Stackelberg L’impresa 1 produrrà q1=(a – c)/2 e il suo profitto sarà q1(a–(q1+ q2)–c)=(a–c)2/8 L’impresa 3 produrrà q2=(a – c)/4 e il suo profitto sarà q2(a–(q1+ q2)–c)=(a–c)2/16 La quantità totale prodotta dalle due imprese sarà 3(a – c)/4. Teoria dei giochi - D'Orio - seconda parte 49 Il modello di duopolio alla Cournot L’impresa 1 produce q1=(a – c)/3 e il suo profitto sarà q1(a–(q1+ q2)–c)=(a–c)2/9 L’impresa 2 produce q2=(a – c)/3 e il suo profitto sarà q2(a–(q1+ q2)–c)=(a–c)2/9 La quantità totale prodotta dalle due imprese sarà 2(a – c)/3. Teoria dei giochi - D'Orio - seconda parte 50 Il monopolio Supponiate che ci sia una sola impresa, un monopolio, che produce il prodotto. Il monopolista, per decidere la quantità qm, deve risolvere il seguente problema: Max qm (a–qm–c) s. a 0 qm +∞ FOC: a – 2qm – c = 0 qm = (a – c)/2 Il monopolista produce qm=(a – c)/2 e il suo profitto sarà qm(a–qm–c)=(a–c)2/4 Teoria dei giochi - D'Orio - seconda parte 51 Il modello di duopolio alla Bertrand: mosse successive e prodotti differenziati Due imprese: impresa 1 e impresa 2. Ogni impresa sceglie il prezzo per il proprio prodotto. I prezzi sono rispettivamente indicati con p1 e p2. La sequenza di questo gioco è come segue: L’impresa 1 sceglie un prezzo p1 0. L’impresa 2 osserva p1 e quindi sceglie p2 0. La quantità domandata dai consumatori all’impresa 1: q1(p1, p2) = a – p1 + bp2. La quantità domandata dai consumatori all’impresa 2: q2(p1, p2) = a – p2 + bp1. I costi dell’impresa i di produrre la quantità qi sono: Ci(qi)=cqi. Teoria dei giochi - D'Orio - seconda parte 52 Il modello di duopolio alla Bertrand: mosse successive e prodotti differenziati Risolvere il problema dell’impresa 2 per ogni p1 0 per ottenere la funzione di risposta ottima ad ogni p1. Max u2(p1, p2)=(a – p2 + bp1 )(p2 – c) s. a 0 p2 +∞ FOC: a + c – 2p2 + bp1 = 0 p2 = (a + c + bp1)/2 La risposta ottima dell’impresa 2 sarà, R2(p1) = (a + c + bp1)/2 Teoria dei giochi - D'Orio - seconda parte 53 Il modello di duopolio alla Bertrand: mosse successive e prodotti differenziati Risolvere il problema dell’impresa 1. Notate che l’impresa 1 può risolvere il problema dell’impresa 2 (common knowledge). L’impresa 1 conosce quindi la funzione di risposta ottima dell’impresa 2 a p1. Quindi il problema dell’impresa 1 sarà: Max u1(p1, R2(p1))=(a – p1 + bR2(p1) )(p1 – c) s. a 0 p1 +∞ Vale a dire, Max u1(p1, R2(p1))=(a – p1 + b(a + c + bp1)/2 )(p1 – c) s. a 0 p1 +∞ F.O.C.: a – p1 + b(a + c + bp1)/2+(–1+b2/2) (p1 – c) = 0 p1 = (a+c+(ab+bc–b2c)/2)/(2–b2) Teoria dei giochi - D'Orio - seconda parte 54 Il modello di duopolio alla Bertrand: mosse successive e prodotti differenziati Equilibrio di Nash perfetto nei sottogiochi 2 2 ((a+c+(ab+bc–b c)/2)/(2–b ), R2(p1) ), dove R2(p1) = (a + c + bp1)/2 L’impresa 1 sceglie un prezzo (a+c+(ab+bc–b2c)/2)/(2–b2), L’impresa 2 sceglie un prezzo R2(p1) se l’impresa 1 sceglie un prezzo p1. Teoria dei giochi - D'Orio - seconda parte 55 Riassunto Equilibrio di Nash perfetto nei sottogiochi Backward induction Modello di duopolio alla Stackelberg Modello di duopolio alla Bertrand a mosse successive e prodotti differenziati Prossimo argomento Giochi dinamici ad informazione completa ma imperfetta Teoria dei giochi - D'Orio - seconda parte 56 Giochi dinamici ad informazione completa ed imperfetta Informazione imperfetta Un giocatore potrebbe non conoscere CHI ha fatto COSA nel momento in cui si trova a dover compiere una scelta. Esempio: Il giocatore 2 fa la sua scelta dopo il giocatore 1. Il giocatore 2 ha bisogno di prendere la propria decisione senza sapere cosa ha fatto il giocatore 1. Teoria dei giochi - D'Orio - seconda parte 57 Informazione imperfetta: esemplificazione Player 1 Ognuno dei due giocatori ha un penny. Il giocatore 1 sceglie se giocare Head o Tail. Dopo ciò, il giocatore 2 sceglie Player 2 se giocare Head o Tail senza sapere la mossa del giocatore 1 H Entrambi conoscono la regola di attribuzione dei payoffs: Se i due pennies sono -1, 1 uguali allora vince il giocatore 2. Se i due pennies sono diversi vince il giocatore 1. Teoria dei giochi - D'Orio - seconda parte H T Player 2 T H T 1, -1 1, -1 -1, 1 58 Insieme informativo Definizione del Gibbons: Un insieme informativo per un giocatore è una serie di nodi che soddisfa: Il giocatore ha la mossa ad ogni nodo dell’insieme informativo, e Quando il gioco raggiunge un nodo in un insieme informativo, il giocatore che deve muovere non sa quale nodo dell’insieme informativo è stato raggiunto. Tutti i nodi di un insieme informativo appartengono allo stesso giocatore Il giocatore deve avere lo stesso insieme di azioni possibili ad ogni nodo dell’insieme informativo. Teoria dei giochi - D'Orio - seconda parte 59 Insieme informativo: esemplificazione Player 1 L Due insiemi informativi per player 2 ognuno dei quali contiene un nodo singolo R Player 2 Player 2 L’ R’ 3 3 L” R” 2, 2, 3 L’ 1, 2, 0 L” 3, 1, 2 Un insieme informativo di player 3 contiene tre nodi R’ 3 R” 2, 2, 1 L” 2, 2, 1 3 R” L” 0, 1, 1 1, 1, 2 R” 1, 1, 1 Un insieme informativo di player 3 contiene un nodo singolo Teoria dei giochi - D'Orio - seconda parte 60 Insieme informativo: esemplificazione Tutti i nodi in un insieme informativo appartengono allo stesso giocatore Player 1 D C Player 2 E 2, 1, 3 Questo NON è un insieme informativo corretto Player 3 F G 3, 0, 2 0, 2, 2 Teoria dei giochi - D'Orio - seconda parte H 1, 3, 1 61 Insieme informativo: esemplificazione Il giocatore deve avere lo stesso insieme di azioni possibili ad ogni nodo dell’insieme informativo Player 1 C D Un insieme informativo NON può contenere questi due nodi Player 2 Player 2 E 2, 1 F 3, 0 G 0, 2 Teoria dei giochi - D'Orio - seconda parte K 1, 1 H 1, 3 62 Rappresentazione di un gioco statico ad albero: esemplificazione Il dilemma del prigioniero Prigioniero 2 Nega Conf Prigioniero 1 N -1, -1 Prigioniero 1 C 0, -9 N -9, 0 C -6, -6 Teoria dei giochi - D'Orio - seconda parte 63 Esempio: distruzione mutualmente assicurata Fra le due superpotenze, 1 e 2, c’è stato un incidente diplomatico. La sequenza è come segue: Il gioco comincia con la scelta della superpotenza 1 che può ignorare l’incidente ( I ), ottenendo i payoffs (0, 0), o esasperare la situazione ( E ). Se la superpotenza 1 esaspera, La superpotenza 2 può ritrattare ( B ), perdendo la faccia e ottenendo quindi un payoff negativo (1, -1), o può scegliere una risposta con attacco atomico ( A ). Su questa scelta, le due superpotenze giocano il seguente gioco a mosse simultanee. Possono entrambe Ritrattare ( R ) o scegliere l’Attacco ( D ) nel qual caso il mondo è distrutto. Se entrambe scelgono di ritrattare entrambe hanno una piccola perdita e il payoff sarà (0.5, -0.5). Se entrambe scelgono l’attacco atomico il payoff sarà (-K, -K), dove K è un numero molto grande. Teoria dei giochi - D'Orio - seconda parte 64 Esempio: distruzione reciproca 1 I E 2 0, 0 A B 1 1, -1 R D 2 R -0.5, -0.5 2 D -K, -K R -K, -K Teoria dei giochi - D'Orio - seconda parte D -K, -K 65 Informazione perfetta e informazione imperfetta Un gioco dinamico nel quale ogni insieme informativo contiene esattamente un nodo è chiamato gioco ad informazione perfetta. Un gioco dinamico nel quale alcuni insiemi informativi contengono più di un nodo è chiamato gioco ad informazione imperfetta. Teoria dei giochi - D'Orio - seconda parte 66 Strategia e payoff Una strategia è un piano completo di azione. Specifica una possibile azione per un giocatore in qualsiasi contingenza nella quale esso sia chiamato in causa. Specifica cosa fa il giocatore ad ogni suo insieme informativo La strategia per player 1: H Player 1 H T Player 2 Player 2 H T H T -1, 1 1, -1 1, -1 -1, 1 Una strategia per player 2: T Il payoff del giocatore 1 è 1 e il payoff del giocatore 2 è -1 se il giocatore 1 gioca H e il giocatore 2 gioca T Teoria dei giochi - D'Orio - seconda parte 67 Strategia e payoff: esemplificazione 1 I Una strategia per il giocatore 1: E, e R se il giocatore 2 gioca A, scritta come ER E 2 0, 0 A B 1 1, -1 R Una strategia per il giocatore 2: A, R, se il giocatore 1 gioca E, scritta come AR D 2 R -0.5, -0.5 2 D -K, -K Teoria dei giochi - D'Orio - seconda parte R -K, -K D -K, -K 68 Il NE in un gioco dinamico Possiamo usare anche la forma normale per rappresentare un gioco dinamico L’insieme degli NE in un gioco dinamico ad informazione completa è l’insieme degli Nenella sua forma normale Come trovare l’NE in un gioco dinamico ad informazione completa Costruite la forma normale del gioco dinamico ad informazione completa Trovate l’NE nella forma normale Teoria dei giochi - D'Orio - seconda parte 69 Rimuovere gli NE non ragionevoli SNE è un NE raffinato Puo eliminare NE non ragionevoli o minacce non credibili Ma prima dobbiamo definire i sottogiochi Teoria dei giochi - D'Orio - seconda parte 70 Sottogioco Un sottogioco in un albero di gioco dinamico Comincia ad un insieme informativo singletone (che contiene un nodo singolo), e Include tutti i nodi e segmenti che seguono il singleton, e NON spezza nessun insieme informativo; vale a dire, se un nodo di un insieme informativo appartiene a questo sottogioco allora tutti i nodi dell’insieme informativo devono anche appartenere al sottogioco. Teoria dei giochi - D'Orio - seconda parte 71 Sottogioco: esemplificazione 1 I un sottogioco E 2 0, 0 un sottogioco A B 1 1, -1 R D 2 R -0.5, -0.5 NON è un sottogioco 2 D -K, -K R -K, -K Teoria dei giochi - D'Orio - seconda parte D -K, -K 72 Equilibrio di Nash perfetto nei sottogiochi L’NE di un gioco dinamico è perfetto nei sottogiochi se le strategie del NE costituiscono o inducono un NE in ogni sottogioco del gioco. SNE è un NE. Teoria dei giochi - D'Orio - seconda parte 73 Ricerca del SNE: backward induction 1 I un sottogioco E 2 0, 0 Iniziate con i sottogiochi più piccoli Muovete all’indietro fino a raggiungere la radice Un SNE ( IR, AR ) Un sottogioco A B 1 1, -1 R D 2 R -0.5, -0.5 2 D -K, -K Teoria dei giochi - D'Orio - seconda parte R -K, -K D -K, -K 74 Ricerca del SNE: backward induction 1 I Un sottogioco E 2 0, 0 Iniziate con i sottogiochi più piccoli Muovete all’indietro fino a raggiungere la radice Un sottogioco A B 1 1, -1 R D 2 Un altro SNE ( ED, BD ) R -0.5, -0.5 2 D -K, -K Teoria dei giochi - D'Orio - seconda parte R -K, -K D -K, -K 75 Investimento Bancario Due investitori, 1 e 2, hanno ognuno un deposito di D con una banca. La banca ha investito questi depositi in un progetto a lungo termine. Se la banca liquida gli investimenti prima che il progetto maturi, si ottiene un totale di 2r, dove D > r > D/2. Se l’investimento bancario invece matura, il progetto pagherà un capitale pari a 2R, dove R>D. Ci sono due date soltanto nelle quali gli investitori possono prelevare i soldi investiti nella banca. Teoria dei giochi - D'Orio - seconda parte 76 Investimenti bancari: sequenza del gioco La sequenza del gioco è come segue Data 1 (prima che l’investimento bancario maturi) I due investitori giocano un gioco a mosse simultanee Se entrambi prelevano alloro ognuno riceve r e il gioco finisce Se solo uno fa un prelievo allora lui riceve D, l’altro riceve 2r-D, e il gioco finisce Se nessuno fa un prelevamento allora il progetto matura il rendimento e il gioco continua alla Data 2. Data 2 (dopo che l’investimento ha maturato rendimenti) Due investitori giocano un gioco a mosse simultanee Se entrambi fanno prelevamenti allora ognuno riceve R e il gioco finisce Se solo uno preleva allora lui riceve 2R-D, l’altro riceve D, e il gioco finisce Se nessuno preleva allora la banca restituisce R a ogni investitore e il gioco finisce. Teoria dei giochi - D'Orio - seconda parte 77 Investimenti bancari: l’albero 1 W W: preleva NW: non preleva NW 2 W r, r 2 NW D, 2r–D Data 1 W NW 1 2r–D, D Data 2 NW W Un sottogioco 2 W Un SNE ( NW W, NW W ) R, R 2 NW 2R–D, D Teoria dei giochi - D'Orio - seconda parte W D, 2R–D NW R, R 78 Investimenti bancari: l’albero 1 W W: preleva NW: non preleva NW 2 W r, r 2 NW D, 2r–D Data 1 W NW 1 2r–D, D Data 2 NW W Un sottogioco 2 W Un altro SNE ( W W, W W ) R, R 2 NW 2R–D, D Teoria dei giochi - D'Orio - seconda parte W D, 2R–D NW R, R 79 Dazi e concorrenza internazionale imperfetta Due nazioni identiche, 1 e 2, scelgono simultaneamente i propri dazi, denotati rispettivamente da t1, t2. L’impresa 1 della nazione 1 e l’impresa 2 dalla nazione 2 producono un prodotto omogeneo sia per il consumo interno sia per esportarlo. Dopo aver osservato i dazi scelti dalle due nazioni, l’impresa 1 e l’impresa w scelgono simultaneamente le quantità da destinare al consumo interno e all’esportazione, indicate rispettivamente con (h1, e1) e (h2, e2). I prezzi di mercato nelle due nazioni sono Pi(Qi)=a–Qi, for i=1, 2. Q1=h1+e2, Q2=h2+e1. Entrambe le imprese hanno costi marginali costanti c. Ogni impresa paga i dazi sulle esportazioni all’altra nazione. Teoria dei giochi - D'Orio - seconda parte 80 Dazi e concorrenza internazionale imperfetta Il payoff dell’impresa 1 e il suo profitto: 1 (t1 , t 2 , h1 , e1 , h2 , e2 ) [a (h1 e2 )]h1 [a (e1 h2 )]e1 c(h1 e1 ) t 2 e1 Il payoff dell’impresa 2 e il suo profitto: 2 (t1 , t 2 , h1 , e1 , h2 , e2 ) [a (h2 e1 )]h2 [a (e2 h1 )]e2 c(h2 e2 ) t1e2 Teoria dei giochi - D'Orio - seconda parte 81 Dazi e concorrenza internazionale imperfetta Il payoff della nazione 1 è il suo benessere totale: somma dei surplus dei consumatori della nazione 1, il profitto dell’impresa 1 e il ricavo ottenuto dai dazi. 1 W1 (t1 , t 2 , h1 , e1 , h2 , e2 ) Q12 1 (t1 , t 2 , h1 , e1 , h2 , e2 ) t1e2 2 dove Q1 h1 e2 . Il payoff della nazione 2 è il suo benessere totale: somma dei surplus dei consumatori della nazione 2, il profitto dell’impresa 2 e il ricavo ottenuto dai dazi. 1 W2 (t1 , t 2 , h1 , e1 , h2 , e2 ) Q22 2 (t1 , t 2 , h1 , e1 , h2 , e2 ) t 2 e1 2 dove Q2 h2 e1. Teoria dei giochi - D'Orio - seconda parte 82 Backward induction: sottogioco tra le due imprese Troviamo l’equilibrio di Nash del sottogioco fra le due imprese per ogni coppia di dazi (t1 , t 2 ) . L’impresa 1 massimizza 1 (t1 , t 2 , h1 , e1 , h2 , e2 ) [a (h1 e2 )]h1 [a (e1 h2 )]e1 c(h1 e1 ) t 2 e1 FOC: 1 a 2h1 e2 c 0 h1 (a e2 c) 2 1 a 2e1 h2 c t 2 0 e1 (a h2 c t 2 ) 2 L’impresa 2 massimizza 2 (t1 , t 2 , h1 , e1 , h2 , e2 ) [a (h2 e1 )]h2 [a (e2 h1 )]e2 c(h2 e2 ) t1e2 FOC: 1 a 2h2 e1 c 0 h2 (a e1 c) 2 1 a 2e2 h1 c t1 0 e2 (a h1 c t1 ) 2 Teoria dei giochi - D'Orio - seconda parte 83 Backward induction: sottogioco tra le due imprese Troviamo l’equilibrio di Nash del sottogioco fra le due imprese per ogni coppia di dazi (t1 , t 2 ) . Dato (t1 , t 2 ) , un equilibrio di Nash ( (h1* , e1* ), (h2* , e2* ) ) del sottogioco deve soddisfare queste equazioni. 1 h1 (a e2 c) 2 1 e1 (a h2 c t 2 ) 2 1 h2 (a e1 c) 2 1 e2 (a h1 c t1 ) 2 Risolvere queste equazioni ci porta alle soluzioni 1 h1* (a c t1 ) 3 1 h2* (a c t 2 ) 3 1 e1* (a c 2t 2 ) 3 1 e2* (a c 2t1 ) 3 Teoria dei giochi - D'Orio - seconda parte 84 Backward induction: l’intero gioco Entrambi le nazioni possono calcolarsi a priori la risposta ottima delle due imprese a (t1 , t 2 ) L’impresa 1 massimizza ( Q1 h1 e2 ) 1 W1 (t1 , t 2 , h1 , e1 , h2 , e2 ) Q12 1 (t1 , t 2 , h1 , e1 , h2 , e2 ) t1e2 2 Sostituendo quanto precedentemente ottenuto nella funzione obiettivo della nazione 1 otteniamo: 1 1 2 1 1 2 1 (2(a c) t1 ) 2 (a (a c) t1 ) (a c t1 ) (a (a c) t 2 ) (a c 2t 2 ) 3 3 3 3 3 3 18 1 1 1 2 c( (a c) (t1 2t 2 )) t 2 (a c 2t 2 ) t1 (a c 2t1 ) 3 3 3 3 FOC: 1 t1 (a c) 3 1 Per simmetria, otteniamo anche t 2 (a c) 3 Teoria dei giochi - D'Orio - seconda parte 85 Dazi e concorrenza internazionale imperfetta L’equilibrio di Nash perfetto nei sottogiochi 1 1 t1* ( a c), t 2* (a c), 3 3 1 h1 (a c t1 ) 3 , 1 e (a c 2t ) 2 1 3 1 h2 (a c t 2 ) 3 1 e (a c 2t ) 1 2 3 Il risultato finale perfetto nei sottogiochi 1 1 t1* (a c), t 2* (a c), 3 3 * 4 h1 (a c) 9 , 1 * e (a c) 1 9 * 4 h2 (a c) 9 1 e* (a c) 2 9 Teoria dei giochi - D'Orio - seconda parte 86 Generalizzazione del gioco dei dazi Quattro giocatori: 1, 2, 3, 4. La sequenza del gioco è come segue: Stadio 1: I giocatori 1 e 2 scelgono simultaneamente le azioni a1 e a2 dall’insieme delle azioni rispettivamente possibili A1 e A2. Stadio 2: Dopo aver osservato il risultato (a1, a2) del primo stadio, I giocatori 3 e 4 scelgono simultaneamente le azioni a3 e a4 dall’insieme delle azioni rispettivamente possibili A3 e A4. Il gioco finisce. I payoff sono ui(a1, a2, a3, a4), per i=1, 2, 3, 4 Teoria dei giochi - D'Orio - seconda parte 87 Albero informale del gioco Gioc. 1 Insieme delle azioni del gioc. 1 A1 a1 Stadio 1 Gioc. 2 a2 Insieme delle azioni del gioc. 2 A2 Gioc. 3 a3 Insieme delle azioni del gioc. 3 A3 Stadio 2 Gioc. 4 Insieme delle azioni del gioc. 4 A4 a4 ui (a1 , a2 , a3 , a4 ), per i 1, 2, 3, 4 Teoria dei giochi - D'Orio - seconda parte Uno dei sottogiochi più piccoli a seguito di (a1, a2) 88 Backward induction: risolvete il sottogioco più piccolo Il sottogioco più piccolo che segue ogni coppia di (a1, a2) è un gioco a mosse simultanee giocato dai giocatori 3 e 4 con la seguente rappresentazione in forma normale: Un insieme di giocatori: {gioc. 3, gioc. 4} Insiemi di azioni: A3, A4 u3 (a1 , a2 , a3 , a4 ) Payoffs: u 4 (a1 , a2 , a3 , a4 ) Notate che a1, a2 possono essere considerate costanti quando risolviamo questo gioco simultaneo fra il giocatore 3 e 4. Dopo aver fatto ciò, otterremo un NE (a3* , a4* ) . Ciò è funzione di a1 e a2, e possiamo scrivere quindi a3* R3 (a1 , a2 ), a4* R4 (a1 , a2 ) Queste individuate sono le funzioni di risposta ottima ad (a1, a2). Teoria dei giochi - D'Orio - seconda parte 89 Backward induction: ritornate alla radice Gioc. 1 Insieme delle azioni del gioc. 1 A1 a1 Stadio 1 Gioc. 2 Insieme delle azioni del gioc. 2 A2 a2 u1 (a1 , a2 , R3 (a1 , a2 ), R4 (a1 , a2 )) u 2 (a1 , a2 , R3 (a1 , a2 ), R4 (a1 , a2 )) Stadio 2 Sostituite i sottogiochi più piccoli con i payoffs dei giocatori 1 e 2. I giocatori 1 e 2 sanno che se giocheranno rispettivamente a1 e a2, , allora i giocatori 3 e 4 giocheranno a3* R3 (a1 , a2 ), a4* R4 (a1 , a2 ) . Teoria dei giochi - D'Orio - seconda parte 90 Backward induction: ritornate alla radice Adesso I giocatori 1 e 2 giocano un gioco a mosse simultaneecon la seguente rappresentazione in forma normale: Un insieme di giocatori: {gioc. 1, gioc. 2} Insiemi di azioni: A1, A2 u1 (a1 , a2 , R3 (a1 , a2 ), R4 (a1 , a2 )) Payoffs: u 2 (a1 , a2 , R3 (a1 , a2 ), R4 (a1 , a2 )) Dopo aver risolto ciò, otteniamo un NE (a1* , a2* ) . L’SNE dell’intero gioco sarà (a1* , a2* , R3 (a1 , a2 ), R4 (a1 , a2 )) Il risultato attuale del gioco sarà (a1* , a2* , R3 (a1* , a2* ), R4 (a1* , a2* )) . Teoria dei giochi - D'Orio - seconda parte 91 Riassunto Giochi dinamici ad informazione completa ed imperfetta Equilibrio di Nash perfetto nei sottogiochi Backward induction Prossimo argomento Giochi ripetuti Teoria dei giochi - D'Orio - seconda parte 92