Economia Industriale (teoria dei giochi) Concetti di soluzione in giochi dinamici a informazione perfetta in strategie pure (LEZIONE 4) Valerio Sterzi Università di Bergamo Facoltà di ingegneria 1 Cosa si intende per.. • soluzione di un gioco? Per soluzione di un gioco si intende un meccanismo “oggettivo” che, sotto alcune ipotesi, dà un modo “ovvio” di giocare. • gioco dinamico? Un gioco è quando un giocatore sceglie un’azione dopo aver osservato alcune mosse dei propri avversari. • informazione perfetta? Si ha informazione perfetta quando i giocatori sono sempre a conoscenza delle mosse che hanno fatto gli avversari che sono stati chiamati a giocare in una fase precedente. In altre parole i giocatori sanno sempre dove si trovano al momento di scegliere. (E ancora, per capirci meglio, quando ciascun insieme informativo è composto da un nodo decisionale singolo –singleton) • strategia pura? Per strategia pura si intende una regola che assegna una mossa ad ogni stato informativo. Una strategia mista è invece una distribuzione di probabilità sulle strategie pure. 2 Agenda 1. Credibilità nelle strategie 2. Principio di razionalità sequenziale 3. Induzione a ritroso 4. Equilibrio perfetto nei sottogiochi 5. Teorema di esistenza 6. Il valore del vincolo 7. Il modello di Stackelberg 3 Credibilità delle strategie (1) Un possibile modo per approcciare i giochi dinamici è semplicemente quello di derivare la rappresentazione in forma normale e applicare i concetti di soluzione della seconda lezione (strategie dominanti, eliminazione iterata delle strategie strettamente dominate, equilibrio di Nash..) Problema: le strategie di equilibrio così trovate sono tutte credibili? credibili 4 Credibilità delle strategie (2) • Il concetto di equilibrio di Nash non è sufficiente ad individuare ed eliminare le strategie non credibili. • Esempio (1): the predation game Ci sono due imprese, un incumbent (I) e un potenziale entrante (E). Il potenziale entrante muove per primo e ha a disposizione due possibili strategie: rimanere fuori dal mercato (OUT) o entrare (IN). In quest’ultimo caso, I viene chiamato a giocare e ha a disposizione due strategie: assumere un atteggiamento aggressivo, attraverso per esempio una guerra di prezzo, (A), oppure assumere un atteggiamento pacifico (P). 5 the predation game … Gioco in forma estesa (albero del gioco) P [2, 1] Incumbent in Entrant A out [-3, -2] [0, 3] 6 … the predation game … Gioco in forma normale Incumbent A, se E “In” P, se E “In” Out 0,3 0,3 In -3, -2 2, 1 Entrant 7 … the predation game Esaminando il gioco in forma normale troviamo due equilibri di Nash, (Out, A se E “In”) e (In, P se E “In”). Ad uno sguardo più attento vediamo però che il primo equilibrio non è una ragionevole predizione del gioco: se il potenziale entrante dovesse scegliere di entrare (E) l’Incumbent troverà ottimale scegliere sempre un atteggiamento pacifico (P), quindi la strategia A se E ”In” non è credibile. 8 Principio di razionalità sequenziale (PRS) Il PRS afferma che la strategia di un giocatore dovrebbe specificare azioni ottimali per ogni nodo nel gioco ad albero. Nell’esempio del predation game la strategia di I, A se E “In” non rispetta il PRS, infatti una volta che l’entrante ha scelto “In”, la strategia ottimale per l’Incumbent è quello di adottare un comportamento pacifico (P). Un concetto di soluzione che ci aiuta a tener conto delle sole strategie che rispettano il PRS è quello di induzione a ritroso. 9 Induzione a ritroso Partiamo dal determinare le azioni ottimali nel nodo decisionale finale dell’albero. Dal momento che il nodo finale non richiede ulteriori interazioni strategiche tra i giocatori, la determinazione del comportamento ottimale si esaurisce in un semplice problema decisionale a livello di singolo individuo. Il giocatore chiamato a muovere per ultimo sceglierà l’azione a cui è associato un pay-off più elevato. Una volta individuata l’azione “massimizzante”, è possibile ridurre il gioco eliminando il sottogioco appena risolto. A questo punto il procedimento appena descritto viene ripetuto per il giocatore che viene chiamato a giocare per penultimo, e così via.. 10 Sottogioco ed equilibrio perfetto nei sottogiochi Sottogioco : parte di un gioco dinamico che presenta le seguenti caratteristiche: (1) ha origine da un insieme di informazione che contiene un solo nodo, (2) contiene tutti i nodi decisionali successivi fino ai nodi finali (è chiuso nella sua successione), (3) non contiene alcun insieme informativo che presenta come suoi elementi nodi decisionali non successivi al nodo iniziale del sottogioco. In particolare, il gioco iniziale stesso è uno dei suoi sottogiochi. Æ (Colombo, 2003): Un sottogioco è una parte del gioco in forma estesa che inizia con un “singleton” e contiene tutti i nodi che seguono. Equilibrio perfetto nei sottogiochi Un equilibrio perfetto nei sottogiochi è un vettore di strategie di equilibrio che hanno la caratteristica di costituire un equilibrio di Nash di ciascun sottogioco. 11 Esempio 2 … Considerate il seguente gioco in forma estesa a tre giocatori: Giocatore 1 L R Giocatore 3 l Giocatore 2 r a b Giocatore 3 2 0 1 -1 5 6 l 3 1 2 Giocatore 3 r l 5 4 4 0 -1 7 r -2 2 0 12 … esempio 2 … Partiamo dal giocatore 3: se dovesse essere chiamato a giocare dopo il giocatore 2, e quest’ultimo dovesse scegliere a, il giocatore 3 sceglierebbe r, se il giocatore 2 dovesse scegliere b allora il giocatore 3 sceglierebbe l. Se il giocatore 1 dovesse scegliere nel primo nodo L, allora il gioco finirebbe di nuovo con la mossa dl giocatore 3, il quale sceglierebbe l’azione r. 13 … esempio 2 … La forma ridotta del gioco sarà la seguente: Giocatore 1 L R Giocatore 2 -1 5 6 a 5 4 4 b 0 -1 7 14 … esempio 2 A questo punto vediamo che il giocatore 2, se chiamato a giocare (ovvero se il giocatore uno dovesse scegliere R), sceglierà a (ottenendo un pay-off di 7 anziché di -4). Il giocatore uno a questo punto si troverebbe di fronte a due possibili pay-off associati alle due possibili azioni: se dovesse scegliere L otterrebbe -1, in caso di R otterrebbe invece 4. La procedura per induzione a ritroso dunque identifica il profilo di strategie (“R”, “a se R”, “r se L, r se R e se a, l se R e se b”). Tale equilibrio è detto perfetto nei sottogiochi. 15 Esercizi consigliati Esercizio 22, pag.239 (FM) Esercizio 23, pag.241 (FM) Identificate tutti gli equilibri di Nash del gioco dinamico a tre giocatori appena visto 16 Teorema di esistenza Ogni gioco finito a info perfetta ha (almeno) un equilibrio di Nash perfetto nei sottogiochi (in strategie pure). 17 Il valore del vincolo I giochi sequenziali consentono di evidenziare il grande valore del vincolo, dove quest’ultimo consente di sfruttare il vantaggio iniziale della prima mossa in modo tale da modificare la situazione strategica. 18 Esempio 3 … Vediamo un’ applicazione analizzando un tipico gioco di entrata. E in out I a ΠE = -20 ΠI = -20 ΠE = 0 ΠI = 40 p ΠE = 10 ΠI = 20 19 … esempio 3 … L’impresa entrante (E) deve decidere se entrare nel mercato (in) oppure rimanerne fuori (out). Il monopolista che attualmente opera sul mercato (I, Incumbent) osserva se l’entrata avviene, e in caso positivo, decide se ostacolarla attraverso un atteggiamento aggressivo (a) oppure accomodarla avendo un atteggiamento pacifico (p). Se l’entrata non avviene l’Incumbent ottiene i profitti di monopolio (40), ma se l’entrata avviene la strategia a non costituisce un’opzione credibile. L’equilibrio perfetto nei sottogiochi è {(In, p se In}. 20 … esempio 3 … In questo gioco quindi l’entrata avviene e il monopolista subisce una perdita di 20 (40-20). Esiste però un modo per migliorare la situazione dal punto di vista dell’Incumbent: quest’ultimo potrebbe, attraverso un’ azione v scrivere un contratto non rinegoziabile in cui si impegna in caso di entrata a scegliere la strategia a. Ovviamente il vincolarsi può implicare un costo per il monopolista, e il massimo valore che può assumere il vincolo è ovviamente di 20. 21 … esempio 3… L’albero del gioco diventa: I v E nv E out out in I a ΠE = -20 ΠI = -20 in ΠE = 0 ΠI = 40 (-V) p ΠE = 10 ΠI = -25 ΠE = 0 ΠI = 40 I a ΠE = -20 ΠI = -20 p ΠE = 10 ΠI = 20 22 … esempio 3 Se il vincolarsi ha un costo basso (v <20), il nuovo equilibrio perfetto nei sottogiochi è {(v, a se In se v, p se In se nv), (out se v, in se nv)}. Questo esempio illustra come un vincolo credibile possa possedere un notevole valore strategico. Nel nostro caso il valore del vincolo è pari a 20. Se il vincolo è credibile allora ha lo stesso impatto di una modifica dell’ordine delle mosse. Altri esempi di vincoli strategici, frequenti nel campo dell’economia industriale, sono gli investimenti in riduzione dei costi e/o della capacità produttiva, lo sviluppo di nuovi prodotti: sono tutti cambiamenti che influenzano la natura della futura competizione. 23 Modello di Stackelberg … Nel modello di Cournot sono presenti due imprese che simultaneamente competono sulle quantità. Nel modello di Stackelberg (1934) invece operano sempre due imprese, ma una (leader) può stabilire la quantità da produrre prima dell’altra (follower). Il gioco non sarà più quindi statico come nel modello di Cournot, ma rientrerà nella categoria dei giochi dinamici. Seguendo il metodo dell’induzione a ritroso, andiamo a determinare la quantità di produzione ottimale per l’impresa che sceglie per ultima, ovvero la follower, e solo successivamente andremo a calcolare la quantità ottimale per la leader, che terrà conto ovviamente dell’azione-reazione della follower. 24 … modello di Stackelberg … Supponiamo di trovarci in un mercato con prodotto omogeneo e che le due imprese fronteggino la medesima curva di domanda (inversa) di mercato: p = a – bQ, dove Q è la quantità totale prodotta dalle due imprese (Q = q1 + q2). Solo per chiarezza nell’esposizione, l’impresa leader è denotata con il pedice 1, la follower con 2. Infine supponiamo che le funzioni di costo siano lineari e identiche per le due imprese, in modo tale che i costi marginali siano costanti e pari a c. 25 … modello di Stackelberg … Poiché il gioco è a informazione perfetta si può ricavare l’esito con l’induzione a ritroso. Partiamo quindi dall’impresa 2, la quale dovrà massimizzare i propri profitti tenendo conto della quantità decisa nel primo stadio dall’impresa 1. Max Π2 (.) a − bq 1 q 2 − cq 2 Foc: q 2 R2 q 1 a − c − bq 1 2b 26 … modello di Stackelberg … Nel primo stadio deve decidere l’impresa leader, tenendo conto della funzione di reazione dell’impresa follower; in altri termini l’impresa uno sceglierà la quantità ottima che: Max Π1(.) a − bq 1 R2 q 1 − cq 1 Foc: q ∗1 a − bq 1 a − c − bq 1 − c q1 2b a−c 2b 27 … modello di Stackelberg … Sostituendo il valore ottimale per l’impresa monopolista nella funzione di reazione dell’impresa leader ne otterremo la quantità ottima: q ∗2 a − c 4b Infine sostituendo i valori di q ∗1 e q ∗2 otterremo i rispettivi valori di equilibrio dei profitti. 28 Bibliografia • Colombo, F. (2003), Introduzione alla teoria dei giochi, Carrocci Editore; • Mas-Colell A., Whinston M.D., and Green J.R. (1995), Microeconomic Theory, Oxford University Press; • Femminis G., Martini G. (1999), Razionalità individuale e decisioni strategiche, Giappichelli editore; • Osborne, M.J.,Rubenstein A. (1994), A course in game theory, The Mit Press; 29