INTRODUZIONE ALLA TEORIA DEI GIOCHI NELLE SCIENZE ECONOMICHE E SOCIALI Massimiliano FERRARA • “Mediterranea” University of Reggio Calabria Department of Law and Economics • Bocconi University- ICRIOS - Department of Management and Technology Teoria dei giochi a) Cosa è un gioco b) Come lo si rappresenta c) Come ci si ragiona sopra c1) giochi in forma normale c2) giochi in forma strategica 1 Cosa è un gioco? • COME COMPORTARSI IN SITUAZIONI DI INTERAZIONE STRATEGICA • INTERAZIONE STRATEGICA: DEFINIZIONE • AGENTI RAZIONALI • FUNZIONI OBIETTIVO (PROFITTI) : PER L’AGENTE i ABBIAMO πi • VARIABILI DI SCELTA xi 2 Interazione strategica ABBIAMO ASSENZA DI INTERAZIONE STRATEGICA QUANDO πi DIPENDE SOLO DA xi ABBIAMO INTERAZIONE STRATEGICA QUANDO πi DIPENDE ANCHE DA xj (con j ≠ i) COME ANALIZZARLA? La teoria dei giochi (VON NEUMANN - NASH - SCHELLING -SELTEN) 3 Esempi • LA POLITICA MILITARE DELLA NATO • LA SCELTA DEL PREZZO DI UN’IMPRESA • COME VESTIRSI A UNA FESTA • COME PASSARE UN POMERIGGIO problema generale: • la mia scelta ottimale dipende da quello che scelgono altri soggetti • la loro scelta (ottimale) dipende dalla mia • .... come se ne esce ? 4 Teoria dei giochi a) Cosa è un gioco b) Come lo si rappresenta c) Come ci si ragiona sopra c1) giochi in forma normale c2) giochi in forma strategica 5 Rappresentazione dei giochi : la matrice dei payoff SE CI INTERESSANO SOLO I PAYOFF, IN FORMA “NORMALE” ⇒ LA MATRICE DEI PAYOFF (ES. MOSSE SIMULTANEE) Giocatore 2 Strategia C Strategia D Strategia A Payoff 1, Payoff 2 con A-C Payoff 1, Payoff 2 con A-D Strategia B Payoff 1, Payoff 2 con B-C Payoff 1, Payoff 2 con B-D Giocatore 1 6 Rappresentazione dei giochi : l’albero del gioco • SE INTERESSA ANCHE L’ORDINE DELLE MOSSE, IN FORMA “STRATEGICA” ⇒ L’ALBERO DEL GIOCO • (ES. MOSSE EFETUATE IN TEMPI DIVERSI, QUANDO LA MOSSA PRECEDENTE E’ NOTA E DEFINITIVA) • UTILE QUANDO I GIOCATORI DECIDONO IN MODO ASINCRONO • ANCHE QUANDO I GIOCATORI DECIDONO PIU’ VARIABILI IN MOMENTI DIVERSI 7 L’albero del gioco: una scelta per ogni giocatore Questi si chiamano “nodi” Il giocatore 1 decide per primo: Mossa A Mossa B Giocatore 1 decide: A o B Giocatore 2 osserva la mossa (A) e decide CoD C Payoff 1,2 con A-C D Payoff 1, 2 con A-D Giocatore 2 osserva la mossa (B) e decide CoD C Payoff 1, 2 con B-C D Payoff 1, 2 con B-D 8 L’albero del gioco • In ogni nodo un giocatore sa cosa è successo fino ad allora e deve effettuare una scelta • Ciò che è successo prima è un dato: ciò che rileva in ogni nodo è quello che segue ⇒ GUARDARE AVANTI • Da ogni nodo parte un “sottogioco” 9 L’albero del gioco: ogni giocatore ha più scelte, da effettuare in sequenza Questi sono i “nodi” I giocatori hanno due variabili strategiche, che decidono in sequenza. Ma a ogni stadio abbiamo decisioni simultanee Giocatore 1 decide la sua prima variabile strategica Giocatore 2 decide la sua prima variabile strategica Giocatore 1 osserva le mosse sulla prima variabile e decide la sua seconda variabile Giocatore 2 osserva le mosse sulla prima variabile e decide la sua seconda variabile Payoff 1, 2 date le strategie decise ai due stadi 10 L’albero del gioco: lo stesso gioco potrebbe essere giocato più volte di seguito I giocatori fronteggiano lo stesso gioco che devono giocare più volte. A ogni stadio abbiamo decisioni simultanee Giocatore 1 decide per la prima volta la sua variabile strategica Giocatore 2 per la prima volta la sua variabile strategica Payoff 1, 2 al primo stadio del gioco Giocatore 1 osserva il risultato del primo stadio e decide come giocare il secondo Giocatore 2 osserva il risultato del primo stadio e decide come giocare il secondo Payoff 1, 2 al secondo stadio del gioco • Questo si chiama “gioco ripetuto” (2 volte, ma in generale n volte) o “supergioco” 11 Teoria dei giochi a) Cosa è un gioco b) Come lo si rappresenta c) Come ci si ragiona sopra c1) giochi in forma normale c2) giochi in forma strategica 12 Giochi in forma normale: il dilemma dei prigionieri Perfetta informazione su obiettivi e possibilità dell’altro Decidono senza conoscere la decisione dell’altro [⇒ come se fossero decisioni simultanee] One-shot [non c’è futuro] Prigioniero 2 Confessa Confessa Non confessa -10, -10 0, -15 -15, 0 -2, -2 Prigioniero 1 Non confessa 13 Strategie dominanti e dominate Qualche volta abbiamo a) strategie che - qualunque sia la scelta dell’altro - ci danno un payoff superiore a quello di tutte le altre ⇒ parliamo di strategie dominanti b) strategie che - qualunque sia la scelta dell’altro - ci danno un payoff inferiore ad almeno un’altra strategia ⇒ parliamo di strategie dominate Con 2 strategie, se una è dominante l’altra è dominata 14 Strategie dominanti Se esiste una strategia dominante, LA SI DEVE GIOCARE Se esiste una strategia (strettamente) dominata, LA SI PUO’ ANCHE CANCELLARE Nel dilemma dei prigionieri, confessare è strategia dominante 15 Esempi di giochi (I) I L M A 8, 5 6, 2 B 5, 9 19, 6 C 4, 8 12, 10 (eliminazione di strategie dominate) 16 L’equilibrio di Nash (1/3) Spesso non esiste una strategia dominante... Dati n giocatori e πi (xi ; xj) abbiamo un EQUILIBRIO DI NASH (x*1, x*2, ... , x*n) quando x*1 massimizza il profitto π1 dati (x*2, ... , x*n) x*2 massimizza il profitto π2 dati (x*1, x*3, ... , x*n) ecc. – fino al giocatore n 17 L’equilibrio di Nash (2/3) Ovvero (x*1, x*2, ... , x*n) è definito come soluzione di un sistema di n equazioni simultanee ∂π 1 = 0 ∂x1 ∂π 2 = 0 ∂x2 ecc. fino al giocatore n Ciascuna condizione di ottimo potrebbe dipendere da tutte le variabili xi (sono funzioni!) 18 L’equilibrio di Nash (3/3) “DATO” quello che fanno gli altri – comunque non lo controllo – la mia scelta ottima è funzione di quanto fanno gli altri, la cui scelta entra come un parametro nella mia condizione di ottimo INTUIZIONE: assenza di rimpianto 19 Un esempio economico Consideriamo due imprese e la loro strategia di prezzo o di pubblicità: strategia aggressiva strategia accomodante strategia aggressiva 2, 2 15, 0 strategia accomodante 0, 15 8, 8 Una coppia di strategie dominanti è sempre un equilibrio di Nash 20 Esempi di giochi (II) II L M A 8, 5 6, 2 B 5, 9 19, 6 C 6, 8 12, 10 [cambia solo il payoff nel caso (C, L)] 21 Esempi di giochi (III) III L M A 8, 5 6, 2 B 15, 9 10, 6 C 6, 8 12, 10 • Possiamo avere molteplicità di equilibri 22 Teoria dei giochi a) Cosa è un gioco b) Come lo si rappresenta c) Come ci si ragiona sopra c1) giochi in forma normale c2) giochi in forma strategica 23 Come ragionare sui giochi sequenziali Non basta più ragionare su quello che fa l’altro (equilibrio di Nash): occorre valutare chi fa cosa QUANDO ( e sapendo che cosa) ⇒ Equilibrio perfetto (“Subgame-perfect”): Da ogni nodo decisionale parte un “sottogioco”. L’equilibrio perfetto è una sequenza di equilibri di Nash per ciascuno dei sottogiochi. In pratica... 24 Il principio di backward induction • Partiamo dall’ultimo stadio del gioco e cerchiamo di capire: “dato che siamo qui, ovvero date le scelte precedenti, quale è ORA la strategia migliore?” • E poi risaliamo (un processo logico “all’indietro”): dato che sappiamo che allo stadio successivo avverranno certe cose, a questo stadio cosa conviene fare? 25 Un gioco in forma normale 2 C D A 10, 8 12,6 B 7,2 11,3 1 Equilibrio di Nash? Cosa succede se uno dei giocatori decide prima dell’altro? 26 Ragionare all’indietro: le scelte dei giocatori nel gioco visto in precedenza Mossa B Il giocatore 1 decide per primo: Mossa A Giocatore 1 decide: A o B Giocatore 2 osserva la mossa (A) e decide CoD C 10, 8 Giocatore 2 osserva la mossa (B) e decide CoD D 12, 6 C D 7, 2 11, 3 All’ultimo stadio, il giocatore 2 cosa sceglie? Anticipando la decisione del giocatore 2, il giocatore 1 sceglie... Se il giocatore 2 potesse vincolarsi a una scelta, cosa sceglierebbe? 27 Il problema centrale: la credibilità delle mosse (ovvero degli annunci) La credibilità delle mosse al primo stadio • Se si potesse tornare indietro, potrebbe convenire... • ma allora… E’ credibile un annuncio (minacce-promesse) su cosa faremo nel futuro? E’ credibile solo se – non avremo scelta (vincolo tecnologico o contrattuale) – dichiariamo di seguire una strategia che - date le mosse precedenti - massimizzerà il nostro utile (convenienza) 28 Un gioco tra imprese Campagna pubblicitaria Leader di mercato Nessuna pubblicità Satellite Pubblicità “accomodante” 1, -1 Pubblicità aggressiva 0, 0 -100, -100 • Equilibrio: entrambe faranno pubblicità, in modo “normale” - il satellite ci perde 29 Come evitare di perderci? Campagna pubblicitaria Leader di mercato Nessuna pubblicità Satellite Pubblicità aggressiva 0, 0 -100, -100 • Vincolarsi a un tipo di pubblicità aggressivo: eliminare una strategia può migliorare l’equilibrio 30 Lezione generale Un modo di migliorare la propria posizione può essere limitare proprie strategie possibili: – – – – – attraversare un fiume con l’esercito interrogare un sospetto di reato l’incrocio tra due camion su una strada di montagna comportarsi in modo aggressivo con un concorrente ... Legarsi le mani (impegno credibile) può avere un costo diretto ma un grande valore strategico Da bilanciare con il valore della flessibilità... 31 Giochi ripetuti Gioco “costitutivo”: mosse simultanee, perfetta informazione (es: dilemma dei prigionieri) Ripetuto n volte (es.: 2 volte) Strategia: una sequenza di decisioni, una per ogni stadio del gioco 32 Equilibrio nei giochi ripetuti Cerchiamo una sequenza di equilibri di Nash Equilibrio “banale”: sequenza di equilibri uguali a quello del gioco “costitutivo” Esistono equilibri diversi? Se esistono, allora la ripetizione “fa differenza” 33 Dilemma dei prigionieri ripetuto un numero finito di volte (1/2) Possiamo partire dall’ultimo stadio e ragionare “all’indietro” Come è fatto l’equilibrio all’ultimo stadio? Prigioniero 2 Confessa Confessa Non confessa 10, 10 0, 15 15, 0 2, 2 Prigioniero 1 Non confessa 34 Dilemma dei prigionieri ripetuto un numero finito di volte (2/2) Cosa posso fare allo stadio n-1 per migliorare tale risultato? Questo risultato è indipendente da quanto è avvenuto in precedenza: conta solo il futuro … nulla ⇒ Non esistono equilibri diversi da una sequenza di equilibri di Nash del gioco costitutivo • chain-store paradox 35 Dilemma dei prigionieri ripetuto un numero infinito di volte Non esiste un ultimo stadio da cui ragionare “all’indietro”… quindi? Strategia trigger (del grilletto): - comincio non confessando e comunico alla controparte che a) non confesserò fin quando l’altro continua a non confessare b) se l’altro confessa una volta, da lì in poi confesserò sempre 36 La credibilità della strategia trigger “Non confessare” è un equilibrio? Se entrambi adottano una strategia trigger: - se confesso, risparmio oggi qualche anno di galera, ma da lì in poi l’altro confesserà sempre - se non confesso rinuncio a uscire di galera oggi, ma so che nel futuro l’altro non confesserà TRADE-OFF tra rinuncia oggi e guadagni futuri Se i benefici futuri sono abbastanza importanti, non confessare è un equilibrio 37 La strategia tit-for-tat La strategia trigger può sembrare un po’ estrema Strategia alternativa: tit-for-tat (pan per focaccia) - comincio non confessando e comunico che mi comporterò nel periodo t come l’altro si comporta in t-1 ⇒ se l’altro “devia” per n periodi, lo punisco n periodi Sono tutti equilibri sostenuti da minacce credibili Richiedono che il futuro “conti abbastanza” 38 Il folk theorem (1/2) Ogni coppia di payoff superiori a quelli ottenibili nell’equilibrio del gioco costitutivo (πC) possono essere sostenuti nel supergioco da una coppia di strategie Con due strategie possibili (confesso o no) è facile Con un numero infinito di strategie (es.: p∈[0,p’]) possiamo avere infiniti equilibri 39 Payoff del giocatore 2 Il folk theorem (2/2) Ogni punto in alto e a destra del punto di incontro può essere sostenuto come equilibrio da una coppia di strategie πC πC Payoff del giocatore 1 Un po’ troppi equilibri... 40