TEORIA DEI GIOCHI
La teoria dei giochi studia l’interazione strategica tra giocatori(situazioni di conflitto o di
cooperazione). Negli ultimi anni la teoria dei giochi ha trovato un vasto campo d’applicazione nello
studio di problemi economici (oltre che politici, di scienze sociali ecc.). Nel contesto della politica
macroeconomica i giocatori sono rappresentati dalle autorità di governo da un lato e dal settore
privato dall’altro (persone e imprese).. Il comportamento del settore privato dipende da cosa si
aspetta dal governo. A sua volta il comportamento del governo dipende da cosa si aspetta
dall’economia (e quindi dal comportamento del settore privato).
Noi analizzeremo tre situazioni:
1) GIOCHI AD INFORMAZIONE COMPLETA E PERFETTA
2) GIOCHI AD INFORMAZIONE QUASI PERFETTA (O GIOCHI RIPETUTI)
3) GIOCHI AD INFORMAZIONE INCOMPLETA
Per rendere più semplice l’esposizione limitiamoci a considerare giochi tra soli due giocatori,
ognuno dei quali ha a disposizione un numero finito di scelte. Ogni coppia di scelte dei due
giocatori si definisce strategia. Supponiamo ad esempio che il giocatore 1 possa scegliere fra
sinistra s e destra d e che il giocatore 2 possa scegliere fra sinistra S e destra D. Allora le possibili
strategie sono:
(s, S) (s, D) (d, S) (d, D).
Ad ogni possibile scelta del giocatore 1 è associata una funzione di utilità u1 e lo stesso accade per il
giocatore 2 al quale sarà associata una funzione di utilità u2 . Ci sono due modi per rappresentare un
gioco:
I. LA FORMA ESTESA (o ad albero)
II. LA FORMA NORMALE (o matriciale)
Nella forma estesa si specifica l’ordine del gioco, le possibili scelte di ogni giocatore ed i
rendimenti (pay offs) o utilità relativa.
La forma estesa si rappresenta con un diagramma ad albero. Facciamo due esempi.
Supponiamo di avere due giocatori che giocano in due tempi diversi. Abbiamo quindi il tempo t = 1
e t =2. Al tempo t = 1 gioca il giocatore 1, al tempo t =2, gioca il giocatore 2. Ciascun giocatore
gioca una sola volta. All’inizio il giocatore 1 sceglie fra sinistra s e destra d. Al tempo 2 successivo
il giocatore 2, dopo aver osservato la scelta del giocatore 1, sceglierà a sua volta tra sinistra S e
destra D. Le coppie ordinate indicano rispettivamente il pay off del primo giocatore nella prima
coordinata e il pay off del secondo giocatore nella seconda coordinata. Pertanto se denotiamo con u1
ed u2 le funzioni di utilità del primo giocatore e del secondo giocatore, risulta:
u1 (s, S) = 2 u1 (s, D) = 2
u1 (d, S) = 1
u1 (d, D) = 3
u2 (s, S) = 0 u2(s, D) = -1
u2(d, S) = 0
u2(d, D) = 1
Vediamo graficamente
1
s
d
2
2
S
(2,0)
GIOCO DINAMICO O
SEQUENZIALE
D
(2,-1)
S
D
(1,0)
(3,1)
Questo gioco prende il nome di gioco dinamico o sequenziale.
In alcuni giochi però non c’è questa sequenzialità nelle scelte, per cui il secondo giocatore gioca
dopo aver osservato la scelta del primo giocatore. Ciò accade per esempio nel caso in cui le scelte
dei due giocatori sono simultanee. Quindi quando il giocatore 2 deve prendere una decisione, non
può osservare il comportamento del giocatore 1 ed in tal caso può fare solo delle congetture. Un
gioco di questo tipo è statico. Il modo di rappresentare un gioco statico è quello accanto: un ovale
racchiude i nodi del giocatore 2 e sta ad indicare che il giocatore 2 non sa cosa ha scelto 1.
1
s
GIOCO STATICO
O SIMULTANEO
d
2
S
(1,2)
D
S
(0,1)
(2,1)
D
(1,0)
Le strategie fino ad ora viste sono dette strategie pure, in quanto il giocatore le sceglie con certezza.
Può accadere però che le possibili scelte che un giocatore può fare, le fa casualmente con una certa
probabilità. Per esempio può accadere che il giocatore 1 scelga s con probabilità p e d con
probabilità (1-p). Tali strategie sono dette strategie miste. Una strategia pura può essere riguardata
come una strategia mista con probabilità con p =1 (cioè la scelta è fatta con certezza).
La forma normale invece di usare il diagramma ad albero, usa una matrice di dati. Vengono scritte
le strategie a disposizione dei due giocatori nella prima colonna e nella prima riga. All’interno si
scrivono i pay offs o utilità.
Nel gioco dell’esempio 2 ogni giocatore gioca indipendentemente dall’altro. Quindi la matrice è:
g1
g2
s
d
S
1,2
2,1
D
0,1
1,0
D’ora in avanti considereremo solo giochi in forma statica e di tipo statico.
Vediamo quale sarà la scelta effettuata dal giocatore 1 e dal giocatore 2. Supponiamo che l’utilità di
ciascun giocatore corrisponda ai valori riportati nelle quattro caselle. Il primo numero esprime
l’utilità del giocatore 1, il secondo numero (in ogni casella) esprime l’utilità del giocatore 2.
Guardando i valori nella tabella si vede che il giocatore 1 ha una utilità massima (ossia la più alta)
se sceglie d perché può avere un pay off pari a 2 oppure ad 1 indipendentemente da quale sarà la
scelta del secondo giocatore (mentre se sceglie s avrà una utilità pari ad 1 oppure 0). Per il giocatore
2 l’utilità è massima se sceglie S perché in tal caso ottiene un pay off di 2 oppure 1
indipendentemente dalla scelta del primo giocatore (se invece scegliesse D otterrebbe un pay off di
1 oppure 0). Quindi si dice che la strategia (d, S) è una strategia dominante. Diamo una
definizione di strategia dominante:
sia A1 l’insieme delle possibili scelte per il giocatore 1 e A2 l’insieme delle possibili scelte per il
giocatore 2,
∃a1* ∈ A1 tale che u1(a1*; a2) = max u1(a1, a2)
per ogni a2 ∈A2
a ∈A
1 1
∃a 2* ∈ A2 tale che u2(a1, a2*) = max u2 (a1, a2)
per ogni a1 ∈A1
a ∈A
2 2
(a1*, a2*) è la STRATEGIA DOMINANTE.
Se questi equilibri con strategia dominante si verificassero realmente, sarebbero sicuramente
ottimali, ma nella realtà una tale situazione è difficile che si realizzi. Generalmente quello che
succede è che ciascuno cerchi di ottenere una massima utilità dalla propria scelta , condizionata dal
comportamento di altri individui. Quindi quello che sembra più probabile che possa accadere è che
ciascun soggetto effettui la propria scelta ottima, condizionata dalla scelta ottima dell’avversario.
Quando si ha questa situazione di “OTTIMALITA’ CONDIZIONATA” si ha un equilibrio di
Nash (dal nome del matematico statunitense che lo elaborò nel 1951).
Diamo quindi la seguente definizione di equilibrio di Nash:
sia A1 l’insieme delle possibili scelte per il giocatore 1 e A2 l’insieme delle possibili scelte per il
giocatore 2
la strategia (a1*, a2*) si dice che è un equilibro di Nash se:
1) a1* ∈ A1 , a2* ∈ A2
2) u1(a1*, a2*) ≥ u1(a1, a2*) ∀ a1∈ A1
3) u2(a1*, a2*) ≥ u2(a1*, a2) ∀ a2∈ A2
In altre parole è la strategia che consente di dare la massima utilità a ciascun giocatore, data la
scelta ottima del secondo giocatore.
u1(a1*, a2*) =max u1(a1, a2*)
a1∈A1
u2(a1*, a2*) = max u2(a1*, a2)
a2∈A2
Se applichiamo questa idea dell’equilibrio di Nash al problema economico potremmo ipotizzare che
la scelta sia tra “inflazionare e non inflazionare”. Da un lato immaginiamo di avere il settore
privato e dall’altro il policy maker. Il policy maker può scegliere cosa fare. Per il policy maker è
ottimale scegliere un tasso di inflazione positivo, perché una volta aver indotto il settore privato a
fare delle scelte contrattuali sulla base della politica annunciata, ed aver quindi spinto lavoratori e
imprenditori a fissare i salari e i prezzi, può trovare conveniente deviare da tale politica annunciata
e fissare un livello di inflazione più elevato per perseguire l’ulteriore obiettivo di riduzione della
disoccupazione. Il settore privato però sa che per il policy maker è ottimale scegliere un livello di
inflazione più elevato perché conosce la sua funzione di utilità ( o perdita). Siamo infatti in uno
stato di informazione completa. Pertanto se il policy maker fissa un tasso di inflazione superiore a
quello annunciato (ipoteticamente pari a zero), per il settore privato sarà ottimale adattare le sue
aspettative a questo valore. Se non lo facesse otterrebbe una perdita. All’inizio dell’anno infatti
quando i lavoratori stipulano i contratti con le imprese, stabilendo i salari, lo fanno sulla base delle
aspettative di inflazione. E’ chiaro che quanto più l’inflazione è elevata tanto minore sarà a parità di
salario nominale, il salario reale. Quindi è ovvio che il lavoratore che si aspetta un aumento
dell’inflazione punterà ad avere un salario nominale più levato. Pertanto se rappresentiamo in una
matrice da un lato il policy maker (che rappresenta il giocatore 1) e dall’altro il settore privato,
avremo:
Pareto ottimale
s. privato
policy maker
π= 0
π = π+
πe = 0
πe = π+
10,10
11,0
0,11
3,3
Nash
Cioè la strategia πe = π = π+ è un equilibrio di Nash.
Un equilibrio di Nash può però presentare dei problemi.
Uno dei problemi di un equilibrio di Nash è che non sempre comporta soluzioni Pareto efficienti.
Cos’è una strategia Pareto ottimale (o Pareto efficiente)?
(a , a )
è una strategia pareto ottimale se non è possibile migliorare l’utilità di un giocatore senza
guastare (ridurre) quella di un altro giocatore, cioè:
1
2
( )
) > u (a , a )
( )
) < u (a , a )
se u1(a1, a2 ) > u1 a1 , a 2
allora
u2(a1, a2 ) <
se u2(a1’, a2’
allora
u1(a1’, a2’
2
1
2
u2 a1 , a 2
1
1
2
Esempio
Facciamo un esempio che ci mostri sia un equilibrio di Nash, sia una strategia pareto efficiente.
Ipotizziamo quindi di avere sempre i due giocatori con possibilità di scelta tra s e d per il giocatore
1 e tra S e D per il giocatore 2. Supponiamo di avere i seguenti pay off:
g1
g2
s
d
S
10,10
11,0
D
0,11
3,3
Qui l’equilibrio di Nash è dato dalla strategia (d, D), infatti:
u1(d,D) = 3 ≥ u1(s,D) = 0
Ferma restando la scelta del giocatore 2, perché per lui è quella che gli da il maggior pay off, se il
giocatore 1 scegliesse sinistra s anziché destra d , il suo pay off, sarebbe minore
Nel caso del giocatore 2 invece,
u2(d,D) = 3 ≥ u2(d,S) = 0
Ferma restando la scelta del giocatore 1 che sceglierebbe sicuramente destra perché gli da un pay
off maggiore, il giocatore 2 sceglierà D piuttosto che sinistra S perché in tal caso il suo pay off
sarebbe minore.
La strategia pareto ottimale invece è (s, S).
Se potesse il giocatore 1 sceglierebbe destra perché gli dà un pay off maggiore (qualunque sia la
scelta dell’altro). Ma per l’altro se il giocatore 1 sceglie destra avrà sempre dei pay off minori
rispetto alla situazione in cui il giocatore 1 gioca s. Quindi quello che fa star bene il giocatore 1 e fa
star bene anche il giocatore 2 è (s, S).
In teoria dei giochi, un esempio che rappresenta questa inefficienza paretiana è il così detto
“dilemma del prigioniero”. Questo gioco considera una situazione in cui due prigionieri complici in
un delitto vengono interrogati in due stanze separate. Questi hanno la possibilità di confessare il
loro delitto o di negare la loro colpevolezza. Se uno confessa e l’altro no, il primo è libero. Se
entrambi dovessero confessare sarebbero condannati a tre mesi. Se entrambi dovessero negare la
propria colpevolezza sarebbero condannati a un mese.
1
Confessa
Nega
2
Nash
Confessa
Nega
-3,-3
-6,0
0,-6
-1,-1
Pareto efficiente
Quindi abbiamo una strategia dominante (Confessare, Confessare), ed è anche un equilibrio di
Nash. Se però i due giocatori potessero restare uniti e ciascuno fosse certo che l’altro nega,
avrebbero convenienza entrambi a negare. Quindi la strategia (negare, negare) è pareto efficiente ,
cioè non vi è nessun altro modo per aumentare la soddisfazione di entrambi. Il dilemma del
prigioniero trova numerose applicazioni in economia. Se torniamo un attimo al problema della
scelta ottimale del livello di inflazione, vediamo che quella soluzione che avevamo trovato non era
pareto efficiente. Si avrebbe invece una soluzione pareto efficiente se il policy maker decidesse di
non barare e fissasse un livello di inflazione effettiva pari a quella annunciata. Quale può essere
allora un modo per indurre il giocatore traditore a non tradire? (nel caso del problema di politica
monetaria ci si chiede come poter spingere la banca centrale a non deviare dalla politica
annunciata). Fino ad ora abbiamo considerato dei giochi uniperiodali, cioè abbiamo visto dei giochi
in cui gli attori si incontravano una sola volta e giocavano una sola volta il gioco del dilemma del
prigioniero. La situazione però cambia se il gioco è ripetuto dagli stessi giocatori un numero
indefinito di volte . In questo contesto le possibilità strategiche per ciascun giocatore cambiano. Se
un giocatore ad un giro tradisce, sa che l’avversario può tradire la volta successiva. Quindi chi
tradisce verrà “punito” per il comportamento scorretto. Quindi in un gioco ripetuto si pone il
problema di “crearsi una reputazione”. In un gioco ripetuto ciascun giocatore, avendo la possibilità
di crearsi la reputazione di individuo che coopera, incoraggia l’altro a comportarsi correttamente.
Esiste un modo per influire sul comportamento dell’avversario: se un giocatore rifiuta di cooperare
ora, l’altro rifiuterà di cooperare la volta successiva. Finché entrambi si preoccupano dei pay off
futuri, la minaccia di non cooperare può costituire una strategia sufficiente per convincere i
partecipanti ad adottare una strategia pareto efficiente. Questo tipo di strategia “minacciosa” viene
detta “colpo su colpo”. Consiste sostanzialmente in questo. Nel primo giro si coopera, si gioca la
strategia negare se facciamo riferimento al gioco del dilemma del prigioniero. Nelle partite
successive si coopera se l’avversario ha cooperato nella partita precedente. Se ha tradito, anche
l’avversario tradirà. In altre parole ci si comporta esattamente come si è comportato l’avversario
nella volta precedente. La strategia del colpo su colpo è molto efficace perché il tradimento viene
immediatamente punito. Questa strategia è “leale”, se infatti l’avversario dopo esser stato punito per
il tradimento, dovesse tornare a cooperare, la strategia del colpo su colpo lo ricompenserà con la
cooperazione dell’altro giocatore. Vediamo come agiscono queste forze reputazionali nel caso di un
problema di politica monetaria. Seguendo la regola del “dente per dente”, il pubblico modifica le
proprie scelte in termini di aspettative inflazionistiche, sulla base del comportamento assunto in
passato dal policy maker. Pertanto se in passato il policy maker ha fissato un livello di inflazione
piuttosto basso, il settore privato manterrà basse le proprie aspettative. Non appena però l’inflazione
dovesse aumentare, il settore privato adeguerà subito le sue aspettative a tale maggior valore.
Pertanto ipotizzando che tale maggior valore corrisponda ad un livello di inflazione pari ad α, se il
policy maker annuncia una politica monetaria con inflazione nulla, come si comporterà il settore
privato? Tutto, come abbiamo detto, dipenderà dalle scelte al tempo t -1. Pertanto se a t-1 è stato
πa = 0,allora al tempo t si avrà πe = πa = 0.
Se invece al tempo t-1 la politica annunciata è stata pari a zero ma quella effettiva pari ad α>0,
allora le aspettative del settore privato saranno tali per cui πe = πa = α.
Quand’è che comunque la banca centrale deciderà di deviare dalla politica annunciata? Quando il
beneficio che ottiene dalla deviazione nel periodo dalla politica annunciata , confrontato con la
perdita che subisce nel secondo periodo in seguito alla perdita di reputazione, attualizzato al tempo t
è positivo e maggiore di zero.
Fino ad ora abbiamo visto giochi ad informazione completa e perfetta e giochi ad informazione
quasi perfetta. Vediamo ora i giochi ad informazione incompleta. Un giocatore ha informazione
incompleta quando non conosce le caratteristiche precise dei propri rivali (preferenze, spazio delle
strategie). Supponiamo ad esempio di avere due tipi di policy makers: uno più avverso
all’inflazione e l’altro meno preoccupato dell’inflazione. Il settore privato in tal caso non è in grado
di distinguere il tipo di polcy maker che ha di fronte. L’interessante conclusione cui giungono
alcuni studiosi in letteratura è che il risultato che si ottiene , in termini di “lotta all’inflazione” con
informazione incompleta circa le preferenze del policy maker è migliore di quello che si ottiene con
informazione completa.