slide4

Teoria dei Giochi
Anna Torre
Almo Collegio Borromeo 20 marzo 2014
email: [email protected]
sito web del corso:www-dimat.unipv.it/atorre/borromeo2014.html
IL PARI O DISPARI
S
H II
I H
H
S
(-1, 1)
T
(1, -1)
T
(1, -1)
(-1, 1)
Questo gioco non ha equilibri di Nash? Cerchiamo di ampliare
opportunamente lo spazio delle strategie in modo che abbia equilibri
di Nash in questo nuovo spazio.
Strategie miste
q
H II
I H
H
p
(-1, 1)
1 − p (1, -1)
II
q
HH
I H
p
pq
1 − p (1-p)q
1−q
(1, -1)
(-1,1)
1−q
p(1-q)
(1-p)(1-q)
Estensione mista
◮
“Estensione mista del gioco”,
◮
Le strategie sono le distribuzioni di probabilità sull’insieme delle
strategie (pure).
◮
Il giocatore I invece di fare una scelta per così dire “secca”, può
scegliere di giocare la strategia T con probabilità p e la strategia
B con probabilità 1 − p.
◮
Analogamente il giocatore II.
Strategie miste
◮
Una distribuzione di probabilità nel caso di due strategie è la
scelta di un numero nell’intervallo [0, 1].
◮
Abbiamo cambiato lo spazio delle strategie, facendolo diventare
molto più grande.
◮
Una strategia per il primo giocatore è adesso rappresentata da
un numero p compreso tra 0 e 1, mentre una strategia per il
secondo da un numero q compreso tra 0 e 1.
◮
Il payoff dei giocatori in corrispondenza ai valori p e q delle
strategie è l’utilità attesa, supponendo che i due agiscano
indipendentemente.
Strategie miste
q
H II
I H
H
p
pq
1 − p (1-p)q
1−q
p(1-q)
(1-p)(1-q)
Utilità attesa del primo giocatore:
f (p, q) = pq·(−1)+p(1−q)·(+1)+q(1−p)·(+1)+(1−p)(1−q)·(−1) =
−4pq + 2p + 2q − 1 = (−4q + 2)p + 2q − 1
L’utilità ettesa del secondo è il suo opposto.
Strategie miste
1
2
p = 0 quando −4q + 2 ≤ 0, cioè q ≥ 12
ogni p quando −4q + 2 = 0, cioè q = 12
◮
max f (p, q) si ha per p = 1 quando −4q + 2 ≥ 0, cioè q ≤
◮
max f (p, q) si ha per
◮
max f (p, q) si ha per
◮
g(p, q) = (4p − 2)q − 2p + 1
◮
max g(p, q) si ha per q = 1 quando 4p − 2 ≥ 0, cioè p ≥
◮
max g(p, q) si ha per
◮
max g(p, q) si ha per
1
2
1
q = 0 quando 4p − 2 ≤ 0, cioè p ≤ 2
ogni q quando 4p − 2 = 0, cioè p = 12
La linea rossa è la strategia di miglior risposta del primo giocatore. La
linea verde è la strategia di miglior risposta del secondo giocatore.
1
1
2
1
In rosso è segnata la strategia di miglior risposta
del primo giocatore1
2
e in blu quella del secondo. Nel punto di intersezione ( 12 , 12 ), p è
miglior risposta a q e viceversa.
EQUILIBRIO DI NASH!!!!!!!
( 21 , 21 ) è un equilibrio di Nash del gioco del pari o dispari.
IL GIOCO DELLE DUE DITA
II
P
HH
I H
P
(-2, 2)
D
(3, -3)
D
(3, -3)
(-4,4)
Strategie miste
q
H II
I H
H
p
pq
1 − p (1-p)q
1−q
p(1-q)
(1-p)(1-q)
che nel nostro caso per il primo giocatore è:
f (p, q) = pq·(−2)+p(1−q)·(+3)+q(1−p)·(+3)+(1−p)(1−q)·(−4) =
−12pq + 7p + 7q − 4 = (−12q + 7)p + 7q − 4
Naturalmente il payoff atteso del secondo è il suo opposto.
Strategie miste
7
12
7
p = 0 quando −12q + 7 ≤ 0, cioè q ≥ 12
7
ogni p quando −12q + 7 = 0, cioè q = 12
◮
max f (p, q) si ha per p = 1 quando −12q + 7 ≥ 0, cioè q ≤
◮
max f (p, q) si ha per
◮
max f (p, q) si ha per
◮
g(p, q) = (12p − 7)q − 7p + 4
7
12
◮ max g(p, q) si ha per q = 0 quando 12p − 7 ≤ 0, cioè p ≤ 7
12
◮ max f (p, q) si ha per ogni q quando 12p − 7 = 0, cioè p = 7
12
◮
max g(p, q) si ha per q = 1 quando 12p − 7 ≥ 0, cioè p ≥
La linea rossa è la strategia di miglior risposta del primo giocatore. La
linea verde è la strategia di miglior risposta del secondo giocatore.
1
7
12
In rosso è segnata la strategia di miglior risposta del7 primo giocatore1
12
7 7
e in verde quella del secondo. Nel punto di intersezione ( 12
, 12 ), p è
miglior risposta a q e viceversa.
Calcoliamo il guadagno atteso del primo giocatore quando viene
adottata la coppia di strategie di Nash:
25
35
35
210−198
1
49
= 12
144 · (−2) + 144 · (−4) + 144 · (3) + 144 · (3) =
144
È facile vedere se un gioco è pari?
P
H II
I H
H
P
(-2, 2)
D
(3, -3)
II
A2
HH
I H
A1
(-1, 1)
B1
(1, -1)
C1
(-1, 1)
D
(3, -3)
(-4,4)
B2
C2
(1, -1)
(-1,1)
(1,-1)
(-, 1)
(1, -1)
(-1, 1)
Poker semplificato
Rivediamo dal punto di vista dell’equilibrio di Nash il poker
semplificato:
H II
I H
H
RA RK
RA PK
PA PK
PA RK
P
S
(1, -1)
(0,0)
(-1, 1)
(0, 0)
(0,0)
(1/2, -1/2)
(-1,1)
(-3/2,3/2)
NB: la strategia RA RK prevede (per via di RK ) che il giocatore I bluffi.
Poker semplificato dopo aver tolto le strategie
dominate
H II
I H
H
p
1−p
RA PK
RA RK
P
S
q
(0,0)
(1, -1)
1−q
(1/2, -1/2)
(0,0)
◮
f (p, q) = − 23 pq + 12 p + q = (− 23 q + 21 )p + q
◮
massimo per p = 1 quando q ≤
◮
massimo per p = 0 se q ≥
◮
g(p, q) = ( 32 p − 1)q − 21 p
◮
massimo per q = 1 quando p ≥
◮
massimo per q = 0 se p ≤
◮
Quindi l’equilibrio di Nash si ottiene per p =
1
3
2
3
1
3
e per ogni valore di p se q =
1
3
2
3
e per ogni valore di q se p =
2
3
eq=
1
3
2
3
◮
L”equilibrio di Nash prevede per il primo giocatore di giocare la
prima strategia con probabilità 23 e di conseguenza la seconda
con probabilità 31 .
◮
La strategia RA RK prevede (per via di RK ) che il giocatore I bluffi.
◮
Quindi la strategia ottimale per I prevede con probabilità positiva
(1/3) che I adotti la strategia RA RK e quindi che, bluffi
mediamente 1/3 delle volte
◮
È ottimale per I bluffare con questa “frequenza”, nè più spesso
nè meno spesso!
Teorema di Nash
Il merito di Nash sta nell’aver dimostrato l’esistenza di almeno un
equilibrio (di Nash) in ipotesi abbastanza generali. Vale infatti il
TEOREMA DI NASH
Siano X e Y sottoinsiemi chiusi, convessi e limitati di Rn (per esempio
l’insieme delle strategie miste di un gioco finito soddisfa a queste
proprietà) ,f e g funzioni continue , inoltre valgano le proprietà:
x → f (x, , y) è quasi concava per ogni y fissato
y → g(x, y) è quasi concava per ogni x fissato
Allora esiste almeno un equilibrio di Nash.
Una funzione h di una variabile si dice quasi concava se per ogni
numero reale k, l’insieme
Ak = {x h(x) ≥ k}
è convesso.
DUOPOLIO DI COURNOT(1838)
Cournot (1838) ha anticipato la definizione di equilibrio di Nash nel
contesto di un particolare modello di duopolio.
PRIMA SITUAZIONE: CONCORRENZA
Due imprese 1 e 2 operano in un mercato in situazione di duopolio
producendo in modo indipendente lo stesso bene e intendono
massimizzare i loro profitti.
DUOPOLIO DI COURNOT
◮
Il prezzo di mercato per unità di prodotto è funzione decrescente
della quantità prodotta e supponiamo per semplicità che sia una
spezzata:
P(Q) =
(
a−Q
0
se Q < a
se Q ≥ a
dove Q è la quantità totale di merce prodotta e quindi presente
sul mercato.
◮
Il costo per produrre una unità di bene è lo stesso per entrambe
le imprese e lo indichiamo con k: C1 = C2 = k, dove C1 è il costo
che deve sostenere la prima impresa per produrre una unità di
bene e C2 è il costo che deve sostenere la seconda impresa.
DUOPOLIO DI COURNOT
◮
Le due imprese sono i giocatori 1 e 2
◮
La scelta delle strategie consiste nella scelta della quantità di
bene da produrre.
◮
Indichiamo con x la scelta della quantità da produrre fatta dalla
prima impresa e con y la scelta della quantità di bene da
produrre fatta dalla seconda impresa.
◮
X1 = Y1 = [0, +∞) sono gli spazi delle strategie.
DUOPOLIO DI COURNOT
La quantità totale di bene prodotto è Q = x + y. Il prezzo di mercato
per unità di merce è lo stesso per le due imprese in quanto:
◮
esse producono lo stesso bene,
◮
sono in possesso della stessa tecnologia,
◮
il consumatore, quando compra il bene, non è in grado di
stabilire quale delle due imprese lo abbia prodotto (non esistono
prodotti per così dire “firmati”).
Consideriamo solo valori di produzione minori o uguali di a, cioè
supponiamo che le imprese producano solo a patto di poter vendere
a prezzo positivo: si ha così P(x + y) = a − (x + y) con la condizione
x + y ≤ a.
In pratica questo consiste nel restringere gli spazi di strategie a
X = Y = [0, a]
DUOPOLIO DI COURNOT
Il ricavo delle due imprese si può descrivere nel modo seguente:
R1 = P · x = [a − (x + y)] · x
R2 = P · y = [a − (x + y)] · y.
Osserviamo che il ricavo della prima impresa dipende da x e da y,
cioè dalla quantità da lei prodotta ma anche dalla quantità prodotta
dalla seconda impresa e viceversa.
Supponiamo che il costo per produrre il bene sia proporzionale alla
quantità di bene prodotta.
DUOPOLIO DI COURNOT
Alcuni dati:
Con questa ipotesi avremo:
C1 = kx
C2 = ky
I profitti sono le differenze tra ricavi e costi:
u1 = R1 − C1 = [a − (x + y)] · x − kx = x(a − x − y − k)
u2 = R2 − C − 2 = y(a − x − y − k) o ancora:
u1 = −x2 + x(a − k − y)
u2 = −y2 + y(a − x − k).
DUOPOLIO DI COURNOT
Otteniamo due funzioni: la prima è di secondo grado nella variabile x
una volta fissato y, la seconda è di secondo grado nella variabile y
una volta fissato x.
Ciascuna impresa cercherà di scegliere la sua strategia in modo da
massimizzare il suo profitto. Per esempio la prima impresa vuole
massimizzare u1 ma può scegliere solo x ( su y non ha alcun
controllo) e analogo discorso possiamo fare per u2 e la seconda
impresa.
DUOPOLIO DI COURNOT
Analizziamo u1 come funzione di x: si tratta di una parabola con la
concavità rivolta verso il basso che ha massimo nel vertice di ascssa:
a−k−y
2
x̄ è la strategia di miglior risposta della prima impresa alla scelta della
strategia y della seconda impresa.
x̄ =
a−k−x
2
è la strategia di miglior risposta dell’impresa 2 alla scelta x
dell’impresa 1.
ȳ =
DUOPOLIO DI COURNOT
e y = a−k−x
:
x = a−k−y
2
2
Il punto di intersezione A = (x̄, ȳ) soddisfa la proprietà che x̄ è miglior
risposta a ȳ e ȳ è miglior risposta a x̄.
Calcoliamo le coordinate di A risolvendo il sistema:
(
le cui soluzioni sono:
(
x=
y=
a−k−y
2
a−k−x
2
x̄ =
ȳ =
a−k
3
a−k
3
DUOPOLIO DI COURNOT
L’utile realizzato dall’impresa 1 si ottiene sostituendo x̄ in u1 :
a−k 2 a−k
a−k
(a − k)2
) −
(a − k −
)=
3
3
3
9
e in modo analogo
u1 = −(
u2 =
(a − k)2
9
. Il prezzo unitario è:
2
PA = a − (x̄ + ȳ) = a − (a − k)
3
.
SECONDA SITUAZIONE: COLLUSIONE
Se i due giocatori (le due imprese) si accordano (fanno cartello) per
produrre complessivamente z ( 2z ciascuna) il prezzo unitario è
P(z) = a − z e l’utile complessivo da massimizzare sarà:
u = P · z = (a − z) · z − kz = (a − z − k) · z = −z2 + z · (a − k).
Si tratta ancora di una parabola con concavità verso il basso quindi
con un massimo nel vertice di ascissa:
z=
a−k
2
Ogni impresa produce
z
a−k
=
2
4
2
3
= 16
(a − k)2 .
Si ha u1 = u2 = z +az−kz
2
Il prezzo unitario in questo caso è
2
1
PB = a − (a − k) > a − (a − k) = PA
2
3
SECONDA SITUAZIONE: COLLUSIONE
Cosa ha di strano questa soluzione?
La stranezza è esattamente identica ala stranezza della soluzione del
dilemma del prigioniero.
Massimizzando in situazione di collusione le industrie producono
ciascuna a−k
4 , un po’ di meno di quello che producono in regime di
concorrenza, cioè quando ciascuna massimizza il suo profitto senza
accordarsi con l’altra.
Ecco a cosa serve l’antitrust!!!!
In realtà i giocatori di questo gioco non sono solo due, c’è un terzo
giocatore che è il consumatore che viene avvantaggiato in regime di
libera concorrenza. Le imprese in concorrenza producono un po’ di
più di quello che produrrebbero se potessero fare un accordo. Così i
prezzi scendono a favore dei consumatori.
TERZA SITUAZIONE: DECISIONI NON
CONTEMPORANEE (STACKELBERG)
I dati del problema sono identici ma questa volta la prima impresa
(lieder) sceglie per prima la quantità da produrre e la seconda
(follower) sceglie conoscendo la scelta della prima.
Si suppone nel modello che queste regole siano note e cioè che la
prima impresa sceglie sì per prima ma sapendo che poi sceglierà
anche la seconda, e che la seconda sarà nel momento della scelta a
conoscenza della scelta della prima.
Per risolvere il problema procediamo così: supponiamo dapprima di
metterci dal punto di vista della seconda impresa a cui viene
comunicato che la prima ha scelto x̄. La seconda impresa cercherà di
massimizzare u2 fissato x̄ e questo massimo si ha per ( i conti sono
sempre gli stessi ) y = a−x̄−k
(l’ascissa del vertice della parabola). Il
2
fatto che l’impresa 2 massimizzerà il suo profitto una volta che le
verrà comunicato x̄ è a conoscenza della prima impresa, cioè la
prima impresa conosce la funzione
a − x̄ − k
2
e quindi la sua funzione di utilità diventa
y(x̄) =
a − x̄ − k
− x̄ − k)
2
che dipende solo da x̄. Quale x̄ sceglierà la prima impresa?
u1 = x̄(a −
Ovviamente quello che massimizza u1 e facendo gli stessi conti si
a−k
ottiene x̄ = a−k
2 e quindi ȳ = 4
In questo caso la prima impresa produce la quantità che
producevano globalmente le due imprese nella situazione di
collusione e la seconda impresa produce la metà. Il prezzo
3
a−k a−k
−
= a − (a − k)
2
4
4
è più basso del prezzo che si ha quando le scelte sono
contemporanee.
PC = a −