Introduzione alla Teoria matematica dei giochi La Teoria

Introduzione alla Teoria matematica dei giochi
La Teoria matematica dei giochi si occupa in generale delle tecniche matematiche per analizzare situazioni in cui due o piu’ individui prendono decisioni
che influenzeranno il proprio e l’altrui benessere.
Le situazioni che i teorici della Teoria dei giochi studiano non sono meramente ricreative come potrebbe erroneamente far pensare il termine gioco.
Nel linguaggio di questa giovane scienza (si può datare un inizio di questa
moderna teoria con i lavori di Zermelo del 1913,di Borel Von Neumann del
1918 e di Von Neumann e Morgenstein del 1944) il termine gioco si riferisce
ad ogni situazione sociale che coinvolge due o più individui: i giocatori.
I giocatori sono supposti sempre decisori razionali, cioè prenderanno decisioni tali da massimizzare i payoff della propria utilita’ attesa.
Un esempio di comportamento che tende a massimizzare il proprio payoff,
puo’ essere trovato nei modelli di selezione evolutiva.
In un universo dove il disordine crescente è una legge fisica, gli organismi
complessi (includendo gli uomini o più in generale le organizzazioni sociali)
possono sopravvivere solo se si comportano in un modo che tende a far aumentare le loro probabilita’ di sopravvivenza e di riproduzione.
Allora un argomento di selezione evoluzionistica suggerisce che gli individui
tendono a massimizzare il valore atteso di una qualche misura di sopravvivenza naturale e idoneità riproduttiva altrimenti vengono rimpiazzati.
In generale, massimizzare il payoff dell’utilità attesa non è lo stesso che massimizzare il payoff monetario atteso , perchè i valori dell’utilità non sono
necessariamente in dollari.
Un individuo avverso al rischio aumenta di piu’ la sua utilità attesa vincendo
un dollaro quando è povero che vincendo lo stesso dollaro quando è ricco.
Questa osservazione ci suggerisce che per molti decisori razionali, l’ utilità
può non essere una funzione lineare del valore monetario.
La teoria dei giochi può essere vista come una estensione della Teoria delle
Decisioni (al caso di 2 o più decisori razionali) , quindi per comprendere le
idee fondamentali della TdG una persona dovrebbe incominciare a studiare
la Teoria delle Decisioni.
Le decisioni riempiono la nostra vita. è proprio la capacita’ di scegliere
e di esprimere i nostri desideri che distingue la vita dell’essere intelligente
da quello delle forme inferiori.
Ogni giorno prendiamo delle decisioni, ma alcune sono cosı̀ poco importanti che ce ne dimentichiamo suito dopo (ad esempio, se mettere o no il
sale nella minestra. . . ) ,ma alcune, ad esempio quelle che incontriamo nella
nostra vita professionale, sono cosı̀ importanti che noi facciamo un’ analisi
accurata prima di prendere una decisione.
In cosa consiste questa analisi accurata ?
1
O meglio, chi è un buon decisore ?
Una volta avute le idee chiare di come deve essere un buon decisore, allora
potremo essere in grado di appoggiare o criticare le decisioni di altri, in particolare dei nostri rappresentanti e dei nostri mandanti.
Questo è il ruolo dei governi che prendono decisioni sul nostro benessere.
Lo fanno nel miglior modo possibile?
A volte dobbiamo delegare gli altri, e vorremmo essere certi che decidano
bene quindi solo se sappiamo riconoscere un buon decisore possiamo essere
certi di ciò .
Uno degli scopi della Teoria delle Decisioni è studiare che cosa è importante
sapere per essere un buon decisore.
Faremo degli esempi “provocanti” :
ESEMPIO 1 (BORDA count)
Una compagnia televisiva nazionale sta facendo una selezione per un festival internazionale.
Sette giudici sono stati convocati e hanno ascoltato quattro canzoni che chiameremo semplicemente:
A, B, C, D.
Ciascun giudice classifica le canzoni in ordine di preferenza cosı̀ da’ quattro
punti alla prima scelta, tre punti alla seconda e cosı̀ via. . .
La canzone che avra’ ottenuto il totale piu’ alto di punti sarà la canzone
vincente.
Sembra che i giudici abbiano votato come in tabella 1:
A
B
C
D
g1
1
2
3
4
g2
4
1
2
3
g3
3
4
1
2
g4
1
2
3
4
g5
4
1
2
3
g6
3
4
1
2
g7
1
2
3
4
Quindi la canzone C è quella vincente.
Immediatamente gli autori della canzone A protestano, perchè la canzone D
non doveva entrare nelle selezioni, infatti sussiste la regola che i cantautori
dovrebbero essere amatori, ma gli scrittori della canzone D sono professionisti.
La compagnia televisiva ammette che è cosı̀ e che è stato fatto un errore: la
canzone D dovrebbe essere squalificata.
Ma qual’ è il problema? La canzone D, infatti è in fondo.
Ciascun giudice preferiva la vittoria per la canzone C invece che per la D.
2
Cosı̀ sembra che non ci sia stata alcuna ingiustizia, tuttavia gli autori della
canzone A non sono soddisfatti.
L’ argomento è che la canzone D doveva essere squalificata prima della classifica cosı̀ i giudici avrebbero avuto solo tre canzoni da scegliere, cioè ciascun
giudice avrebbe dato:
3 punti al primo posto
2 punti l secondo posto
1 punto al primo posto
Supponendo che le preferenze rimangano quelle della tabella 1, le canzoni
avrebbero ottenuto il seguente punteggio:
A
3+1+2+3+1+2+3=15
B
2+3+1+2+3+1+2=14
C
1+2+3+1+2+3+1=13
cosı̀ la canzone A sarebbe stata la vincitrice.
Sembra quindi che gli autori della canzone A avessero motivo di protestare.
Vediamo ora alcuni Problemi di decisione reale
Gli esempi della vita reale, in generale, possono essere molto complicati,
inoltre, molte volte gli obiettivi di un decisore possono essere in contraddizione:
ad esmpio èimpossibile costruire un reattore nucleare minimizzando il suo
costo di costruzione e massimizzando la sua sicurezza.
Vediamo altri esempi:
CONTROLLO NELLA BANCA DL SANGUE.
Un ospedale ha una bana del sangue da cui desidera soddisfare ogni giorno
le necessitá per le trasfusioni.
Due sono i criteri importanti per valutare l’efficienza di una politica di controllo: la mancanza di sangue e la scadenza.
Capita una mancanza se una domanda per il sangue non può essere supplita
dalle riserve della banca.
Tali mancanze non sono cosı̀ catastrofiche come potrebbero sembrare, perchè
l’ospedale può chiamare i sevizi di una banca del sangue regionale o anche
portare il sangue dal donatore chiamato specificatamente per soddisfare una
certa richiesta.
Non di meno si va incontro a problemi di costo e di ritardo; il sangue non
ha una scadenza indefinita, infatti dopo poche settimane si deteriora e non
può essere usato a lungo.
D’altra parte se la banca del sangue ne raccoglie in quantità superiori alle
3
sue necessità, la successiva scadenza e distruzione sarebbero un significativo
spreco di risorse.
È ovvio che c’è INCERTEZZA, perchè la domanda della quantità di sangue
in ogni periodo non è conosciuta, sebbene le esigenze passate possano dare
qualche informazione per il futuro.
Questo è un problema decisionale.
Altro esempio:
DECISIONE DI POSIZIONARE UN AEROPORTO.
È stata presa la decisione di costruire un aeroporto. Un governo dve dovrebbe
scegliere di porre un nuovo aeroporto internazionale?
In generale la scelta è limitata a pochi siti candidati per ragion di richiesta
geografica.
Dovranno essere evitate le montagne, i centri abitati, la vicinanza con altri
aeroporti già esistenti, lughi con pericolose correnti d’aria, eccetera. . .
Il governo deve trovare un opportuno compromesso tra molti obiettivi spesso
diametralmente opposti.
Per minimizzare l’ inconveniente del viaggio, l’aeroporto dovrebbe essere il
posto più vicino possibile alla più grande città del paese, ma per salvalguardare la salute pubblica e inimizzare gli inconvenienti alla popolazione
dovrebbe essere costruito il piú lontano possibile dalle grandi città.
Ovviamente il governo dovrà minimizzare i costi di costruzione e di mantenimento,ancora vorràmassimizzare la capacità e desidererà costruire un
aeroporto tale da aumentare il prestigio internazionale del paese.
I progetti su un aeroporto non sono mai a breve termine e la loro costruzione
richiede molti anni.
È necessario sottolineare che ci sono varie incertezze?
Come sarà la domanda in futuro per il lavoro aeroportuale?
Come saranno in futuro i cambiamenti della crisi energetica? Questi potrebbero cambiare il costo drammaticamente e causare un veloce declino del
traffico aereo.
I voli diventeranno più sicuri e più tranquilli?
Il prezzo del volo cambierà significativamente?
L’avvento del jet wide body con la sua capacità di portare 500 passeggeri in
pochi minuti, non era prevista quando furono disegnati alcuni air-terminal
negli ultimi cinquant’anni. . .
Ci sono quindi moltissimi fattori che contribuiscono all’incertezza di scegliere
un luogo piuttosto che un altro.
gli aeroporti e i loro siti sono stati studiati a lungo in letteratura.
La comunicazione Roskill del Terzo Aeroporto di Londra ha pubblicato le
delibere in 9 volumi! (cfr Keeney-Raiffa) .
4
TEORIA DELLE DECISIONI : PARADOSSI
Che cosa è un paradosso? Con paradosso si intende in genere un argomento
che appare contraddittorio ma deve essere accettato
oppure
un argomento che appare corretto ma porta ad una contraddizione.
Un’ampia classe di paradossi è costituita da quelli che contraddicono il senso
comune.
Ma cosa è il senso comune?
Einstein ha detto che il senso comune è l’insieme dei pregiudizi che ognuno
ha assorbito fino all’età dei 18 anni.
Forse è l’insieme delle credenze efficaci che l’essere umano adotta per sopravvivere nell’ambiente (ad esempio per non morire di paura ogni volta
che tramonta il sole).
Vediamo ora alcuni paradossi per riflettere come sia a volte difficile prendere
una decisione.
PARADOSSO DEL MENTITORE: Io sto mentendo.
PARADOSSO DELLA DECISIONE: Il coccodrillo dice che mangerà
il bambino se e solo se la madre non indovina che cosa il coccodrillo farà.
La madre piange: - Crudele, mangerai il mio bambino! - Il coccodrillo (evidentemente un coccodrillo molto logico) osserva dunque che ora non può
restituirlo, altrimenti la madre non avrà indovinato per cui lo deve mangiare, ma la madre ha un sussulto di logica e obietta che il coccodrillo non
può mangiare il bambino, altrimenti fa sı̀ che lei abbia indovinato e in tal
caso deve mangiarlo.
PARADOSSO DEL DILEMMA DEL PRIGIONIERO
PARADOSSO DELLA PREVISIONE DELL’IMPICCATO
Questo paradosso risale a un episodio realmente accaduto durante l’ultima
guerra:
Qualcosa avverrà entro un certo numero di giorni, ma a sorpresa, in modo
che al mattino di quel giorno il soggetto non possa sapere con certeza qualè
il giorno fatale.
Il condannato ragiona: - Non può essere l’ultimo giorno, altrimenti all’alba
di quel giorno saprei con certezza, ma essendo escluso l’ultimo giorno, non
può essere il penultimo altrimenti all’alba di quel giorno saprei con certezza...
PARADOSSI DELLA PROBABILITÀ
Paradosso di St.Petersburg.
PARADOSSI STATISTICI
Questi paradossi sono molto importanti perché la statistica è usata per imporci molte decisioni e credenze.
E.H. Simpson (1961) dimostrò come è possibile che i dati di 2 casi diversi,
considerati separatamente, confermino la stessa ipotesi, ma considerati congiuntamente la falsifichino.
Supponiamo che in 2 urne, una bianca e una nera, ci siano delle caramelle
1
di liquirizia e menta rispettivamente nelle proporzioni:
B 50 liquirizia
60 menta
N 30 liquirizia
40 menta
ora supponiamo che in un’altra coppia di urne, poste in un’altra stanza,
ci sia la seguente distribuzione:
B 60 liquirizia
30 menta
N 90 liquirizia
50 menta
In entrambi i casi la probabilità di prendere una caramella di liquirizia
è maggiore nell’urna bianca. Supponiamo ora che le urne siano travasate in
una nuova coppia di urne più grandi, quelle nelle urne bianche in una nuova
urna bianca, e quelle nelle urne nere in una nuova urna nera. Allora:
B
110 liquirizia
90 menta
N
120 liquirizia
90 menta
Ora la probabilità di prendere una caramella di liquirizia è maggiore nell’urna
nera!
Si potrebbero fare esperimenti diversi e più realistici pensando agli esperimenti su un farmaco e ai suoi effetti su diversi campioni in varie città,
ma .....non deprimiamoci!
(per approfondimenti ”Il riso di Talete” di G.Lolli)
2
GIOCHI e determinazione dell’equilibrio di Nash
Esempio 1: Il dilemma del prigioniero
La polizia sospetta due banditi di un grosso crimine, ma non ha prove sufficienti per condannarli.
I due uomini vengono interrogati separatamente e non possono comunicare
tra loro.
L’offerta del procuratore distrettuale è la seguente:
- se uno confessa il crimine e l’altro no, quello che confessa è libero e l’altro
si prende ben 10 anni di carcere
-se entrambi confessano, ognuno avrà una condanna ridotta di 5 anni di
carcere
-se nessuno confessa, non avendo prove sufficienti per condannarli per quel
grosso crimine, vengono comunque condannati per porto abusivo d’armi, e
hanno ciascuno 1 anno di carcere
Che cosa dovrebbe fare ciascuno degli indiziati?
Che cosa farà ?
NC
C
NC
-1 -1
-10 0
C
0 -10
-5 -5
La teoria dei giochi prevede come esito finale il profilo di strategie: (C, C)
cioè ognuno confersserà.
Naturalmente l’esito può cambiare se viene ripetuto più volte, se c‘è cooperazione oppure se sono permesse comunicazioni.
1
Nel mondo reale ci sono molte situazioni simili a quelle del dilemma del prigioniero, ad esempio la corsa agli armamenti nucleari tra due nazioni rivali.
Supponiamo che due nazioni siano impegnate ad armarsi, ognuna ha le stesse
possibilità di scelta: continuare ad investire denari in armamenti nucleari oppure fermarsi.
Se entrambe le nazioni si fermano, ciascuna può utilizzare il proprio denaro
in progetti che vanno a beneficio della popolazione.
Se una cintinua ad armarsi e l’altra no, la prima otterrà in breve una posizione dominante.
Cosı̀ i due paesi continuano ad armarsi e si trovano nella situazione peggiore
perchè hanno speso una grande quantità di denaro in pericolosi armamenti
nucleari, ma nessuno può diventare più forte dell’altro.
Anche in questo caso la cooperazione (senza accordi vincolanti) è uno stato
instabile perchè induce l’altro all’inganno.
Esempio 2: La battaglia dei sessi
Consideriamo la seguente matrice dove il giocatore I è la moglie e il giocatore II è il marito. Devono scegliere tra Teatro o Partita che indicheremo
brevemente con T e P, la moglie preferisce andare a teatro e il marito alla
partita, ma preferiscono andare insieme piuttosto che separatamente. Leggiamo questo gioco sulla seguente matrice:
P
T
P
12
00
T
00
21
Sembra difficile distinguere tra i risultati (1,2) e (2,1) che sembrano essere
due possibili soluzioni del gioco. I due giocatori invece non sono indifferenti
rispetto ad un equilibrio o all’altro
2
La presenza di più equilibri in TdG costituisce una difficoltà maggiore,
rispetto ad altri problemi di ottimo. Ci sono stati vari tentativi da parte
di molti autori per selezionare un equilibrio tra i tanti possibili (problema
dei raffinamenti degli equilibri), ma fin’ora nessuno sembra aver dato un
risultato soddisfacente.
Esempio 3: Morra cinese
Consideriamo la seguente matrice nella quale conveniamo di assegnare il
valore 1 al giocatore che vince. Corrisponde al celebre gioco della morra
cinese in cui i giocatori Operano mosse simultanee tra sasso , carta e forbice
indicati rispettivamente con S, C, F.
C
S
F
C
00
1 -1
-1 1
S
-1 1
00
1 -1
F
1 -1
-1 1
00
Di questo gioco non è possibile prevedere il risultato.
Non esistono equilibri.
Se vi trovate a giocare più volte con lo stesso giocatore, accettereste il consiglio di non giocare mai sasso? Il vostro avversario potrebbe intuire cosa
avete in mente e potrebbe cosı̀ decidere di non giocare mai carta. In questo
modo si garantisce più possibilità di vittoria perchè rende inutile l’utilizzo
della forbice di parte vostra.
3
GIOCHI ED EQUILIBRIO DI NASH
–
Ricordiamo il Teorema di esistenza dell’equilibrio di Nash, in una forma
semplificata ( perchè è la versione che usiamo nei nostri giochi) e la nozione
di equilibrio di Nash:
Definizione Dato un gioco G = (X, Y, u1 , u2 ) a due giocatori,un profilo di
strategie (x∗ , y ∗ ) ∈ X×Y dicesi un equilibrio di Nash (per brevità scriveremo
NE) se valgono le seguenti diseguaglianze:
1) u1 (x∗ , y ∗ ) ≥ u1 (x, y ∗ ) ∀x ∈ X
2) u2 (x∗ , y ∗ ) ≥ u2 (x∗ , y) ∀y ∈ Y
in altre parole x∗ è la miglior risposta del giocatore I alla strategia y∗ del
giocatore II e viceversa y∗...
TeoremaOgni gioco finito ha almeno un equilibrio di Nash in strategie
miste.
Intanto dobbiamo specificare che per gioco finito intendiamo un gioco in cui
il numero dei giocatori è finito e lo spazio delle strategie è un insieme finito.
A questo punto mi aspetto una domanda dagli studenti svegli:- Come è
possibile che ci siano un numero infinito di giocatori?Nella realtà questo non è possibile ma in una teoria matematica il concetto
di infinito deve essere preso in considerazione (pensate ai limiti all’infinito, li
farete), l’idea è capire cosa succede se il numero dei giocatori diventa molto
ma molto grande (analogamente per le strategie).
Va detto che noi tratteremo solo giochi finiti.
Ricordate il gioco del PARI/DISPARI? Abbiamo già visto che non ha NE
in strategie pure.
In strategie miste Nash ci dice che ha almeno un equilibrio.
Gioco del Pari/Dispari
P
D
P
1
-1
1
D
-1
1
Supponiamo che il giocatore I giochi la strategia P (Pari) con probabilità p
e quindi la strategia D (dispari)con probabilità 1 − p; il giocatore II giochi
la strategia P con probabilità q e la strategia D con probabilità 1 − q, dimostriamo che il gioco del Pari/Dispari ha un equilibrio di Nash in strategie
miste dato da (p, q) = ( 12 , 12 )
Chiamiamo u(., .) la funzione di utilià del giocatore I ovviamente la funzione
di utilità del giocatore II sarà −u(., .).
Indichiamo con ũ(., .) l’estensione della funzione di utilità del giocatore I allo
spazio delle distribuzioni delle probabilità su X × Y . (∆(X) × ∆(Y ).).
Risulta
3) ũ(p, q) = pq+p(1−q)(−1)+(1−p)q(−1)+(1−p)(1−q) = 4pq−2p−2q+1
Dalla definizione di equilibrio di Nash devo dimostrare che:
4) ũ( 12 , 12 ) ≥ ũ(p, 12 ) ∀p ∈ ∆(X)
5) ũ( 12 , 12 ) ≥ ũ( 12 , q) ∀q ∈ ∆(Y )
La dimostrazione è banale sostituendo (p, q) = ( 12 , 12 ) nelle 4) e 5), in realtà,
poichè il gioco è a somma zero, è sufficiente la prima disuguaglianza.
2
Giochi a somma zero :un gioco con le carte
Il seguente gioco è un gioco a somma zero cioè rientra in quella classe particolare di giochi in cui un giocatore vince e l’altro perde (cosa che nella realtà
non avviene quasi mai, ognuno guadagna qualcosa) da notare che in questo
gioco l’utilità attesa coincide con il guadagno atteso, anche questo è un caso
particolare.
Esempi per illustrare che l’utilità attesa è ben diversa dal guadagno atteso
se ne possono fare tantissimi: sono più contento se guadagno 10 euro e sono
povero di quanto lo sia se guadagno la stessa cifra e sono molto ricco...
Invitare i ragazzi a fare altri esempi mettendo in luce che :
UTILITÀ ATTESA 6= GUADAGNO ATTESO.
Descriviamo il gioco:
– Entrambi i giocatori mettono una moneta di 1 euro nel piatto e il giocatore
I pesca una carta senza mostrarla al giocatore II, la guarda e decide se
rilanciare (azione R) o fermarsi (azione F). Se rilancia deve mettere 1 euro
nel piatto e il gioco passa al giocatore II che dovrà scegliere tra vedere (azione
V) e non vedere (azione N). Per vedere deve aggiungere un altro euro nel
piatto. Se I si ferma vince il piatto solo se la carta pescata è rossa altrimenti
perde.
Se I rilancia, vince il piatto solo se la carta pescata sia rossa oppure se II
decide di non vedere.
Allora il gioco ha due giocatori: I e II e questi hanno come spazi delle azioni:
A1 = {N, V } e A2 {F, R} rispettivamente.
Qui metterei l’albero del gioco come in Lucchetti.
Le strategie sono date da: S2 = {N, V } per il giocatore II e
S1 = {F F, F R, RF, RR} per il giocatore I, dove la prima lettera sta a indicare cosa fa I se la carta è rossa e la seconda lettera cosa fa I se la carta è
nera. Allora se indichiamo con
u 1 : S1 × S2 → R
e
u 2 : S1 × S2 → R
le funzioni di utilità rispettivamente dei due giocatori possiamo descrivere il
gioco dato dalla quadrupla:
1
G = (S1 , S2 , u1 , u2 )
(ricordare che un gioco è descritto solo quando sono dati gli spazi delle
strategie e le funzioni di utilità).
A questo punto con facili conti si ottiene la seguente matrice 4 × 2
che rappresenta il gioco in forma strategica.
FF
FR
RF
RR
N
0
1
0
1
V
0
-1/2
1/2
0
infatti:
u1 (RF, N ) = 12 (1) + 12 (−1) = 0
u1 (RF, V ) = 12 (2) + 12 (−1) =
1
2
u1 (RR, N ) = 12 (1) + 12 (1) = 1
u1 (RR, V ) = 12 (2) + 12 (−2) = 0
u1 (F F, N ) = 21 (1) + 12 (−1) = 0
u1 (F F, V ) = 0
u1 (F R, N ) = 12 (1) + 12 (1) = 1
u1 (F R, V ) = 12 (1) + 12 (−2) = − 12 .
Ricordando che in un gioco a somma zero u2 = −u1 sono noti anche i payoff
di II. Con considerazioni più volte usate sulla miglior risposta si conclude
che non esistono equilibri di Nash.
2
GIOCHI, STRATEGIE DOMINATE e CONOSCENZA
COMUNE
C‘è un modo ovvio per predire come saranno giocati i seguenti giochi?
Example 1
D
E
F
A
43
51
62
B
21
84
36
C
30
96
28
Fissiamo la nostra attenzione sul giocatore II.
La strategia F dà al giocatore II un payoff strettamente migliore del payoff
dato da E; diciamo allora che la strategia E è strettamente dominata da F.
Se il giocatore I sa (intuisce, capisce... essendo un giocatore razionale) allora
per I la miglior risposta è A.
Infine se il giocatore II sa che I sa che che II non giocherà E, allora II sa
che I giocherà A e allora II giocherà D. Otteniamo cosı̀ (A,D) come unico
equilibrio di Nash del gioco.
Questo processo dicesi anche di dominanza stretta iterata e non dipende
dall’ordine in cui le strategie sono considerate.
Example 2-Common knowledge
C
D
A
8 10
-100 9
B
76
65
Quando un gioco si può giocare mediante eliminazione iterata di strategie
dominate, nel senso che a ciascun giocatore rimane solo una strategia, allora
questo profilo di strategie è il candidato ovvio per predire come sarà giocato
1
il gioco.
Non è però sempre cosı̀, specialmente quando i payoff possono assumere valori molto grandi o molto piccoli.
La maggior parte degli studenti a cui è stato chiesto come avrebbero giocato questo gioco, ha risposto B come strategia per I sebbene la dominanza
iterata dia (A,C) come unica soluzione.
Infatti sebbene A è meglio di B quando II non usa la strategia dominata D,
B è meglio di A quando c’è una possibilità che II giochi D.
Se la perdita è meno grave, ad esempio sostituendo -100 con -1 allora quasi
tutti i giocatori I preferiscono A. Provate infatti a proporre agli stessi studenti il seguente gioco:
C
D
A
8 10
-1 9
B
76
65
.
Questo esempio illustra il fatto fondamentale che i payoff e gli spazi delle
strategie siano conoscenza comune e la razionalità nel senso di NON GIOCARE UNA STRATEGIA STRETTAMENTE DOMINATA È CONOSCENZA
COMUNE (apparentemente non sembrava vero nell’ esempio dove compare
un payoff molto piccolo)
Example 3
Come giocheresti il seguente gioco?
D
E
A
22
51
B
34
42
C
21
34
2
QUIZ ed ENIGMI
1. Le 3 signorine con la faccia sporca
Supponiamo che tre ragazze tutte con la faccia sporca siano sedute in modo
da vedere ciascuna la faccia delle altre.
Supponiamo inoltre che le tre ragazze siano perfettamente razionali (come
tutti i giocatori della TdG) e ciascuna sa che tutte le altre sono perfettamente razionali. In altre parole la razionalita’ di tutte è conoscenza comune.
Supponiamo che dato che queste ragazze sono razionali, arrossiscono appena
si rendono conto di avere la faccia sporca.(Possiamo supporre che arrossiscono se e solo se si rendono conto di avere la faccia sporca, cioè nessun altro
motivo può farle arrossire)
Osserviamo che:
1) Ciascuna ragazza vede le altre quindi ognuna sa che almeno una di esse
ha la faccia sporca
2) non ci sono specchi di nessun tipo quindi nessuna ragazza può vedere se
ha la faccia sporca. fin qui nessuna ragazza ha motivo di arrossire.
Supponiamo ora che una quarta persona entri nella stanza e fa a voce alta
la seguente osservazione:
”Almeno una ragazza in questa stanza ha la faccia sporca”
Sembrerebbe che il nuovo arrivato non dica nulla di nuovo (la situazione era
già nota a tutti) ma in realtà la situazione è cambiata.
Perchè?
Perchè l’annuncio mette a conoscenza le ragazze del fatto che tutte e tre
sono a conoscenza del fatto che almeno una di loro ha la faccia sporca.
Ciò ha delle conseguenze?
Chiamiamo le tre ragazze Amelia, Barbara, Carlotta.
Mettiamoci dal punto di vista di Amelia (ma la situazione è simmetrica per
3
le altre).
Amelia pensa: se io ho la faccia pulita, Barbara e Carlotta osservano ciascuno una sola faccia sporca. Quindi se ad esempio Carlotta non arrossisce,
Barbara sa di avere la faccia sporca. Carlotta non arrossisce quindi presto
Barbara saprà con certezza che le facce sporche sono almeno due e, nel caso
che la faccia di Amelia sia pulita arrossirà. Poichè Barbara non arrossisce,
Amelia pensa che le facce sporche sono tre, quindi arrossisce. Poiche’ il ragionamento è simmetrico per le tre amiche, tutte arrossiranno.
Concludendo possiamo dire che la conoscenza comune ha permesso un passaggio di informazioni ”silenzioso” conseguenza del comportamento di ognuna.
2. Un padre burlone
Un padre offre ai suoi due figli una busta ciascuno. In una ci sono 10n euro
e nell’altra 10n+1 ( n è un numero intero scelto con la stessa probabilità tra
1 e 5 e i figli sanno questo).
Le buste vengono date a caso.
Il primo figlio, chiamiamolo Giovanni, scopre di aver ricevuto 104 euro e il
secondo figlio, chiamiamolo Luca, scopre di aver ricevuto 105 euro. Ognuno
non sa cosa ha ricevuto l’altro.
A questo punto il padre chiede separatamente a ciascun figlio se vuole scambiare la busta con quella del fratello. Facciamo l’ulteriore ipotesi che ciascuno sia indifferente al rischio e entrambi sono giocatori razionali pertanto
cercheranno di massimizzare il propriopayoff atteso. Giovanni che ha ricevuto 104 euro, sa che Luca potrebbe aver ricevuto 103 euro oppure 105
pertanto si calcola la sua utilità attesa se scambiasse la busta (per fortuna
ha sempre studiato bene la Matematica) e ottiene:
103 +105
2
euro.
Essendo
103 +105
2
> 104 (provate!!!), sicuramente accetta.
4
Luca (che ha ricevuto 105 euro, pensa analogamente che il fratello Giovanni potrebbe aver ricevuto 104 euro oppure 106 euro, pertanto anche Luca,
sapendo per fortuna un po’ di Matematica riesce a calcolare la sua utilità
attesa se cambiasse la busta :
Luca osserva che:
104 +106
2
>
104 +106
euro.
2
105 (ancora una
volta la Matematica viene
in aiuto) e Luca conclude che anche a lui conviene accettare e cambiare la
busta.
A questo punto il padre comunica ai due figli che entrambi hanno accettato
di cambiare la busta.
Ora senza che avvenga alcuno scambio ripete come prima separatamente a
entrambi la stessa domanda.
Ma questa volta Giovanni accetta, Luca no
Perchè?
Perchè Luca ha capito che nella busta di Giovanni ci sono 104 euro, infatti
venendo a conoscenza del fatto che il fratello vuole cambiare la busta, necessariamente non ha trovato il massimo cioè 106 euro.
Anche in questo caso la ”conoscenza comune” ha permesso un passaggio di
informazioni silenzioso.
5
BIBLIOGRAFIA
References
[1]
Castelli E. ,I paradossi del senso comune. (1970).
[2]
Clark M., I paradossi dalla A alla Z ed.Cortina 2004.
[3]
Costa G. Mori P.Introduzione alla Teoria dei Gichi ed Il Mulino (1994).
[4]
Gibbons R.Teoria dei Gichi ed Il Mulino, Bologna, 1994 : A Primer in
Game Theory, Harvester, 1992.
[5]
Lucchetti R.Di duelli, scacchi e dilemmi: la teoria matematica dei
giochi. Bruno Mondadori Editore,2001
[6]
Mero’L., Calcoli morali, teoria dei giochi, logica e fragilit umana Dedalo
ed. 198
[7]
Patrone F.Decisori (razionali) interagenti Una Introduzione alla Teoria
dei giochi. Ed Plus, 2006.
[8]
Pusillo L. Appunti dal corso di Teoria matematica dei Giochi per facoltà
di SMFN
1
TEORIA MATEMATICA DEI GIOCHI
ED EVOLUZIONE
Può la teoria matematica dei giochi spiegare comportamente paradossali nei
processi evolutivi?
Lucia Pusillo
Dipartimento di Matematica dell’ Università di Genova,
via Dodecaneso 35, 16146 Genova.
1
La teoria dei giochi si applica più facilmente alla biologia che al comportamento economico per cui invece è stata inventata.
2
Ci sono due motivi per questo: il primo è che la teoria richiede che
i valori di differenti risultati possano essere misurati su una singola
scala, e nelle applicazioni umane questa misura è ottenuta con un
concetto artificiale che è la funzione di utilità.
In biologia il benessere darwiniano fornisce una scala unidimensionale.
Il secondo e forse più importante motivo nel cercare la soluzione di
un gioco è il concetto della razionalità umana che qui viene sostituito
dalla stabilità evolutiva.
3
Il vantaggio, afferma Maynard Smith, è che qui ci sono varie ragioni
per aspettarsi che la popolazione evolva verso stati stabili e invece ci
sono molti dubbi sulla razionalità del comportamento umano.
4
La nozione pù accreditata di soluzione per giochi non cooperativi è la
nozione di equilibrio di Nash.
Se indichiamo con X e Y gli spazi delle strategie dei due giocatori,
ricordo che una coppia di strategie (x, y) ∈ X × Y è un equilibrio di
Nash ( brevemente N E) se
u1(x, y) ≥ u1(x, y) ∀x ∈ X,
u2(x, y) ≥ u2(x, y) ∀y ∈ Y
5
Ciascun organismo animale e vegetale sceglie un’azione da un insieme
ammissibile B che si chiama anche spazio delle strategie.
L’essere sceglie una strategia (cioè una azione) non coscientemente ma
seguendo delle leggi di ereditarietà oppure leggi dovute alla mutazione.
La funzione di utilità, misurerà il successo riproduttivo futuro o una
qualche abilità della specie per la sopravvivenza.
6
Da notare che se un’azione, cioè un comportamento, risulta nocivo per
il singolo organismo animale o vegetale, ma risulta utile per il processo
riproduttivo, allora viene favorito dalle leggi dell’evoluzione e spiegato
in termini di Teoria dei Giochi come un equilibrio evolutivamente
stabile (cioè deriva da azioni ESS).
7
Un esempio può essere fornito dalla coda del pavone. Come è noto
questa è nociva per il singolo animale perchè ne fa facile vittima di
un predatore, ma è utile per la sua specie perchè serve per attirare il
partner e quindi prelude ad un successo riproduttivo futuro, pertanto
la coda sarà favorita dall’Evoluzione e secondo la Teoria dei Giochi è
un equilibrio evolutivo
8
Tutto questo può essere espresso mediante un gioco simmetrico che
scriverò come una quadrupla
G = (B, B, u1, u2)
dove B è lo spazio delle strategie del giocatore I e del giocatore II,
u1, u2 sono le funzioni di utilità dei due giocatori.
Supponiamo inoltre che il gioco sia simmetrico cioè u1(a, b) = u2(b, a),
9
Il seguente gioco, noto anche come DILEMMA DEL PRIGIONIERO,
è simmetrico nel senso detto:
44 05
50 11
10
Il gioco del PARI/DISPARI
1 − 1 −1 1
−1 1
1 −1
11
Candidato per un equilibrio evolutivo è una coppia di azioni in B × B
cioè una coppia (x̃, x̃).
La nozione di equilibrio è data pertanto in modo tale che in quello
stadio l’organismo compie un’azione e nessun mutante può invadere
la popolazione.
Più precisamente l’idea di equilibrio è che il processo evolutivo trasforma
una piccola frazione della popolazione in mutanti che seguono una
strategia b scelta nell’insieme delle strategie B.
Va osservato che tra una mutazione e l’altra possono passare anche
migliaia di anni.
In un equilibrio un mutante deve ottenere un payoff atteso più piccolo
di quello che ottiene un non mutante.
12
Supponiamo che una percentuale di ² individui mutanti (² > 0) compiano l’azione b, mentre gli altri compiono l’azione b∗, allora deve
risultare che il payoff atteso di un mutante deve essere più piccolo
del payoff atteso di un non-mutante, se b∗ è la strategia di equilibrio
dovrà essere:
(1 − ²)u(b, b∗) + ²u(b, b) < (1 − ²)u(b∗, b∗) + ²u(b∗, b)
per ogni ² > 0 e sufficientemente piccolo.
13
Da questa relazione usando vari teoremi di Analisi Matematica si
perviene all’equilibrio di strategie evolutivamente stabili
Infatti la disugualianza scritta equivale a 1) e 2):
1) u(b, b∗) < u(b∗, b∗) se b 6= b∗
2) se u(b, b∗) = u(b∗, b∗) allora u(b, b) < u(b∗, b)
14
Dato un gioco G = (B, B, u1, u2) simmetrico a due giocatori, una
strategia evolutivamente stabile ( brevemente diremo una ESS di G)
è una azione b∗ ∈ B tale che:
- (b∗, b∗) è un equilibrio di Nash del gioco e u(b, b) < u(b∗, b) per ogni
b miglior risposta a b∗ con b 6= b∗.
15
Esempio FALCHI/COLOMBE:
C
F
C
F
1/2, 1/2
0, 1
1, 0
(1 − c)/2, (1 − c)/2
16
Usando dei concetti matematici quali:
–
–
–
–
–
funzione a valori reali
massimi e minimi per funzioni a valori reali
multiapplicazione
disequazioni
monotonia cioè crescenza e decrescenza per una funzione reale
si perviene al seguente risultato:
17
– Se c ≤ 1 esiste un solo equilibrio evolutivamente stabile (F, F ) e
questo ci dice che se il costo della lotta è piccolo, allora si comporteranno entrambi da aggressori (strategia F ) e gli altri comportamenti
tenderanno ad estinguersi
– Se c > 1 (cioè il costo della lotta è elevato rispetto al valore della
preda) solo
(1 − 1/c, 1 − 1/c) è un equilibrio evolutivo quindi solo questo comportamento tenderà ad affermarsi nel corso dell’evoluzione e gli altri
tenderanno a scomparire.
18
Può la teoria matematica dei giochi spiegare comportamente paradossali nei processi evolutivi?
19
Quanto vi racconterò, è contenuto in parte in un interessante articolo di Michael Mesterton Gibbons e Eldridge S.Adams (il primo
professore di Matematica all’Università di Stato della Florida e il
secondo ricercatore al Dipartimento di Ecologia e Biologia Evoluzionistica all’Università del Connecticut.
20
Consideriamo ad esempio il famoso principio dell’handicap.
L’etologo A.Zahavi di Tel Aviv afferma che animali in conflitto possono sviluppare dei comportamenti costosi per chi li attua cioè comportamenti che possono abbassare la probabilità di sopravvivenza.
L’animale mostrando che può sopportare un
handicap mette in mostra la sua forza, cioè
lancia un messaggio che gli altri animali dovrebbero rispettare.
21
Questa ipotesi fu dapprima respinta dagli studiosi perchè andrebbe
contro il principio che l’evoluzione dovrebbe favorire i segnali che
costano meno fatica per gli animali.
22
Per studiare e risolvere tali questioni ci si basa sempre più sulla
collaborazione tra biologi e matematici attraverso degli strumenti
analitici chiamati giochi e oggetto di studio della
Teoria matematica dei giochi
23
ESEMPI:Gioco della guerra di logoramento
Nel gioco della guerra di logoramento i giocatori conoscono solo la
propria forza e una strategia è una porzione delle riserve iniziali che
l’animale è disposto a spendere in una lotta prolungata per conquistarsi un sito.
Tante più riserve un animale risparmia, tante più energie avrà e quindi
possibilità di successo nell’attirare una compagna, nel trovare cibo, nel
difendere il suo territorio e quindi un maggior successo riproduttivo.
Tutte queste ipotesi ci permettono di individuare lo spazi delle strategie e la funzione di utilità.
24
se vogliamo costruire un modello su questo esempio, abbiamo bisogno
di due parametri:c, R.
- c ∈ [0, 1] è il coefficiente di variazione e intuitivamente misura la
variazione delle riserve di energia intorno alla sua media (ad esempio
se diciamo che c = 0.6 , significa che la deviazione standard delle
riserve di grasso è il 60% della media.
-R ∈ [0, 1] ci fornisce il rapporto costi-benefici, cioè paragona il costo
di spendere 1 unità di riserve di grasso con l’eventuale beneficio del
vincitore per 1 unità risparmiata.
25
La funzione di utilità:

x 1−c


R(1
−
x)
se
≤


y
1+c



y
1−c x
1 − R + Rx


R(1 − x) + a(x, y)
− 2 b(x, y) se
≤ <1
2
4c
4c
1
+
c
y
u(x, y) =
x 1−c


≥
1
−
y
se


y
1+c



R − Rx − 1
y
x 1−c


+ 2 d(x, y) se 1 ≤ ≤
1 − y + g(x, y)
4c2
4c
y
1+c
dove:
c ∈ [0, 1]
26
R ∈ [0, 1]
y2
x
(1 − c)(1 + c)2
3
3
a(x, y) = 2 (1 − c) + (1 + c) −
6x
3y
2
2
y
x
(1 + c)(1 − c)2
3
3
b(x, y) = 2 (1 + c) + (1 − c) −
6y
3x
2
y2
x
(1 + c)(1 − c)2
3
3
g(x, y) = 2 (1 + c) + (1 − c) −
6x
3y
2
(1 − c)(1 + c)2
x2
y
3
3
d(x, y) = 2 (1 − c) + (1 + c) −
6y
3x
2
27
Si dimostra con tecniche matematiche che tengono conto
del concetto di integrale che esiste un equilibrio evolutivo
se il rapporto
costi-benefici R non supera una certa soglia critica
2c(c2+3)
f (C) = c2(c+6)+9(2−c)
28
Una strategia ESS esiste quando le farfalle combattono fino all’esaurimento
consumando almeno il 66% delle proprie energie, questo è un comportamento paradossale tanto più perche si può dimostrare che l’equilibrio
evolutivo associato è sempre non efficiente.
29
Altri esempi in cui il comportamento paradossale degli animali può
essere interpretato come una strategia evolutivamente stabile sono:
gioco della minaccia dei granchi
il bluff che si osserva in una specie di ragno messicano l’Oecobius
civitas.
30
Conclusioni: il valore della Teoria Matematica dei Giochi
I modelli della teoria dei giochi hanno il merito di suggerire dei modi
per verificare nuove idee.
I ”giochi” hanno valore proprio perchè ci permettono di verificare con
calcoli precisi la logica delle nostre argomentazioni.
È vero che i comportamenti descritti non sono frequenti in natura
(l’effetto domino è stato osservato solo nell’Oecobius Civitas), ma sono
i comportamenti strani ad attirare la nostra attenzione...e in questo
senso la Teoria dei giochi facendo uso di una bella e profonda
matematica si dimostra molto utile nello studio del comportamento
animale.
31