Introduzione alla Teoria matematica dei giochi La Teoria

annuncio pubblicitario
Introduzione alla Teoria matematica dei giochi
La Teoria matematica dei giochi si occupa in generale delle tecniche matematiche per analizzare situazioni in cui due o piu’ individui prendono decisioni
che influenzeranno il proprio e l’altrui benessere.
Le situazioni che i teorici della Teoria dei giochi studiano non sono meramente ricreative come potrebbe erroneamente far pensare il termine gioco.
Nel linguaggio di questa giovane scienza (si può datare un inizio di questa
moderna teoria con i lavori di Zermelo del 1913,di Borel Von Neumann del
1918 e di Von Neumann e Morgenstein del 1944) il termine gioco si riferisce
ad ogni situazione sociale che coinvolge due o più individui: i giocatori.
I giocatori sono supposti sempre decisori razionali, cioè prenderanno decisioni tali da massimizzare i payoff della propria utilita’ attesa.
Un esempio di comportamento che tende a massimizzare il proprio payoff,
puo’ essere trovato nei modelli di selezione evolutiva.
In un universo dove il disordine crescente è una legge fisica, gli organismi
complessi (includendo gli uomini o più in generale le organizzazioni sociali)
possono sopravvivere solo se si comportano in un modo che tende a far aumentare le loro probabilita’ di sopravvivenza e di riproduzione.
Allora un argomento di selezione evoluzionistica suggerisce che gli individui
tendono a massimizzare il valore atteso di una qualche misura di sopravvivenza naturale e idoneità riproduttiva altrimenti vengono rimpiazzati.
In generale, massimizzare il payoff dell’utilità attesa non è lo stesso che massimizzare il payoff monetario atteso , perchè i valori dell’utilità non sono
necessariamente in dollari.
Un individuo avverso al rischio aumenta di piu’ la sua utilità attesa vincendo
un dollaro quando è povero che vincendo lo stesso dollaro quando è ricco.
Questa osservazione ci suggerisce che per molti decisori razionali, l’ utilità
può non essere una funzione lineare del valore monetario.
La teoria dei giochi può essere vista come una estensione della Teoria delle
Decisioni (al caso di 2 o più decisori razionali) , quindi per comprendere le
idee fondamentali della TdG una persona dovrebbe incominciare a studiare
la Teoria delle Decisioni.
Le decisioni riempiono la nostra vita. è proprio la capacita’ di scegliere
e di esprimere i nostri desideri che distingue la vita dell’essere intelligente
da quello delle forme inferiori.
Ogni giorno prendiamo delle decisioni, ma alcune sono cosı̀ poco importanti che ce ne dimentichiamo suito dopo (ad esempio, se mettere o no il
sale nella minestra. . . ) ,ma alcune, ad esempio quelle che incontriamo nella
nostra vita professionale, sono cosı̀ importanti che noi facciamo un’ analisi
accurata prima di prendere una decisione.
In cosa consiste questa analisi accurata ?
1
O meglio, chi è un buon decisore ?
Una volta avute le idee chiare di come deve essere un buon decisore, allora
potremo essere in grado di appoggiare o criticare le decisioni di altri, in particolare dei nostri rappresentanti e dei nostri mandanti.
Questo è il ruolo dei governi che prendono decisioni sul nostro benessere.
Lo fanno nel miglior modo possibile?
A volte dobbiamo delegare gli altri, e vorremmo essere certi che decidano
bene quindi solo se sappiamo riconoscere un buon decisore possiamo essere
certi di ciò .
Uno degli scopi della Teoria delle Decisioni è studiare che cosa è importante
sapere per essere un buon decisore.
Faremo degli esempi “provocanti” :
ESEMPIO 1 (BORDA count)
Una compagnia televisiva nazionale sta facendo una selezione per un festival internazionale.
Sette giudici sono stati convocati e hanno ascoltato quattro canzoni che chiameremo semplicemente:
A, B, C, D.
Ciascun giudice classifica le canzoni in ordine di preferenza cosı̀ da’ quattro
punti alla prima scelta, tre punti alla seconda e cosı̀ via. . .
La canzone che avra’ ottenuto il totale piu’ alto di punti sarà la canzone
vincente.
Sembra che i giudici abbiano votato come in tabella 1:
A
B
C
D
g1
1
2
3
4
g2
4
1
2
3
g3
3
4
1
2
g4
1
2
3
4
g5
4
1
2
3
g6
3
4
1
2
g7
1
2
3
4
Quindi la canzone C è quella vincente.
Immediatamente gli autori della canzone A protestano, perchè la canzone D
non doveva entrare nelle selezioni, infatti sussiste la regola che i cantautori
dovrebbero essere amatori, ma gli scrittori della canzone D sono professionisti.
La compagnia televisiva ammette che è cosı̀ e che è stato fatto un errore: la
canzone D dovrebbe essere squalificata.
Ma qual’ è il problema? La canzone D, infatti è in fondo.
Ciascun giudice preferiva la vittoria per la canzone C invece che per la D.
2
Cosı̀ sembra che non ci sia stata alcuna ingiustizia, tuttavia gli autori della
canzone A non sono soddisfatti.
L’ argomento è che la canzone D doveva essere squalificata prima della classifica cosı̀ i giudici avrebbero avuto solo tre canzoni da scegliere, cioè ciascun
giudice avrebbe dato:
3 punti al primo posto
2 punti l secondo posto
1 punto al primo posto
Supponendo che le preferenze rimangano quelle della tabella 1, le canzoni
avrebbero ottenuto il seguente punteggio:
A
3+1+2+3+1+2+3=15
B
2+3+1+2+3+1+2=14
C
1+2+3+1+2+3+1=13
cosı̀ la canzone A sarebbe stata la vincitrice.
Sembra quindi che gli autori della canzone A avessero motivo di protestare.
Vediamo ora alcuni Problemi di decisione reale
Gli esempi della vita reale, in generale, possono essere molto complicati,
inoltre, molte volte gli obiettivi di un decisore possono essere in contraddizione:
ad esmpio èimpossibile costruire un reattore nucleare minimizzando il suo
costo di costruzione e massimizzando la sua sicurezza.
Vediamo altri esempi:
CONTROLLO NELLA BANCA DL SANGUE.
Un ospedale ha una bana del sangue da cui desidera soddisfare ogni giorno
le necessitá per le trasfusioni.
Due sono i criteri importanti per valutare l’efficienza di una politica di controllo: la mancanza di sangue e la scadenza.
Capita una mancanza se una domanda per il sangue non può essere supplita
dalle riserve della banca.
Tali mancanze non sono cosı̀ catastrofiche come potrebbero sembrare, perchè
l’ospedale può chiamare i sevizi di una banca del sangue regionale o anche
portare il sangue dal donatore chiamato specificatamente per soddisfare una
certa richiesta.
Non di meno si va incontro a problemi di costo e di ritardo; il sangue non
ha una scadenza indefinita, infatti dopo poche settimane si deteriora e non
può essere usato a lungo.
D’altra parte se la banca del sangue ne raccoglie in quantità superiori alle
3
sue necessità, la successiva scadenza e distruzione sarebbero un significativo
spreco di risorse.
È ovvio che c’è INCERTEZZA, perchè la domanda della quantità di sangue
in ogni periodo non è conosciuta, sebbene le esigenze passate possano dare
qualche informazione per il futuro.
Questo è un problema decisionale.
Altro esempio:
DECISIONE DI POSIZIONARE UN AEROPORTO.
È stata presa la decisione di costruire un aeroporto. Un governo dve dovrebbe
scegliere di porre un nuovo aeroporto internazionale?
In generale la scelta è limitata a pochi siti candidati per ragion di richiesta
geografica.
Dovranno essere evitate le montagne, i centri abitati, la vicinanza con altri
aeroporti già esistenti, lughi con pericolose correnti d’aria, eccetera. . .
Il governo deve trovare un opportuno compromesso tra molti obiettivi spesso
diametralmente opposti.
Per minimizzare l’ inconveniente del viaggio, l’aeroporto dovrebbe essere il
posto più vicino possibile alla più grande città del paese, ma per salvalguardare la salute pubblica e inimizzare gli inconvenienti alla popolazione
dovrebbe essere costruito il piú lontano possibile dalle grandi città.
Ovviamente il governo dovrà minimizzare i costi di costruzione e di mantenimento,ancora vorràmassimizzare la capacità e desidererà costruire un
aeroporto tale da aumentare il prestigio internazionale del paese.
I progetti su un aeroporto non sono mai a breve termine e la loro costruzione
richiede molti anni.
È necessario sottolineare che ci sono varie incertezze?
Come sarà la domanda in futuro per il lavoro aeroportuale?
Come saranno in futuro i cambiamenti della crisi energetica? Questi potrebbero cambiare il costo drammaticamente e causare un veloce declino del
traffico aereo.
I voli diventeranno più sicuri e più tranquilli?
Il prezzo del volo cambierà significativamente?
L’avvento del jet wide body con la sua capacità di portare 500 passeggeri in
pochi minuti, non era prevista quando furono disegnati alcuni air-terminal
negli ultimi cinquant’anni. . .
Ci sono quindi moltissimi fattori che contribuiscono all’incertezza di scegliere
un luogo piuttosto che un altro.
gli aeroporti e i loro siti sono stati studiati a lungo in letteratura.
La comunicazione Roskill del Terzo Aeroporto di Londra ha pubblicato le
delibere in 9 volumi! (cfr Keeney-Raiffa) .
4
TEORIA DELLE DECISIONI : PARADOSSI
Che cosa è un paradosso? Con paradosso si intende in genere un argomento
che appare contraddittorio ma deve essere accettato
oppure
un argomento che appare corretto ma porta ad una contraddizione.
Un’ampia classe di paradossi è costituita da quelli che contraddicono il senso
comune.
Ma cosa è il senso comune?
Einstein ha detto che il senso comune è l’insieme dei pregiudizi che ognuno
ha assorbito fino all’età dei 18 anni.
Forse è l’insieme delle credenze efficaci che l’essere umano adotta per sopravvivere nell’ambiente (ad esempio per non morire di paura ogni volta
che tramonta il sole).
Vediamo ora alcuni paradossi per riflettere come sia a volte difficile prendere
una decisione.
PARADOSSO DEL MENTITORE: Io sto mentendo.
PARADOSSO DELLA DECISIONE: Il coccodrillo dice che mangerà
il bambino se e solo se la madre non indovina che cosa il coccodrillo farà.
La madre piange: - Crudele, mangerai il mio bambino! - Il coccodrillo (evidentemente un coccodrillo molto logico) osserva dunque che ora non può
restituirlo, altrimenti la madre non avrà indovinato per cui lo deve mangiare, ma la madre ha un sussulto di logica e obietta che il coccodrillo non
può mangiare il bambino, altrimenti fa sı̀ che lei abbia indovinato e in tal
caso deve mangiarlo.
PARADOSSO DEL DILEMMA DEL PRIGIONIERO
PARADOSSO DELLA PREVISIONE DELL’IMPICCATO
Questo paradosso risale a un episodio realmente accaduto durante l’ultima
guerra:
Qualcosa avverrà entro un certo numero di giorni, ma a sorpresa, in modo
che al mattino di quel giorno il soggetto non possa sapere con certeza qualè
il giorno fatale.
Il condannato ragiona: - Non può essere l’ultimo giorno, altrimenti all’alba
di quel giorno saprei con certezza, ma essendo escluso l’ultimo giorno, non
può essere il penultimo altrimenti all’alba di quel giorno saprei con certezza...
PARADOSSI DELLA PROBABILITÀ
Paradosso di St.Petersburg.
PARADOSSI STATISTICI
Questi paradossi sono molto importanti perché la statistica è usata per imporci molte decisioni e credenze.
E.H. Simpson (1961) dimostrò come è possibile che i dati di 2 casi diversi,
considerati separatamente, confermino la stessa ipotesi, ma considerati congiuntamente la falsifichino.
Supponiamo che in 2 urne, una bianca e una nera, ci siano delle caramelle
1
di liquirizia e menta rispettivamente nelle proporzioni:
B 50 liquirizia
60 menta
N 30 liquirizia
40 menta
ora supponiamo che in un’altra coppia di urne, poste in un’altra stanza,
ci sia la seguente distribuzione:
B 60 liquirizia
30 menta
N 90 liquirizia
50 menta
In entrambi i casi la probabilità di prendere una caramella di liquirizia
è maggiore nell’urna bianca. Supponiamo ora che le urne siano travasate in
una nuova coppia di urne più grandi, quelle nelle urne bianche in una nuova
urna bianca, e quelle nelle urne nere in una nuova urna nera. Allora:
B
110 liquirizia
90 menta
N
120 liquirizia
90 menta
Ora la probabilità di prendere una caramella di liquirizia è maggiore nell’urna
nera!
Si potrebbero fare esperimenti diversi e più realistici pensando agli esperimenti su un farmaco e ai suoi effetti su diversi campioni in varie città,
ma .....non deprimiamoci!
(per approfondimenti ”Il riso di Talete” di G.Lolli)
2
GIOCHI e determinazione dell’equilibrio di Nash
Esempio 1: Il dilemma del prigioniero
La polizia sospetta due banditi di un grosso crimine, ma non ha prove sufficienti per condannarli.
I due uomini vengono interrogati separatamente e non possono comunicare
tra loro.
L’offerta del procuratore distrettuale è la seguente:
- se uno confessa il crimine e l’altro no, quello che confessa è libero e l’altro
si prende ben 10 anni di carcere
-se entrambi confessano, ognuno avrà una condanna ridotta di 5 anni di
carcere
-se nessuno confessa, non avendo prove sufficienti per condannarli per quel
grosso crimine, vengono comunque condannati per porto abusivo d’armi, e
hanno ciascuno 1 anno di carcere
Che cosa dovrebbe fare ciascuno degli indiziati?
Che cosa farà ?
NC
C
NC
-1 -1
-10 0
C
0 -10
-5 -5
La teoria dei giochi prevede come esito finale il profilo di strategie: (C, C)
cioè ognuno confersserà.
Naturalmente l’esito può cambiare se viene ripetuto più volte, se c‘è cooperazione oppure se sono permesse comunicazioni.
1
Nel mondo reale ci sono molte situazioni simili a quelle del dilemma del prigioniero, ad esempio la corsa agli armamenti nucleari tra due nazioni rivali.
Supponiamo che due nazioni siano impegnate ad armarsi, ognuna ha le stesse
possibilità di scelta: continuare ad investire denari in armamenti nucleari oppure fermarsi.
Se entrambe le nazioni si fermano, ciascuna può utilizzare il proprio denaro
in progetti che vanno a beneficio della popolazione.
Se una cintinua ad armarsi e l’altra no, la prima otterrà in breve una posizione dominante.
Cosı̀ i due paesi continuano ad armarsi e si trovano nella situazione peggiore
perchè hanno speso una grande quantità di denaro in pericolosi armamenti
nucleari, ma nessuno può diventare più forte dell’altro.
Anche in questo caso la cooperazione (senza accordi vincolanti) è uno stato
instabile perchè induce l’altro all’inganno.
Esempio 2: La battaglia dei sessi
Consideriamo la seguente matrice dove il giocatore I è la moglie e il giocatore II è il marito. Devono scegliere tra Teatro o Partita che indicheremo
brevemente con T e P, la moglie preferisce andare a teatro e il marito alla
partita, ma preferiscono andare insieme piuttosto che separatamente. Leggiamo questo gioco sulla seguente matrice:
P
T
P
12
00
T
00
21
Sembra difficile distinguere tra i risultati (1,2) e (2,1) che sembrano essere
due possibili soluzioni del gioco. I due giocatori invece non sono indifferenti
rispetto ad un equilibrio o all’altro
2
La presenza di più equilibri in TdG costituisce una difficoltà maggiore,
rispetto ad altri problemi di ottimo. Ci sono stati vari tentativi da parte
di molti autori per selezionare un equilibrio tra i tanti possibili (problema
dei raffinamenti degli equilibri), ma fin’ora nessuno sembra aver dato un
risultato soddisfacente.
Esempio 3: Morra cinese
Consideriamo la seguente matrice nella quale conveniamo di assegnare il
valore 1 al giocatore che vince. Corrisponde al celebre gioco della morra
cinese in cui i giocatori Operano mosse simultanee tra sasso , carta e forbice
indicati rispettivamente con S, C, F.
C
S
F
C
00
1 -1
-1 1
S
-1 1
00
1 -1
F
1 -1
-1 1
00
Di questo gioco non è possibile prevedere il risultato.
Non esistono equilibri.
Se vi trovate a giocare più volte con lo stesso giocatore, accettereste il consiglio di non giocare mai sasso? Il vostro avversario potrebbe intuire cosa
avete in mente e potrebbe cosı̀ decidere di non giocare mai carta. In questo
modo si garantisce più possibilità di vittoria perchè rende inutile l’utilizzo
della forbice di parte vostra.
3
GIOCHI ED EQUILIBRIO DI NASH
–
Ricordiamo il Teorema di esistenza dell’equilibrio di Nash, in una forma
semplificata ( perchè è la versione che usiamo nei nostri giochi) e la nozione
di equilibrio di Nash:
Definizione Dato un gioco G = (X, Y, u1 , u2 ) a due giocatori,un profilo di
strategie (x∗ , y ∗ ) ∈ X×Y dicesi un equilibrio di Nash (per brevità scriveremo
NE) se valgono le seguenti diseguaglianze:
1) u1 (x∗ , y ∗ ) ≥ u1 (x, y ∗ ) ∀x ∈ X
2) u2 (x∗ , y ∗ ) ≥ u2 (x∗ , y) ∀y ∈ Y
in altre parole x∗ è la miglior risposta del giocatore I alla strategia y∗ del
giocatore II e viceversa y∗...
TeoremaOgni gioco finito ha almeno un equilibrio di Nash in strategie
miste.
Intanto dobbiamo specificare che per gioco finito intendiamo un gioco in cui
il numero dei giocatori è finito e lo spazio delle strategie è un insieme finito.
A questo punto mi aspetto una domanda dagli studenti svegli:- Come è
possibile che ci siano un numero infinito di giocatori?Nella realtà questo non è possibile ma in una teoria matematica il concetto
di infinito deve essere preso in considerazione (pensate ai limiti all’infinito, li
farete), l’idea è capire cosa succede se il numero dei giocatori diventa molto
ma molto grande (analogamente per le strategie).
Va detto che noi tratteremo solo giochi finiti.
Ricordate il gioco del PARI/DISPARI? Abbiamo già visto che non ha NE
in strategie pure.
In strategie miste Nash ci dice che ha almeno un equilibrio.
Gioco del Pari/Dispari
P
D
P
1
-1
1
D
-1
1
Supponiamo che il giocatore I giochi la strategia P (Pari) con probabilità p
e quindi la strategia D (dispari)con probabilità 1 − p; il giocatore II giochi
la strategia P con probabilità q e la strategia D con probabilità 1 − q, dimostriamo che il gioco del Pari/Dispari ha un equilibrio di Nash in strategie
miste dato da (p, q) = ( 12 , 12 )
Chiamiamo u(., .) la funzione di utilià del giocatore I ovviamente la funzione
di utilità del giocatore II sarà −u(., .).
Indichiamo con ũ(., .) l’estensione della funzione di utilità del giocatore I allo
spazio delle distribuzioni delle probabilità su X × Y . (∆(X) × ∆(Y ).).
Risulta
3) ũ(p, q) = pq+p(1−q)(−1)+(1−p)q(−1)+(1−p)(1−q) = 4pq−2p−2q+1
Dalla definizione di equilibrio di Nash devo dimostrare che:
4) ũ( 12 , 12 ) ≥ ũ(p, 12 ) ∀p ∈ ∆(X)
5) ũ( 12 , 12 ) ≥ ũ( 12 , q) ∀q ∈ ∆(Y )
La dimostrazione è banale sostituendo (p, q) = ( 12 , 12 ) nelle 4) e 5), in realtà,
poichè il gioco è a somma zero, è sufficiente la prima disuguaglianza.
2
Giochi a somma zero :un gioco con le carte
Il seguente gioco è un gioco a somma zero cioè rientra in quella classe particolare di giochi in cui un giocatore vince e l’altro perde (cosa che nella realtà
non avviene quasi mai, ognuno guadagna qualcosa) da notare che in questo
gioco l’utilità attesa coincide con il guadagno atteso, anche questo è un caso
particolare.
Esempi per illustrare che l’utilità attesa è ben diversa dal guadagno atteso
se ne possono fare tantissimi: sono più contento se guadagno 10 euro e sono
povero di quanto lo sia se guadagno la stessa cifra e sono molto ricco...
Invitare i ragazzi a fare altri esempi mettendo in luce che :
UTILITÀ ATTESA 6= GUADAGNO ATTESO.
Descriviamo il gioco:
– Entrambi i giocatori mettono una moneta di 1 euro nel piatto e il giocatore
I pesca una carta senza mostrarla al giocatore II, la guarda e decide se
rilanciare (azione R) o fermarsi (azione F). Se rilancia deve mettere 1 euro
nel piatto e il gioco passa al giocatore II che dovrà scegliere tra vedere (azione
V) e non vedere (azione N). Per vedere deve aggiungere un altro euro nel
piatto. Se I si ferma vince il piatto solo se la carta pescata è rossa altrimenti
perde.
Se I rilancia, vince il piatto solo se la carta pescata sia rossa oppure se II
decide di non vedere.
Allora il gioco ha due giocatori: I e II e questi hanno come spazi delle azioni:
A1 = {N, V } e A2 {F, R} rispettivamente.
Qui metterei l’albero del gioco come in Lucchetti.
Le strategie sono date da: S2 = {N, V } per il giocatore II e
S1 = {F F, F R, RF, RR} per il giocatore I, dove la prima lettera sta a indicare cosa fa I se la carta è rossa e la seconda lettera cosa fa I se la carta è
nera. Allora se indichiamo con
u 1 : S1 × S2 → R
e
u 2 : S1 × S2 → R
le funzioni di utilità rispettivamente dei due giocatori possiamo descrivere il
gioco dato dalla quadrupla:
1
G = (S1 , S2 , u1 , u2 )
(ricordare che un gioco è descritto solo quando sono dati gli spazi delle
strategie e le funzioni di utilità).
A questo punto con facili conti si ottiene la seguente matrice 4 × 2
che rappresenta il gioco in forma strategica.
FF
FR
RF
RR
N
0
1
0
1
V
0
-1/2
1/2
0
infatti:
u1 (RF, N ) = 12 (1) + 12 (−1) = 0
u1 (RF, V ) = 12 (2) + 12 (−1) =
1
2
u1 (RR, N ) = 12 (1) + 12 (1) = 1
u1 (RR, V ) = 12 (2) + 12 (−2) = 0
u1 (F F, N ) = 21 (1) + 12 (−1) = 0
u1 (F F, V ) = 0
u1 (F R, N ) = 12 (1) + 12 (1) = 1
u1 (F R, V ) = 12 (1) + 12 (−2) = − 12 .
Ricordando che in un gioco a somma zero u2 = −u1 sono noti anche i payoff
di II. Con considerazioni più volte usate sulla miglior risposta si conclude
che non esistono equilibri di Nash.
2
GIOCHI, STRATEGIE DOMINATE e CONOSCENZA
COMUNE
C‘è un modo ovvio per predire come saranno giocati i seguenti giochi?
Example 1
D
E
F
A
43
51
62
B
21
84
36
C
30
96
28
Fissiamo la nostra attenzione sul giocatore II.
La strategia F dà al giocatore II un payoff strettamente migliore del payoff
dato da E; diciamo allora che la strategia E è strettamente dominata da F.
Se il giocatore I sa (intuisce, capisce... essendo un giocatore razionale) allora
per I la miglior risposta è A.
Infine se il giocatore II sa che I sa che che II non giocherà E, allora II sa
che I giocherà A e allora II giocherà D. Otteniamo cosı̀ (A,D) come unico
equilibrio di Nash del gioco.
Questo processo dicesi anche di dominanza stretta iterata e non dipende
dall’ordine in cui le strategie sono considerate.
Example 2-Common knowledge
C
D
A
8 10
-100 9
B
76
65
Quando un gioco si può giocare mediante eliminazione iterata di strategie
dominate, nel senso che a ciascun giocatore rimane solo una strategia, allora
questo profilo di strategie è il candidato ovvio per predire come sarà giocato
1
il gioco.
Non è però sempre cosı̀, specialmente quando i payoff possono assumere valori molto grandi o molto piccoli.
La maggior parte degli studenti a cui è stato chiesto come avrebbero giocato questo gioco, ha risposto B come strategia per I sebbene la dominanza
iterata dia (A,C) come unica soluzione.
Infatti sebbene A è meglio di B quando II non usa la strategia dominata D,
B è meglio di A quando c’è una possibilità che II giochi D.
Se la perdita è meno grave, ad esempio sostituendo -100 con -1 allora quasi
tutti i giocatori I preferiscono A. Provate infatti a proporre agli stessi studenti il seguente gioco:
C
D
A
8 10
-1 9
B
76
65
.
Questo esempio illustra il fatto fondamentale che i payoff e gli spazi delle
strategie siano conoscenza comune e la razionalità nel senso di NON GIOCARE UNA STRATEGIA STRETTAMENTE DOMINATA È CONOSCENZA
COMUNE (apparentemente non sembrava vero nell’ esempio dove compare
un payoff molto piccolo)
Example 3
Come giocheresti il seguente gioco?
D
E
A
22
51
B
34
42
C
21
34
2
QUIZ ed ENIGMI
1. Le 3 signorine con la faccia sporca
Supponiamo che tre ragazze tutte con la faccia sporca siano sedute in modo
da vedere ciascuna la faccia delle altre.
Supponiamo inoltre che le tre ragazze siano perfettamente razionali (come
tutti i giocatori della TdG) e ciascuna sa che tutte le altre sono perfettamente razionali. In altre parole la razionalita’ di tutte è conoscenza comune.
Supponiamo che dato che queste ragazze sono razionali, arrossiscono appena
si rendono conto di avere la faccia sporca.(Possiamo supporre che arrossiscono se e solo se si rendono conto di avere la faccia sporca, cioè nessun altro
motivo può farle arrossire)
Osserviamo che:
1) Ciascuna ragazza vede le altre quindi ognuna sa che almeno una di esse
ha la faccia sporca
2) non ci sono specchi di nessun tipo quindi nessuna ragazza può vedere se
ha la faccia sporca. fin qui nessuna ragazza ha motivo di arrossire.
Supponiamo ora che una quarta persona entri nella stanza e fa a voce alta
la seguente osservazione:
”Almeno una ragazza in questa stanza ha la faccia sporca”
Sembrerebbe che il nuovo arrivato non dica nulla di nuovo (la situazione era
già nota a tutti) ma in realtà la situazione è cambiata.
Perchè?
Perchè l’annuncio mette a conoscenza le ragazze del fatto che tutte e tre
sono a conoscenza del fatto che almeno una di loro ha la faccia sporca.
Ciò ha delle conseguenze?
Chiamiamo le tre ragazze Amelia, Barbara, Carlotta.
Mettiamoci dal punto di vista di Amelia (ma la situazione è simmetrica per
3
le altre).
Amelia pensa: se io ho la faccia pulita, Barbara e Carlotta osservano ciascuno una sola faccia sporca. Quindi se ad esempio Carlotta non arrossisce,
Barbara sa di avere la faccia sporca. Carlotta non arrossisce quindi presto
Barbara saprà con certezza che le facce sporche sono almeno due e, nel caso
che la faccia di Amelia sia pulita arrossirà. Poichè Barbara non arrossisce,
Amelia pensa che le facce sporche sono tre, quindi arrossisce. Poiche’ il ragionamento è simmetrico per le tre amiche, tutte arrossiranno.
Concludendo possiamo dire che la conoscenza comune ha permesso un passaggio di informazioni ”silenzioso” conseguenza del comportamento di ognuna.
2. Un padre burlone
Un padre offre ai suoi due figli una busta ciascuno. In una ci sono 10n euro
e nell’altra 10n+1 ( n è un numero intero scelto con la stessa probabilità tra
1 e 5 e i figli sanno questo).
Le buste vengono date a caso.
Il primo figlio, chiamiamolo Giovanni, scopre di aver ricevuto 104 euro e il
secondo figlio, chiamiamolo Luca, scopre di aver ricevuto 105 euro. Ognuno
non sa cosa ha ricevuto l’altro.
A questo punto il padre chiede separatamente a ciascun figlio se vuole scambiare la busta con quella del fratello. Facciamo l’ulteriore ipotesi che ciascuno sia indifferente al rischio e entrambi sono giocatori razionali pertanto
cercheranno di massimizzare il propriopayoff atteso. Giovanni che ha ricevuto 104 euro, sa che Luca potrebbe aver ricevuto 103 euro oppure 105
pertanto si calcola la sua utilità attesa se scambiasse la busta (per fortuna
ha sempre studiato bene la Matematica) e ottiene:
103 +105
2
euro.
Essendo
103 +105
2
> 104 (provate!!!), sicuramente accetta.
4
Luca (che ha ricevuto 105 euro, pensa analogamente che il fratello Giovanni potrebbe aver ricevuto 104 euro oppure 106 euro, pertanto anche Luca,
sapendo per fortuna un po’ di Matematica riesce a calcolare la sua utilità
attesa se cambiasse la busta :
Luca osserva che:
104 +106
2
>
104 +106
euro.
2
105 (ancora una
volta la Matematica viene
in aiuto) e Luca conclude che anche a lui conviene accettare e cambiare la
busta.
A questo punto il padre comunica ai due figli che entrambi hanno accettato
di cambiare la busta.
Ora senza che avvenga alcuno scambio ripete come prima separatamente a
entrambi la stessa domanda.
Ma questa volta Giovanni accetta, Luca no
Perchè?
Perchè Luca ha capito che nella busta di Giovanni ci sono 104 euro, infatti
venendo a conoscenza del fatto che il fratello vuole cambiare la busta, necessariamente non ha trovato il massimo cioè 106 euro.
Anche in questo caso la ”conoscenza comune” ha permesso un passaggio di
informazioni silenzioso.
5
BIBLIOGRAFIA
References
[1]
Castelli E. ,I paradossi del senso comune. (1970).
[2]
Clark M., I paradossi dalla A alla Z ed.Cortina 2004.
[3]
Costa G. Mori P.Introduzione alla Teoria dei Gichi ed Il Mulino (1994).
[4]
Gibbons R.Teoria dei Gichi ed Il Mulino, Bologna, 1994 : A Primer in
Game Theory, Harvester, 1992.
[5]
Lucchetti R.Di duelli, scacchi e dilemmi: la teoria matematica dei
giochi. Bruno Mondadori Editore,2001
[6]
Mero’L., Calcoli morali, teoria dei giochi, logica e fragilit umana Dedalo
ed. 198
[7]
Patrone F.Decisori (razionali) interagenti Una Introduzione alla Teoria
dei giochi. Ed Plus, 2006.
[8]
Pusillo L. Appunti dal corso di Teoria matematica dei Giochi per facoltà
di SMFN
1
TEORIA MATEMATICA DEI GIOCHI
ED EVOLUZIONE
Può la teoria matematica dei giochi spiegare comportamente paradossali nei
processi evolutivi?
Lucia Pusillo
Dipartimento di Matematica dell’ Università di Genova,
via Dodecaneso 35, 16146 Genova.
1
La teoria dei giochi si applica più facilmente alla biologia che al comportamento economico per cui invece è stata inventata.
2
Ci sono due motivi per questo: il primo è che la teoria richiede che
i valori di differenti risultati possano essere misurati su una singola
scala, e nelle applicazioni umane questa misura è ottenuta con un
concetto artificiale che è la funzione di utilità.
In biologia il benessere darwiniano fornisce una scala unidimensionale.
Il secondo e forse più importante motivo nel cercare la soluzione di
un gioco è il concetto della razionalità umana che qui viene sostituito
dalla stabilità evolutiva.
3
Il vantaggio, afferma Maynard Smith, è che qui ci sono varie ragioni
per aspettarsi che la popolazione evolva verso stati stabili e invece ci
sono molti dubbi sulla razionalità del comportamento umano.
4
La nozione pù accreditata di soluzione per giochi non cooperativi è la
nozione di equilibrio di Nash.
Se indichiamo con X e Y gli spazi delle strategie dei due giocatori,
ricordo che una coppia di strategie (x, y) ∈ X × Y è un equilibrio di
Nash ( brevemente N E) se
u1(x, y) ≥ u1(x, y) ∀x ∈ X,
u2(x, y) ≥ u2(x, y) ∀y ∈ Y
5
Ciascun organismo animale e vegetale sceglie un’azione da un insieme
ammissibile B che si chiama anche spazio delle strategie.
L’essere sceglie una strategia (cioè una azione) non coscientemente ma
seguendo delle leggi di ereditarietà oppure leggi dovute alla mutazione.
La funzione di utilità, misurerà il successo riproduttivo futuro o una
qualche abilità della specie per la sopravvivenza.
6
Da notare che se un’azione, cioè un comportamento, risulta nocivo per
il singolo organismo animale o vegetale, ma risulta utile per il processo
riproduttivo, allora viene favorito dalle leggi dell’evoluzione e spiegato
in termini di Teoria dei Giochi come un equilibrio evolutivamente
stabile (cioè deriva da azioni ESS).
7
Un esempio può essere fornito dalla coda del pavone. Come è noto
questa è nociva per il singolo animale perchè ne fa facile vittima di
un predatore, ma è utile per la sua specie perchè serve per attirare il
partner e quindi prelude ad un successo riproduttivo futuro, pertanto
la coda sarà favorita dall’Evoluzione e secondo la Teoria dei Giochi è
un equilibrio evolutivo
8
Tutto questo può essere espresso mediante un gioco simmetrico che
scriverò come una quadrupla
G = (B, B, u1, u2)
dove B è lo spazio delle strategie del giocatore I e del giocatore II,
u1, u2 sono le funzioni di utilità dei due giocatori.
Supponiamo inoltre che il gioco sia simmetrico cioè u1(a, b) = u2(b, a),
9
Il seguente gioco, noto anche come DILEMMA DEL PRIGIONIERO,
è simmetrico nel senso detto:
44 05
50 11
10
Il gioco del PARI/DISPARI
1 − 1 −1 1
−1 1
1 −1
11
Candidato per un equilibrio evolutivo è una coppia di azioni in B × B
cioè una coppia (x̃, x̃).
La nozione di equilibrio è data pertanto in modo tale che in quello
stadio l’organismo compie un’azione e nessun mutante può invadere
la popolazione.
Più precisamente l’idea di equilibrio è che il processo evolutivo trasforma
una piccola frazione della popolazione in mutanti che seguono una
strategia b scelta nell’insieme delle strategie B.
Va osservato che tra una mutazione e l’altra possono passare anche
migliaia di anni.
In un equilibrio un mutante deve ottenere un payoff atteso più piccolo
di quello che ottiene un non mutante.
12
Supponiamo che una percentuale di ² individui mutanti (² > 0) compiano l’azione b, mentre gli altri compiono l’azione b∗, allora deve
risultare che il payoff atteso di un mutante deve essere più piccolo
del payoff atteso di un non-mutante, se b∗ è la strategia di equilibrio
dovrà essere:
(1 − ²)u(b, b∗) + ²u(b, b) < (1 − ²)u(b∗, b∗) + ²u(b∗, b)
per ogni ² > 0 e sufficientemente piccolo.
13
Da questa relazione usando vari teoremi di Analisi Matematica si
perviene all’equilibrio di strategie evolutivamente stabili
Infatti la disugualianza scritta equivale a 1) e 2):
1) u(b, b∗) < u(b∗, b∗) se b 6= b∗
2) se u(b, b∗) = u(b∗, b∗) allora u(b, b) < u(b∗, b)
14
Dato un gioco G = (B, B, u1, u2) simmetrico a due giocatori, una
strategia evolutivamente stabile ( brevemente diremo una ESS di G)
è una azione b∗ ∈ B tale che:
- (b∗, b∗) è un equilibrio di Nash del gioco e u(b, b) < u(b∗, b) per ogni
b miglior risposta a b∗ con b 6= b∗.
15
Esempio FALCHI/COLOMBE:
C
F
C
F
1/2, 1/2
0, 1
1, 0
(1 − c)/2, (1 − c)/2
16
Usando dei concetti matematici quali:
–
–
–
–
–
funzione a valori reali
massimi e minimi per funzioni a valori reali
multiapplicazione
disequazioni
monotonia cioè crescenza e decrescenza per una funzione reale
si perviene al seguente risultato:
17
– Se c ≤ 1 esiste un solo equilibrio evolutivamente stabile (F, F ) e
questo ci dice che se il costo della lotta è piccolo, allora si comporteranno entrambi da aggressori (strategia F ) e gli altri comportamenti
tenderanno ad estinguersi
– Se c > 1 (cioè il costo della lotta è elevato rispetto al valore della
preda) solo
(1 − 1/c, 1 − 1/c) è un equilibrio evolutivo quindi solo questo comportamento tenderà ad affermarsi nel corso dell’evoluzione e gli altri
tenderanno a scomparire.
18
Può la teoria matematica dei giochi spiegare comportamente paradossali nei processi evolutivi?
19
Quanto vi racconterò, è contenuto in parte in un interessante articolo di Michael Mesterton Gibbons e Eldridge S.Adams (il primo
professore di Matematica all’Università di Stato della Florida e il
secondo ricercatore al Dipartimento di Ecologia e Biologia Evoluzionistica all’Università del Connecticut.
20
Consideriamo ad esempio il famoso principio dell’handicap.
L’etologo A.Zahavi di Tel Aviv afferma che animali in conflitto possono sviluppare dei comportamenti costosi per chi li attua cioè comportamenti che possono abbassare la probabilità di sopravvivenza.
L’animale mostrando che può sopportare un
handicap mette in mostra la sua forza, cioè
lancia un messaggio che gli altri animali dovrebbero rispettare.
21
Questa ipotesi fu dapprima respinta dagli studiosi perchè andrebbe
contro il principio che l’evoluzione dovrebbe favorire i segnali che
costano meno fatica per gli animali.
22
Per studiare e risolvere tali questioni ci si basa sempre più sulla
collaborazione tra biologi e matematici attraverso degli strumenti
analitici chiamati giochi e oggetto di studio della
Teoria matematica dei giochi
23
ESEMPI:Gioco della guerra di logoramento
Nel gioco della guerra di logoramento i giocatori conoscono solo la
propria forza e una strategia è una porzione delle riserve iniziali che
l’animale è disposto a spendere in una lotta prolungata per conquistarsi un sito.
Tante più riserve un animale risparmia, tante più energie avrà e quindi
possibilità di successo nell’attirare una compagna, nel trovare cibo, nel
difendere il suo territorio e quindi un maggior successo riproduttivo.
Tutte queste ipotesi ci permettono di individuare lo spazi delle strategie e la funzione di utilità.
24
se vogliamo costruire un modello su questo esempio, abbiamo bisogno
di due parametri:c, R.
- c ∈ [0, 1] è il coefficiente di variazione e intuitivamente misura la
variazione delle riserve di energia intorno alla sua media (ad esempio
se diciamo che c = 0.6 , significa che la deviazione standard delle
riserve di grasso è il 60% della media.
-R ∈ [0, 1] ci fornisce il rapporto costi-benefici, cioè paragona il costo
di spendere 1 unità di riserve di grasso con l’eventuale beneficio del
vincitore per 1 unità risparmiata.
25
La funzione di utilità:

x 1−c


R(1
−
x)
se
≤


y
1+c



y
1−c x
1 − R + Rx


R(1 − x) + a(x, y)
− 2 b(x, y) se
≤ <1
2
4c
4c
1
+
c
y
u(x, y) =
x 1−c


≥
1
−
y
se


y
1+c



R − Rx − 1
y
x 1−c


+ 2 d(x, y) se 1 ≤ ≤
1 − y + g(x, y)
4c2
4c
y
1+c
dove:
c ∈ [0, 1]
26
R ∈ [0, 1]
y2
x
(1 − c)(1 + c)2
3
3
a(x, y) = 2 (1 − c) + (1 + c) −
6x
3y
2
2
y
x
(1 + c)(1 − c)2
3
3
b(x, y) = 2 (1 + c) + (1 − c) −
6y
3x
2
y2
x
(1 + c)(1 − c)2
3
3
g(x, y) = 2 (1 + c) + (1 − c) −
6x
3y
2
(1 − c)(1 + c)2
x2
y
3
3
d(x, y) = 2 (1 − c) + (1 + c) −
6y
3x
2
27
Si dimostra con tecniche matematiche che tengono conto
del concetto di integrale che esiste un equilibrio evolutivo
se il rapporto
costi-benefici R non supera una certa soglia critica
2c(c2+3)
f (C) = c2(c+6)+9(2−c)
28
Una strategia ESS esiste quando le farfalle combattono fino all’esaurimento
consumando almeno il 66% delle proprie energie, questo è un comportamento paradossale tanto più perche si può dimostrare che l’equilibrio
evolutivo associato è sempre non efficiente.
29
Altri esempi in cui il comportamento paradossale degli animali può
essere interpretato come una strategia evolutivamente stabile sono:
gioco della minaccia dei granchi
il bluff che si osserva in una specie di ragno messicano l’Oecobius
civitas.
30
Conclusioni: il valore della Teoria Matematica dei Giochi
I modelli della teoria dei giochi hanno il merito di suggerire dei modi
per verificare nuove idee.
I ”giochi” hanno valore proprio perchè ci permettono di verificare con
calcoli precisi la logica delle nostre argomentazioni.
È vero che i comportamenti descritti non sono frequenti in natura
(l’effetto domino è stato osservato solo nell’Oecobius Civitas), ma sono
i comportamenti strani ad attirare la nostra attenzione...e in questo
senso la Teoria dei giochi facendo uso di una bella e profonda
matematica si dimostra molto utile nello studio del comportamento
animale.
31
Scarica