Introduzione alla Teoria matematica dei giochi La Teoria matematica dei giochi si occupa in generale delle tecniche matematiche per analizzare situazioni in cui due o piu’ individui prendono decisioni che influenzeranno il proprio e l’altrui benessere. Le situazioni che i teorici della Teoria dei giochi studiano non sono meramente ricreative come potrebbe erroneamente far pensare il termine gioco. Nel linguaggio di questa giovane scienza (si può datare un inizio di questa moderna teoria con i lavori di Zermelo del 1913,di Borel Von Neumann del 1918 e di Von Neumann e Morgenstein del 1944) il termine gioco si riferisce ad ogni situazione sociale che coinvolge due o più individui: i giocatori. I giocatori sono supposti sempre decisori razionali, cioè prenderanno decisioni tali da massimizzare i payoff della propria utilita’ attesa. Un esempio di comportamento che tende a massimizzare il proprio payoff, puo’ essere trovato nei modelli di selezione evolutiva. In un universo dove il disordine crescente è una legge fisica, gli organismi complessi (includendo gli uomini o più in generale le organizzazioni sociali) possono sopravvivere solo se si comportano in un modo che tende a far aumentare le loro probabilita’ di sopravvivenza e di riproduzione. Allora un argomento di selezione evoluzionistica suggerisce che gli individui tendono a massimizzare il valore atteso di una qualche misura di sopravvivenza naturale e idoneità riproduttiva altrimenti vengono rimpiazzati. In generale, massimizzare il payoff dell’utilità attesa non è lo stesso che massimizzare il payoff monetario atteso , perchè i valori dell’utilità non sono necessariamente in dollari. Un individuo avverso al rischio aumenta di piu’ la sua utilità attesa vincendo un dollaro quando è povero che vincendo lo stesso dollaro quando è ricco. Questa osservazione ci suggerisce che per molti decisori razionali, l’ utilità può non essere una funzione lineare del valore monetario. La teoria dei giochi può essere vista come una estensione della Teoria delle Decisioni (al caso di 2 o più decisori razionali) , quindi per comprendere le idee fondamentali della TdG una persona dovrebbe incominciare a studiare la Teoria delle Decisioni. Le decisioni riempiono la nostra vita. è proprio la capacita’ di scegliere e di esprimere i nostri desideri che distingue la vita dell’essere intelligente da quello delle forme inferiori. Ogni giorno prendiamo delle decisioni, ma alcune sono cosı̀ poco importanti che ce ne dimentichiamo suito dopo (ad esempio, se mettere o no il sale nella minestra. . . ) ,ma alcune, ad esempio quelle che incontriamo nella nostra vita professionale, sono cosı̀ importanti che noi facciamo un’ analisi accurata prima di prendere una decisione. In cosa consiste questa analisi accurata ? 1 O meglio, chi è un buon decisore ? Una volta avute le idee chiare di come deve essere un buon decisore, allora potremo essere in grado di appoggiare o criticare le decisioni di altri, in particolare dei nostri rappresentanti e dei nostri mandanti. Questo è il ruolo dei governi che prendono decisioni sul nostro benessere. Lo fanno nel miglior modo possibile? A volte dobbiamo delegare gli altri, e vorremmo essere certi che decidano bene quindi solo se sappiamo riconoscere un buon decisore possiamo essere certi di ciò . Uno degli scopi della Teoria delle Decisioni è studiare che cosa è importante sapere per essere un buon decisore. Faremo degli esempi “provocanti” : ESEMPIO 1 (BORDA count) Una compagnia televisiva nazionale sta facendo una selezione per un festival internazionale. Sette giudici sono stati convocati e hanno ascoltato quattro canzoni che chiameremo semplicemente: A, B, C, D. Ciascun giudice classifica le canzoni in ordine di preferenza cosı̀ da’ quattro punti alla prima scelta, tre punti alla seconda e cosı̀ via. . . La canzone che avra’ ottenuto il totale piu’ alto di punti sarà la canzone vincente. Sembra che i giudici abbiano votato come in tabella 1: A B C D g1 1 2 3 4 g2 4 1 2 3 g3 3 4 1 2 g4 1 2 3 4 g5 4 1 2 3 g6 3 4 1 2 g7 1 2 3 4 Quindi la canzone C è quella vincente. Immediatamente gli autori della canzone A protestano, perchè la canzone D non doveva entrare nelle selezioni, infatti sussiste la regola che i cantautori dovrebbero essere amatori, ma gli scrittori della canzone D sono professionisti. La compagnia televisiva ammette che è cosı̀ e che è stato fatto un errore: la canzone D dovrebbe essere squalificata. Ma qual’ è il problema? La canzone D, infatti è in fondo. Ciascun giudice preferiva la vittoria per la canzone C invece che per la D. 2 Cosı̀ sembra che non ci sia stata alcuna ingiustizia, tuttavia gli autori della canzone A non sono soddisfatti. L’ argomento è che la canzone D doveva essere squalificata prima della classifica cosı̀ i giudici avrebbero avuto solo tre canzoni da scegliere, cioè ciascun giudice avrebbe dato: 3 punti al primo posto 2 punti l secondo posto 1 punto al primo posto Supponendo che le preferenze rimangano quelle della tabella 1, le canzoni avrebbero ottenuto il seguente punteggio: A 3+1+2+3+1+2+3=15 B 2+3+1+2+3+1+2=14 C 1+2+3+1+2+3+1=13 cosı̀ la canzone A sarebbe stata la vincitrice. Sembra quindi che gli autori della canzone A avessero motivo di protestare. Vediamo ora alcuni Problemi di decisione reale Gli esempi della vita reale, in generale, possono essere molto complicati, inoltre, molte volte gli obiettivi di un decisore possono essere in contraddizione: ad esmpio èimpossibile costruire un reattore nucleare minimizzando il suo costo di costruzione e massimizzando la sua sicurezza. Vediamo altri esempi: CONTROLLO NELLA BANCA DL SANGUE. Un ospedale ha una bana del sangue da cui desidera soddisfare ogni giorno le necessitá per le trasfusioni. Due sono i criteri importanti per valutare l’efficienza di una politica di controllo: la mancanza di sangue e la scadenza. Capita una mancanza se una domanda per il sangue non può essere supplita dalle riserve della banca. Tali mancanze non sono cosı̀ catastrofiche come potrebbero sembrare, perchè l’ospedale può chiamare i sevizi di una banca del sangue regionale o anche portare il sangue dal donatore chiamato specificatamente per soddisfare una certa richiesta. Non di meno si va incontro a problemi di costo e di ritardo; il sangue non ha una scadenza indefinita, infatti dopo poche settimane si deteriora e non può essere usato a lungo. D’altra parte se la banca del sangue ne raccoglie in quantità superiori alle 3 sue necessità, la successiva scadenza e distruzione sarebbero un significativo spreco di risorse. È ovvio che c’è INCERTEZZA, perchè la domanda della quantità di sangue in ogni periodo non è conosciuta, sebbene le esigenze passate possano dare qualche informazione per il futuro. Questo è un problema decisionale. Altro esempio: DECISIONE DI POSIZIONARE UN AEROPORTO. È stata presa la decisione di costruire un aeroporto. Un governo dve dovrebbe scegliere di porre un nuovo aeroporto internazionale? In generale la scelta è limitata a pochi siti candidati per ragion di richiesta geografica. Dovranno essere evitate le montagne, i centri abitati, la vicinanza con altri aeroporti già esistenti, lughi con pericolose correnti d’aria, eccetera. . . Il governo deve trovare un opportuno compromesso tra molti obiettivi spesso diametralmente opposti. Per minimizzare l’ inconveniente del viaggio, l’aeroporto dovrebbe essere il posto più vicino possibile alla più grande città del paese, ma per salvalguardare la salute pubblica e inimizzare gli inconvenienti alla popolazione dovrebbe essere costruito il piú lontano possibile dalle grandi città. Ovviamente il governo dovrà minimizzare i costi di costruzione e di mantenimento,ancora vorràmassimizzare la capacità e desidererà costruire un aeroporto tale da aumentare il prestigio internazionale del paese. I progetti su un aeroporto non sono mai a breve termine e la loro costruzione richiede molti anni. È necessario sottolineare che ci sono varie incertezze? Come sarà la domanda in futuro per il lavoro aeroportuale? Come saranno in futuro i cambiamenti della crisi energetica? Questi potrebbero cambiare il costo drammaticamente e causare un veloce declino del traffico aereo. I voli diventeranno più sicuri e più tranquilli? Il prezzo del volo cambierà significativamente? L’avvento del jet wide body con la sua capacità di portare 500 passeggeri in pochi minuti, non era prevista quando furono disegnati alcuni air-terminal negli ultimi cinquant’anni. . . Ci sono quindi moltissimi fattori che contribuiscono all’incertezza di scegliere un luogo piuttosto che un altro. gli aeroporti e i loro siti sono stati studiati a lungo in letteratura. La comunicazione Roskill del Terzo Aeroporto di Londra ha pubblicato le delibere in 9 volumi! (cfr Keeney-Raiffa) . 4 TEORIA DELLE DECISIONI : PARADOSSI Che cosa è un paradosso? Con paradosso si intende in genere un argomento che appare contraddittorio ma deve essere accettato oppure un argomento che appare corretto ma porta ad una contraddizione. Un’ampia classe di paradossi è costituita da quelli che contraddicono il senso comune. Ma cosa è il senso comune? Einstein ha detto che il senso comune è l’insieme dei pregiudizi che ognuno ha assorbito fino all’età dei 18 anni. Forse è l’insieme delle credenze efficaci che l’essere umano adotta per sopravvivere nell’ambiente (ad esempio per non morire di paura ogni volta che tramonta il sole). Vediamo ora alcuni paradossi per riflettere come sia a volte difficile prendere una decisione. PARADOSSO DEL MENTITORE: Io sto mentendo. PARADOSSO DELLA DECISIONE: Il coccodrillo dice che mangerà il bambino se e solo se la madre non indovina che cosa il coccodrillo farà. La madre piange: - Crudele, mangerai il mio bambino! - Il coccodrillo (evidentemente un coccodrillo molto logico) osserva dunque che ora non può restituirlo, altrimenti la madre non avrà indovinato per cui lo deve mangiare, ma la madre ha un sussulto di logica e obietta che il coccodrillo non può mangiare il bambino, altrimenti fa sı̀ che lei abbia indovinato e in tal caso deve mangiarlo. PARADOSSO DEL DILEMMA DEL PRIGIONIERO PARADOSSO DELLA PREVISIONE DELL’IMPICCATO Questo paradosso risale a un episodio realmente accaduto durante l’ultima guerra: Qualcosa avverrà entro un certo numero di giorni, ma a sorpresa, in modo che al mattino di quel giorno il soggetto non possa sapere con certeza qualè il giorno fatale. Il condannato ragiona: - Non può essere l’ultimo giorno, altrimenti all’alba di quel giorno saprei con certezza, ma essendo escluso l’ultimo giorno, non può essere il penultimo altrimenti all’alba di quel giorno saprei con certezza... PARADOSSI DELLA PROBABILITÀ Paradosso di St.Petersburg. PARADOSSI STATISTICI Questi paradossi sono molto importanti perché la statistica è usata per imporci molte decisioni e credenze. E.H. Simpson (1961) dimostrò come è possibile che i dati di 2 casi diversi, considerati separatamente, confermino la stessa ipotesi, ma considerati congiuntamente la falsifichino. Supponiamo che in 2 urne, una bianca e una nera, ci siano delle caramelle 1 di liquirizia e menta rispettivamente nelle proporzioni: B 50 liquirizia 60 menta N 30 liquirizia 40 menta ora supponiamo che in un’altra coppia di urne, poste in un’altra stanza, ci sia la seguente distribuzione: B 60 liquirizia 30 menta N 90 liquirizia 50 menta In entrambi i casi la probabilità di prendere una caramella di liquirizia è maggiore nell’urna bianca. Supponiamo ora che le urne siano travasate in una nuova coppia di urne più grandi, quelle nelle urne bianche in una nuova urna bianca, e quelle nelle urne nere in una nuova urna nera. Allora: B 110 liquirizia 90 menta N 120 liquirizia 90 menta Ora la probabilità di prendere una caramella di liquirizia è maggiore nell’urna nera! Si potrebbero fare esperimenti diversi e più realistici pensando agli esperimenti su un farmaco e ai suoi effetti su diversi campioni in varie città, ma .....non deprimiamoci! (per approfondimenti ”Il riso di Talete” di G.Lolli) 2 GIOCHI e determinazione dell’equilibrio di Nash Esempio 1: Il dilemma del prigioniero La polizia sospetta due banditi di un grosso crimine, ma non ha prove sufficienti per condannarli. I due uomini vengono interrogati separatamente e non possono comunicare tra loro. L’offerta del procuratore distrettuale è la seguente: - se uno confessa il crimine e l’altro no, quello che confessa è libero e l’altro si prende ben 10 anni di carcere -se entrambi confessano, ognuno avrà una condanna ridotta di 5 anni di carcere -se nessuno confessa, non avendo prove sufficienti per condannarli per quel grosso crimine, vengono comunque condannati per porto abusivo d’armi, e hanno ciascuno 1 anno di carcere Che cosa dovrebbe fare ciascuno degli indiziati? Che cosa farà ? NC C NC -1 -1 -10 0 C 0 -10 -5 -5 La teoria dei giochi prevede come esito finale il profilo di strategie: (C, C) cioè ognuno confersserà. Naturalmente l’esito può cambiare se viene ripetuto più volte, se c‘è cooperazione oppure se sono permesse comunicazioni. 1 Nel mondo reale ci sono molte situazioni simili a quelle del dilemma del prigioniero, ad esempio la corsa agli armamenti nucleari tra due nazioni rivali. Supponiamo che due nazioni siano impegnate ad armarsi, ognuna ha le stesse possibilità di scelta: continuare ad investire denari in armamenti nucleari oppure fermarsi. Se entrambe le nazioni si fermano, ciascuna può utilizzare il proprio denaro in progetti che vanno a beneficio della popolazione. Se una cintinua ad armarsi e l’altra no, la prima otterrà in breve una posizione dominante. Cosı̀ i due paesi continuano ad armarsi e si trovano nella situazione peggiore perchè hanno speso una grande quantità di denaro in pericolosi armamenti nucleari, ma nessuno può diventare più forte dell’altro. Anche in questo caso la cooperazione (senza accordi vincolanti) è uno stato instabile perchè induce l’altro all’inganno. Esempio 2: La battaglia dei sessi Consideriamo la seguente matrice dove il giocatore I è la moglie e il giocatore II è il marito. Devono scegliere tra Teatro o Partita che indicheremo brevemente con T e P, la moglie preferisce andare a teatro e il marito alla partita, ma preferiscono andare insieme piuttosto che separatamente. Leggiamo questo gioco sulla seguente matrice: P T P 12 00 T 00 21 Sembra difficile distinguere tra i risultati (1,2) e (2,1) che sembrano essere due possibili soluzioni del gioco. I due giocatori invece non sono indifferenti rispetto ad un equilibrio o all’altro 2 La presenza di più equilibri in TdG costituisce una difficoltà maggiore, rispetto ad altri problemi di ottimo. Ci sono stati vari tentativi da parte di molti autori per selezionare un equilibrio tra i tanti possibili (problema dei raffinamenti degli equilibri), ma fin’ora nessuno sembra aver dato un risultato soddisfacente. Esempio 3: Morra cinese Consideriamo la seguente matrice nella quale conveniamo di assegnare il valore 1 al giocatore che vince. Corrisponde al celebre gioco della morra cinese in cui i giocatori Operano mosse simultanee tra sasso , carta e forbice indicati rispettivamente con S, C, F. C S F C 00 1 -1 -1 1 S -1 1 00 1 -1 F 1 -1 -1 1 00 Di questo gioco non è possibile prevedere il risultato. Non esistono equilibri. Se vi trovate a giocare più volte con lo stesso giocatore, accettereste il consiglio di non giocare mai sasso? Il vostro avversario potrebbe intuire cosa avete in mente e potrebbe cosı̀ decidere di non giocare mai carta. In questo modo si garantisce più possibilità di vittoria perchè rende inutile l’utilizzo della forbice di parte vostra. 3 GIOCHI ED EQUILIBRIO DI NASH – Ricordiamo il Teorema di esistenza dell’equilibrio di Nash, in una forma semplificata ( perchè è la versione che usiamo nei nostri giochi) e la nozione di equilibrio di Nash: Definizione Dato un gioco G = (X, Y, u1 , u2 ) a due giocatori,un profilo di strategie (x∗ , y ∗ ) ∈ X×Y dicesi un equilibrio di Nash (per brevità scriveremo NE) se valgono le seguenti diseguaglianze: 1) u1 (x∗ , y ∗ ) ≥ u1 (x, y ∗ ) ∀x ∈ X 2) u2 (x∗ , y ∗ ) ≥ u2 (x∗ , y) ∀y ∈ Y in altre parole x∗ è la miglior risposta del giocatore I alla strategia y∗ del giocatore II e viceversa y∗... TeoremaOgni gioco finito ha almeno un equilibrio di Nash in strategie miste. Intanto dobbiamo specificare che per gioco finito intendiamo un gioco in cui il numero dei giocatori è finito e lo spazio delle strategie è un insieme finito. A questo punto mi aspetto una domanda dagli studenti svegli:- Come è possibile che ci siano un numero infinito di giocatori?Nella realtà questo non è possibile ma in una teoria matematica il concetto di infinito deve essere preso in considerazione (pensate ai limiti all’infinito, li farete), l’idea è capire cosa succede se il numero dei giocatori diventa molto ma molto grande (analogamente per le strategie). Va detto che noi tratteremo solo giochi finiti. Ricordate il gioco del PARI/DISPARI? Abbiamo già visto che non ha NE in strategie pure. In strategie miste Nash ci dice che ha almeno un equilibrio. Gioco del Pari/Dispari P D P 1 -1 1 D -1 1 Supponiamo che il giocatore I giochi la strategia P (Pari) con probabilità p e quindi la strategia D (dispari)con probabilità 1 − p; il giocatore II giochi la strategia P con probabilità q e la strategia D con probabilità 1 − q, dimostriamo che il gioco del Pari/Dispari ha un equilibrio di Nash in strategie miste dato da (p, q) = ( 12 , 12 ) Chiamiamo u(., .) la funzione di utilià del giocatore I ovviamente la funzione di utilità del giocatore II sarà −u(., .). Indichiamo con ũ(., .) l’estensione della funzione di utilità del giocatore I allo spazio delle distribuzioni delle probabilità su X × Y . (∆(X) × ∆(Y ).). Risulta 3) ũ(p, q) = pq+p(1−q)(−1)+(1−p)q(−1)+(1−p)(1−q) = 4pq−2p−2q+1 Dalla definizione di equilibrio di Nash devo dimostrare che: 4) ũ( 12 , 12 ) ≥ ũ(p, 12 ) ∀p ∈ ∆(X) 5) ũ( 12 , 12 ) ≥ ũ( 12 , q) ∀q ∈ ∆(Y ) La dimostrazione è banale sostituendo (p, q) = ( 12 , 12 ) nelle 4) e 5), in realtà, poichè il gioco è a somma zero, è sufficiente la prima disuguaglianza. 2 Giochi a somma zero :un gioco con le carte Il seguente gioco è un gioco a somma zero cioè rientra in quella classe particolare di giochi in cui un giocatore vince e l’altro perde (cosa che nella realtà non avviene quasi mai, ognuno guadagna qualcosa) da notare che in questo gioco l’utilità attesa coincide con il guadagno atteso, anche questo è un caso particolare. Esempi per illustrare che l’utilità attesa è ben diversa dal guadagno atteso se ne possono fare tantissimi: sono più contento se guadagno 10 euro e sono povero di quanto lo sia se guadagno la stessa cifra e sono molto ricco... Invitare i ragazzi a fare altri esempi mettendo in luce che : UTILITÀ ATTESA 6= GUADAGNO ATTESO. Descriviamo il gioco: – Entrambi i giocatori mettono una moneta di 1 euro nel piatto e il giocatore I pesca una carta senza mostrarla al giocatore II, la guarda e decide se rilanciare (azione R) o fermarsi (azione F). Se rilancia deve mettere 1 euro nel piatto e il gioco passa al giocatore II che dovrà scegliere tra vedere (azione V) e non vedere (azione N). Per vedere deve aggiungere un altro euro nel piatto. Se I si ferma vince il piatto solo se la carta pescata è rossa altrimenti perde. Se I rilancia, vince il piatto solo se la carta pescata sia rossa oppure se II decide di non vedere. Allora il gioco ha due giocatori: I e II e questi hanno come spazi delle azioni: A1 = {N, V } e A2 {F, R} rispettivamente. Qui metterei l’albero del gioco come in Lucchetti. Le strategie sono date da: S2 = {N, V } per il giocatore II e S1 = {F F, F R, RF, RR} per il giocatore I, dove la prima lettera sta a indicare cosa fa I se la carta è rossa e la seconda lettera cosa fa I se la carta è nera. Allora se indichiamo con u 1 : S1 × S2 → R e u 2 : S1 × S2 → R le funzioni di utilità rispettivamente dei due giocatori possiamo descrivere il gioco dato dalla quadrupla: 1 G = (S1 , S2 , u1 , u2 ) (ricordare che un gioco è descritto solo quando sono dati gli spazi delle strategie e le funzioni di utilità). A questo punto con facili conti si ottiene la seguente matrice 4 × 2 che rappresenta il gioco in forma strategica. FF FR RF RR N 0 1 0 1 V 0 -1/2 1/2 0 infatti: u1 (RF, N ) = 12 (1) + 12 (−1) = 0 u1 (RF, V ) = 12 (2) + 12 (−1) = 1 2 u1 (RR, N ) = 12 (1) + 12 (1) = 1 u1 (RR, V ) = 12 (2) + 12 (−2) = 0 u1 (F F, N ) = 21 (1) + 12 (−1) = 0 u1 (F F, V ) = 0 u1 (F R, N ) = 12 (1) + 12 (1) = 1 u1 (F R, V ) = 12 (1) + 12 (−2) = − 12 . Ricordando che in un gioco a somma zero u2 = −u1 sono noti anche i payoff di II. Con considerazioni più volte usate sulla miglior risposta si conclude che non esistono equilibri di Nash. 2 GIOCHI, STRATEGIE DOMINATE e CONOSCENZA COMUNE C‘è un modo ovvio per predire come saranno giocati i seguenti giochi? Example 1 D E F A 43 51 62 B 21 84 36 C 30 96 28 Fissiamo la nostra attenzione sul giocatore II. La strategia F dà al giocatore II un payoff strettamente migliore del payoff dato da E; diciamo allora che la strategia E è strettamente dominata da F. Se il giocatore I sa (intuisce, capisce... essendo un giocatore razionale) allora per I la miglior risposta è A. Infine se il giocatore II sa che I sa che che II non giocherà E, allora II sa che I giocherà A e allora II giocherà D. Otteniamo cosı̀ (A,D) come unico equilibrio di Nash del gioco. Questo processo dicesi anche di dominanza stretta iterata e non dipende dall’ordine in cui le strategie sono considerate. Example 2-Common knowledge C D A 8 10 -100 9 B 76 65 Quando un gioco si può giocare mediante eliminazione iterata di strategie dominate, nel senso che a ciascun giocatore rimane solo una strategia, allora questo profilo di strategie è il candidato ovvio per predire come sarà giocato 1 il gioco. Non è però sempre cosı̀, specialmente quando i payoff possono assumere valori molto grandi o molto piccoli. La maggior parte degli studenti a cui è stato chiesto come avrebbero giocato questo gioco, ha risposto B come strategia per I sebbene la dominanza iterata dia (A,C) come unica soluzione. Infatti sebbene A è meglio di B quando II non usa la strategia dominata D, B è meglio di A quando c’è una possibilità che II giochi D. Se la perdita è meno grave, ad esempio sostituendo -100 con -1 allora quasi tutti i giocatori I preferiscono A. Provate infatti a proporre agli stessi studenti il seguente gioco: C D A 8 10 -1 9 B 76 65 . Questo esempio illustra il fatto fondamentale che i payoff e gli spazi delle strategie siano conoscenza comune e la razionalità nel senso di NON GIOCARE UNA STRATEGIA STRETTAMENTE DOMINATA È CONOSCENZA COMUNE (apparentemente non sembrava vero nell’ esempio dove compare un payoff molto piccolo) Example 3 Come giocheresti il seguente gioco? D E A 22 51 B 34 42 C 21 34 2 QUIZ ed ENIGMI 1. Le 3 signorine con la faccia sporca Supponiamo che tre ragazze tutte con la faccia sporca siano sedute in modo da vedere ciascuna la faccia delle altre. Supponiamo inoltre che le tre ragazze siano perfettamente razionali (come tutti i giocatori della TdG) e ciascuna sa che tutte le altre sono perfettamente razionali. In altre parole la razionalita’ di tutte è conoscenza comune. Supponiamo che dato che queste ragazze sono razionali, arrossiscono appena si rendono conto di avere la faccia sporca.(Possiamo supporre che arrossiscono se e solo se si rendono conto di avere la faccia sporca, cioè nessun altro motivo può farle arrossire) Osserviamo che: 1) Ciascuna ragazza vede le altre quindi ognuna sa che almeno una di esse ha la faccia sporca 2) non ci sono specchi di nessun tipo quindi nessuna ragazza può vedere se ha la faccia sporca. fin qui nessuna ragazza ha motivo di arrossire. Supponiamo ora che una quarta persona entri nella stanza e fa a voce alta la seguente osservazione: ”Almeno una ragazza in questa stanza ha la faccia sporca” Sembrerebbe che il nuovo arrivato non dica nulla di nuovo (la situazione era già nota a tutti) ma in realtà la situazione è cambiata. Perchè? Perchè l’annuncio mette a conoscenza le ragazze del fatto che tutte e tre sono a conoscenza del fatto che almeno una di loro ha la faccia sporca. Ciò ha delle conseguenze? Chiamiamo le tre ragazze Amelia, Barbara, Carlotta. Mettiamoci dal punto di vista di Amelia (ma la situazione è simmetrica per 3 le altre). Amelia pensa: se io ho la faccia pulita, Barbara e Carlotta osservano ciascuno una sola faccia sporca. Quindi se ad esempio Carlotta non arrossisce, Barbara sa di avere la faccia sporca. Carlotta non arrossisce quindi presto Barbara saprà con certezza che le facce sporche sono almeno due e, nel caso che la faccia di Amelia sia pulita arrossirà. Poichè Barbara non arrossisce, Amelia pensa che le facce sporche sono tre, quindi arrossisce. Poiche’ il ragionamento è simmetrico per le tre amiche, tutte arrossiranno. Concludendo possiamo dire che la conoscenza comune ha permesso un passaggio di informazioni ”silenzioso” conseguenza del comportamento di ognuna. 2. Un padre burlone Un padre offre ai suoi due figli una busta ciascuno. In una ci sono 10n euro e nell’altra 10n+1 ( n è un numero intero scelto con la stessa probabilità tra 1 e 5 e i figli sanno questo). Le buste vengono date a caso. Il primo figlio, chiamiamolo Giovanni, scopre di aver ricevuto 104 euro e il secondo figlio, chiamiamolo Luca, scopre di aver ricevuto 105 euro. Ognuno non sa cosa ha ricevuto l’altro. A questo punto il padre chiede separatamente a ciascun figlio se vuole scambiare la busta con quella del fratello. Facciamo l’ulteriore ipotesi che ciascuno sia indifferente al rischio e entrambi sono giocatori razionali pertanto cercheranno di massimizzare il propriopayoff atteso. Giovanni che ha ricevuto 104 euro, sa che Luca potrebbe aver ricevuto 103 euro oppure 105 pertanto si calcola la sua utilità attesa se scambiasse la busta (per fortuna ha sempre studiato bene la Matematica) e ottiene: 103 +105 2 euro. Essendo 103 +105 2 > 104 (provate!!!), sicuramente accetta. 4 Luca (che ha ricevuto 105 euro, pensa analogamente che il fratello Giovanni potrebbe aver ricevuto 104 euro oppure 106 euro, pertanto anche Luca, sapendo per fortuna un po’ di Matematica riesce a calcolare la sua utilità attesa se cambiasse la busta : Luca osserva che: 104 +106 2 > 104 +106 euro. 2 105 (ancora una volta la Matematica viene in aiuto) e Luca conclude che anche a lui conviene accettare e cambiare la busta. A questo punto il padre comunica ai due figli che entrambi hanno accettato di cambiare la busta. Ora senza che avvenga alcuno scambio ripete come prima separatamente a entrambi la stessa domanda. Ma questa volta Giovanni accetta, Luca no Perchè? Perchè Luca ha capito che nella busta di Giovanni ci sono 104 euro, infatti venendo a conoscenza del fatto che il fratello vuole cambiare la busta, necessariamente non ha trovato il massimo cioè 106 euro. Anche in questo caso la ”conoscenza comune” ha permesso un passaggio di informazioni silenzioso. 5 BIBLIOGRAFIA References [1] Castelli E. ,I paradossi del senso comune. (1970). [2] Clark M., I paradossi dalla A alla Z ed.Cortina 2004. [3] Costa G. Mori P.Introduzione alla Teoria dei Gichi ed Il Mulino (1994). [4] Gibbons R.Teoria dei Gichi ed Il Mulino, Bologna, 1994 : A Primer in Game Theory, Harvester, 1992. [5] Lucchetti R.Di duelli, scacchi e dilemmi: la teoria matematica dei giochi. Bruno Mondadori Editore,2001 [6] Mero’L., Calcoli morali, teoria dei giochi, logica e fragilit umana Dedalo ed. 198 [7] Patrone F.Decisori (razionali) interagenti Una Introduzione alla Teoria dei giochi. Ed Plus, 2006. [8] Pusillo L. Appunti dal corso di Teoria matematica dei Giochi per facoltà di SMFN 1 TEORIA MATEMATICA DEI GIOCHI ED EVOLUZIONE Può la teoria matematica dei giochi spiegare comportamente paradossali nei processi evolutivi? Lucia Pusillo Dipartimento di Matematica dell’ Università di Genova, via Dodecaneso 35, 16146 Genova. 1 La teoria dei giochi si applica più facilmente alla biologia che al comportamento economico per cui invece è stata inventata. 2 Ci sono due motivi per questo: il primo è che la teoria richiede che i valori di differenti risultati possano essere misurati su una singola scala, e nelle applicazioni umane questa misura è ottenuta con un concetto artificiale che è la funzione di utilità. In biologia il benessere darwiniano fornisce una scala unidimensionale. Il secondo e forse più importante motivo nel cercare la soluzione di un gioco è il concetto della razionalità umana che qui viene sostituito dalla stabilità evolutiva. 3 Il vantaggio, afferma Maynard Smith, è che qui ci sono varie ragioni per aspettarsi che la popolazione evolva verso stati stabili e invece ci sono molti dubbi sulla razionalità del comportamento umano. 4 La nozione pù accreditata di soluzione per giochi non cooperativi è la nozione di equilibrio di Nash. Se indichiamo con X e Y gli spazi delle strategie dei due giocatori, ricordo che una coppia di strategie (x, y) ∈ X × Y è un equilibrio di Nash ( brevemente N E) se u1(x, y) ≥ u1(x, y) ∀x ∈ X, u2(x, y) ≥ u2(x, y) ∀y ∈ Y 5 Ciascun organismo animale e vegetale sceglie un’azione da un insieme ammissibile B che si chiama anche spazio delle strategie. L’essere sceglie una strategia (cioè una azione) non coscientemente ma seguendo delle leggi di ereditarietà oppure leggi dovute alla mutazione. La funzione di utilità, misurerà il successo riproduttivo futuro o una qualche abilità della specie per la sopravvivenza. 6 Da notare che se un’azione, cioè un comportamento, risulta nocivo per il singolo organismo animale o vegetale, ma risulta utile per il processo riproduttivo, allora viene favorito dalle leggi dell’evoluzione e spiegato in termini di Teoria dei Giochi come un equilibrio evolutivamente stabile (cioè deriva da azioni ESS). 7 Un esempio può essere fornito dalla coda del pavone. Come è noto questa è nociva per il singolo animale perchè ne fa facile vittima di un predatore, ma è utile per la sua specie perchè serve per attirare il partner e quindi prelude ad un successo riproduttivo futuro, pertanto la coda sarà favorita dall’Evoluzione e secondo la Teoria dei Giochi è un equilibrio evolutivo 8 Tutto questo può essere espresso mediante un gioco simmetrico che scriverò come una quadrupla G = (B, B, u1, u2) dove B è lo spazio delle strategie del giocatore I e del giocatore II, u1, u2 sono le funzioni di utilità dei due giocatori. Supponiamo inoltre che il gioco sia simmetrico cioè u1(a, b) = u2(b, a), 9 Il seguente gioco, noto anche come DILEMMA DEL PRIGIONIERO, è simmetrico nel senso detto: 44 05 50 11 10 Il gioco del PARI/DISPARI 1 − 1 −1 1 −1 1 1 −1 11 Candidato per un equilibrio evolutivo è una coppia di azioni in B × B cioè una coppia (x̃, x̃). La nozione di equilibrio è data pertanto in modo tale che in quello stadio l’organismo compie un’azione e nessun mutante può invadere la popolazione. Più precisamente l’idea di equilibrio è che il processo evolutivo trasforma una piccola frazione della popolazione in mutanti che seguono una strategia b scelta nell’insieme delle strategie B. Va osservato che tra una mutazione e l’altra possono passare anche migliaia di anni. In un equilibrio un mutante deve ottenere un payoff atteso più piccolo di quello che ottiene un non mutante. 12 Supponiamo che una percentuale di ² individui mutanti (² > 0) compiano l’azione b, mentre gli altri compiono l’azione b∗, allora deve risultare che il payoff atteso di un mutante deve essere più piccolo del payoff atteso di un non-mutante, se b∗ è la strategia di equilibrio dovrà essere: (1 − ²)u(b, b∗) + ²u(b, b) < (1 − ²)u(b∗, b∗) + ²u(b∗, b) per ogni ² > 0 e sufficientemente piccolo. 13 Da questa relazione usando vari teoremi di Analisi Matematica si perviene all’equilibrio di strategie evolutivamente stabili Infatti la disugualianza scritta equivale a 1) e 2): 1) u(b, b∗) < u(b∗, b∗) se b 6= b∗ 2) se u(b, b∗) = u(b∗, b∗) allora u(b, b) < u(b∗, b) 14 Dato un gioco G = (B, B, u1, u2) simmetrico a due giocatori, una strategia evolutivamente stabile ( brevemente diremo una ESS di G) è una azione b∗ ∈ B tale che: - (b∗, b∗) è un equilibrio di Nash del gioco e u(b, b) < u(b∗, b) per ogni b miglior risposta a b∗ con b 6= b∗. 15 Esempio FALCHI/COLOMBE: C F C F 1/2, 1/2 0, 1 1, 0 (1 − c)/2, (1 − c)/2 16 Usando dei concetti matematici quali: – – – – – funzione a valori reali massimi e minimi per funzioni a valori reali multiapplicazione disequazioni monotonia cioè crescenza e decrescenza per una funzione reale si perviene al seguente risultato: 17 – Se c ≤ 1 esiste un solo equilibrio evolutivamente stabile (F, F ) e questo ci dice che se il costo della lotta è piccolo, allora si comporteranno entrambi da aggressori (strategia F ) e gli altri comportamenti tenderanno ad estinguersi – Se c > 1 (cioè il costo della lotta è elevato rispetto al valore della preda) solo (1 − 1/c, 1 − 1/c) è un equilibrio evolutivo quindi solo questo comportamento tenderà ad affermarsi nel corso dell’evoluzione e gli altri tenderanno a scomparire. 18 Può la teoria matematica dei giochi spiegare comportamente paradossali nei processi evolutivi? 19 Quanto vi racconterò, è contenuto in parte in un interessante articolo di Michael Mesterton Gibbons e Eldridge S.Adams (il primo professore di Matematica all’Università di Stato della Florida e il secondo ricercatore al Dipartimento di Ecologia e Biologia Evoluzionistica all’Università del Connecticut. 20 Consideriamo ad esempio il famoso principio dell’handicap. L’etologo A.Zahavi di Tel Aviv afferma che animali in conflitto possono sviluppare dei comportamenti costosi per chi li attua cioè comportamenti che possono abbassare la probabilità di sopravvivenza. L’animale mostrando che può sopportare un handicap mette in mostra la sua forza, cioè lancia un messaggio che gli altri animali dovrebbero rispettare. 21 Questa ipotesi fu dapprima respinta dagli studiosi perchè andrebbe contro il principio che l’evoluzione dovrebbe favorire i segnali che costano meno fatica per gli animali. 22 Per studiare e risolvere tali questioni ci si basa sempre più sulla collaborazione tra biologi e matematici attraverso degli strumenti analitici chiamati giochi e oggetto di studio della Teoria matematica dei giochi 23 ESEMPI:Gioco della guerra di logoramento Nel gioco della guerra di logoramento i giocatori conoscono solo la propria forza e una strategia è una porzione delle riserve iniziali che l’animale è disposto a spendere in una lotta prolungata per conquistarsi un sito. Tante più riserve un animale risparmia, tante più energie avrà e quindi possibilità di successo nell’attirare una compagna, nel trovare cibo, nel difendere il suo territorio e quindi un maggior successo riproduttivo. Tutte queste ipotesi ci permettono di individuare lo spazi delle strategie e la funzione di utilità. 24 se vogliamo costruire un modello su questo esempio, abbiamo bisogno di due parametri:c, R. - c ∈ [0, 1] è il coefficiente di variazione e intuitivamente misura la variazione delle riserve di energia intorno alla sua media (ad esempio se diciamo che c = 0.6 , significa che la deviazione standard delle riserve di grasso è il 60% della media. -R ∈ [0, 1] ci fornisce il rapporto costi-benefici, cioè paragona il costo di spendere 1 unità di riserve di grasso con l’eventuale beneficio del vincitore per 1 unità risparmiata. 25 La funzione di utilità: x 1−c R(1 − x) se ≤ y 1+c y 1−c x 1 − R + Rx R(1 − x) + a(x, y) − 2 b(x, y) se ≤ <1 2 4c 4c 1 + c y u(x, y) = x 1−c ≥ 1 − y se y 1+c R − Rx − 1 y x 1−c + 2 d(x, y) se 1 ≤ ≤ 1 − y + g(x, y) 4c2 4c y 1+c dove: c ∈ [0, 1] 26 R ∈ [0, 1] y2 x (1 − c)(1 + c)2 3 3 a(x, y) = 2 (1 − c) + (1 + c) − 6x 3y 2 2 y x (1 + c)(1 − c)2 3 3 b(x, y) = 2 (1 + c) + (1 − c) − 6y 3x 2 y2 x (1 + c)(1 − c)2 3 3 g(x, y) = 2 (1 + c) + (1 − c) − 6x 3y 2 (1 − c)(1 + c)2 x2 y 3 3 d(x, y) = 2 (1 − c) + (1 + c) − 6y 3x 2 27 Si dimostra con tecniche matematiche che tengono conto del concetto di integrale che esiste un equilibrio evolutivo se il rapporto costi-benefici R non supera una certa soglia critica 2c(c2+3) f (C) = c2(c+6)+9(2−c) 28 Una strategia ESS esiste quando le farfalle combattono fino all’esaurimento consumando almeno il 66% delle proprie energie, questo è un comportamento paradossale tanto più perche si può dimostrare che l’equilibrio evolutivo associato è sempre non efficiente. 29 Altri esempi in cui il comportamento paradossale degli animali può essere interpretato come una strategia evolutivamente stabile sono: gioco della minaccia dei granchi il bluff che si osserva in una specie di ragno messicano l’Oecobius civitas. 30 Conclusioni: il valore della Teoria Matematica dei Giochi I modelli della teoria dei giochi hanno il merito di suggerire dei modi per verificare nuove idee. I ”giochi” hanno valore proprio perchè ci permettono di verificare con calcoli precisi la logica delle nostre argomentazioni. È vero che i comportamenti descritti non sono frequenti in natura (l’effetto domino è stato osservato solo nell’Oecobius Civitas), ma sono i comportamenti strani ad attirare la nostra attenzione...e in questo senso la Teoria dei giochi facendo uso di una bella e profonda matematica si dimostra molto utile nello studio del comportamento animale. 31