Sistemi di Supporto alle Decisioni I Lezione 7 Chiara Mocenni Corso di laurea L1 in Ingegneria Gestionale e L2 in Ingegneria Informatica III ciclo Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2006-2007 Reti Bayesiane Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2006-2007 • Le reti Bayesiane sono modelli grafici della conoscenza in un dominio incerto. Basandosi sulla regola di Bayes, esprimono relazioni di dipendenza condizionale (archi) tra le variabili in gioco (nodi). Il vantaggio principale del ragionamento probabilistico rispetto a quello logico sta nella possibilità di giungere a descrizioni razionali anche quando non vi è abbastanza informazione di tipo deterministico sul funzionamento del sistema. Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2006-2007 • Le reti bayesiane possono essere utilizzate in ogni settore in cui sia necessario modellare la realtà in situazioni di incertezza, cioè in cui siano coinvolte delle probabilità. Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2006-2007 La regola di Bayes Spesso, nei ragionamenti probabilistici, capita che si debba valutare una probabilità avendo già delle informazioni su quanto è già accaduto in precedenza. Dati due eventi A e B, se questi sono in qualche modo correlati, è ragionevole pensare che il sapere che uno dei due è già avvenuto possa migliorare la conoscenza della probabilità dell'altro. Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2006-2007 Dato uno spazio di probabilità (W,A, P[.]), dove W : spazio campionario (insieme di tutti i possibili risultati dell'esperimento) A: spazio degli eventi (contenente W) P[.]: funzione di probabilità con Dominio in A e Codominio in [0,1] dati due eventi A e B appartenenti ad A, indichiamo con P[A|B] la probabilità che si verifichi A sapendo che si è già verificato B, cioè la probabilità di A condizionata a B. Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2006-2007 Regola di Bayes • P[A|B] = P[A,B] / P[B] (per P[B]≠0), dove P[A,B]=P[B|A] P[A] • Forma completa: • dato lo spazio di probabilità ( W, A, P[.]), siano B1,B2,...Bn appartenenti ad A; • per ogni i P[Bi]>0; i≠i BiBj=0; W=UiBi; allora per ogni A appartenente ad A • P[Bk|A] = P[A|Bk] P[Bk] / (S i P[A|Bi] P[Bi] ) Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2006-2007 • Supponiamo che viviate a Londra e che abbiate notato che in inverno piove (P) il 50% (p(P)) delle volte ed è nuvoloso (N) l’80% (p(N)) delle volte (talvolta è nuvoloso ma non piove). • D’altra parte, il 100% delle volte in cui piove è anche nuvoloso (p(N|P)). • Qual è la probabilità che oggi piova essendo nuvoloso (p(P|N))? • La regola di Bayes ci può aiutare in questo, infatti p(P|N) = p(P)p(N|P)/p(N) = 0.5 x 1.0 / 0.8 = 0.625 = 5/8. Quindi 5/8 delle volte a Londra, quando è nuvoloso, piove. Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2006-2007 Le reti Bayesiane • Si usa una struttura di dati chiamata rete bayesiana (o rete di credenze) per rappresentare la dipendenza fra le variabili e per dare una specifica concisa della distribuzione di probabilità congiunta. Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2006-2007 Una rete Bayesiana è un grafo in cui valgono le seguenti proprietà: • 1) Un insieme di variabili casuali costituiscono i nodi della rete; • 2) Un insieme di archi con verso connette le coppie di nodi (Il significato intuitivo di una freccia dal nodo X al nodo Y è che X ha un’influenza diretta su Y); Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2006-2007 • 3) Ogni nodo ha una tabella delle probabilità condizionate che quantifica gli effetti che i “genitori” hanno sul nodo, dove per “genitori” si intendono tutti quei nodi che hanno frecce che puntano al nodo; • 4) Il grafo non ha cicli diretti; Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2006-2007 • Un nodo che non ha genitori diretti (cioè non ha frecce che puntano verso di lui) contiene una tabella di probabilità marginali. • Se il nodo è discreto contiene una distribuzione di probabilità sugli stati della variabile che rappresenta. • Se il nodo è continuo contiene una funzione gaussiana di densità (definita da media e varianza) della variabile casuale che rappresenta. Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2006-2007 • Se un nodo ha parenti (cioè uno o più frecce che puntano verso di lui) allora il nodo contiene una tabella di probabilità condizionate. • Se il nodo è discreto la funzione di probabilità condizionata contiene la probabilità condizionata del nodo data una configurazione dei suoi parenti. • Se il nodo è continuo, la funzione di probabilità condizionata contiene media e varianza di ogni configurazione degli stati dei suoi nodi parenti. Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2006-2007 Esempio 1: Gestione del traffico Un Comune può decidere se bloccare o no le auto per una giornata nel caso in cui si verifichi uno dei seguenti casi: • viene raggiunto il livello massimo di inquinamento, • si verifica una congestione delle strade. A seconda della situazione i cittadini dovranno decidere se spostarsi con i mezzi pubblici o prendere la macchina. Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2006-2007 Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2006-2007 • Una volta che la topologia della rete è specificata dobbiamo solo specificare le probabilità condizionate per i nodi che partecipano nelle dipendenze dirette, usando queste per il calcolo di qualunque altro valore di probabilità. Ogni nodo è caratterizzato da una tabella delle probabilità condizionate. Ogni riga della tabella contiene la probabilità condizionata del valore di ogni nodo per un caso condizionante. Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2006-2007 Esempio 2: L’albero di Jack • Un giorno Jack si accorge che il suo albero di mele perde le foglie. • Jack sa che se l’albero è secco allora è normale che perda le foglie. • Ma Jack sa anche che la perdita delle foglie può essere sintomo di malattia per il suo albero. Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2006-2007 La rete per l’albero di Jack secco malato perde le foglie • • • • La rete consiste di 3 nodi: Malato, Secco, e Perde le foglie Malato può essere “malato" o "no" Secco può essere “secco" o "no" Perde le foglie può essere “si" o "no". Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2006-2007 • La dipendenza casuale è tra Malato e Perde le foglie e Secco e Perde le foglie. • Ad ogni nodo è associata una tabella di probabilità, che possono essere a priori o condizionate. Ad esempio: • • • • P(Malato=“malato“)=0.1 P(Malato="no“)=0.9 P(Secco=“secco“)=0.1 P(Secco="no“)=0.9 Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2006-2007 Secco=“secco” Secco=“No” Malato= “Malato” Malato= “No” Malato= “Malato” Malato= “No” Perde=“si” 0.95 0.85 0.90 0.02 Perde=“no” 0.05 0.15 0.10 0.98 P(Perde le foglie | Malato, Secco) Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2006-2007 Esempio 3: Diagnosi di un paziente che arriva in clinica Supponiamo di avere di fronte un nuovo paziente, di cui non sappiamo niente. Una volta che avremo acquisito informazione specifica su di lui la nostra rete bayesiana riguardante il suo stato di salute potrà essere aggiornato, fornendo risultati più attendibili. Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2006-2007 Diagnosi di una malattia polmonare Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2006-2007 I dati • Statisticamente, in un campione rappresentativo di popolazione si conoscono i seguenti dati. • • • • Il 50% dei pazienti fuma. Il 1% ha la tubercolosi. Il 5.5% ha un cancro al polmone (). Il 45% ha una qualche forma di bronchite. Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2006-2007 Come si procede Si costruisce la rete bayesiana e si analizzano i sintomi mostrati dal paziente. Ad esempio, supponiamo che: • Il paziente lamenta dispnea. • Il paziente è stato recentemente in Asia. • Il paziente è un fumatore. Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2006-2007 Inoltre • Si effettua una radiografia da cui si vede che: • 1. Risultato negativo Sembra che la diagnosi migliore sia che il paziente ha una semplice bronchite. • 2. Risultato positivo • La probabilità di un cancro o della tubercolosi sono aumentate enormemente. E’ comunque necessario effettuare nuovi esami. Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2006-2007 Reti Bayesiane Statiche Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2006-2007 Reti Bayesiane Dinamiche Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2006-2007 Esempio 4: Il pozzo di petrolio • Un agente deve decidere se perforare o non perforare per trovare un pozzo di petrolio. E’ incerto se il punto in cui vuole perforare sia secco (dry), umido (wet) o pieno (soaking). L’agente puo’ effettuare una ricerca geologica che puo’ aiutarlo a determinare la struttura geologica del sito. La risposta dell’indagine puo’ essere: molto petrolio (closed), poco petrolio (open) o vuoto (diffuse). Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2006-2007 • • • • Le decisioni sono 2: 1. Fare il test geologico (costo: 10 K$); 2. Perforare (costo: 70 K$). L’utilita’ della perforazione e’ determinata dal risultato: dry, wet o soaking. Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2006-2007