SALOTTO FUZZY Scherzando seriamente: il cambiamento della ricerca San Polo dei Cavalieri, 11 luglio 2009 Mario Gentili www.mariogentili.it [email protected] « Il mare è l’acqua più pura e più impura: per i pesci essa è potabile e conserva la vita, per gli uomini è imbevibile ed esiziale. » (Eraclito V sec. a.c.) « Finché le leggi della matematica si riferiscono alla realtà, non sono certe, e finché sono certe, non si riferiscono alla realtà. » (Albert Einstain, Sidelights on Relativity) IL PERCORSO Apprendimento umano Costruzioni di modelli matematici di apprendimento Applicazioni operative 2 IL CERVELLO L’esempio più poderoso di logica fuzzy è il nostro cervello. Le più complete enciclopedie ci ricordano che “…Il cervello è una complessa organizzazione di cellule nervose, con compiti di riconoscimento delle configurazioni assunte dall'ambiente esterno, memorizzazione e reazione agli stimoli”. Al fine di compiere queste operazioni, la rete biologica cerebrale si serve di miliardi di semplici elementi computazionali (i neuroni) fittamente interconnessi in modo da variare la loro configurazione in risposta agli stimoli esterni: in questo senso può parlarsi di processi di evoluzione per apprendimento 3 IL NEURONE Il neurone è costituito da tre parti principali: il corpo cellulare, la linea di uscita del neurone (unica, ma che si dirama in migliaia di rami) e la linea di entrata del neurone, che riceve segnali in ingresso dalle linee di uscita degli altri neuroni tramite le sinapsi. Il corpo cellulare esegue una valutazione dei segnali in ingresso: se il risultato supera un certo valore di soglia, allora il neurone si attiva. Se il risultato invece non supera il valore di soglia, il neurone rimane in uno stato di riposo. 4 IL PROCESSO DI RICERCA E APPRENDIMENTO Lo studio dell’apprendimento umano ha nel tempo costruito dei modelli di riferimento per la filosofia, la logica, la chimica, la fisica, la psicologia, e la matematica, generando, di fatto, un modello del processo di ricerca che è comune all’intelligenza umana e, come vedremo inseguito, a quella artificiale: 5 UNA BUONA RICERCA In verità, quando si effettua una ricerca già ci è nota la risposta. Non in termini di contenuti, ma sicuramente dobbiamo sapere cosa ci si aspetta per poter effettuare una valutazione di qualità su quanto trovato. In altre parole dobbiamo sapere già se la risposta che otterremo è coerente a quanto richiesto e se risponde ai nostri obiettivi di ricerca. Questo principio è alla base della nostra valutazione del risultato e ci consentirà di scartarlo, ovvero di archiviarlo per poi poterlo richiamare e riutilizzare. Solo in rari casi si “naviga senza mèta”: in ogni caso l’obiettivo finale è sempre quello di trovarne una. 6 … PLATONE Menone: E che tipo di domanda farete, Socrate, per sapere quello che non conoscete? Che cosa metterete come soggetto della richiesta? E se trovate che cosa volete, come saprete mai che questa è la cosa che non conoscevate? Socrate: so, Menone, cosa vuoi dire; ma lasciami evidenziare la disputa noiosa che stai introducendo circa quello che l’uomo può richiedere in base alla sua conoscenza; se sa, non ha necessità di domandare; e se non sa, non può domandare. Non ha senso porci delle domande perché per poter riconoscere una risposta dovremmo conoscere quello che vorremmo esserci risposto … … eppure … 7 IL FUZZY MODELLO Gli sviluppi nella logica fuzzy, con la loro interpretazione della realtà, magnificamente sintetizzata dal detto popolare la verità sta nel mezzo, hanno contribuito all’istituzione di una nuova disciplina scientifica che ha consentito il rinnovamento del concetto di ricerca soprattutto nel settore dell’intelligenza artificiale: soft computing Le tecniche di soft computing si prefiggono di valutare, calcolare, decidere e controllare lo scenario in un ambiente apparentemente impreciso, vago, fluido o soggetto a continui e repentini cambiamenti, emulando e utilizzando la capacità degli esseri umani di apprendimento, ovvero di eseguire le attività sulla base della loro esperienza passata per costruirne di uguali o di nuove. 8 IL SOFT COMPUTING Tre sono i capisaldi di questa disciplina: 1. la possibilità di modellare e di controllare sistemi incerti e complessi, nonché di rappresentare la conoscenza in maniera efficiente attraverso le descrizioni tipiche della teoria degli insiemi fuzzy; 2. la capacità d’ottimizzazione degli algoritmi matematici, la cui computazione si ispira alle leggi di selezione e mutazione tipiche degli organismi viventi; 3. la capacità di apprendere complesse relazioni funzionali delle reti neurali, ispirate a quelle proprie dei tessuti cerebrali. 9 IL SOFT COMPUTING Dice Zadeh, "…una tendenza crescente è costituita dall‟uso della logica fuzzy in combinazione con il calcolo neurale e gli algoritmi genetici. Più in generale, la fuzzy logic, le reti neurali e gli algoritmi genetici possono considerarsi i principali costituenti di ciò che potrebbe essere definito „calcolo soft‟. A differenza dei metodi di calcolo tradizionali o „hard‟, il soft computing ha lo scopo di adattarsi alla pervasiva imprecisione del mondo reale. Il suo principio guida può esprimersi così: sfruttare la tolleranza per l‟imprecisione, l‟incertezza e le verità parziali in modo da ottenere trattabilità, robustezza e soluzioni a basso costo. Nei prossimi anni, il soft computing è probabilmente destinato a giocare un ruolo sempre più rilevante in molti settori”. … la vita vera, insomma, nei confronti della quale la logica fuzzy rappresenta un vero e proprio “sistema adattativo” efficace. 10 LE RETI NEURALI ARTIFICIALI Tradizionalmente, il termine rete neurale viene utilizzato come riferimento ad una rete o ad un circuito di neuroni biologici, ma se ne è affermato l’uso anche in matematica, con riferimento ai modelli matematici delle reti neurali artificiali (ANN), che rappresentano l'interconnessione tra elementi definiti neuroni artificiali, ossia costrutti matematici che in qualche misura imitano le proprietà dei neuroni viventi. Una rete neurale artificiale è un’interconnessione di un gruppo di nodi, chiamati neuroni: è un sistema adattativo, uno strumento di modellazione che cambia la propria struttura sulla base delle informazioni che scorrono attraverso la rete durante la fase di apprendimento. 11 LE SCIENZE I principali campi di azione del soft computing sono: la cibernetica, la teoria matematica delle informazioni. La traduzione informatica dei modelli e la realizzazione di simulatori e di strumenti per la previsione 12 LA CIBERNETICA Nasce con Wiener (che non riuscì mai ad imparare il percorso dell‟autobus che lo portava a casa). Il concetto più importante che maggiormente ha lasciato traccia nello sviluppo dell’IA è quello di feedback, secondo il quale la discrepanza tra il modello costruito e quello effettivo, costituisce un importante nuovo segnale per il controllo del modello costruito affinché si modifichi … in qualche modo apprenda per correggere i suoi errori. Esempio: il termostato della caldaia: Obiettivo: mantenere costante una temperatura; Sistema di controllo: accensione/spegnimento della caldaia. La presenza di un sistema di controllo fa sì che sia nell’uomo, sia nella macchina, di possa parlare di scopo, e di comportamento diretto ad uno scopo. 13 LA CIBERNETICA L’aspetto che più ha attirato l'interesse dei ricercatori, è la possibilità di apprendimento del modello: dato un compito specifico da risolvere, apprendimento significa utilizzare l’osservazione del risultato al fine di trovare una funzione che risolva il problema in modo ottimale. La funzione di costo è un concetto importante nell'apprendimento: si tratta della misura di “quanto è lontana da noi” la soluzione ottimale del problema che vogliamo risolvere, e quindi qual è lo sforzo richiesto per raggiungerla. Gli algoritmi di apprendimento ricercano soluzioni al fine di trovare una funzione che abbia il minor “costo” possibile. 14 LA CIBERNETICA L'addestramento di une rete neurale avviene sollecitando i nodi in ingresso con una propagazione in avanti dei segnali attraverso ciascun livello della rete, confrontando la risposta della rete con il risultato desiderato ottenendo un corrispondente segnale d'errore in caso di difformità, e propagando poi nella direzione inversa rispetto a quella delle connessioni sinaptiche il segnale di errore, “educando” così la rete a minimizzare la differenza tra l'uscita ottenuta e l'uscita desiderata. 15 LA TEORIA MATEMATICA DELL’INFORMAZIONE Si interessa del contenuto informativo presente in un messaggio (o in un segnale). Un messaggio contiene tanta più informazione quanto più è imprevedibile, tanto meno informazione quanto più è noto, scontato, prevedibile. Problema: Esiste un’equivalenza tra mente umana e computer in considerazione che entrambi sono dei sistemi di trasmissione e di ricezione di messaggi? Dimostrazione: test di Turing: se due sistemi danno le stesse risposte nella stessa situazione, allora sono equivalenti. Negazione: Searle: due sistemi possono dare la stessa risposta ma possono usare processi molto diversi per raggiungere quel risultato. In IA l’apprendimento è inteso come insieme di conoscenze e non come comportamento. Può essere: •di informazioni (di primo ordine), attraverso l’aggiunta di nuove conoscenze alla base dati precedente •di procedure (di secondo ordine), attraverso l’apprendimento di strategie che permettono di ottimizzare le procedure note. 16 I PRINCIPALI CAMPI DI RICERCA MODELS & ALGORITHMS RESEARCH SOFTWARE ARTIFICIAL ADAPTIVE SYSTEMS EXPERIMENTAL RESEARCH Family of Software Systems Cognitive & Natural Systems SuperVised ANNs Artificial Neural Networks Associative Memories Evolutionary Programming Autopoietic ANNs Artificial Organisms Pre-Processing Tools Active Connections Matrix Active Connections Matrix SW 17 I PRINCIPALI CAMPI DI APPLICAZIONE SOCIAL FIELD FINANCIAL FIELD INDUSTRIAL FIELD BIOMEDICAL FIELD Drugs & Alcohol Stock Market Prediction Process Control Clinical Trial Social Security Credit Scoring Ecology & Environment Diagnostic Imaging Urban Sustainability Portfolio Optimization Fraud & Defect Recognition Proteins Structure Jobs Optimization Trading Strategies Process Optimization Chemical Simulation 18 ALCUNI RISULTATI 19 ALCUNI RISULTATI 20 ALCUNI RISULTATI 21 SCOPRIRE LE COSE NASCOSTE 22 EVOLUZIONE DEL WEB 23 EVOLUZIONE DEL WEB FILTERING 1- All’inizio era solo per motivi di sicurezza. 2- Si passa ad un filtraggio delle informazioni per evitare il “rumore” delle stesse in base a filtri per: categoria, argomenti. Si passa alle prime pagine personalizzate in base ad un profilo dichiarato o richiesto all’utente (compare il concetto di “la mia home page”) 3- Registrazione delle abitudini dell’utente e costruzione automatica del profilo con conseguente costruzione automatica della pagina utente. Primi siti “personalized store” (ie. Amazon store). L’utente non fa più query per tradurre la sua esigenza in domanda, ma gli si presentano già potenziali risposte alle sue abitudini di navigazione. Ma come produrre un profilo automatico? Bisogna conoscere chi naviga: diventa fondamentale sapere cosa legge nel web. Si fanno strada l’analisi semantica dei testi e le ANN ai fini della probabilità che il prossimo argomento che verrà letto sia proprio quello da proporre. 24 TEXT MINING Cos’è? La capacità di trovare regolarità di rilievo in grandi data-set testuali. Di rilievo significa: non-trivial, nascosti, sconosciuti prima, potenzialmente utili. Ancora una volta si fanno strada l’analisi semantica dei testi e le ANN ai fini della scoperta delle regolarità. 25 SEMANTIC WEB Quando si parla di web semantico si intende proporre un web che possieda delle strutture di collegamenti più espressive di quelle attuali, ovvero un web nel quale agiscano agenti intelligenti: applicazioni in grado di comprendere il significato dei testi presenti sulla rete e perciò in grado di guidare l'utente direttamente verso l'informazione ricercata, oppure di sostituirsi a lui nello svolgimento di alcune operazioni. Un agente intelligente dovrebbe essere una applicazione in grado di svolgere operazioni come la prenotazione di un aereo per Parigi con arrivo in centro città prima delle 13.00. Il tutto spulciando informazioni da siti che definiscono l'aeroporto di Parigi in modo diverso (Paris, Charles de Gaule, Orly) e deducendo, senza che sia specificato nella domanda, che un arrivo per le 13.00 in centro implichi un arrivo in aeroporto diverso a seconda dell'aeroporto effettivamente selezionato. 26