Scherzando seriamente: il cambiamento della ricerca

SALOTTO FUZZY
Scherzando seriamente: il cambiamento della ricerca
San Polo dei Cavalieri, 11 luglio 2009
Mario Gentili
www.mariogentili.it
[email protected]
« Il mare è l’acqua più pura e più impura:
per i pesci essa è potabile e conserva la vita,
per gli uomini è imbevibile ed esiziale. »
(Eraclito V sec. a.c.)
« Finché le leggi della matematica si
riferiscono alla realtà, non sono certe, e finché
sono certe, non si riferiscono alla realtà. »
(Albert Einstain, Sidelights on Relativity)
IL PERCORSO
Apprendimento umano
Costruzioni di modelli
matematici di apprendimento
Applicazioni operative
2
IL CERVELLO
L’esempio più poderoso di logica fuzzy è il nostro cervello.
Le più complete enciclopedie ci ricordano che “…Il cervello è una
complessa organizzazione di cellule nervose, con compiti di
riconoscimento delle configurazioni assunte dall'ambiente esterno,
memorizzazione e reazione agli stimoli”.
Al fine di compiere queste operazioni, la rete biologica cerebrale si serve
di miliardi di semplici elementi computazionali (i neuroni) fittamente
interconnessi in modo da variare la loro configurazione in risposta agli
stimoli esterni: in questo senso può parlarsi di processi di evoluzione per
apprendimento
3
IL NEURONE
Il neurone è costituito da tre parti principali: il corpo cellulare, la linea di
uscita del neurone (unica, ma che si dirama in migliaia di rami) e la
linea di entrata del neurone, che riceve segnali in ingresso dalle linee di
uscita degli altri neuroni tramite le sinapsi.
Il corpo cellulare esegue una valutazione dei segnali in ingresso: se il
risultato supera un certo valore di soglia, allora il neurone si attiva.
Se il risultato invece non supera il valore di soglia, il neurone rimane in
uno stato di riposo.
4
IL PROCESSO DI RICERCA E
APPRENDIMENTO
Lo studio dell’apprendimento umano ha nel tempo costruito dei modelli di
riferimento per la filosofia, la logica, la chimica, la fisica, la psicologia, e la
matematica, generando, di fatto, un modello del processo di ricerca che è
comune all’intelligenza umana e, come vedremo inseguito, a quella artificiale:
5
UNA BUONA RICERCA
In verità, quando si effettua una ricerca già ci è nota la risposta.
Non in termini di contenuti, ma sicuramente dobbiamo sapere cosa ci si
aspetta per poter effettuare una valutazione di qualità su quanto trovato.
In altre parole dobbiamo sapere già se la risposta che otterremo è coerente a
quanto richiesto e se risponde ai nostri obiettivi di ricerca.
Questo principio è alla base della nostra valutazione del risultato e ci
consentirà di scartarlo, ovvero di archiviarlo per poi poterlo richiamare e
riutilizzare.
Solo in rari casi si “naviga senza mèta”: in ogni caso l’obiettivo finale è
sempre quello di trovarne una.
6
… PLATONE
Menone: E che tipo di domanda farete, Socrate, per sapere quello che non
conoscete? Che cosa metterete come soggetto della richiesta? E se trovate
che cosa volete, come saprete mai che questa è la cosa che non
conoscevate?
Socrate: so, Menone, cosa vuoi dire; ma lasciami evidenziare la disputa
noiosa che stai introducendo circa quello che l’uomo può richiedere in base
alla sua conoscenza; se sa, non ha necessità di domandare; e se non sa,
non può domandare.
Non ha senso porci delle domande perché per poter riconoscere una
risposta dovremmo conoscere quello che vorremmo esserci risposto …
… eppure …
7
IL FUZZY MODELLO
Gli sviluppi nella logica fuzzy, con la loro interpretazione della
realtà, magnificamente sintetizzata dal detto popolare la verità sta
nel mezzo, hanno contribuito all’istituzione di una nuova disciplina
scientifica che ha consentito il rinnovamento del concetto di ricerca
soprattutto nel settore dell’intelligenza artificiale:
soft computing
Le tecniche di soft computing si prefiggono di valutare, calcolare,
decidere e controllare lo scenario in un ambiente apparentemente
impreciso, vago, fluido o soggetto a continui e repentini
cambiamenti, emulando e utilizzando la capacità degli esseri umani
di apprendimento, ovvero di eseguire le attività sulla base della loro
esperienza passata per costruirne di uguali o di nuove.
8
IL SOFT COMPUTING
Tre sono i capisaldi di questa disciplina:
1. la possibilità di modellare e di controllare sistemi incerti e
complessi, nonché di rappresentare la conoscenza in maniera
efficiente attraverso le descrizioni tipiche della teoria degli insiemi
fuzzy;
2. la capacità d’ottimizzazione degli algoritmi matematici, la cui
computazione si ispira alle leggi di selezione e mutazione tipiche
degli organismi viventi;
3. la capacità di apprendere complesse relazioni funzionali delle reti
neurali, ispirate a quelle proprie dei tessuti cerebrali.
9
IL SOFT COMPUTING
Dice Zadeh, "…una tendenza crescente è costituita dall‟uso della
logica fuzzy in combinazione con il calcolo neurale e gli
algoritmi genetici. Più in generale, la fuzzy logic, le reti neurali e
gli algoritmi genetici possono considerarsi i principali costituenti di
ciò che potrebbe essere definito „calcolo soft‟. A differenza dei
metodi di calcolo tradizionali o „hard‟, il soft computing ha lo scopo
di adattarsi alla pervasiva imprecisione del mondo reale. Il suo
principio guida può esprimersi così: sfruttare la tolleranza per
l‟imprecisione, l‟incertezza e le verità parziali in modo da ottenere
trattabilità, robustezza e soluzioni a basso costo. Nei prossimi
anni, il soft computing è probabilmente destinato a giocare un
ruolo sempre più rilevante in molti settori”.
… la vita vera, insomma, nei confronti della quale la logica fuzzy
rappresenta un vero e proprio “sistema adattativo” efficace.
10
LE RETI NEURALI ARTIFICIALI
Tradizionalmente, il termine rete neurale viene utilizzato come riferimento
ad una rete o ad un circuito di neuroni biologici, ma se ne è affermato
l’uso anche in matematica, con riferimento ai modelli matematici delle reti
neurali artificiali (ANN), che rappresentano l'interconnessione tra elementi
definiti neuroni artificiali, ossia costrutti matematici che in qualche misura
imitano le proprietà dei neuroni viventi. Una rete neurale artificiale è
un’interconnessione di un gruppo di nodi, chiamati neuroni: è un sistema
adattativo, uno strumento di modellazione che cambia la propria
struttura sulla base delle informazioni che scorrono attraverso la
rete durante la fase di apprendimento.
11
LE SCIENZE
I principali campi di azione del soft computing sono:
la
cibernetica,
la teoria matematica delle informazioni.
La traduzione informatica dei modelli e la realizzazione di simulatori e di
strumenti per la previsione
12
LA CIBERNETICA
Nasce con Wiener (che non riuscì mai ad imparare il percorso dell‟autobus
che lo portava a casa).
Il concetto più importante che maggiormente ha lasciato traccia nello
sviluppo dell’IA è quello di feedback, secondo il quale la discrepanza tra il
modello costruito e quello effettivo, costituisce un importante nuovo segnale
per il controllo del modello costruito affinché si modifichi … in qualche modo
apprenda per correggere i suoi errori.
Esempio: il termostato della caldaia:
Obiettivo:
mantenere costante una temperatura;
Sistema di controllo: accensione/spegnimento della caldaia.
La presenza di un sistema di controllo fa sì che sia nell’uomo, sia nella
macchina, di possa parlare di scopo, e di comportamento diretto ad uno
scopo.
13
LA CIBERNETICA
L’aspetto che più ha attirato l'interesse dei ricercatori, è la possibilità di
apprendimento del modello: dato un compito specifico da risolvere,
apprendimento significa utilizzare l’osservazione del risultato al fine di
trovare una funzione che risolva il problema in modo ottimale. La
funzione di costo è un concetto importante nell'apprendimento: si tratta
della misura di “quanto è lontana da noi” la soluzione ottimale del
problema che vogliamo risolvere, e quindi qual è lo sforzo richiesto per
raggiungerla. Gli algoritmi di apprendimento ricercano soluzioni al fine di
trovare una funzione che abbia il minor “costo” possibile.
14
LA CIBERNETICA
L'addestramento di une rete neurale avviene sollecitando i nodi in
ingresso con una propagazione in avanti dei segnali attraverso ciascun
livello della rete, confrontando la risposta della rete con il risultato
desiderato ottenendo un corrispondente segnale
d'errore in caso di difformità, e propagando poi nella direzione inversa
rispetto a quella delle connessioni sinaptiche il segnale di errore,
“educando” così la rete a minimizzare la differenza tra l'uscita ottenuta e
l'uscita desiderata.
15
LA TEORIA MATEMATICA
DELL’INFORMAZIONE
Si interessa del contenuto informativo presente in un messaggio (o in un segnale). Un
messaggio contiene tanta più informazione quanto più è imprevedibile, tanto meno
informazione quanto più è noto, scontato, prevedibile.
Problema: Esiste un’equivalenza tra mente umana e computer in considerazione che
entrambi sono dei sistemi di trasmissione e di ricezione di messaggi?
Dimostrazione: test di Turing: se due sistemi danno le stesse risposte nella stessa
situazione, allora sono equivalenti.
Negazione: Searle: due sistemi possono dare la stessa risposta ma possono usare
processi molto diversi per raggiungere quel risultato.
In IA l’apprendimento è inteso come insieme di conoscenze e non come comportamento.
Può essere:
•di informazioni (di primo ordine), attraverso l’aggiunta di nuove conoscenze alla
base dati precedente
•di procedure (di secondo ordine), attraverso l’apprendimento di strategie che
permettono di ottimizzare le procedure note.
16
I PRINCIPALI CAMPI DI RICERCA
MODELS & ALGORITHMS
RESEARCH SOFTWARE
ARTIFICIAL ADAPTIVE SYSTEMS
EXPERIMENTAL RESEARCH
Family of Software Systems
Cognitive & Natural Systems
SuperVised ANNs
Artificial Neural Networks
Associative Memories
Evolutionary Programming
Autopoietic ANNs
Artificial Organisms
Pre-Processing Tools
Active Connections Matrix
Active Connections Matrix SW
17
I PRINCIPALI CAMPI DI APPLICAZIONE
SOCIAL FIELD
FINANCIAL FIELD
INDUSTRIAL FIELD
BIOMEDICAL FIELD
Drugs & Alcohol
Stock Market Prediction
Process Control
Clinical Trial
Social Security
Credit Scoring
Ecology & Environment
Diagnostic Imaging
Urban Sustainability
Portfolio Optimization
Fraud & Defect Recognition
Proteins Structure
Jobs Optimization
Trading Strategies
Process Optimization
Chemical Simulation
18
ALCUNI RISULTATI
19
ALCUNI RISULTATI
20
ALCUNI RISULTATI
21
SCOPRIRE LE COSE NASCOSTE
22
EVOLUZIONE DEL WEB
23
EVOLUZIONE DEL WEB FILTERING
1- All’inizio era solo per motivi di sicurezza.
2- Si passa ad un filtraggio delle informazioni per evitare il “rumore” delle stesse
in base a filtri per: categoria, argomenti. Si passa alle prime pagine
personalizzate in base ad un profilo dichiarato o richiesto all’utente (compare
il concetto di “la mia home page”)
3- Registrazione delle abitudini dell’utente e costruzione automatica del profilo
con conseguente costruzione automatica della pagina utente. Primi siti
“personalized store” (ie. Amazon store). L’utente non fa più query per tradurre
la sua esigenza in domanda, ma gli si presentano già potenziali risposte alle
sue abitudini di navigazione.
Ma come produrre un profilo automatico?
Bisogna conoscere chi naviga: diventa fondamentale sapere cosa legge nel web.
Si fanno strada l’analisi semantica dei testi e le ANN ai fini della probabilità
che il prossimo argomento che verrà letto sia proprio quello da proporre.
24
TEXT MINING
Cos’è?
La capacità di trovare regolarità di rilievo in grandi data-set testuali.
Di rilievo significa:
 non-trivial,
 nascosti, sconosciuti prima,
 potenzialmente utili.
Ancora una volta si fanno strada l’analisi semantica dei testi e le ANN ai fini
della scoperta delle regolarità.
25
SEMANTIC WEB
Quando si parla di web semantico si intende proporre un web che possieda delle
strutture di collegamenti più espressive di quelle attuali, ovvero un web nel
quale agiscano agenti intelligenti: applicazioni in grado di comprendere il
significato dei testi presenti sulla rete e perciò in grado di guidare l'utente
direttamente verso l'informazione ricercata, oppure di sostituirsi a lui nello
svolgimento di alcune operazioni.
Un agente intelligente dovrebbe essere una applicazione in grado di svolgere
operazioni come la prenotazione di un aereo per Parigi con arrivo in centro
città prima delle 13.00. Il tutto spulciando informazioni da siti che
definiscono l'aeroporto di Parigi in modo diverso (Paris, Charles de Gaule,
Orly) e deducendo, senza che sia specificato nella domanda, che un arrivo
per le 13.00 in centro implichi un arrivo in aeroporto diverso a seconda
dell'aeroporto effettivamente selezionato.
26