RELAZIONE SULL APROPOSTA DI TESI di Luca Nicotra “Learning

RELAZIONE SULL APROPOSTA DI TESI di
Luca Nicotra
“Learning Sparse Models for Structured Input and Output Spaces: Kernel Functions,
Mathematical Programming and Data Mining”
Advisory board: F.Turini, P.Ferragina, A.Micheli
La problematica che verra' affrontata in questo lavoro di tesi e' la generalizzazione di
tecniche di machine learning per la trattazione di dati strutturati, espressione con cui si
intendono og-getti discreti come sequenze, alberi, lattici o grafi. In particolare si vogliono
affrontare proble-mi in cui tali strutture possano costituire sia i dati di ingresso, forniti
all'algoritmo per estrarne statistiche, sia i dati di uscita, cioe' le predizioni che desideriamo
ottenere dai nostri modelli.
Le soluzioni che verranno proposte si fondano tutte su un'assunzione di sparsita': un
insieme di regole sconosciuto a priori, ma piccolo rispetto alla dimensionalita' dello spazio
osservato, e' in grado di descrivere efficaciemente l'informazione necessaria a
generalizzare rispetto a dati sconosciuti. Compito del lavoro di tesi sara' anche verificare in
quali contesti questa assunzione sia verificata, in quali costituisca un'utile approssimazione
e dove invece non sia un approccio percorribile. In particolare sono due gli ambiti in cui si
prevede che la tesi possa fornire i maggiori contributi.
Da un lato c'e' l'analisi di tecniche di data mining da un punto di vista statistico e
del machine learning. Parte del lavoro gia' svolto e' stato sviluppare metodologie che
combinino una modellazione statistica con una ricerca di feature sparse effettuata con
tecniche di data mining. Ma i criteri utilizzati per la ricerca di tali feature sono ancora non
ottimalitesi a l'approssimazione delle soluzioni o l'individuazione di restrizioni del
problema rispetto allo scopo finale. Trovare modalita' per guidare il data mining verso
pattern utili da un punto di vista modellistico ed interpretare le euristiche in termini di bias
e varianza, regolarizzazione e capacita' di generalizzazione, concetti tipici del machine
learning ma poco diffusi nell'ambito del data mining, sembra essere una strada promettente
per lo sviluppo di una metodologia generale e ben fondata. Dall'altro lato sono gia' state
sviluppate alcune tecniche basate su funzioni di kernel, in particolare basate su modelli
probabilistici ricorsivi dei dati strutturati. Una trattazione sistematica di tali kernel sembra
essere un obiettivo percorribile, cosi' come l'analisi di come sia possibile una modellazione
sparsa di tale funzioni di similarita'. Entrambi sembrano essere ragionevoli prerequisiti per
una estensione di tali funzioni ad output strutturati.
Entrambe le direzioni, data mining e funzioni di kernel, costituiscono solo una parte
di framework piu' estesi. Nel caso degli input strutturati questi sono il risultato di poco
meno di un decennio di ricerca e risultano percio' sufficientemente consolidati,
consentendo una rapida validazione e confronto con altre metodologie. Nel caso di output
strutturati non esistono in-vece metodologie sufficientemente generiche. In particolare
sembra necessaria un'analisi ap-profondita degli approcci tesi all'approssimazione delle
soluzioni o all'individuazione di restri-zioni del problema, per affrontare problemi
tipicamente NP-hard. Estendere lo stato dell'arte ad ulteriori, anche se specifici, domini,
sara' un'ulteriore direzione per questo lavoro di tesi.
La commissione ha apprezzato la ricchezza dei problemi affrontati e ha anche
apprezzato i risultati parziali ottenuti. Ritiene comunque che sia necessario procedere ora
con una attenta focalizzazione degli obiettivi, che ne stabilisca le priorità, e previa analisi
delle assunzioni caratteristiche dei modelli con la scelta di un campo applicativo di
riferimento che possa consentire una valutazione e una opportuna valorizzazione dei
modelli ipotizzati.