RELAZIONE SULL APROPOSTA DI TESI di Luca Nicotra “Learning Sparse Models for Structured Input and Output Spaces: Kernel Functions, Mathematical Programming and Data Mining” Advisory board: F.Turini, P.Ferragina, A.Micheli La problematica che verra' affrontata in questo lavoro di tesi e' la generalizzazione di tecniche di machine learning per la trattazione di dati strutturati, espressione con cui si intendono og-getti discreti come sequenze, alberi, lattici o grafi. In particolare si vogliono affrontare proble-mi in cui tali strutture possano costituire sia i dati di ingresso, forniti all'algoritmo per estrarne statistiche, sia i dati di uscita, cioe' le predizioni che desideriamo ottenere dai nostri modelli. Le soluzioni che verranno proposte si fondano tutte su un'assunzione di sparsita': un insieme di regole sconosciuto a priori, ma piccolo rispetto alla dimensionalita' dello spazio osservato, e' in grado di descrivere efficaciemente l'informazione necessaria a generalizzare rispetto a dati sconosciuti. Compito del lavoro di tesi sara' anche verificare in quali contesti questa assunzione sia verificata, in quali costituisca un'utile approssimazione e dove invece non sia un approccio percorribile. In particolare sono due gli ambiti in cui si prevede che la tesi possa fornire i maggiori contributi. Da un lato c'e' l'analisi di tecniche di data mining da un punto di vista statistico e del machine learning. Parte del lavoro gia' svolto e' stato sviluppare metodologie che combinino una modellazione statistica con una ricerca di feature sparse effettuata con tecniche di data mining. Ma i criteri utilizzati per la ricerca di tali feature sono ancora non ottimalitesi a l'approssimazione delle soluzioni o l'individuazione di restrizioni del problema rispetto allo scopo finale. Trovare modalita' per guidare il data mining verso pattern utili da un punto di vista modellistico ed interpretare le euristiche in termini di bias e varianza, regolarizzazione e capacita' di generalizzazione, concetti tipici del machine learning ma poco diffusi nell'ambito del data mining, sembra essere una strada promettente per lo sviluppo di una metodologia generale e ben fondata. Dall'altro lato sono gia' state sviluppate alcune tecniche basate su funzioni di kernel, in particolare basate su modelli probabilistici ricorsivi dei dati strutturati. Una trattazione sistematica di tali kernel sembra essere un obiettivo percorribile, cosi' come l'analisi di come sia possibile una modellazione sparsa di tale funzioni di similarita'. Entrambi sembrano essere ragionevoli prerequisiti per una estensione di tali funzioni ad output strutturati. Entrambe le direzioni, data mining e funzioni di kernel, costituiscono solo una parte di framework piu' estesi. Nel caso degli input strutturati questi sono il risultato di poco meno di un decennio di ricerca e risultano percio' sufficientemente consolidati, consentendo una rapida validazione e confronto con altre metodologie. Nel caso di output strutturati non esistono in-vece metodologie sufficientemente generiche. In particolare sembra necessaria un'analisi ap-profondita degli approcci tesi all'approssimazione delle soluzioni o all'individuazione di restri-zioni del problema, per affrontare problemi tipicamente NP-hard. Estendere lo stato dell'arte ad ulteriori, anche se specifici, domini, sara' un'ulteriore direzione per questo lavoro di tesi. La commissione ha apprezzato la ricchezza dei problemi affrontati e ha anche apprezzato i risultati parziali ottenuti. Ritiene comunque che sia necessario procedere ora con una attenta focalizzazione degli obiettivi, che ne stabilisca le priorità, e previa analisi delle assunzioni caratteristiche dei modelli con la scelta di un campo applicativo di riferimento che possa consentire una valutazione e una opportuna valorizzazione dei modelli ipotizzati.