Corso di Laurea Triennale in Informatica - Università degli Studi di Bari Corso di "Gestione della Conoscenza d’Impresa" Anno Accademico 2005/06 – Programma preliminare Docente: Giovanni Semeraro ([email protected]) Programma 1. Knowledge management: definizione, metodi, strumenti ed applicazioni. 2. - I piani della conoscenza. Fattuale (Rappresentazione oggetti individuali: sistemi di gestione di database). Concettuale (rappresentazione entità e funzioni: modelli d’impresa e schemi di database). Metodologica (linee guida per la costruzione di una KB: ingegneria della conoscenza e metamodelli). 3. I livelli di formalizzazione della conoscenza. 4. Semantic Web. 4.1. Ontologie e loro applicazioni nella condivisione di conoscenza. o Ontologie e loro applicazione nella condivisione di conoscenza. o Condivisione di conoscenza e riuso. o Motivazioni per l’uso di ontologie. o Ontologie e basi di conoscenza. o Differenti definizioni di ontologie. o Ontologie e concettualizzazioni. o Tipi di ontologie. o Proprietà delle ontologie. o Ontology engineering: cenni sulle metodologie. o Sviluppo di una ontologia step-by-step. o Ontologie e linguaggi software. 4.2. eXtensible Markup Language (XML). o Introduzione. o Struttura di un documento XML. o Document Type Definition (DTD) e XML Schema. o eXtensible Style Sheet (XSL), XML Query Language (XQL). o Interoperabilità e protocolli di comunicazione: SOAP & Web Services. o Un caso applicativo: XML Content Manager. 4.3. Resource Description Framework (RDF). o Ritrovamento automatico nel World Wide Web. o Concetti fondamentali: URI, Models, Statements, Classes, Properties, Resources. o RDF Schema:differenze tra validazione semantica e validazione XML–based. o Limiti di RDF ed RDF Schema. o Evoluzioni di RDF: OWL (Lite, DL, Full). o Casi applicativi: RDFCore e gestione efficiente di modelli RDF. 5. Accesso Intelligente all’Informazione. 5.1. Text Mining: dal testo alla conoscenza. o Definizione diText Mining. o Il processo di Text Mining. o Confronto tra Text Mining, Data Mining, Information Retrieval, Data Retrieval. o Text Mining nell’Impresa. 5.2. Intelligent Information Retrieval (IR). o Architettura di un sistema di IR. o Modelli di IR: confronto tra il modello booleano e quello "vector space". o Integrazione di conoscenza lessicale nel processo di ritrovamento: WordNet. o Organizzazione e rappresentazione della conoscenza in WordNet: i synset e la matrice lessicale. o Metriche per la valutazione. 5.3. Text Categorization (TC). o Generalità sul problema della classificazione. o Estensione del problema ai dati testuali: Text Categorization. o Machine learning for TC: cenni sui metodi k-NN, Rocchio. Analisi del metodo Naive Bayes. o Metriche per la valutazione. o Casi applicativi. 5.4. Information Extraction (IE). o Definizione del processo di IE. o Differenze tra IE e IR. o Le fasi di un sistema per l’IE. o Metriche per la valutazione. 5.5. Applicazioni. o Personalizzazione: apprendimento di profili utente. o Il sistema ITem Recommender (ITR) e sue applicazioni nel campo del commercio elettronico. o Il sistema Profile Extractor e sue applicazioni nel campo delle biblioteche elettroniche. 6. Il linguaggio Java. o Programmazione object-oriented: le caratteristiche. o Java ed Internet: introduzione al linguaggio, vantaggi del linguaggio Java. o Tipi di dati, variabili e array, operatori ed istruzioni di controllo. o Classi e metodi: concetti fondamentali, costruttori, dichiarazione degli oggetti, overloading dei metodi. o Concetti fondamentali sull'ereditarietà ed overriding: la classe Stack. o Interfacce per oggetti Java e implementazione di interfacce. o Gestione delle eccezioni: blocco try/catch, clausola throws, catch multiple, try annidate. Esempi. o Il pacchetto AWT. o Il pacchetto Swing. o Generalità sulle applet ed esempi. o Programmazione multithreading: il modello thread di Java. o Creazione di thread. o Priorità dei thread e sincronizzazione. o Servlet. o Java Server Pages (JSP). o Java ed XML: JAXP e Xerces. o Java e Database: Java DataBase Connectivity (JDBC). o I socket in Java. o Esercitazioni. Testi consigliati Per i punti 1. 2. e 3. Bracchi, G., Francalanci, C., Motta, G., Sistemi informativi e aziende in rete, McGraw-Hill, 2001. Lops, P., Semeraro, G., Knowledge Management, dispense (2001). Missikoff, M., Gestione della conoscenza d’impresa: metodi strumenti ed applicazioni, AI*IA Notizie, Vol. XIII, N° 2, pp. 5-7, Giugno 2000. Missikoff, M., Ernani, E., La Gestione della Conoscenza d’Impresa, AICA 2000: Le Tecnologie dell’informazione e della Comunicazione come motore di sviluppo del Paese, pp. 785-794, 2000. Per il punto 4. Tamma, V., Ontologies and their applications in knowledge sharing, dispense (2001). Bradley, N., The XML Companion, Addison-Wesley, 1998. Iannone, L., Palmisano, G. Semeraro, I. XML Tutorial, dispense (2003). Capursi, D., Iannone, L., Lops, P., Semeraro, G., RDF Tutorial, dispense (2003). Per il punto 5. Baeza-Yates, R.A., Ribeiro-Neto, B.A., Modern Information Retrieval, ACM Press/Addison-Wesley, 1999. L. Bordoni, F. Esposito, O. Licchelli, F. Poggi & G. Semeraro. Personalized Search for Digital Library Users. In L. Bordoni and F. Poggi (Eds.), Proc. of the AI*IA 2003 Workshop on Artificial Intelligence for the Cultural Heritage, 104-109, Pisa, Italy, September 23, 2003. M. Degemmis, P. Lops, G. Semeraro, M.F. Costabile, S.P. Guida & O. Licchelli. Improving Collaborative Recommender Systems by means of User Profiles. In C.-M. Karat, J. Blom, and J. Karat (Eds.), Designing Personalized User Experiences in eCommerce, Chapter 14, 253-274, Kluwer Academic, 2004. M. Degemmis, P. Lops, G. Semeraro & F. Abbattista. Extraction of User Profiles by Discovering Preferences through Machine Learning. In M.A. Kłopotek, S.T. Wierzchoń and K. Trojanowski (Eds.), Intelligent Information Processing and Web Mining: Proceedings of the International IIS IIPWM´03 Conference, Advances in Soft Computing, 69-78, Springer:Berlin, 2003. Eikvil, L.: Information Extraction from World Wide Web - A Survey, Report No. 945, ISBN 82-539-0429-0 (1999). Web: citeseer.nj.nec.com/eikvil99information.html. R. Feldman and I. Dagan, Knowledge Discovery in Textual Databases (KDT). Proc. of the 1st Int. Conf. on Knowledge Discovery (KDD-95), pp. 112-117, Montreal, 1995. Grishman, R., "Information Extraction: Techniques and Challenges". Springer-Verlag, Lecture Notes in Artificial Intelligence, Rome (1997). Web: citeseer.nj.nec.com/grishman97information.html. M. Grobelnik, D. Mladenic, and N. Milic-Frayling, Text Mining as Integration of Several Related Research Areas. Report on KDD’2000 Workshop on Text Mining, 2000. T.M. Mitchell, Machine Learning, McGraw-Hill, 1997. M. Pazzani, Machine Learning and Information Filtering on the Internet, IJCAI-97 Tutorial, Nagoya, Japan, Aug 1997. Sebastiani F., Machine learning in automated text categorization, ACM Computing Surveys, 34(1):1-47, 2002. Semeraro, G., Lops, P., Degemmis, M., Document/Text Mining: From Text to Knowledge, dispense (2004). Semeraro, G., Lops, P., Degemmis, M., Text Categorization, dispense (2004). Semeraro, G., Lops, P., Degemmis, M., Information Extraction, dispense (2004). Semeraro, G., Lops, P., Degemmis, M., Personalization: learning user profiles, dispense (2004). vanRijsbergen, C.J., Information Retrieval, Butterworth & Co., Boston, MA, 1979. Web: http://citeseer.ist.psu.edu/vanrijsbergen79information.html Christiane Fellbaum (Editor), WordNet: An Electronic Lexical Database. Edited by. MIT Press. ISBN 0-26206197-X. Per il punto 6. Lewis, J., Loftus, W., Java: Fondamenti di progettazione software, Addison-Wesley, 2001. Licchelli, O., Palmisano, I. Linguaggio Java, dispense (2003). Naughton, P., Schildt, H., Java: La guida completa, McGraw-Hill, 1997. Horstmann, C. S., Cornell, G., Java2: I fondamenti, McGraw-Hill, 1999. Eckel, B., Thinking in Java, Prentice-Hall, December 2002. Web: http://www.mindview.net/Books/TIJ/. Tarquini, Ligi, Java mattone dopo mattone (http://www.java-net.it/jmonline/).