Corso di Basi di dati distribuite Programma a.a. 2003-2004 Prof.ssa M.T, Pazienza 1. Introduzione. Basi di dati distribuite:inquadramento della problematica. Dalle basi di dati alle basi di documenti, al Web semantico. 2. Data warehousing e data mining. Analisi di grandi volumi di dati per il supporto alla decisione e per la identificazione di fenomeni “inattesi”. 3. Modelli di dati ed Ontologie nel Web Semantico: Richiami ed approfondimenti di logica, programmazione logica ed ontologie. Modelli di dominio e modelli utente. Linguaggi e Protocolli per il Web semantico: XML, RDF/RDFS, DAM+OIL, DL. 4. Web documentation e retrieval: Memorizzazione di documenti per l’Information Retrieval (IR). Metodologie per l’indicizzazione di testo. Valutazione delle prestazioni per l’IR. Il Vector Space Model. Classificazione di testi, information filtering e routine. Modelli avanzati per l’IR: il ruolo del trattamento del linguaggio naturale. 5. Approfondimenti. Information Extraction (IE). Question/Answering (Q/A). Apprendimento Automatico per l’IR. Cross-language IR. Agent-based information Retrieval. Bibliografia di riferimento (capitoli selezionati) 1. R. Ramakrishnan, J. Gehrke: Database Management Systems, McGraw-Hill, 2003, (Capitoli 22, 25, 26, 27) 2. Cabena, Hadjinian, Stadler, Verhees, Zanasi: Discovering Data Mining, Prentice Hall, 1997 (Cap. 1, 3) 3. G. Salton: Automatic Text Processing, Addison-Wesley, USA, 1989. 4. G. Grefenstette: Cross-Language Information Retrieval, Kluwer Academic Publishers, 1998. 5. N. Zhong, J. Liu, Y. Yao: Web Intelligence, Springer, 2003. 6. C. Tasso, P. Omero: La personalizzazione dei contenuti Web, e-commerce, i-access, egovernment. F. Angeli, 2002 7. W. Abramowicz, J. Zurada: Knowledge discovery for business information systems F. Kluwer, 2001 8. Documentazione specifica distribuita dal docente: http://www.sciam.com/print_version.cfm?articleID=00048144-10D2-1C70-84A9809EC588EF21 http://citeseer.nj.nec.com/chau01personalized.html