Corso di Basi di dati distribuite
Programma a.a. 2003-2004
Prof.ssa M.T, Pazienza
1. Introduzione. Basi di dati distribuite:inquadramento della problematica. Dalle basi di dati
alle basi di documenti, al Web semantico.
2. Data warehousing e data mining. Analisi di grandi volumi di dati per il supporto alla
decisione e per la identificazione di fenomeni “inattesi”.
3. Modelli di dati ed Ontologie nel Web Semantico: Richiami ed approfondimenti di
logica, programmazione logica ed ontologie. Modelli di dominio e modelli utente.
Linguaggi e Protocolli per il Web semantico: XML, RDF/RDFS, DAM+OIL, DL.
4. Web documentation e retrieval: Memorizzazione di documenti per l’Information
Retrieval (IR). Metodologie per l’indicizzazione di testo. Valutazione delle prestazioni per
l’IR. Il Vector Space Model. Classificazione di testi, information filtering e routine.
Modelli avanzati per l’IR: il ruolo del trattamento del linguaggio naturale.
5. Approfondimenti. Information Extraction (IE). Question/Answering (Q/A).
Apprendimento Automatico per l’IR. Cross-language IR. Agent-based information
Retrieval.
Bibliografia di riferimento (capitoli selezionati)
1. R. Ramakrishnan, J. Gehrke: Database Management Systems, McGraw-Hill, 2003,
(Capitoli 22, 25, 26, 27)
2. Cabena, Hadjinian, Stadler, Verhees, Zanasi: Discovering Data Mining, Prentice Hall,
1997 (Cap. 1, 3)
3. G. Salton: Automatic Text Processing, Addison-Wesley, USA, 1989.
4. G. Grefenstette: Cross-Language Information Retrieval, Kluwer Academic Publishers,
1998.
5. N. Zhong, J. Liu, Y. Yao: Web Intelligence, Springer, 2003.
6. C. Tasso, P. Omero: La personalizzazione dei contenuti Web, e-commerce, i-access, egovernment. F. Angeli, 2002
7. W. Abramowicz, J. Zurada: Knowledge discovery for business information systems F.
Kluwer, 2001
8. Documentazione specifica distribuita dal docente:
http://www.sciam.com/print_version.cfm?articleID=00048144-10D2-1C70-84A9809EC588EF21
http://citeseer.nj.nec.com/chau01personalized.html