====== Tecniche di Data Mining a.a. 2007-2008 ======
====== News ======
Prossima sessione di esami orali: Lunedi 21 luglio 2008, ore 15:00, studio Pedreschi
Seconda verifica: Giovedi 5 Giugno 2008 - risultati {{:tdm:verificatdm5giugno2008.pdf| pdf }}
Prima verifica: risultati {{:tdm:verifica_1_tdm_2008.pdf| pdf }}
** Appelli sessione estiva **
* 12 Giugno 2008
9.30 - 12.30
{{:tdm:appello_12.06.2008.txt| txt }}
* 2 Luglio 2008
9.00 - 12.00
* 18 Luglio 2008
15.00 - 18.00
* 11 Settembre 2008 9.30 - 12.30
aula C1 Risultati {{:tdm:appello_12.06.2008.rtf| rtf }}
aula D1
aula C1
aula D1
====== Docente ======
* **Dino Pedreschi**
* **KDD LAB** - Knowledge Discovery Laboratory / ISTI-CNR e Dipartimento di Informatica
dell'Università di Pisa
* [[[email protected]]]
* http://www.di.unipi.it/~pedre
====== Obiettivi del corso ======
La grande disponibilità di dati provenienti da database relazionali, dal web o da altre sorgenti motiva lo
studio di tecniche di analisi dei dati che permettano una migliore comprensione ed un più facile utilizzo
dei risultati nei processi decisionali. L'obiettivo del corso è quello di fornire un'introduzione ai concetti di
base del processo di estrazione di conoscenza, alle principali tecniche di data mining ed ai relativi
algoritmi, concentrandosi su quelli più diffusi e consolidati, ma discutendo anche gli aspetti avanzati ed
ancora al limite fra tecnologia metura e ricerca. Si discutono esempi di uso delle tecniche di data mining
in contesti applicativi realistici, quali la market basket analysis ed il rilevamento di frodi. Il corso si
conclude con cenni sugli aspetti di privacy ed etici inerenti all’utilizzo di tecniche inferenza sui dati e dei
quali l’analista deve essere a conoscenza. Il corso consiste delle seguenti parti:
- i concetti di base del processo di estrazione della conoscenza;
- le principali tecniche di datamining (regole associative, classificazione e clustering). Di queste
tecniche si studieranno gli aspetti formali e implementativi, sia nelle versioni standard che avanzate;
- alcuni casi di studio nell’ambito del marketing e del supporto alla gestione clienti, del rilevamento di
frodi e di studi epidemiologici.
- cenni sugli aspetti di privacy ed etici e delle tecnologie di analisi privacy-preserving.
====== Orario ======
* **Lunedì 14-16, Aula A1**
* **Giovedì 16-18, Aula A**
====== Libro di Testo ======
•
Pang-Ning Tan, Michael Steinbach, Vipin Kumar, Introduction to DATA MINING, Pearson Addison Wesley, ISBN 0-321-32136-7, 2006
* [[http://www-users.cs.umn.edu/~kumar/dmbook/index.php]] (slides e capitoli 4, 6 e 8 scaricabili
liberamente).
====== Riferimenti bibliografici ======
* Jiawei Han, Micheline Kamber, Data Mining: Concepts and Techniques, Morgan Kaufmann
Publishers, 2000
http://www.mkp.com/books_catalog/catalog.asp?ISBN=1-55860-489-8
* U. Fayyad, G. Piatetsky-Shapiro, P. Smyth, R. Uthurusamy (editors). Advances in Knowledge
discovery and data mining, MIT Press, 1996.
* Barry Linoff Data Mining Techniques for Marketing Sales and Customer Support, John Wiles & Sons,
2002
====== Calendario delle lezioni ======
^ ^ Giorno/ora ^ Aula ^ Argomento ^ Materiale didattico ^ Docente ^
|1.| Lunedì, Febbraio 18 | A1 | //Presentazione del corso// | {{tdm:chap1_intro.pdf|lucidi}} | Pedreschi |
|2.| Giovedì, Febbraio 21 | A | //Cosa è il Data Mining, Motivazioni, Classi di applicazioni, I principali
metodi di datamining// | | Pedreschi |
|3.| Lunedì, Febbraio 25 | A1 | //Il processo di estrazione della conoscenza, esempi: previsione di frodi
fiscali, analisi competitiva, etc.// | {{tdm:bonchi260207.pdf|lucidi}} | Pedreschi |
|4.| Giovedì, Febbraio 28 | A | //I dati: i tipi di dato, la qualità dei dati, la preparazione dei dati// |
{{tdm:tdm_data_preparation_2-3.pdf|lucidi}}| Pedreschi |
|5.| Lunedì, Marzo 3 | A1 | //Misure di similarità e dissimilarità// | {{tdm:chap2_data.pdf|lucidi}} | Pedreschi |
|6.| Giovedì, Marzo 6 | A | //Esplorazione dei dati: dalla statistica descrittiva alla visualizzazione// |
{{tdm:chap3_data_exploration.pdf|lucidi}}|Pedreschi |
|7.| Lunedì, Marzo 10 | A1 | //Clustering - Algoritmo k-means// |
{{tdm:chap8_basic_cluster_analysis.pdf|lucidi}} | Mirco Nanni |
|8.| Giovedì, Marzo 13 | A | //Clustering - Algoritmi gerarchici e density-based// | | Pedreschi |
|9.| Lunedì, Marzo 17 | A1 | // Classificazione con alberi di decisione, Algoritmo C4.5 // | | Pedreschi |
|10.| Giovedì, Marzo 20 | A | //Classificazione con alberi di decisione, Algoritmo C4.5 // | | Pedreschi |
|11.| Giovedì, Marzo 27 | A | // Esercitazione // | | Pedreschi |
|12.| Lunedi, Marzo 31 | A1 | //Ricevimento collettivo e preparazione verifica //
|{{tdm:tdm_12_aprile_07.pdf|lucidi}}| Pedreschi |
|13.| ** Giovedì, Aprile 3, 16-18 ** | **A** | ** PRIMA VERIFICA ** | | |
|14.| Lunedì, Aprile 7 | A1 | // Classificazione con alberi di decisione, Esercitazione con strumenti software
data mining // | {{tdm:TDM_DM_16_aprile_07.pdf|lucidi}} | Pedreschi |
|15.| Giovedì, Aprile 10 | A | //Classificazione e clustering - casi di studio // | | Pedreschi |
|16.| Giovedì, Aprile 17 | A | //Gestione del processo di KDD con strumenti commerciali e open-source// | |
Pedreschi|
|17.| Lunedì, Aprile 21 | A1 | //Altri algoritmi di classificazione: modelli a regole, K-nearest neighbors.// | |
|
|18.| Giovedì, Aprile 24 | A | //Pattern discovery e regole associative.// | | Maurizio Atzori |
|19.| Lunedi, Aprile 28 | A1 | //Pattern discovery e regole associative. // | | Maurizio Atzori |
|20.| Lunedì, Maggio 5 | A1 | //Regole Associative: concetti basici, algoritmi A-Priori e FP-Growth //
|{{tdm:bonchi-7-maggio.pdf|lucidi}} {{tdm:bonchi-14-maggio.pdf|lucidi}} | Pedreschi |
|21.| Giovedì, Maggio 8 | A |//Itemset frequenti con vincoli // | {{tdm:bonchi-10-maggio.pdf|lucidi}}|
Pedreschi |
|22.| Giovedì, Maggio 15| A | // Mobility data mining // | | Pedreschi |
|23.| Lunedì, Maggio 19 | A1 | Privacy-preserving data mining ed aspetti etici
|{{tdm:2._privacypreservingtechnologies_pedreschi_.pdf|lucidi}}
{{tdm:1._geopkdd-introduction_giannotti_.pdf|lucidi}}| Giannotti - Pedreschi |
|24.| **Giovedì, Giugno 5, 16-18** | **A** | **SECONDA VERIFICA** | |
|
====== Verifiche anni precedenti ======
* {{tdm:verifica2006.pdf|Verifica 2006}}
* {{tdm:verifica2005.pdf|Verifica 2005}} (con soluzioni)
* {{tdm:verifica2004.pdf|Verifica 2004}}
====== Seminari e progetti di esame ======
// da definire //
====== Appelli di esame ======
// da definire //
====== Edizioni anni precedenti ======
* [[TDM-2006-2007|TDM a.a. 2006-07]]
* [[http://www.di.unipi.it/~pedre/TDM-ADEC2006.htm|TDM a.a. 2005-06]]