UNIVERSITA’ POLITECNICA DELLE MARCHE Facoltà di Ingegneria Corso di Laurea Specialistica in Ingegneria Informatica PROGETTO DI UN DATA WAREHOUSE PER IL SUPPORTO AL MONITORAGGIO DI PREZZI E TARIFFE SUL WEB http://pollosky.it Anno Accademico 2007/2008 Ambito Osservatori prezzi Problematiche TRASPARENZA E CONOSCENZA SUI LIVELLI E SULLE DINAMICHE CHE CARATTERIZZANO L’ ANDAMENTO DEI PREZZI RACCOLTA DATI (COSTI, COMPLESSITÀ) POTENZIALITA’ DI ANALISI RACCOLTA ED INTEGRAZIONE DEI DATI SUL WEB Obiettivi GESTIONE DEI DATI SISTEMA DI SUPPORTO ALLE ANALISI Attività progettuale • Progettazione della base dati – Completa – Generalizzata • Soluzione problematiche – Gestione delle eterogeneità (aggregazioni) Sistema di supporto alle analisi Analisi flessibili ed interattive OLAP Modello multidimensionale Funzione di aggregazione Dimensione Misura Data warehouse Metodologia di progettazione [Cabibbo, 1998]: • Studio della natura delle Identificazione di fatti e dimensioni Schema Entità-Relazione Grafo Dimensionale Modello MD sorgenti • Formato di rappresentazione dei dati • Proprietà associate ai fatti • Identificazione delle misure e delle prospettive di analisi Gestione delle eterogeneità informazioni sul web COMUNALE PROVINCIALE diversi livelli di granularità REGIONALE NAZIONALE Misure aggregate AVG 1,524 Provincia 1,522 Comune 1 1,517 Comune 2 1,521 Comune 3 1,536 Comune 4 Misura aggregata Roll up Misure aggregate 1,520 Provincia AVG 1,522 1,524 Comune 1 GIA’ DISPONIBILE 1,517 Comune 2 1,521 Comune 3 - Comune 4 NON PRESENTE NEL DATA WAREHOUSE Provincia Possibili soluzioni Prevedere un modulo che pre-calcoli ogni livello di aggregazione navigabile Personalizzare il server OLAP Viste materializzate Intervenire a livello logico (query MDX) prezzo aggregato Soluzione • DIMENSIONE AUSILIARIA • FILTRAGGIO • NUOVA MISURA IF Level IS [Nazionale] THEN IF Level IS [Regionale] THEN IF Level IS [Provinciale] THEN IF Level IS [Comunale] THEN Query MDX Implementazione CONFIGURAZIONE Motore OLAP Mondrian XML Schema Mondrian-JPivot Query espresse in MDX Legge i dati da un RDBMS Presenta i risultati in forma multidimensionale Cube Table Dimension Hierarchy Level CalculatedMember Measures Collezione di misure e dimensioni Relazioni con le tabella del database fisico Gerarchie legate ad una dimensione Sperimentazione • Analisi sui dati disponibili Generare query di interesse Elaborare rappresentazioni grafiche Confrontare le misure visualizzate • Stimare i tempi di calcolo • Performance • Significatività Analisi OLAP Analisi OLAP AGIP 1.555 1.550 1.545 1.540 1.535 1.530 1.525 Benzina Diesel 16 Luglio 2008 Conclusioni • Riuso delle informazioni acquisite dal web • Adattabilità a diverse tipologie di prodotti (Alimenti, Carburanti, Servizi, etc.) • Analisi ad alto valore aggiunto PROTOTIPO • Flessibile – Adattabilità delle sorgenti – Elasticità di analisi • Robusto – Nessun malfunzionamento rilevato • Efficiente – Rapidità – Puntualità Sviluppi Futuri • Nuovi flussi informativi • Supporto agli utenti nella costruzioni di analisi • Nuovi servizi di analisi avanzata –Data quality –Data mining