UNIVERSITA’ POLITECNICA DELLE MARCHE
Facoltà di Ingegneria
Corso di Laurea Specialistica in Ingegneria Informatica
PROGETTO DI UN DATA WAREHOUSE
PER IL SUPPORTO AL MONITORAGGIO
DI PREZZI E TARIFFE SUL WEB
http://pollosky.it
Anno Accademico 2007/2008
Ambito
Osservatori prezzi
Problematiche
TRASPARENZA E CONOSCENZA SUI LIVELLI E
SULLE DINAMICHE CHE CARATTERIZZANO
L’ ANDAMENTO DEI PREZZI
RACCOLTA DATI (COSTI, COMPLESSITÀ)
POTENZIALITA’ DI ANALISI
RACCOLTA ED INTEGRAZIONE DEI DATI SUL WEB
Obiettivi
GESTIONE DEI DATI
SISTEMA DI SUPPORTO ALLE ANALISI
Attività progettuale
• Progettazione della base dati
– Completa
– Generalizzata
• Soluzione problematiche
– Gestione delle eterogeneità (aggregazioni)
Sistema di supporto alle analisi
Analisi flessibili
ed interattive
OLAP
Modello multidimensionale
Funzione di
aggregazione
Dimensione
Misura
Data warehouse
Metodologia di progettazione [Cabibbo, 1998]:
• Studio della natura delle
 Identificazione di fatti e dimensioni
 Schema Entità-Relazione
 Grafo Dimensionale
 Modello MD
sorgenti
• Formato di rappresentazione
dei dati
• Proprietà associate ai fatti
• Identificazione delle misure e
delle prospettive di analisi
Gestione delle eterogeneità
informazioni
sul web
COMUNALE
PROVINCIALE
diversi livelli di
granularità
REGIONALE
NAZIONALE
Misure aggregate
AVG
1,524
Provincia
1,522
Comune 1
1,517
Comune 2
1,521
Comune 3
1,536
Comune 4
Misura aggregata
Roll up
Misure aggregate
1,520
Provincia
AVG
1,522
1,524
Comune 1
GIA’ DISPONIBILE
1,517
Comune 2
1,521
Comune 3
-
Comune 4
NON PRESENTE NEL
DATA WAREHOUSE
Provincia
Possibili soluzioni
 Prevedere un modulo che pre-calcoli ogni livello di
aggregazione navigabile
 Personalizzare il server OLAP
 Viste materializzate
 Intervenire a livello logico (query MDX)
prezzo aggregato
Soluzione
• DIMENSIONE AUSILIARIA
• FILTRAGGIO
• NUOVA MISURA
IF Level IS [Nazionale] THEN
IF Level IS [Regionale] THEN
IF Level IS [Provinciale] THEN
IF Level IS [Comunale] THEN
Query MDX
Implementazione
CONFIGURAZIONE
Motore OLAP
Mondrian XML Schema
Mondrian-JPivot
 Query espresse in MDX
 Legge i dati da un RDBMS
 Presenta i risultati in forma multidimensionale
Cube
Table
Dimension
Hierarchy
Level
CalculatedMember
Measures
Collezione di misure e
dimensioni
Relazioni con le tabella
del database fisico
Gerarchie legate ad
una dimensione
Sperimentazione
• Analisi sui dati disponibili
 Generare query di interesse
 Elaborare rappresentazioni grafiche
 Confrontare le misure visualizzate
• Stimare i tempi di calcolo
• Performance
• Significatività
Analisi OLAP
Analisi OLAP
AGIP
1.555
1.550
1.545
1.540
1.535
1.530
1.525
Benzina
Diesel
16 Luglio 2008
Conclusioni
• Riuso delle informazioni acquisite dal web
• Adattabilità a diverse tipologie di prodotti (Alimenti, Carburanti,
Servizi, etc.)
• Analisi ad alto valore aggiunto
PROTOTIPO
• Flessibile
– Adattabilità delle sorgenti
– Elasticità di analisi
• Robusto
– Nessun malfunzionamento rilevato
• Efficiente
– Rapidità
– Puntualità
Sviluppi Futuri
• Nuovi flussi informativi
• Supporto agli utenti nella costruzioni di analisi
• Nuovi servizi di analisi avanzata
–Data quality
–Data mining