Data Warehouse Cos`è il DWH? Il problema

Data Warehouse
Data Warehouse
Cos’è il DWH?
«A Data Warehouse is a subject oriented, integrated, time variant, and non-volatile collection of summary and
detailed historical data used to support the strategic decision-making processes for the corporation.» William H. Inmon
Orientata al soggetto: un DWH può essere utilizzato per analizzare una particolare area (soggetto). Per esempio,
“vendite” può essere un’area di interesse specifico.
Integrata: un DWH integra dati provenienti da molteplici fonti di dati. Ad esempio, la fonte A e la fonte B possono
avere modi diversi di identificare un prodotto, ma nel DWH ci sarà un unico modo di identificare un prodotto.
Variabile nel tempo: nel DWH sono conservati anche i dati storici. Infatti, da un DWH possono essere recuperati
anche dati risalenti a svariati anni addietro. Questo differenzia il DWH dal sistema transazionale, il quale conserva
solo i dati correnti. Ad esempio, un sistema transazionale può contenere solo l’indirizzo più recente di un cliente,
mentre il DWH può contenere tutti gli indirizzi associati al cliente nel corso del tempo.
Non volatile: una volta che i dati sono nel DWH, essi non cambiano più; pertanto, i dati storici contenuti nel DWH
non vengono mai alterati.
Data
Mining
Streams
Files
ETL,
Replication,
Data Quality
Apps
OLTP, EDW
Source Systems
Fonti di dati
Acquisizione dati
SQL
ODBC
JDBC
SCI
Feeds
Multidimensional
Analysis
Analytics
Reporting
(Rewrite, Append, Update)
Archiviazione dati
Analisi dati
Reportistica e visualizzazione
Il problema
Un Data Warehouse fondamentalmente immagazzina dati, ma ci sono anche molte altre attività correlate: estrarre,
trasformare e caricare i dati provenienti da diverse fonti, e successivamente rintracciarli e analizzarli secondo le
esigenze degli utenti. Questo è indispensabile, in particolare, per la business intelligence: recuperare rapidamente
e interpretare efficacemente i dati è essenziale per ottenere informazioni utili e quindi consentire di prendere le
decisioni migliori.
I tempi delle fasi di ETL possono essere un punto dolente visto che la dimensione dei dati è spesso enorme: infatti,
la qualità dell’analisi dipende dal volume delle informazioni caricate nel data warehouse. D’altro canto, anche i
tempi di query possono essere critici, specialmente per analisi non predefinite.
ETL,
Replication,
Data Quality
• Data Mining
Feeds
(Rewrite, Append, Update)
www.sadasdb.com
SQL, ODBC,
JDBC, SCI
• Multidimensional
Analysis
• Analytics Reporting
Data Warehouse
La soluzione SADAS per il Data Warehouse
La nostra soluzione trae beneficio dalle caratteristiche di Sadas Engine, la
nostra tecnologia principale: un DBMS colonnare progettato specificatamente
per garantire prestazioni eccezionali in ambienti Data Warehouse. Sadas
Engine è un DBMS rivoluzionario che soddisfa le esigenze delle aziende nelle
loro attività quotidiane di recuperare, analizzare e gestire i dati. È facile da
integrare con le diverse fonti dei dati e molto efficiente in tutte le attività di
ETL. Inoltre, il suo front-end per cruscotti e report è semplice e pronto all’uso.
L’utente ha tutto ciò che serve in un’unica soluzione.
Loading
Time
Average
Inquiry
Time
SADAS
Altro DBMS
25
20
15
10
5
0
Funzioni e caratteristiche
Database colonnare: efficiente, veloce, affidabile ed economico.
Tecnologia specifica: indici e strutture innovative, funzioni di “Intelligent Upload” e “Learn by Usage”,
ovvero capacità di auto-adattarsi a nuove condizioni d’uso, ridotta necessità di amministrazione e tuning.
One stop shop: con Sadas hai tutto ciò che serve per implementare, caricare e usare il data warehouse.
Hardware commerciale: nessun bisogno di appliance specifici e costosi o di licenze di terze parti.
Vantaggi della soluzione SADAS
Alte performance: la soluzione più veloce e più efficiente per assicurare risultati eccezionali in attività di
caricamento e analisi.
Basso TCO: Sadas taglia il TCO potendo funzionare su hardware a basso costo ed offrendo una politica
commerciale flessibile.
Implementazione rapida: processo di installazione e personalizzazione rapidi, garantendo più tempo da
dedicare ad una migliore progettazione e analisi.
Costi di manutenzione contenuti: non sono necessari interventi da parte di DBA, risparmiando risorse
e costi di gestione e tuning.
Compatibilità: Sadas può essere introdotto senza alcuna difficoltà in qualunque ambiente.
Statistiche da un business case sul DWH
Numero schemi
> 200
Numero totale utenti
> 6 500
Numero tabelle
>150 000
Numero utenti medio per giorno
> 1 000
Numero totale record
> 38 miliardi (~20 TB)
Frequenza aggiornamento dati
Qualsiasi
Tabella più grande
> 2 miliardi di record
Record aggiornati giornalieri
> 8 miliardi (~3 TB)
Numero query al giorno
> 2 600 000
Modalità aggiornamento dati
rewrite, append, update,
Tempo medio di risposta
< 0,1 sec
delete, insert
SADAS fornisce servizi e soluzioni tecnologiche per l’analisi e la governance dei dati in settori diversi ed eterogenei, assieme ad una gamma
di prodotti innovativi per la Business Intelligence. SADAS fornisce anche servizi di consulenza e formazione a livello internazionale sulla
Data Governance e l’Information Management grazie alle competenze del suo team UK, coordinato da Christopher M. Bradley - Presidente
di DAMA UK. Per saperne di più visitate i nostri siti www.sadasdb.com e www.getsadas.com, o scrivete a [email protected]
MILANO Sede centrale
Via Boschetti, 1 • 20121, Milano
Tel: +39 02 29017449
ROMA Direzione commerciale
Via Principessa Clotilde, 7 • 00196, Roma
Tel: +39 06 83089713 / fax: +39 06 8928 1917
NAPOLI Sede Legale, Customer Service, Laboratori R&D
Via Napoli, 159 • 80013, Casalnuovo di Napoli (NA)
Tel: +39 081 8427112 / fax: +39 081 8427171
rev003
BATH - Consulenza e Formazione
1 Priory Close • Bath, BA2 5AL, UK
Tel. +44 1225 637004
SAN FRANCISCO - USA international office
20 California St. 7th floor • San Francisco, CA, 94111, USA
Tel. +1 415 429 3969