Data Warehouse Data Warehouse Cos’è il DWH? «A Data Warehouse is a subject oriented, integrated, time variant, and non-volatile collection of summary and detailed historical data used to support the strategic decision-making processes for the corporation.» William H. Inmon Orientata al soggetto: un DWH può essere utilizzato per analizzare una particolare area (soggetto). Per esempio, “vendite” può essere un’area di interesse specifico. Integrata: un DWH integra dati provenienti da molteplici fonti di dati. Ad esempio, la fonte A e la fonte B possono avere modi diversi di identificare un prodotto, ma nel DWH ci sarà un unico modo di identificare un prodotto. Variabile nel tempo: nel DWH sono conservati anche i dati storici. Infatti, da un DWH possono essere recuperati anche dati risalenti a svariati anni addietro. Questo differenzia il DWH dal sistema transazionale, il quale conserva solo i dati correnti. Ad esempio, un sistema transazionale può contenere solo l’indirizzo più recente di un cliente, mentre il DWH può contenere tutti gli indirizzi associati al cliente nel corso del tempo. Non volatile: una volta che i dati sono nel DWH, essi non cambiano più; pertanto, i dati storici contenuti nel DWH non vengono mai alterati. Data Mining Streams Files ETL, Replication, Data Quality Apps OLTP, EDW Source Systems Fonti di dati Acquisizione dati SQL ODBC JDBC SCI Feeds Multidimensional Analysis Analytics Reporting (Rewrite, Append, Update) Archiviazione dati Analisi dati Reportistica e visualizzazione Il problema Un Data Warehouse fondamentalmente immagazzina dati, ma ci sono anche molte altre attività correlate: estrarre, trasformare e caricare i dati provenienti da diverse fonti, e successivamente rintracciarli e analizzarli secondo le esigenze degli utenti. Questo è indispensabile, in particolare, per la business intelligence: recuperare rapidamente e interpretare efficacemente i dati è essenziale per ottenere informazioni utili e quindi consentire di prendere le decisioni migliori. I tempi delle fasi di ETL possono essere un punto dolente visto che la dimensione dei dati è spesso enorme: infatti, la qualità dell’analisi dipende dal volume delle informazioni caricate nel data warehouse. D’altro canto, anche i tempi di query possono essere critici, specialmente per analisi non predefinite. ETL, Replication, Data Quality • Data Mining Feeds (Rewrite, Append, Update) www.sadasdb.com SQL, ODBC, JDBC, SCI • Multidimensional Analysis • Analytics Reporting Data Warehouse La soluzione SADAS per il Data Warehouse La nostra soluzione trae beneficio dalle caratteristiche di Sadas Engine, la nostra tecnologia principale: un DBMS colonnare progettato specificatamente per garantire prestazioni eccezionali in ambienti Data Warehouse. Sadas Engine è un DBMS rivoluzionario che soddisfa le esigenze delle aziende nelle loro attività quotidiane di recuperare, analizzare e gestire i dati. È facile da integrare con le diverse fonti dei dati e molto efficiente in tutte le attività di ETL. Inoltre, il suo front-end per cruscotti e report è semplice e pronto all’uso. L’utente ha tutto ciò che serve in un’unica soluzione. Loading Time Average Inquiry Time SADAS Altro DBMS 25 20 15 10 5 0 Funzioni e caratteristiche Database colonnare: efficiente, veloce, affidabile ed economico. Tecnologia specifica: indici e strutture innovative, funzioni di “Intelligent Upload” e “Learn by Usage”, ovvero capacità di auto-adattarsi a nuove condizioni d’uso, ridotta necessità di amministrazione e tuning. One stop shop: con Sadas hai tutto ciò che serve per implementare, caricare e usare il data warehouse. Hardware commerciale: nessun bisogno di appliance specifici e costosi o di licenze di terze parti. Vantaggi della soluzione SADAS Alte performance: la soluzione più veloce e più efficiente per assicurare risultati eccezionali in attività di caricamento e analisi. Basso TCO: Sadas taglia il TCO potendo funzionare su hardware a basso costo ed offrendo una politica commerciale flessibile. Implementazione rapida: processo di installazione e personalizzazione rapidi, garantendo più tempo da dedicare ad una migliore progettazione e analisi. Costi di manutenzione contenuti: non sono necessari interventi da parte di DBA, risparmiando risorse e costi di gestione e tuning. Compatibilità: Sadas può essere introdotto senza alcuna difficoltà in qualunque ambiente. Statistiche da un business case sul DWH Numero schemi > 200 Numero totale utenti > 6 500 Numero tabelle >150 000 Numero utenti medio per giorno > 1 000 Numero totale record > 38 miliardi (~20 TB) Frequenza aggiornamento dati Qualsiasi Tabella più grande > 2 miliardi di record Record aggiornati giornalieri > 8 miliardi (~3 TB) Numero query al giorno > 2 600 000 Modalità aggiornamento dati rewrite, append, update, Tempo medio di risposta < 0,1 sec delete, insert SADAS fornisce servizi e soluzioni tecnologiche per l’analisi e la governance dei dati in settori diversi ed eterogenei, assieme ad una gamma di prodotti innovativi per la Business Intelligence. SADAS fornisce anche servizi di consulenza e formazione a livello internazionale sulla Data Governance e l’Information Management grazie alle competenze del suo team UK, coordinato da Christopher M. Bradley - Presidente di DAMA UK. Per saperne di più visitate i nostri siti www.sadasdb.com e www.getsadas.com, o scrivete a [email protected] MILANO Sede centrale Via Boschetti, 1 • 20121, Milano Tel: +39 02 29017449 ROMA Direzione commerciale Via Principessa Clotilde, 7 • 00196, Roma Tel: +39 06 83089713 / fax: +39 06 8928 1917 NAPOLI Sede Legale, Customer Service, Laboratori R&D Via Napoli, 159 • 80013, Casalnuovo di Napoli (NA) Tel: +39 081 8427112 / fax: +39 081 8427171 rev003 BATH - Consulenza e Formazione 1 Priory Close • Bath, BA2 5AL, UK Tel. +44 1225 637004 SAN FRANCISCO - USA international office 20 California St. 7th floor • San Francisco, CA, 94111, USA Tel. +1 415 429 3969