F A C T S H E E T SAS® Data Quality Solution Trasformare i dati in informazioni consistenti cui fare solido affidamento sia in contesti strategici che operativi. Gli investimenti in CRM, Data Warehouse e Business Intelligence, progetti ERP ed altre iniziative strategiche, permettono di accedere ad informazioni di elevata qualità sui clienti, fornitori ed altre entità di business. Tuttavia la presenza di dati “sporchi”, presenti in molte organizzazioni, non permettono il conseguimento dei risultati attesi. Occorre dotarsi di strumenti software adatti per la gestione e il trattamento dei dati affinché sia possibile il conseguimento della “vista unica” delle informazioni e accrescere il volume degli affari, abbattere i costi e mantenere salde le relazioni con il mercato. SAS Data Quality è una potente soluzione per la profilazione e analisi, la bonifica, l'arricchimento e l'integrazione dei dati al fine di accrescere significativamente l'efficienza dei risultati delle iniziative strategiche e operative aziendali. Con l'integrazione delle funzionalità di data quality all'interno dei processi ETL, le aziende possono trasformare e combinare dati disparati ed eterogenei fra loro, rimuovere inesattezze, “pulirli”, standardizzarli sulla base di valori comuni e applicare regole per il parsing al fine di creare un patrimonio informativo strategico ed affidabile, migliorando i processi decisionali. Ogni anno nel mondo vengono spesi miliardi di dollari a causa della scarsa qualità dei dati. SAS Data Quality Solution consente alle aziende di accrescere l'affidabilità delle informazioni disponibili, ridurre i costi operativi e incrementare l'efficacia delle iniziative strategiche. La crescita costante dei volumi dei dati, inoltre, impone un approccio corretto alla loro qualità. Sono molti i fattori che ostacolano i dipartimenti IT nelle attività di consolidamento e distribuzione di informazioni affidabili in azienda - crescita del numero dei sistemi e degli standard, informazioni provenienti da terze parti non facilmente integrabili, duplicazioni e ridondanze dei dati e delle applicazioni. Principali benefici Per chi è stato concepito SAS Data Quality Solution? Molte organizzazioni non sono consapevoli dell'effettivo stato qualitativo dei dati finché i progetti strategici non generano risultati inattesi. L’inserimento dei dati è fra le cause più comuni dei problemi di qualità: ad esempio, il nominativo inserito come “Mario Rossi” non viene riconosciuto dal sistema come “M. Rossi”, causando anomalie e ridondanze. Le possibilità di immissione di errori possono essere molteplici in un contesto transazionale dove gli utenti inseriscono dati manualmente commettendo errori di digitazione e ortografici, lasciano spazi vuoti, aggiungono informazioni “extra”, ecc. La variazione di un nome di un cliente, infatti, costringe il sistema a registrare il contatto come un nuovo cliente impedendo la correlazione di importanti informazioni che potrebbero rivelare opportunità di business ulteriori e/o fare luce su aspetti sinora sconosciuti. Quali sono le caratteristiche principali di SAS Data Quality Solution? SAS Data Quality Solution è la soluzione enterprise per la profilazione, la verifica, la bonifica, l'arricchimento e l'integrazione dei dati per generare informazioni coerenti ed affidabili, accrescendo il valore ed incrementando i ritorni delle iniziative aziendali. Quale è l'importanza di SAS Data Quality Solution? SAS Data Quality Solution si rivolge principalmente a due tipologie di utenti: quelli di business, inclusi i business analyst, data analyst e data steward, responsabili sia delle regole di business e delle relazioni fra i dati, anche per il supporto alla Business Intelligence, e gli utenti tecnici, quali i database administrator, warehouse manager ed altri professionisti dell'IT, affinché possano più agevolmente assicurare che il livello qualitativo dei dati sia aderente agli standard definiti ed esteso in tutta l'azienda. ® SAS 9 • Profilare, monitorare e gestire la qualità dei dati aziendali. SAS Data Quality Solution consente alle organizzazioni di individuare facilmente imprecisioni e incongruenze nei dati e permette una migliore pianificazione ed esecuzione progettuale. • Integrare e standardizzare i dati in molteplici sistemi e unità di business. Grazie a SAS Data Quality Solution le aziende possono incorporare regole di business per la bonifica, la standardizzazione dei dati in molteplici sorgenti e piattaforme. Le capacità end-to-end per la verifica consentono di mettere in evidenza inesattezze e problematiche di qualità dei dati presenti nelle strutture informative mediante algoritmi per il data quality e di determinare lo sforzo necessario per correggerli. Attraverso processi standard e customizzati, i dati possono essere regolati e standardizzati per conseguire la “vista unica” delle informazioni aziendali. • Definire in modo semplice regole di correzione per riflettere i cambiamenti aziendali e pulire i dati. La soluzione fornisce un set completo di strumenti di data quality e di interfacce di facile utilizzo ideate per soddisfare le esigenze degli utenti sia tecnici che di business. L'interfaccia guidata permette la definizione delle regole su dati provenienti da qualsiasi piattaforma e formato, anche in tempo reale. ® • Fornire ai decisori aziendali informazioni affidabili. Integrando le funzionalità per il data quality all'interno dei processi ETL e di Data Integration, i dati impiegati all'interno degli ambienti analitici e di business intelligence saranno sempre precisi e tempestivi, garantendo maggiore efficacia ed affidabilità alla reportistica per il supporto alle decisioni. Caratteristiche e funzionalità La soluzione SAS Data Quality fornisce un set completo di strumenti di data quality e di interfacce grafiche che consentono di effettuare il profiling dei dati per la verifica degli errori. SAS Data Quality può eseguire regole di qualità dei dati, senza limiti rispetto alla piattaforma e al formato. Quando vengono identificati dati errati o non conformi allo standard qualitativo aziendale, la soluzione facilita la loro pulizia ed arricchimento, garantendone coerenza e precisione. SAS Data Quality: • Riduce le finestre temporali ed i costi per implementare iniziative strategiche di successo come CRM, Data Warehouse e Business Intelligence, grazie alla disponibilità di dati ed informazioni valide ed affidabili. • Permette la realizzazione di una vista consolidata circa il parco clienti favorendo attività di crossselling, up-selling, migliorando le relazioni con il mercato. • Aiuta a migliorare il livello qualitativo del servizio e del supporto al cliente e agevola l'individuazione dei clienti più profittevoli. Interfaccia potente e easy-to-use Gli utenti di business e i tecnici possono operare in un ambiente di lavoro intuitivo per analizzare i dati di cui dispongono, definire regole di business e crearne altre per utenti più tecnici, volte alla standardizzazione ed al confronto dei dati. Ciò permette la comprensione dell'impatto dei dati non accurati, la facile definizione di regole volte alla loro standardizzazione ed incremento qualitativo mediante l'adozione di regole ripetibili e riutilizzabili. Data profiling Il data profiling permette alle organizzazioni di individuare le imprecisioni e incongruenze dei dati e per una migliore pianificazione ed esecuzione dei progetti. La soluzione SAS Data Quality identifica la struttura, il contenuto e la qualità dei dati, validandoli secondo le necessità prima dello sviluppo progettuale. Il Data Profiling consente inoltre la riduzione dei costi e dei ritardi operativi approcciando ai problemi durante il disegno anzichè durante la fase di produzione. Pulizia e standardizzazione Strumenti di facile utilizzo consentono ad utenti di business e tecnici di analizzare i dati, standardizzare gli elementi, applicare regole di correzione, eliminare incongruenze e garantire precisione di analisi. Matching ed eliminazione dei duplicati Gli algoritmi di matching possono unire e comporre dati dissimili provenienti da molteplici sistemi sorgente utilizzando l'euristica e la fonetica dei dati. Ciò permette di creare una visione univoca delle informazioni, senza dover ricorrere ad attività di deduplica dei dati sulla base di mere supposizioni quando non è possibile determinare con precisione un matching. Vengono creati valori chiave univoci con la logica fuzzy per raggruppare informazioni con valori simili (per esempio, Robert, Bob e Bobby) per uno o più campi. E' possibile rimuovere valori duplicati liberando spazio sui dischi, fornendo informazioni omogenee e consistenti in tutti i sistemi sorgente ove hanno origine i dati. Analisi di identificazione Questa funzionalità determina il sesso di un individuo, un'informazione che può essere utile nella segmentazione dei dati per scopi di marketing. Può inoltre stabilire se un valore si riferisce ad una persona o ad un'organizzazione, indicazione che può essere utilizzata per selezionare il tipo di servizio offerto. SAS Data Quality Solution è dotato di una interfaccia guidata, easy-to-use, che permette di individuare inconsistenze ed imprecisioni fra i dati e condurre attività volte alla loro pulizia ed arricchimento, garantendone coerenza ed affidabilità per l'intero patrimonio informativo aziendale. Personalizzazione La personalizzazione degli algoritmi e delle regole di analisi, matching e standardizzazione offre la capacità di controllare il processo di data quality in base alle esigenze di business di una singola organizzazione. Per esempio, è possibile migliorare o creare regole per controllare la struttura dei codici, delle quantità e altre caratteristiche di un prodotto in una stringa di dati. Funzionalità Chiave Interfaccia utente grafica, potente e di facile utilizzo • L'ambiente Windows consente agli utenti di analizzare dati, definire regole di business, standardizzare i dati e creare specifiche di data matching/integrazione per gli utenti IT. Funzionalità di data profiling • Un ambiente robusto analizza i dati aziendali per determinarne sfumature, discrepanze e imprecisioni. • L'interfaccia consente di determinare le aree di scarsa qualità dei dati e l'impegno necessario per porvi rimedio. Data cleansing, eliminazione dei duplicati e standardizzazione Supporto internazionale La soluzione SAS Data Quality riconosce le differenze tra le lingue, inclusi nomi, indirizzi, organizzazioni, telefoni, ecc. Per esempio, un indirizzo italiano non contiene gli stessi dati di un indirizzo americano e non viene suddiviso in parti seguendo la medesima regola. La soluzione SAS Data Quality offre la possibilità di standardizzare correttamente i dati in più lingue, incluso l'italiano. • Offre la possibilità di eliminare o ridurre le incongruenze nei dati aziendali. • Consente di rimuovere i record duplicati da un database di clienti, fornitori, ecc. Generazione di matching code (chiavi con elementi singoli o compositi) • Consolida i dati derivanti da più origini quando non è possibile un matching completo. • Crea valori chiave univoci con la logica fuzzy per raggruppare informazioni con valori simili (per esempio, Robert, Bob, Bobby, ecc.) per uno o più campi. Analisi di identificazione • Determina il sesso di un individuo per scopi di marketing. • Determina se un valore è una persona o un'organizzazione. Personalizzazione di algoritmi di analisi, standardizzazione e confronto Sfruttare le potenti funzionalità per la Data Integration di SAS La soluzione SAS Data Quality può essere applicata a qualsiasi origine dati supportata da SAS su una qualunque piattaforma, garantendo piena scalabilità al crescere dei volumi dei dati aziendali ed accrescendo la qualità di tutti i processi ETL e delle strategie di data integration. La soluzione SAS Data Quality presenta un'interfaccia di facile utilizzo che consente di individuare le incongruenze e le imprecisioni dei dati e un ambiente server robusto che offre la potenza necessaria per analizzare nel tempo la qualità dei dati in tutta l'organizzazione. SAS assicura pertanto piena compatibilità con le tradizionali esigenze di elaborazione schedulate, che processano in modalità “batch” grosse quantità di dati aziendali, e soddisfa l'emergente necessità di arricchimento dinamico di qualsiasi infrastruttura mediante lo sfruttamento delle potenzialità dell'integrazione in tempo reale. Estendere il valore delle soluzioni per la Business Intelligence di SAS L'integrazione delle funzionalità per il data quality all'interno delle soluzioni di business intelligence consente il conseguimento di risultati migliori, più affidabili ed il conseguimento del ritorno dell'investimento atteso. • Consente di personalizzare algoritmi di analisi, matching e standardizzazione. • Crea o potenzia le regole utilizzate per analizzare le parti dei nomi, indirizzi, e-mail, codici di prodotti e altri dati di business. • Aggiunge regole agli algoritmi di matching che definiscono quale parte di una stringa di dati ha il peso maggiore in un matching. • Una Common Quality Knowledge Base (QKB) consente di condividere queste informazioni tra differenti ambienti hardware e software. Analisi di Identificazione • Determinazione del genere di un individuo per propositi di marketing/commerciali. • Determinare se un valore si riferisce ad una persona fisica o ad una persona giuridica. Capacità di distinguere a livello internazionale numerosi costrutti specifici della lingua e del paese • Comprende le differenze tra varie lingue, inclusi nomi, indirizzi, organizzazioni e altre aree in cui occorre analizzare i dati. • Applica automaticamente le regole della nazione di riferimento. Utilizzo delle potenti funzionalità per la Data Integration di SAS • L'integrazione con le funzionalità SAS, consente alla soluzione SAS Data Quality di far parte di una strategia globale di ETL o di integrazione dei dati. • Il processo di data quality può essere applicato a qualsiasi origine dati supportata da SAS su qualunque piattaforma, assicurando la scalabilità a livello aziendale. • Un approccio interattivo al data quality limita gli sforzi necessari per creare regole di business. Estendere il valore delle Soluzioni SAS per la Business & Analytic Intelligence • L'integrazione delle funzionalità di data quality all'interno delle soluzioni per la business intelligence permette di conseguire risultati migliori assicurando il ritorno sugli investimenti atteso. SAS® Data Quality Solution Technical Requirements Client environment • Windows (x86-32): Windows 2000 Professional, Windows XP Professional, Windows NT 4.o Workstation Server environment • AIX (64-bit), Release 5.1+ • HP/UX (64-bit), Release 11i+* Required/optional software • HP/UX Itanium (64-bit), Release 11i+ • Base SAS • Linux per Intel (32-bit): Red Hat Linux 8.0, RHAS 2.1, RHEL 3.0, SuSE SLES 8, SLES 9 • Optional SAS software: • Linux for Intel (32-bit): Red Hat Linux 8.0, RHAS 2.1, RHEL 3.0, SuSE SLES 8, SLES 9 • Linux for Itanium (64-bit): Red Hat RHEL 3.0 • OpenVMS Alpha (64-bit), Release 7.2+ (excluding Release 7.3)* • OS/390, Version 3, Release 10* • Solaris (64-bit), Version 8, 9 or 10 on SPARC • Tru64 UNIX (64-bit), Version 5.1A or 5.1B • SAS Data Integration Studio (data quality transformation plug-ins) • SAS/ACCESS (access to third-party databases) • Additional Quality Knowledge Base (QKB) locales • Optional software from Dataflux (a SAS company): • dfPower Verify (CASS, SERP, U.S. Geocode, Canadian Geocode, phone and ZIP code analysis) • Windows (x86-32): Windows 2000 Professional, Windows XP Professional, Windows NT 4 Server* • Additonal QKB locales (also available from SAS) • Windows (64-bit on Itanium): Windows Server 2003 • dfIntelliServer (real-time client/server capabilities) • z/OS, Version 1 • dfConnector for SAP * Note: SAS Metadata Server must be installed on an alternate supported platform. • SAS Data Quality Solution is also included as part of the SAS Enterprise Data Integration Server. • BlueFusion SDK