F A C T
S H E E T
SAS® Data Quality Solution
Trasformare i dati in informazioni consistenti cui fare solido
affidamento sia in contesti strategici che operativi.
Gli investimenti in CRM, Data
Warehouse e Business Intelligence,
progetti ERP ed altre iniziative
strategiche, permettono di accedere
ad informazioni di elevata qualità sui
clienti, fornitori ed altre entità di
business. Tuttavia la presenza di dati
“sporchi”, presenti in molte
organizzazioni, non permettono il
conseguimento dei risultati attesi.
Occorre dotarsi di strumenti software
adatti per la gestione e il trattamento
dei dati affinché sia possibile il
conseguimento della “vista unica”
delle informazioni e accrescere il
volume degli affari, abbattere i costi e
mantenere salde le relazioni con il
mercato.
SAS Data Quality è una potente
soluzione per la profilazione e analisi,
la bonifica, l'arricchimento e
l'integrazione dei dati al fine di
accrescere significativamente
l'efficienza dei risultati delle iniziative
strategiche e operative aziendali.
Con l'integrazione delle funzionalità
di data quality all'interno dei processi
ETL, le aziende possono trasformare
e combinare dati disparati ed
eterogenei fra loro, rimuovere
inesattezze, “pulirli”, standardizzarli
sulla base di valori comuni e
applicare regole per il parsing al fine
di creare un patrimonio informativo
strategico ed affidabile, migliorando i
processi decisionali.
Ogni anno nel mondo vengono
spesi miliardi di dollari a causa
della scarsa qualità dei dati. SAS
Data Quality Solution consente alle
aziende di accrescere l'affidabilità
delle informazioni disponibili,
ridurre i costi operativi e
incrementare l'efficacia delle
iniziative strategiche.
La crescita costante dei volumi dei
dati, inoltre, impone un approccio
corretto alla loro qualità. Sono molti i
fattori che ostacolano i dipartimenti
IT nelle attività di consolidamento e
distribuzione di informazioni affidabili
in azienda - crescita del numero dei
sistemi e degli standard, informazioni
provenienti da terze parti non
facilmente integrabili, duplicazioni e
ridondanze dei dati e delle
applicazioni.
Principali benefici
Per chi è stato concepito SAS Data
Quality Solution?
Molte organizzazioni non sono
consapevoli dell'effettivo stato
qualitativo dei dati finché i progetti
strategici non generano risultati
inattesi. L’inserimento dei dati è fra le
cause più comuni dei problemi di
qualità: ad esempio, il nominativo
inserito come “Mario Rossi” non
viene riconosciuto dal sistema come
“M. Rossi”, causando anomalie e
ridondanze. Le possibilità di
immissione di errori possono essere
molteplici in un contesto
transazionale dove gli utenti
inseriscono dati manualmente
commettendo errori di digitazione e
ortografici, lasciano spazi vuoti,
aggiungono informazioni “extra”, ecc.
La variazione di un nome di un
cliente, infatti, costringe il sistema a
registrare il contatto come un nuovo
cliente impedendo la correlazione di
importanti informazioni che
potrebbero rivelare opportunità di
business ulteriori e/o fare luce su
aspetti sinora sconosciuti.
Quali sono le caratteristiche
principali di SAS Data Quality
Solution?
SAS Data Quality Solution è la
soluzione enterprise per la
profilazione, la verifica, la bonifica,
l'arricchimento e l'integrazione dei
dati per generare informazioni
coerenti ed affidabili, accrescendo
il valore ed incrementando i ritorni
delle iniziative aziendali.
Quale è l'importanza di SAS Data
Quality Solution?
SAS Data Quality Solution si rivolge
principalmente a due tipologie di
utenti: quelli di business, inclusi i
business analyst, data analyst e
data steward, responsabili sia delle
regole di business e delle relazioni
fra i dati, anche per il supporto alla
Business Intelligence, e gli utenti
tecnici, quali i database
administrator, warehouse manager
ed altri professionisti dell'IT,
affinché possano più agevolmente
assicurare che il livello qualitativo
dei dati sia aderente agli standard
definiti ed esteso in tutta l'azienda.
®
SAS
9
• Profilare, monitorare e gestire la
qualità dei dati aziendali. SAS
Data Quality Solution consente alle
organizzazioni di individuare
facilmente imprecisioni e
incongruenze nei dati e permette
una migliore pianificazione ed
esecuzione progettuale.
• Integrare e standardizzare i dati
in molteplici sistemi e unità di
business. Grazie a SAS Data
Quality Solution le aziende possono
incorporare regole di business per
la bonifica, la standardizzazione dei
dati in molteplici sorgenti e
piattaforme. Le capacità end-to-end
per la verifica consentono di
mettere in evidenza inesattezze e
problematiche di qualità dei dati
presenti nelle strutture informative
mediante algoritmi per il data quality
e di determinare lo sforzo
necessario per correggerli.
Attraverso processi standard e
customizzati, i dati possono essere
regolati e standardizzati per
conseguire la “vista unica” delle
informazioni aziendali.
• Definire in modo semplice regole
di correzione per riflettere i
cambiamenti aziendali e pulire i
dati. La soluzione fornisce un set
completo di strumenti di data
quality e di interfacce di facile
utilizzo ideate per soddisfare le
esigenze degli utenti sia tecnici che
di business. L'interfaccia guidata
permette la definizione delle regole
su dati provenienti da qualsiasi
piattaforma e formato, anche in
tempo reale.
®
• Fornire ai decisori aziendali
informazioni affidabili. Integrando
le funzionalità per il data quality
all'interno dei processi ETL e di
Data Integration, i dati impiegati
all'interno degli ambienti analitici e
di business intelligence saranno
sempre precisi e tempestivi,
garantendo maggiore efficacia ed
affidabilità alla reportistica per il
supporto alle decisioni.
Caratteristiche e funzionalità
La soluzione SAS Data Quality
fornisce un set completo di strumenti
di data quality e di interfacce
grafiche che consentono di effettuare
il profiling dei dati per la verifica degli
errori. SAS Data Quality può eseguire
regole di qualità dei dati, senza limiti
rispetto alla piattaforma e al formato.
Quando vengono identificati dati
errati o non conformi allo standard
qualitativo aziendale, la soluzione
facilita la loro pulizia ed
arricchimento, garantendone
coerenza e precisione.
SAS Data Quality:
• Riduce le finestre temporali ed i
costi per implementare iniziative
strategiche di successo come
CRM, Data Warehouse e Business
Intelligence, grazie alla disponibilità
di dati ed informazioni valide ed
affidabili.
• Permette la realizzazione di una
vista consolidata circa il parco
clienti favorendo attività di crossselling, up-selling, migliorando le
relazioni con il mercato.
• Aiuta a migliorare il livello qualitativo
del servizio e del supporto al cliente
e agevola l'individuazione dei clienti
più profittevoli.
Interfaccia potente e easy-to-use
Gli utenti di business e i tecnici
possono operare in un ambiente di
lavoro intuitivo per analizzare i dati di
cui dispongono, definire regole di
business e crearne altre per utenti
più tecnici, volte alla
standardizzazione ed al confronto dei
dati. Ciò permette la comprensione
dell'impatto dei dati non accurati, la
facile definizione di regole volte alla
loro standardizzazione ed incremento
qualitativo mediante l'adozione di
regole ripetibili e riutilizzabili.
Data profiling
Il data profiling permette alle
organizzazioni di individuare le
imprecisioni e incongruenze dei dati
e per una migliore pianificazione ed
esecuzione dei progetti. La soluzione
SAS Data Quality identifica la
struttura, il contenuto e la qualità dei
dati, validandoli secondo le necessità
prima dello sviluppo progettuale. Il
Data Profiling consente inoltre la
riduzione dei costi e dei ritardi
operativi approcciando ai problemi
durante il disegno anzichè durante la
fase di produzione.
Pulizia e standardizzazione
Strumenti di facile utilizzo
consentono ad utenti di business e
tecnici di analizzare i dati,
standardizzare gli elementi, applicare
regole di correzione, eliminare
incongruenze e garantire precisione
di analisi.
Matching ed eliminazione dei
duplicati
Gli algoritmi di matching possono
unire e comporre dati dissimili
provenienti da molteplici sistemi
sorgente utilizzando l'euristica e la
fonetica dei dati. Ciò permette di
creare una visione univoca delle
informazioni, senza dover ricorrere
ad attività di deduplica dei dati sulla
base di mere supposizioni quando
non è possibile determinare con
precisione un matching. Vengono
creati valori chiave univoci con la
logica fuzzy per raggruppare
informazioni con valori simili (per
esempio, Robert, Bob e Bobby) per
uno o più campi. E' possibile
rimuovere valori duplicati liberando
spazio sui dischi, fornendo
informazioni omogenee e consistenti
in tutti i sistemi sorgente ove hanno
origine i dati.
Analisi di identificazione
Questa funzionalità determina il
sesso di un individuo,
un'informazione che può essere utile
nella segmentazione dei dati per
scopi di marketing. Può inoltre
stabilire se un valore si riferisce ad
una persona o ad un'organizzazione,
indicazione che può essere utilizzata
per selezionare il tipo di servizio
offerto.
SAS Data Quality Solution è dotato di una interfaccia guidata, easy-to-use, che permette di
individuare inconsistenze ed imprecisioni fra i dati e condurre attività volte alla loro pulizia ed
arricchimento, garantendone coerenza ed affidabilità per l'intero patrimonio informativo
aziendale.
Personalizzazione
La personalizzazione degli algoritmi
e delle regole di analisi, matching e
standardizzazione offre la capacità di
controllare il processo di data quality
in base alle esigenze di business di
una singola organizzazione.
Per esempio, è possibile migliorare o
creare regole per controllare la
struttura dei codici, delle quantità e
altre caratteristiche di un prodotto in
una stringa di dati.
Funzionalità Chiave
Interfaccia utente grafica, potente e di facile utilizzo
• L'ambiente Windows consente agli utenti di analizzare dati, definire regole di business,
standardizzare i dati e creare specifiche di data matching/integrazione per gli utenti IT.
Funzionalità di data profiling
• Un ambiente robusto analizza i dati aziendali per determinarne sfumature, discrepanze e
imprecisioni.
• L'interfaccia consente di determinare le aree di scarsa qualità dei dati e l'impegno
necessario per porvi rimedio.
Data cleansing, eliminazione dei duplicati e standardizzazione
Supporto internazionale
La soluzione SAS Data Quality
riconosce le differenze tra le lingue,
inclusi nomi, indirizzi, organizzazioni,
telefoni, ecc. Per esempio, un
indirizzo italiano non contiene gli
stessi dati di un indirizzo americano
e non viene suddiviso in parti
seguendo la medesima regola. La
soluzione SAS Data Quality offre la
possibilità di standardizzare
correttamente i dati in più lingue,
incluso l'italiano.
• Offre la possibilità di eliminare o ridurre le incongruenze nei dati aziendali.
• Consente di rimuovere i record duplicati da un database di clienti, fornitori, ecc.
Generazione di matching code (chiavi con elementi singoli o compositi)
• Consolida i dati derivanti da più origini quando non è possibile un matching completo.
• Crea valori chiave univoci con la logica fuzzy per raggruppare informazioni con valori simili
(per esempio, Robert, Bob, Bobby, ecc.) per uno o più campi.
Analisi di identificazione
• Determina il sesso di un individuo per scopi di marketing.
• Determina se un valore è una persona o un'organizzazione.
Personalizzazione di algoritmi di analisi, standardizzazione e confronto
Sfruttare le potenti funzionalità per
la Data Integration di SAS
La soluzione SAS Data Quality può
essere applicata a qualsiasi origine
dati supportata da SAS su una
qualunque piattaforma, garantendo
piena scalabilità al crescere dei
volumi dei dati aziendali ed
accrescendo la qualità di tutti i
processi ETL e delle strategie di data
integration. La soluzione SAS Data
Quality presenta un'interfaccia di
facile utilizzo che consente di
individuare le incongruenze e le
imprecisioni dei dati e un ambiente
server robusto che offre la potenza
necessaria per analizzare nel tempo
la qualità dei dati in tutta
l'organizzazione. SAS assicura
pertanto piena compatibilità con le
tradizionali esigenze di elaborazione
schedulate, che processano in
modalità “batch” grosse quantità di
dati aziendali, e soddisfa l'emergente
necessità di arricchimento dinamico
di qualsiasi infrastruttura mediante lo
sfruttamento delle potenzialità
dell'integrazione in tempo reale.
Estendere il valore delle soluzioni
per la Business Intelligence di SAS
L'integrazione delle funzionalità per il
data quality all'interno delle soluzioni
di business intelligence consente il
conseguimento di risultati migliori,
più affidabili ed il conseguimento del
ritorno dell'investimento atteso.
• Consente di personalizzare algoritmi di analisi, matching e standardizzazione.
• Crea o potenzia le regole utilizzate per analizzare le parti dei nomi, indirizzi, e-mail, codici di
prodotti e altri dati di business.
• Aggiunge regole agli algoritmi di matching che definiscono quale parte di una stringa di dati
ha il peso maggiore in un matching.
• Una Common Quality Knowledge Base (QKB) consente di condividere queste informazioni tra
differenti ambienti hardware e software.
Analisi di Identificazione
• Determinazione del genere di un individuo per propositi di marketing/commerciali.
• Determinare se un valore si riferisce ad una persona fisica o ad una persona giuridica.
Capacità di distinguere a livello internazionale numerosi costrutti specifici della lingua e
del paese
• Comprende le differenze tra varie lingue, inclusi nomi, indirizzi, organizzazioni e altre aree in
cui occorre analizzare i dati.
• Applica automaticamente le regole della nazione di riferimento.
Utilizzo delle potenti funzionalità per la Data Integration di SAS
• L'integrazione con le funzionalità SAS, consente alla soluzione SAS Data Quality di far parte
di una strategia globale di ETL o di integrazione dei dati.
• Il processo di data quality può essere applicato a qualsiasi origine dati supportata da SAS su
qualunque piattaforma, assicurando la scalabilità a livello aziendale.
• Un approccio interattivo al data quality limita gli sforzi necessari per creare regole di business.
Estendere il valore delle Soluzioni SAS per la Business & Analytic Intelligence
• L'integrazione delle funzionalità di data quality all'interno delle soluzioni per la business
intelligence permette di conseguire risultati migliori assicurando il ritorno sugli investimenti
atteso.
SAS® Data Quality Solution
Technical Requirements
Client environment
• Windows (x86-32): Windows 2000
Professional, Windows XP Professional,
Windows NT 4.o Workstation
Server environment
• AIX (64-bit), Release 5.1+
• HP/UX (64-bit), Release 11i+*
Required/optional software
• HP/UX Itanium (64-bit), Release 11i+
• Base SAS
• Linux per Intel (32-bit): Red Hat Linux 8.0,
RHAS 2.1, RHEL 3.0, SuSE SLES 8, SLES 9
• Optional SAS software:
• Linux for Intel (32-bit): Red Hat Linux 8.0,
RHAS 2.1, RHEL 3.0, SuSE SLES 8, SLES 9
• Linux for Itanium (64-bit):
Red Hat RHEL 3.0
• OpenVMS Alpha (64-bit), Release 7.2+
(excluding Release 7.3)*
• OS/390, Version 3, Release 10*
• Solaris (64-bit), Version 8, 9 or 10 on
SPARC
• Tru64 UNIX (64-bit), Version 5.1A or 5.1B
• SAS Data Integration Studio (data quality
transformation plug-ins)
• SAS/ACCESS (access to third-party
databases)
• Additional Quality Knowledge Base
(QKB) locales
• Optional software from Dataflux
(a SAS company):
• dfPower Verify (CASS, SERP, U.S.
Geocode, Canadian Geocode, phone and
ZIP code analysis)
• Windows (x86-32): Windows 2000
Professional, Windows XP Professional,
Windows NT 4 Server*
• Additonal QKB locales (also available
from SAS)
• Windows (64-bit on Itanium): Windows
Server 2003
• dfIntelliServer (real-time client/server
capabilities)
• z/OS, Version 1
• dfConnector for SAP
* Note: SAS Metadata Server must be
installed on an alternate supported
platform.
• SAS Data Quality Solution is also included
as part of the SAS Enterprise Data
Integration Server.
• BlueFusion SDK