L A T E C H N O L O G Y Roma, 25-26 Giugno, 2015 Residenza di Ripetta Via di Ripetta, 231 T R A N S F E R P R E S E N T A INTERNATIONAL SUMMIT 2 0 1 5 Data Management, Analytics e Business Intelligence D E S C R I Z I O N Molte aziende usano i reports di Business Intelligence e i dashboards per misurare la Business Performance a livello strategico, tattico e operativo. Ma oggi il business richiede molto più che la BI descrittiva e si cerca di implementare lʼanalitica predittiva e prescrittiva. Per fare questo molte aziende stanno creando dei gruppi di analitica avanzata nei dipartimenti di business per favorirne lo sviluppo al fine di avere un vantaggio competitivo. E questo sta avvenendo sia nei tradizionali ambienti di Data Warehouse che nei nuovi ambienti di Big Data dove i Data Scientists stanno analizzando nuove sorgenti dati multi-strutturati per produrre nuovi modelli e nuove conoscenze. Anche gli Analisti di Business stanno usando questa analitica nei tools visuali di Data Discovery. Inoltre lʼanalitica viene incastonata nelle applicazioni per ottimizzare le operazioni di business. Unʼaltra scommessa è rappresentata dal numero di sorgenti dati a cui le aziende stanno accedendo per catturare dati da analizzare e ricavarne un vantaggio competitivo nel business. Dati del clikstream, dati dai social network, dati metereologici, dati dei sensori, dati di posizione ecc. Ma le domande sono: cosa dovrebbero fare le aziende con questi dati? Come dovrebbero essere organizzati e memorizzati? Lʼemergere di Hadoop ha fatto sì che Data Cleansing e integrazione siano stati portati fuori dai Data Warehouses e collocati in ambienti Hadoop più economici ma tutto questo a discapito della Data Governance. Come governare i dati negli ambienti Big Data e nei tradizionali ambienti Data Warehouses? Cosa succede se i dati strutturati vengono portati dentro Hadoop? Questo Summit esamina i trends nellʼAnalitica di Business e Business Intelligence e spiega come le aziende dovrebbero gestire e governare tutta questa massa di dati. E D E S C R I Z I O N Gli argomenti trattati nel Summit includono: • Nuove Architetture Analitiche: il ruolo di un Data Reservoir e di una Data Refinery • Lʼimpatto dellʼintegrazione dei dati self-service: Caos o Governance dei dati? • Organizzazione 2.0 della BI: il ruolo sempre crescente di Data Scientists e Analisti di Business • Tecniche di Agile Data Modelling per ambienti tradizionali e Big Data Analytical • Best Practices nella Data Discovery e Data Visualization • Analitica avanzata e predittiva per la Big Data Enterprise • Cinque livelli di Business Intelligence nel Cloud • Actionable Intelligence usando Storytelling e Collaborative BI E SPEAKERS Mike Ferguson Mike Ferguson Claudia Imhoff Barry Devlin È Managing Director di Intelligent Business Strategies Limited. Come analista e consulente è specializzato in Business Intelligence, Analytics, Rick van der Lans Big Data e Data Management. Ha più di 32 per importanti aziende, è stato speaker in numerosissimi eventi in tutto il mondo e ha scritto numerosi articoli tecnici. È stato Principal e un co-fondatore della Codd & Date Europe Limited, Chief Archiect con Teradata e Direttore europeo di Database Associates. Rick van der Lans È un analista indipendente, consulente, autore e docente specializzato nel Data Warehousing, Business Intelligence, Big Data, Data Virtualization e tecnologia database. È Managing Director di R20/Consultancy, è un docente di fama internazionale, scrive per diversi siti Web, tra cui il ben noto B-eyeNetwork .com ed è l’autore di numerosi articoli tecnici. I suoi libri di successo, tra cui Introduction to SQL e SQL for MySQL Developers sono stati tradotti in molte lingue e hanno venduto oltre 100.000 copie. Il suo ultimo libro di recente pubblicazione si intitola Data Virtualization for Business Intelligence Systems. SCHEDA D’ISCRIZIONE anni di esperienza di IT, ha operato consulenze Da restituire compilata a: Technology Transfer Piazza Cavour, 3 - 00193 Roma Tel. 06-6832227 Fax 06-6871102 www.technologytransfer.it [email protected] Partecipanti Questo Summit si rivolge a Professionisti, Managers e Architetti di IT che vogliono conoscere e capire in maniera approfondita gli ultimi sviluppi nel Data Management, nella Business Analytics e nella Business Intelligence. Claudia Imhoff È una autorità riconosciuta a livello internazionale nei campo dell’analitica, Business Intelligence e delle architetture che supportano queste iniziative. È stata co-autrice di cinque libri e ha scritto più di 150 articoli tecnici su questi argomenti. È QUOTA DI PARTECIPAZIONE Euro 1400 (+IVA) La quota di partecipazione comprende documentazione, colazioni di lavoro e coffee breaks. MODALITÀ DI ISCRIZIONE Il pagamento della quota, IVA inclusa, dovrà essere effettuato tramite bonifico, codice Iban: IT 03 W 06230 03202 000057031348 Banca: Cariparma Agenzia 1 di Roma intestato alla Technology Transfer S.r.l. e la ricevuta di versamento inviata insieme alla scheda di iscrizione a: TECHNOLOGY TRANSFER S.r.l. Piazza Cavour, 3 - 00193 ROMA (Tel. 06.6832227 - Fax 06. 6871102) CONDIZIONI GENERALI In caso di rinuncia con preavviso inferiore a 15 giorni verrà addebitato il 50% della quota di partecipazione, in caso di rinuncia con preavviso inferiore ad una settimana verrà addebitata l’intera quota. In caso di cancellazione del seminario, per qualsiasi causa, la responsabilità della Technology Transfer si intende limitata al rimborso delle quote di iscrizione già pervenute. SCONTI DI GRUPPO Se un’azienda iscrive allo stesso evento 5 partecipanti, pagherà solo 4 partecipazioni. Chi usufruisce di questa agevolazione non ha diritto ad altri sconti per lo stesso evento. fondatrice del Boulder BI Brain Trust, un consorzio di analisti ed esperti indipendenti riconosciuti a livello internazionale. Li potete seguire su Twitter al #BBBT o diventando un sottoscrittore nel sito www.bbbt.us. ISCRIZIONI IN ANTICIPO I partecipanti che si iscriveranno al seminario 30 giorni prima avranno uno sconto del 5%. entro il 10 Giugno 2015 ROMA 25-26 Giugno 2015 Residenza di Ripetta Via di Ripetta, 231 In caso di rinuncia o di cancellazione dei seminari valgono le condizioni generali riportate sopra. Quota di iscrizione Euro 1400 (+IVA) DURATA ED ORARIO 2 giorni: 9.30 - 13.00 14.00 - 17.00 International Summit 2015 Barry Devlin È una delle più eminenti personalità su Business Insight e uno dei creatori del Data Warehousing, avendo pubblicato il suo primo scritto su questa Nome architettura nel 1988. Ha più di 30 anni di Cognome esperienza di cui 20 come Distinguished Engineer Funzione aziendale in IBM. È un rispettatissimo consuletnte, analista, Azienda docente e autore. Il suo nuovo libro Business Partita IVA Codice fiscale unIntelligence – Insight and Innovation Indirizzo Beyond Analytics and Big Data è stato CAP pubblicato nell’Ottobre del 2013. È fondatore e Città Principal di 9sight Consulting, una azienda Provincia specializzata nelle implicazioni umane, Telefono Fax organizzative e tecniche di soluzioni di Business E-mail Insight che combinano ambienti operativi, informativi e collaborativi. Un regolare tweeter Timbro e firma isto È prevvizio il ser zione u di tradltanea simu Tutela dati personali Ai sensi dellʼart. 13 della legge n. 196/2003, il partecipante è informato che i suoi dati personali acquisiti tramite la scheda di partecipazione al seminario saranno trattati da Technology Transfer anche con lʼausilio di mezzi elettronici, con finalità riguardanti lʼesecuzione degli obblighi derivati dalla Sua partecipazione al seminario, per finalità statistiche e per lʼinvio di materiale promozionale dellʼattività di Technology Transfer. Il conferimento dei dati è facoltativo ma necessario per la partecipazione al seminario. Il titolare del trattamento dei dati è Technology Transfer, Piazza Cavour, 3 - 00193 Roma, nei cui confronti il partecipante può esercitare i diritti di cui allʼart. 13 della legge n. 196/2003. @BarryDevlin e un contributor di ITKnowledgeExchange e TDWI. Mr. Devlin vive a Cape Town, Sud Africa e opera in tutto il mondo. P R O G R A M M A Prima Giornata Sessione 1 Nuove Architetture Analitiche: il ruolo di un Data Reservoir e di una Data Refinery Barry Devlin La nuova tecnologia, soprattutto nello spazio Hadoop, comincia a essere sempre più popolare e pervasiva. Per dare un senso a questi tools, vendors, consulenti e anche clienti hanno cominciato a delineare architetture per sistemare i pezzi e mettere insieme le funzioni. Hanno sentito l’esigenza di diagrammi architetturali di Data Reservoirs (anche conosciuti come Data Lakes) e Data Refineries. Ma siamo ancora all’inizio. La sessione si sofferma su queste nuove architetture di analitica: • Cosa è la Data Reservoir/Lake e come si può comparare con il Data Warehouse? • Cosa è la Data Refinery e qual è la relazione con ETL? • Quali sono i benefici e gli aspetti negativi di queste nuove componenti architetturali? • Reservoirs e Refineries rimpiazzeranno o saranno complementari alle architetture tradizionali? • Quali tecnologie e quali tools sono necessari? Sessione 2 L’impatto dell’integrazione dei dati selfservice: Caos o Governance dei dati? Mike Ferguson Molte aziende oggi hanno sistemi di Data Warehouse e di Master Data Management e usano ETL processing per prendere, pulire e integrare i dati OLTP per popolare questi sistemi. Ma molte cose stanno cambiando. La sete di nuove sorgenti dati sia interne che esterne cresce includendo dati semi-strutturati e dati non strutturati. Questi nuovi dati hanno grandi volumi e sono creati ad una velocità molto alta. Questo ha prodotto la nascita di piattaforme di Big Data per supportare l’alta velocità dei dati in ingresso e l’exploratory analysis di queste nuove sorgenti dati. In aggiunta stanno emergendo dei tools di “Data Wrangling”. Questi tools si rivolgono agli utenti esperti di business per incoraggiarli a pulire e integrare i dati senza l’aiuto dell’IT. Allora la domanda è: ma, se gli utenti del business usano tools self-service di data integration, cosa succede con i tradizionali tools ETL? Come possono essere verificati i dati se gli utenti si fanno in proprio l’integrazione dei dati? Cosa provocherà questo self-service alle iniziative di Data Governance? La sessione cercherà di rispondere a queste domande. • L’emergenza del self-service Data Integration • Tools di Data Wrangling: cosa sono, come lavorano e chi sono i vendors? • Smart Data Management: statistiche, analitica e automazione • Piattaforme tradizionali di Data Management e self-service Data Integration • Perché ora è necessaria una collaborative data Governance • Integrazione dei metadati attraverso ambienti self-service e tradizionali Sessione 3 Organizzazione 2.0 della BI: il ruolo sempre crescente di Data Scientists e Analisti di Business Barry Devlin Per più di venti anni le aziende hanno distribuito BI in accordo con un modello organizzativo chiamato Centro di Competenza di BI. Questo modello ha fornito un approccio per rilasciare dati consistenti e controllati. Oggi le necessità di business hanno portato ad un’enfasi sempre crescente sulla Data Discovery e sulla self-service analysis. Le tecnologie Big Data e le sorgenti dati esterne hanno ridotto l’attenzione sui database e sul Data Management tradizionali. Ed è per questo che vengono oggi richiesti nuovi modi di organizzare e gestire l’informazione. Questa sessione esamina l’evoluzione di questo pensiero e mostra come: • I ruoli degli Analisti di Business e dei Data Scientists si stanno espandendo • Può essere trovato un bilanciamneto fra controllo formale e uso innovativo dei dati • Un nuovo ciclo adattabile di decisione può supportare la transizione dall’esplorazione alla produzione • Business e IT devono definire un nuovo e simbiotico approccio alla collaborazione per ottenere il massimo beneficio di business dall’informazione e dalla tecnologia Sessione 4 Tecniche di Agile Data Modelling per ambienti tradizionali e Big Data Analytical Rick van der Lans C’è stato un tempo in cui i Data Warehouses e i Data Marts venivano progettati usando le classiche tecniche di database design come normalizzazione e star schema. Ma il mondo del Data Modeling si sta escludendo a causa dei cambiamenti tecnologici. Per esempio, le tecniche di Data Vault Modeling sono state introdotte per sviluppare Data Warehouses che offrono una estensibilità del modello dati e la riproducibilità del reporting. Con i database servers NoSQL sono stati introdotti nuovi concetti database. Questi prodotti possono offrire un’alta velocità nell’immissione dei dati ma solo se i databases sono progettati in modo specifico. NoSQL e Hadoop offrono inoltre il concetto di schema-onread che ha un grande impatto sul Data Modeling. In aggiunta la virtualizzazione dei dati ha reso possibile lo sviluppo di Data Marts virtuali. Progettare Data Marts virtuali è molto diverso dal progetto fisico dei Data Marts. Insomma il Data Modeling è cambiato e questa sessione si sofferma su questi nuovi aspetti. • Le componenti del Data Vault Modeling: hubs, links e satelliti • Differenze fra schema on-read e schema on-write • Come fare il deisgn per database servers NoSQL • Fare il Modeling di Data Marts virtuali per Data Virtualization • Combinare Data Vault e Data Virtualization per avere sistemi Agile BI Seconda Giornata Sessione 5 Best Practices nella Data Discovery e Data Visualization Claudia Imhoff Gartner ha per primo riconosciuto il mercato della Data Discovery nel 2011 come “il nuovo approccio end-user-driven alla BI”. Oggi ci sono molti vendors che si sono posizionati come Data Discovery vendors. Queste aziende “indipendenti” di software si sono rapidamente mosse nel territorio che apparteneva ai grandi vendors di BI. Questo movimento è condotto dagli utenti di business che vogliono una facilità d’uso e che stanno esercitando una maggiore influenza sulle decisioni di acquisto di BI rispetto al passato. Data Discovery storicamente è stata vista come un’aggiunta alla tradizionale BI ma oggi sta sempre più diventando come una alternativa stand-alone. I partecipanti impareranno: • La differenza fra Data Discovery, Data Visualization e Business Intelligence • La necessità della Data Discovery/Visualization nell’era dei Big Data • Best Practices e punti critici nell’implementazione di Data Discovery/Data Visualization Sessione 6 Analitica avanzata e predittiva per la Big Data Enterprise Mike Ferguson Per molte aziende la descriptive BI non è più sufficiente. La richiesta è oggi quella di cercare di predire il futuro e guidare il business nel processo decisionale. In aggiunta le nuove e complesse sorgenti di Big Data richiedono una più potente analitica avanzata per trattare dati semi-strutturati e non strutturati. Questa sessione esamina come le aziende possono usare predictive analytics e come i nuovi algoritmi avanzati possono essere usati per scavare più a fondo nell’ambiente Big Data. Mostra anche come queste analitiche possono essere incorporate negli ambienti analitici esistenti. • Una introduzione alla advanced e predictive analytics • Tipi di algoritmi analitici e come si usano • L’importanza della preparazione dei dati • Approcci per usare advanced e predictive analytics, ad esempio in-database, in-Hadoop, in-stream e in-memory • Usare analitica nei tools di self-service BI e applicazioni analitiche attraverso predictive APIs • Casi d’uso di Big Data Analytics: infrastruttura IT e application performance management, impegno con il cliente, prevenzione del rischio e ottimizzazione delle operations • Getting Started: cosa fare e cosa no, model management, allineamento con gli obiettivi del business e gli aspetti organizzativi • Dietro le scene di una BI nel Cloud • Usare tools proprietari o pubblici? • Rimanere indipendenti dalla soluzione Cloud • Aspetti di privacy e security della memorizzazione di dati sul Cloud Sessione 9 Actionable Intelligence usando Storytelling e Collaborative BI Claudia Imhoff “Opinioni senza fatti restano solo opinioni”. “I numeri assoluti da soli sono inutili”. Sessione 7 Panel - L’impatto del Self-Service sull’ambiente tradizionale IT BI/DW Speakers e Vendors Sessione 8 Cinque livelli di Business Intelligence nel Cloud Rick van der Lans La Business Intelligence e l’Analitica cercano di migliorare e supportare i processi di decision making. Per sviluppare funzionalità di reporting e analitiche, le aziende devono installare, ottimizzare, operare e gestire tutte le componenti tecniche, come i Data Warehouses, i tools ETL, i clusters Hadoop, disk storage, appliances ecc. Ma le aziende vogliono fare tutto da sole? Vogliono che tutti gli specialisti siano propri dipendenti? Altrimenti, i sistemi di BI possono essere dati in outsourcing. Possono essere collocati sul Cloud. Ma qual è la forma migliore di BI nel Cloud per la Vostra organizzazione? Questa sessione discute le differenze fra i 5 livelli di BI nel Cloud. Ad esempio con il Data Warehouse-in-the-Cloud le aziende continuano ad avere in carico molti tasks. Mentre con BICC nel Cloud, quasi tutto il lavoro è fatto dal vendor e questo significa che le aziende possono focalizzarsi su reporting e analytics. • Panoramica dei 5 livelli di BI nel Cloud: risorsa nel Cloud, database nel Cloud, Data Warehouse nel Cloud, BI nel Cloud e BICC nel Cloud Queste sono delle frasi tipiche degli executives nelle aziende più importanti e illustrano la frustrazione che questi Decision Makers hanno con l’analitica e la data science. Mentre l’analitica e la data science sono ancora affascinanti nella nostra industria, stanno venendo fuori problemi significativi sul reale valore della loro opera. Data Storytelling e Collaborative BI aggiungono drammaticità e comprensione nei secchi risultati analitici. Migliorano non solo l’interesse ma anche una maggiore comprensione del significato di questi numeri per i Decision Makers dell’azienda. I partecipanti impareranno: • Le definizioni di Storytelling e Collaborative BI • Esempi di entrambe le cose • L’infrastruttura necessaria per supportare queste iniziative • Getting Started con Storytelling e Collaborative BI TECHNOLOGY TRANSFER Piazza Cavour, 3 - 00193 Roma Tel. 06.6832227 - Fax 06.6871102 www.technologytransfer.it [email protected]