ICT e Sistemi informativi Aziendali Materiale di supporto alla didattica ICT e Sistemi informativi Aziendali CAPITOLO IV – Database e Data warehouse Sommario Modelli dei dati Modello relazionale DBMS La progettazione di database Business Intelligence Data Warehouse e Data Mining Introduzione DATABASE Archivio di dati strutturati, indipendente dalle applicazioni e gestito grazie a uno specifico software, DBMS (Data Base Management System) OLTP DATA WAREHOUSE Ambiente integrato che raccoglie i dati provenienti dai diversi ambiti aziendali ed extra aziendali, a supporto dell’attività decisionale OLAP Progettazione di un database Si svolge in tre fasi, e fa riferimento ad altrettanti modelli, indipendenti, che permettono di rappresentare al meglio la realtà d’interesse e che rendono il db indipendente dalle applicazioni Progettazione concettuale Progettazione logica Progettazione fisica Modelli dei dati Progettazione concettuale Schema Entità Relazioni Entità Relazioni Occorrenze Tipologie di relazioni (cardinalità) Attributi Identificatori Modelli dei dati Progettazione logica Modello Modello Modello Modello gerarchico reticolare orientato agli oggetti relazionale Modelli dei dati Progettazione fisica Data Storage Description Language Schema fisico realizzato a partire da: Schema logico Carichi applicativi Caratteristiche del sistema utilizzato per l’implementazione Modello Relazionale Tabelle o relazioni Colonne o campi Righe o record (tuple) Dominio Database “Gestione Ordini” Modello relazionale caratteristiche Impiego di strutture logiche Dizionario dati Legami logici fra le informazioni Chiave primaria Vincoli di integrità Univocità della chiave Corrispondenza fra chiave esterna e chiave primaria DBMS Data Base Management System Creazione e modifica struttura logica del database Data Definition Interrogazioni e modifica delle informazioni Data Manipulation Generazione di maschere e report Application Generation Gestione delle autorizzazioni e dei backup Data Administration Modifiche strutturali D B M S Database E n g i n e Data Dictionary Progettazione di un database relazionale Modello concettuale Es. Entità Prodotto Cliente Codice Prodotto Descrizione Prodotto Scorta Magazzino Prezzo Unitario IVA Categoria Prodotto Codice Cliente Denominazione Cliente Telefono Cliente Indirizzo Cliente Contatto Es. Relazione Ordina Cliente Prodotto Progettazione di un database relazionale Modello concettuale - Cardinalità Es. 1:1 Cliente 1 1 Tessera Socio Possiede Es 1:m Dipendente 1 n Area Appartiene a Es. n:m Componente n È parte di Prodotto m Progettazione di un database relazionale Modello concettuale – Entità associativa Componente 1 è inserita in n Scheda installazione n Codice componente ... Descrizione componente Quantità Riordino ... Quantità ha una propria Tempo di montaggio 1 Prodotto Codice prodotto Descrizione prodotto Scorta Magazzino Prezzo Unitario Progettazione di un database relazionale Dal Modello concettuale al modello logico Prodotto Codice Prodotto Descrizione Prodotto Scorta Magazzino Prezzo Unitario IVA Categoria Prodotto Progettazione di un database relazionale eliminazione delle anomalie Anomalie Ridondanza dei dati Anomalie di cancellazione Anomalie di aggiornamento Anomalie di inserimento Soluzione Definire entità e attributi nel modello E/R Determinare le relazioni tra le entità Convertire entità e attributi in tabelle e campi Definire le chiavi primarie ed esterne Definire, se necessarie, le restrizioni o vincoli di input Valutare lo schema disegnato Implementare il database Progettazione di un database relazionale Normalizzazione Strumento utilizzato per eliminare problemi di ridondanza, anomalie e dipendenze funzionali 1FN - Eliminare i gruppi ripetitivi di dati 2FN – Verificare che i campi non chiave primaria dipendano dall’intera chiave primaria 3FN – Verificare che i campi non chiave primaria dipendano direttamente dalla chiave primaria Business Intelligence Insieme di concetti e di metodi per migliorare i processi decisionali di business, utilizzando sistemi di supporto basati sui fatti e sulle rilevazioni aziendali ARCHITETTURA DI RIFERIMENTO Report Operational Data Warehouse ERP Data Integrazione Dati (ETL) Query Accesso all’Informazione e analisi Data Mart External Data Meta Dati OLAP Mining Business Intelligence Data Warehouse Archivio di informazioni, raccolte da numerosi database operativi, in grado di supportare le attività di analisi aziendale e i processi decisionali Raccolta di dati integrata, orientata ai dati e focalizzata su un soggetto di business, con un ampia memoria storica, e accessibile in sola lettura, che fornisce supporto ai processi decisionali (Inmon, 1996) Data mart Analisi Multidimensionale (OLAP) Data mining Nell’ambito del processo di identificazione e di estrazione di modelli significativi che interpretano la realtà utile per generare la conoscenza, chiamato KDD (Knowledge Discovery in Database), il data mining riguarda l’impiego di algoritmi necessari per estrarre modelli o regole di comportamento presenti nei dati Modalità di apprendimento supervisionato o non supervisionato Data mining Tecniche di analisi e obiettivi di business Tecniche di analisi Reti neurali Visualizzazione Algoritmi genetici Fuzzy logic Decision tree e rule induction Obiettivi di business classificazione, Clustering Associazione previsione