IL “PATRIMONIO” DI DATI E LE BASI DI DATI QUESTIONI CHIAVE: ­ quali tipi di dati per rappresentare tali informazioni? ­ dove li memorizziamo? ­ in quali database e con quali strutture? PIANIFICARE IL “PATRIMONIO” DI DATI E LE BASI DI DATI Il patrimonio dei dati • L’insieme dei dati memorizzati e gestiti nel S.I. • Il “valore” del patrimonio di dati: – capacità di rispondere alle esigenze informative – Dipende da: • Completezza • Tempistica • Fruibilità/accessibilità • Omogeneità di rappresentazione PREMESSA: la progettazione delle basi di dati • Progettazione concettuale • progettazione logica • progettazione fisica dato significato origine Unità di misura e/o processo di elaboraz. codifica Il catalogo dei dati Esempio: CODICE PRODOTTO (catena di supermercati) • SIGNIFICATO: tipo di articolo o sua confezione • ORIGINE: lettura codice a barre o immissione • PROCESSO DI ELABORAZ: memorizzazione diretta dopo validazione • UNITA’ DI MISURA/CODIFICA: codice EAN Esempio: costo del prodotto (catena di supermercati) • SIGNIFICATO: costo medio per unità di articolo • ORIGINE: costi dei lotti di prodotto acquistati • PROCESSO DI ELABORAZIONE: media del costo unitario rispetto ai lotti acquistati in un periodo prefissato • UNITA’ DI MISURA/CODIFICA: euro per unità Catalogo dei dati e data dictionary • Catalogo dei dati: punto di vista degli utenti – inventario dei dati presenti nel patrimonio aziendale (significato, fonte, modalità di reperimento, ecc.) • data dictionary: per programmatori e gestori del sistema: – come i dati sono classificati nel database, con quali attributi, quali procedure, da quali altri dati, ecc. DOVE MEMORIZZARE I DATI? Possibili approcci alla memorizzazione e relative architetture ESEMPIO il sistema di casse automatiche in un punto vendita • DB “Listino prezzi” dei prodotti (L) • DB “scontrini” (S) • DB scontrini (S) devono (alla fine) essere raccolti insieme • DB listini (L) devono essere aggiornati Alternativa 1 cassa1 cassa2 cassa3 cassa4 L S1 L S2 L S3 L S4 = connessione occasionale o a cadenza stabilita L S1 SISTEMA CENTRALE (?) Alternativa 2 cassa1 cassa2 cassa3 cassa4 S1 S2 S3 S4 = connessione L S1 occasionale o a cadenza stabilita = connessione in tempo reale SISTEMA CENTRALE Alternativa 3 cassa1 cassa2 cassa3 L = connessione in tempo reale S SISTEMA CENTRALE cassa4 Alternativa 4 … Quale alternativa scegliere? Con che criteri? • Tecnici • Economici (costi) • Organizzativi • In relazione agli obiettivi specifici Due approcci opposti alla memorizzazione dei dati Database distinti • I singoli archivi sono organizzati in modo specifico • Ogni applicazione (programma/software) lavora su propri archivi di dati a) Sia nel caso di sistemi distinti e scollegati tra loro b) Sia nel caso di unico sistema centrale • PRO: Facilità di progettazione • CONTRO: Frammentazione dati, ridondanze, incoerenze Caso A Sistema operativo Sistema operativo Sistema operativo Programma A Programma B Programma C Caso B Unico database centralizzato • Archivio unico (database centralizzato) • Tutti i software attingono dallo stesso DB centrale • DBMS: DataBase Management System • • • • PRO: Patrimonio dei dati unitario e non frammentato PRO: Limitate ridondanze; coerenza dei dati archiviati CONTRO: Problema diritti di accesso al database CONTRO: Elevata complessità progettuale e di gestione DBMS • Usato da più applicazioni contemporaneamente • Gestisce i dati secondo un modello unitario e coerente • Risolve i problemi di • Integrità • Ridondanza • Sicurezza di accesso • Indipendenza dei dati dalle applicazioni DBMS Data manipulation Language (DML) Data description Language (DDL) Software di manutezione del database