I DATA BASE:Generalità e schema E/R (appunti NON esaustivi ) Introduzione Con il termine base di dati si indica: un insieme di archivi di dati organizzati con l’obiettivo di raggiungere una grande efficienza nel trattamento e nel ritrovamento dei dati ovvero la possibilità di gestire (inserire-modificare-eliminare) e ritrovare facilmente le informazioni desiderate, attraverso criteri di ricerca diversi. Deve essere anche garantita la consistenza degli archivi, cioè, i dati devono essere significativi (…) ed utilizzabili (Es: i dati relativi agli importi una fattura (conto corrente, proprietà ....)devono poter essere collegati al relativo cliente (correntista, padrone ...) ). I dati contenuti nei database devono quindi, essere protetti da manomissioni, danni e perdite. La sicurezza significa impedire che il database sia danneggiato da interventi accidentali o non autorizzati; L’integrità significa garantire che le operazioni effettuate da altri utenti autorizzati non provochino una perdita di consistenza ai dati. Per la creazione e gestione dei database esistono degli applicativi appositi detti DBMS (Data Base Management System). Bisogna, però, fare una precisazione tra diverse figure che utilizzano i database: Gli utenti finali del database, che utilizzano le informazioni contenute negli archivi; Gli amministratori del database (DBA) si occupano della progettazione e della manutenzione degli archivi. Inoltre precisiamo che: Il database è formato dall’insieme degli archivi; Il DBMS è il sistema informatico con cui si può gestire un database. Limiti nell’organizzazione tradizionale degli archivi (cartacei realizzati tramite File ) e loro superamento Le tecniche di gestione delle basi di dati nascono per superare i problemi e i limiti che nascono nelle tradizionali organizzazioni degli archivi in modo non integrato. Il problema principale di un archivio è la ridondanza. La ridondanza dei dati si ha quando questi sono “copiati” più volte all’interno dell’archivio (o di più archivi). Questa può provocare diversi problemi: - L’incongruenza, cioè il mancato aggiornamento di tutti i dati (copie di dati), contenuti negli archivi; - L’inefficienza dei dati, cioè i dati aziendali non sono più affidabili. Fra i limiti individuati nell’organizzazione tradizionale ricordiamo: - I programmi sono legati agli archivi che essi gestiscono, al variare della struttura di un archivio devono variare i programmi che lo utilizzano; - Alcuni dati presenti più volte in archivi diversi come campi di record diversi: si ha ridondanza; - L’accesso ai dati è determinato dal tipo di organizzazione assegnata agli archivi, dalle chiavi e dall’ordine con cui i campi compaiono all’interno del record. - Ogni programma che modifica i dati di un file si deve occupare di controllare la validità dei dati immessi 1 Per eliminare questo problema si utilizzano delle tecniche, che servono appunto a creare delle relazioni tra i vari record in modo da non dover “duplicare” l’informazione (utilizzo di chiavi primarie …). La nuova tipologia di gestione dei database presenta le seguenti caratteristiche fondamentali: Indipendenza dalla struttura fisica dei dati, i programmi applicativi sono indipendenti dei dati fisici; Indipendenza dalla struttura logica dei dati, i programmi applicativi sono indipendenti dalla struttura logica; Utilizzo da parte di più utenti, i dati organizzati in un unico database possono essere utilizzati più utenti e la multiutenza (accesso contemporaneo) è gestita dal DBMC Eliminazione della ridondanza, gli stessi dati non compaiono più volte in archivi diversi; Eliminazione della inconsistenza, i database non può presentare campi uguali con valori diversi in archivi diversi; Facilità di accesso; Integrità dei dati, controlli per evitare anomalie dei dati; Sicurezza dei dati, procedure per impedire l’accesso non autorizzato; Uso di linguaggi per la gestione del database, attraverso comandi per la manipolazione e l’interrogazione alla base dati. 2