Archivi di dati Un archivio è una raccolta di informazioni relative a un determinato argomento: • i libri di una biblioteca • i dipendenti di un’azienda • gli articoli di un magazzino • gli abitanti di un comune Un archivio è rappresentabile sotto forma di tabella in cui le righe sono dette record e le colonne sono dette campi, ad esempio un archivio Clienti: campi record Cognome Nome Cod. Fisc. Indirizzo Telefono Rossi Mario rssmra…. Via Roma.. 0961737.. Bianchi Carlo bnccrl…. Via Milano 096172.. …… ….. ….. …. ….. ….. …. …. ….. ….. Corso di informatica - Database & DBMS - Raffaele Grande - 2005 1 Campi e record Un campo o attributo contiene una singola informazione (un cognome, una data, un codice o un prezzo, ecc.); i campi costituiscono le colonne della tabella e ognuno è caratterizzato da • un nome che lo identifica, • un tipo che definisce la natura delle informazioni che esso può contenere: un testo, un numero, una data ecc. • una dimensione che definisce la quantità di memoria necessaria per quel campo Un record o ennupla è l’insieme dei campi relativi a un elemento (una persona, un libro, un articolo di magazzino) dell’archivio; i record sono le righe della tabella. La dimensione di un record è data dalla somma delle dimensioni dei campi che lo compongono. Corso di informatica - Database & DBMS - Raffaele Grande - 2005 2 Database & DBMS Un database ( o base di dati) è una struttura di archivi (tabelle) correlati tra loro in modo da costituire una base di informazioni indipendente dall’uso che se ne farà e sulla quale possano quindi essere eseguite procedure diverse e possano lavorare utenti diversi. Ad esempio: la base di informazioni per la gestione di una biblioteca (i libri, gli utenti, i prestiti); la gestione di un’azienda (clienti, fornitori, dipendenti, ……); la gestione di una scuola (studenti, classi, docenti, …..) Un DBMS (Database Management System) è un software applicativo per la gestione completa di un database : • creazione • aggiornamento • interrogazione • presentazione • sicurezza Corso di informatica - Database & DBMS - Raffaele Grande - 2005 3 Modelli di database Sono stati proposti, nel tempo, alcuni modelli di database, in ordine cronologico: • Database gerarchici I legami tra gli archivi sono di tipo gerarchico e quindi implicano delle dipendenze di alcune entità rispetto ad altre, ciò porta a una certa rigidità di struttura. • Database reticolari Non ci sono più livelli diversi tra le entità in quanto esse sono nodi di un reticolo più o meno complesso. • Database relazionali Sono basati sul concetto matematico di relazione fra insiemi. Una tabella può infatti essere vista come una relazione tra gli insiemi costituiti dalle sue colonne (domini): ad esempio l’insieme dei nomi, quello dei cognomi, quello delle date di nascita,… ogni riga è costituita da n elementi, uno per dominio, e si chiama n-pla o tupla. Corso di informatica - Database & DBMS - Raffaele Grande - 2005 4 Database relazionali Cognome Nome Cod._Fisc Indirizzo Telefono Rossi Mario rssmra…. Via Roma.. 0961737.. Bianchi Carlo bnccrl…. Via Milano 096172.. …… ….. ….. …. ….. ….. …. …. ….. ….. È una relazione tra i domini: Cognome, Nome, Cod_Fisc, Indirizzo, Telefono. Ogni riga (n-pla o tupla) contiene un elemento per ogni dominio. Non possono esserci due tuple uguali, come vedremo due tuple differiranno per almeno un elemento (chiave) Non esiste un ordine prestabilito tra le n-ple I contenuti della relazione in un certo istante si chiamano istanze. Corso di informatica - Database & DBMS - Raffaele Grande - 2005 5 Un esempio di DBMS relazionale: Microsoft Access Microsoft Access è un software per la gestione di basi di dati relazionali utilizzato su personal computer, nel seguito faremo riferimento a questo programma. Il programma mette a disposizione dell’utente una serie di strumenti a interfaccia grafica per la realizzazione di tutte le funzioni di gestione di un database: • tabelle per la definizione dei dati • maschere per l’accesso ai dati (sia in ingresso che in uscita) • query per l’interrogazione della base di dati • report per la presentazione in stampa delle informazioni • macro per la preparazione di serie di comandi da eseguire in sequenza • moduli per la programmazione di intere applicazioni Corso di informatica - Database & DBMS - Raffaele Grande - 2005 6 Gli strumenti di Access utente maschera maschera tabella maschera tabella tabella report report query query report maschera Le tabelle sono i contenitori dei dati, le queries prendono i dati da una o più tabelle o queries in base a determinati criteri di interrogazione e si comportano a loro volta come tabelle, le maschere danno accesso ai dati (tabelle e queries), i report presentano in stampa i contenuti di tabelle e queries. Corso di informatica - Database & DBMS - Raffaele Grande - 2005 7 Collegamenti tra tabelle In un database normalmente gli archivi (tabelle) sono tra loro correlati per rendere massima l’efficienza e minima la ridondanza di informazioni che consiste nel ripetersi degli stessi dati più volte nello stesso archivio o in archivi diversi. La ridondanza, oltre all’evidente spreco di spazio di memoria, può comportare anche veri e propri errori, infatti un’informazione ripetuta più volte in posizioni diverse può essere aggiornata in alcune posizioni e non in altre provocando inconsistenza nei dati. Due tabelle possono essere collegate tra loro attraverso alcuni campi particolari detti chiavi. Una chiave primaria è un campo che individua univocamente ogni record all’interno di una tabella. In altre parole non possono esserci due record con la stessa chiave primaria. Ad esempio, in un archivio anagrafico, il codice fiscale è un campo che può essere usato come chiave primaria mentre non lo sono, normalmente, il cognome o il nome. Inserendo, in una tabella correlata, un campo (detto chiave esterna) corrispondente alla chiave primaria della prima tabella si può stabilire un’associazione tra le due tabelle. Corso di informatica - Database & DBMS - Raffaele Grande - 2005 8 Collegamenti tra tabelle Chiave primaria CLIENTI cognome nome cod_fisc indirizzo telefono 1 Chiave esterna ORDINI num_ordine molti data importo cod_fis_cli Le due tabelle CLIENTI e ORDINI sono correlate attraverso il campo codice fiscale che lega ogni cliente agli ordini da lui effettuati e ogni ordine al cliente che lo ha effettuato. Senza questo collegamento bisognerebbe ripetere i dati del cliente per ogni ordine presente nell’archivio ordini creando una notevole ridondanza. In questo modo i dati di un cliente, a parte il codice fiscale, sono memorizzati una sola volta nell’archivio clienti e si devono aggiornare solo li. Il campo cod_fis_cli si chiama chiave esterna e, poiché ogni cliente può fare più ordini, il collegamento creato è di tipo uno a molti. È evidente che nella tabella ORDINI ci possono essere più record con lo stesso codice fiscale che infatti non è una chiave primaria ma una chiave esterna. Corso di informatica - Database & DBMS - Raffaele Grande - 2005 9 Indici Un indice è uno strumento per rendere più efficienti e veloci le ricerche all’interno di una tabella. Ogni campo può essere associato a un indice, una tabella in cui ad ogni valore del campo è indicato il numero della riga in cui si trova quel valore, per rendere più veloci le ricerche secondo quel campo. Un indice, però, occupa spazio di memoria e rende più lento l’aggiornamento della tabella (perché bisogna aggiornare anche l’indice), quindi è opportuno indicizzare solo i campi secondo cui si prevede di effettuare prevalentemente le ricerche. Un campo può essere indicizzato con duplicati ammessi nel caso in cui più righe possono avere lo stesso contenuto per quel campo con duplicati non ammessi nel caso in cui più righe non possono avere lo stesso contenuto per quel campo Una chiave primaria è, per sua natura, sempre indicizzata con duplicati non ammessi Corso di informatica - Database & DBMS - Raffaele Grande - 2005 10 Integrità referenziale L’integrità referenziale è un sistema di controlli che assicurano la congruenza delle informazioni di un database. Ad esempio, nel caso delle due tabelle correlate CLIENTI e ORDINI Se esiste, nella tabella ORDINI, un ordine con un certo codice fiscale non deve essere cancellato, dalla tabella CLIENTI, il cliente con quel codice fiscale Non si può modificare un codice fiscale nella tabella CLIENTI se esistono record correlati nella tabella ORDINI Non si può inserire un ordine con un codice fiscale che non appartiene a nessun cliente della tabella clienti Ne consegue che, normalmente, prima di inserire un ordine bisogna aver creato il relativo cliente nella tabella CLIENTI e quando si cancella un cliente vengono cancellati anche tutti i suoi ordini Corso di informatica - Database & DBMS - Raffaele Grande - 2005 11 L’inserimento dei dati Una volta definite le tabelle e i collegamenti tra queste, il DBMS consente l’inserimento dei dati in due modi: • direttamente nelle tabelle (modalità foglio dati) • attraverso una maschera o vista, associata alla tabella, che consente di inserire e vedere i contenuti della tabella in una forma personalizzata Sia in modalità foglio dati che nell’uso di maschere il DBMS offre una serie di strumenti per la visualizzazione dei dati: • sistemi di navigazione • filtri di selezione e ricerca • ordinamenti secondo uno o più criteri Corso di informatica - Database & DBMS - Raffaele Grande - 2005 12 Le queries Una query è uno strumento per interrogare il database, cioè per estrarre dall’insieme delle tabelle le informazioni desiderate con i criteri di scelta necessari. Il punto di partenza di una query è quindi costituito da una o più tabelle e il risultato di una query è, in generale, un’altra tabella che contiene le risposte all’interrogazione impostata. In alcuni casi il risultato di una query può essere costituito da valori risultanti da calcoli o conteggi. Il DBMS Access offre un sistema visuale per definire la query cioè: • Definire la o le tabelle di partenza • Definire i campi interessati • Definire i criteri di selezione • Definire eventuali ordinamenti • Effettuare conteggi o calcoli su particolari campi Il sistema visuale consente di aggirare l’uso dello strumento più generale per la gestione dei database e la definizione di query che è il linguaggio SQL ( Structured Query Language) che rimane comunque disponibile per gli utenti in grado di usarlo. Corso di informatica - Database & DBMS - Raffaele Grande - 2005 13 Esempio di query (1) Si vogliono il cognome, il nome del cliente e la data degli ordini con importo superiore a 100 €, ordinati per importo decrescente Sono richiesti dati provenienti dalla tabella CLIENTI (cognome e nome) e dalla tabella ORDINI (data e importo). La struttura della query può essere impostata in Access: Campo cognome nome data importo Tabella Clienti Clienti Ordini Ordini Ordinamento Mostra decrescente √ √ √ Criteri √ > 100 Il risultato sarà una tabella con quattro colonne e un numero di righe pari al numero di ordini con importo maggiore di 100 € e le righe saranno ordinate per importo decrescente Corso di informatica - Database & DBMS - Raffaele Grande - 2005 14 Esempio di query (2) Se invece si vuole il numero totale degli ordini ricevuti in un certo intervallo di tempo: 1/12/05 – 31/12/05 Campo Num_ord Data Tabella Ordini Ordini Formula Conteggio Espressione Ordinamento Mostra Criteri √ <=#31/12/2005# And >=#01/12/2005# Nella struttura della query è stata inserita la riga formula che permette di inserire funzioni come conteggio, somma, media ecc. che effettuano calcoli su determinati campi. Nella colonna data si inserisce il criterio di selezione che, in questo caso, usa l’operatore logico AND. Il risultato è un valore numerico. Corso di informatica - Database & DBMS - Raffaele Grande - 2005 15 Esempio di query (3) Query parametrica Nelle queries viste finora i criteri di selezione dei dati erano espressi esplicitamente: importo>100, data compresa tra 1/12/2005 e 31/12/2005. Si possono definire delle queries in cui, invece, i criteri sono espressi tramite parametri il cui valore può cambiare ogni volta che la query viene eseguita. Campo cognome nome data importo Tabella Clienti Clienti Ordini Ordini Ordinamento Mostra decrescente √ √ √ Criteri √ >[importo=] Nella riga criteri invece del valore costante 100 si inserisce una domanda tra parentesi quadra, tale domanda verrà riproposta all’utente ogni volta che verrà attivata la query e ogni volta si potrà inserire un valore diverso. Corso di informatica - Database & DBMS - Raffaele Grande - 2005 16 I report I contenuti di tabelle e queries possono essere mandati in stampa col formato e l’organizzazione desiderati utilizzando i report che svolgono una funzione analoga a quella delle maschere ma limitatamente all’uscita (presentazione) dei dati. Il DBMS offre dei formati standard di report (report tabulare, report a colonne) oppure la possibilità di definire liberamente la struttura delle stampe. In ogni caso è possibile definire oltre al formato della stampa anche particolari modalità grafiche, raggruppamenti e ordinamenti. Corso di informatica - Database & DBMS - Raffaele Grande - 2005 17