Prof. Emanuele Papotto
Gli archivi
y Archivio: è un insieme organizzato di informazioni (movimenti contabili, archivi: clienti/fornitori, personale, magazzino)
y Proprietà: y tra le informazioni esiste un nesso logico (sono inerenti a un medesimo argomento)
y rappresentate in formato di facile interpretazione
y registrate su supporto di lettura/scrittura che perdura nel tempo
y organizzate per permettere facile consultazione
1
Archivi aspetti principali
y Tipologia dei supporti utilizzati per registrare le informazioni
y Attrezzature HW dedicate alla gestione delle unità di memorizzazione
y Strumenti SW per la costruzione di programmi applicativi e dell’interfaccia per l’utente
y Definizione dell’organizzazione degli archivi per rendere efficiente l’accesso ai dati e veloci le operazioni di ritrovamento
Operazioni sugli archivi
y Creazione dell’archivio: realizzazione sul supporto di memorizzazione dello spazio destinato a contenere i dati
y Inserimento: di nuovi dati dopo che l’archivio è stato creato
y Modifica, aggiornamento e cancellazione dei dati presenti nell’archivio. Indicate anche come manipolazione degli archivi
y Consultazione o interrogazione: reperire all’interno dell’archivio informazioni necessarie per l’elaborazione desiderata. 2
Operazioni sugli archivi
y Ordinamento (sort) dei dati secondo un determinato criterio. Organizzare gli archivi in modo da consentire una rapida e facile consultazione.
y Fusione (merge) tra due o più archivi. Si crea un nuovo archivio utilizzando i dati contenuti negli archivi di partenza.
Database e DBMS
y Definizione: Il DataBase (DB) è una collezione, un archivio di dati, organizzati e gestiti sulle memorie di massa dei computer, attraverso appositi SoftWare (SW), con l’obiettivo di raggiungere una grande efficienza nel trattamento e ritrovamento dei dati.
y Definizione: Il DBMS (Database Management System) è il SW che permette di costruire e gestire un DB.
y Differenza : y Database = insieme di dati
y DBMS = gestisce il DB
6
3
Struttura logica di un archivio y Campo: singolo valore che descrive una caratteristica dell’entità in considerazione
Cognome
Numero di telefono
NOME CAMPI
Rossi
081/598734
INFORMAZIONI
y Record: l’insieme di tutti i campi che descrivono una entità
Cognome
Nome
Città
Rossi
Mauro
Salerno
Nome dei Campi
RECORD
7
Record fisico e record logico
y Un archivio è costituito da un insieme di record logici
y Un record logico è costituito da un insieme strutturato di campi riguardanti una determinata entità; la sua lunghezza dipende dalla lunghezza dei singoli campi che lo compongono. y Un record fisico è l'insieme dei dati letti o scritti ad ogni lettura o scrittura fisica su disco. Un record fisico può contenere più record logici, può coincidere con il record logico.
Cognome
Nome
Città
Rossi
Mauro
Salerno
RECORD LOGICO
RECORD LOGICO
RECORD FISICO
RECORD LOGICO
4
La memorizzazione dei dati …ieri
y Prima applicazione gestionale dell’informatica moderna per la registrazione dei dati è stata la scheda perforata.
La scheda perforata
potevano essere memorizzati appena 80 caratteri in ogni scheda
5
I nastri magnetici
y Pregio: Maggiore capacità di contenere dati
y Difetto: Accesso sequenziale ai dati
…oggi le memorie di massa
6
Memorie di massa caratteristiche
y Accesso diretto (random) ai dati
y Capacità di memorizzazione: misurata in megabyte y 1 B (byte) = 8 b (bit)
y 1 KB (Kilobyte) = 1024 B
y 1 MB (Megabyte) = 1024 KB y 1 GB (Gigabyte) = 1024 MB y 1 TB (Terabyte) = 1024 GB
y Tempo di accesso medio (access time), necessario per ritrovare i dati
y Velocità di trasferimento (transfer rate), misurato in KB/sec o MB/sec, dalla memoria di massa all’unità centrale
Memorie di massa caratteristiche
y Compatibilità in base a determinati sistemi di elaborazione
y Gestione fault tollerance (tolleranza al guasto): duplicazione dei sistemi di memorizzazione, consente di continuare il lavoro se uno dei due è guasto
y Sicurezza e integrità dei dati: rischi di cancellazione accidentali, modifica indesiderata, fenomeni fisici, ambientali,
interventi esterni (virus, pirati informatici)
y Durata delle registrazioni sui supporti nel tempo
y Espansione, aggiunta di nuove unità con maggiori capacità
y Costo, dei supporti e SW di gestione
7
Problematiche archivi
y Nei supporti magnetici l’informazione viene registrata
magnetizzando o meno aree puntiformi della superficie per mezzo delle apposite testine di cui sono dotate le periferiche. y Rischi: smagnetizzazione, tenere in ambienti privi di polvere, lontano da campi magnetici, temperature comprese tra 10°C e 50°C
y Soluzione: copie di sicurezza (backup)
y Restore: procedimento che ripristina i dati e le informazioni perse o danneggiate, precedentemente salvate in una copia di sicurezza Problematiche archivi
y Regolarità e frequenza nell’effettuare copie di sicurezza y Predisporre eventuale Backup automatico
y Predisporre eventuale salvataggio solo dei dati modificati (controllo data modifica ultima modifica)
y Gruppo di continuità UPS (Uninterruptible Power Supply)
y i dati vendono elaborati nella RAM e in buffer della memoria centrale. Se cade sistema (mancanza di alimentazione energetica) durante la memorizzazione sulla memoria di massa si ha una perdita delle informazioni appena elaborate
8
Organizzazione degli archivi
y Spazio
y Quantità di dati a disposizione
y Dimensione archivi
y Capacità supporti memoria di massa
y Tempo
y Tempi accesso alla periferica
y Velocità reperimento informazioni dati richiesti
y Velocità trasferimento dati memoria di massaÆcentrale
y Ottimizzare l’uso dello spazio disponibile sul supporto in relazione alla sua capacità, e rendere bassi i tempi di accesso e di ritrovamento dei dati contenuti nella memoria
Organizzazione sequenziale
y Organizzazione sequenziale: l’archivio sequenziale è un archivio i cui record sono memorizzati uno di seguito all’altro, cioè in sequenza.
y Questo tipo di organizzazione nasce sul primo supporto ad essere utilizzato, il nastro magnetico, e risente delle caratteristiche di quel tipo di supporto (aggiunta in coda).
y Per reperire il record che interessa è necessario scorrere sequenzialmente tutti i record che lo precedono: l’accesso è quindi sequenziale.
y VANTAGGI: semplicità nella gestione
y SVANTAGGI: lunghi tempi di reperimento quando è elevato il numero di record
9
Organizzazione ad accesso diretto
y Organizzazione ad accesso relativa o diretta o random: sono gli archivi che consentono di reperire un record direttamente, senza dover scorrere sequenzialmente l’archivio.
es: ogni record è lungo 240 Byte
Si vuole leggere/scrivere il record 35
(35‐1) x 240 + 1 = 8161
8161 è la posizione (il byte) dal quale inizia il 35° record LR = lunghezza record
lungo 240 byte
NR= numero di record
Organizzazione a indici
y L’archivio sequenziale a indici è caratterizzato dalla presenza di una chiave che deve essere individuata tra i campi che formano il record, ovviamente tale campo deve avere la caratteristica di univocità.
y Accanto alla zona dove sono registrati i record nell’ordine di immissione viene gestita una tabella delle chiavi, y La ricerca e l’accesso al record avviene leggendo la tabella delle chiavi e non i record. Ad ogni chiave corrisponde un record.
y La chiave può essere primaria e
secondaria. Queste consentono di accedere al record cercato sia con una che con l’altra.
y ATTENZIONE!!! Non confondere queste chiavi con le PK e FK che di solito si utilizzano quando si modella un DB.
10
Operazioni sui file
y L’ apertura di un archivio stabilisce un collegamento tra la memoria centrale e il file registrato sulla memoria di massa. Questo comando deve essere eseguito prima di effettuare qualsiasi operazione di lettura o scrittura.
y L’operazione di lettura copia in memoria centrale dalla memoria di massa il contenuto di un record contenuto in un file
y L’operazione di scrittura trasferisce sulla memoria di massa il contenuto del record composto in memoria centrale con i valori assegnati ai campi
y Il posizionamento individua il record sul quale si deve leggere o scrivere oppure da dove si deve iniziare a leggere o scrivere
Operazioni sui file
y L’operazione di riscrittura aggiorna nel file su memoria di massa il contenuto di un record modificato durante l’elaborazione
y La cancellazione di un record elimina le informazioni che si ritengono non servire più nelle applicazioni utilizzate. Questa operazione va effettuata con molta attenzione e cautela y La chiusura del file interrompe il collegamento tra memoria centrale e file.
11