rappresentazione informazioni

annuncio pubblicitario
Rappresentazione
dell’informazione
La codifica delle informazioni
codifica
INFORMAZIONI
forma adatta
per essere trattata
dall’elaboratore
DATI
interpretazione
Ing. L.Testa - Fondamenti di Informatica
2
Informazioni
„
„
Numeri
„ Interi positivi
„ Positivi e negativi
„ Reali
Testi
Informazioni tradizionali
„
„
„
Immagini fisse
„ Vettoriali
„ Bitmap
Audio
Video
Informazioni multimediali
Ing. L.Testa - Fondamenti di Informatica
Rappresentazione dell’informazione
„
Interessa soprattutto distinguere informazioni
diverse
„
„
Con un solo simbolo è impossibile
Pertanto l’insieme minimo è costituito da
2 simboli (alfabeto binario)
Ing. L.Testa - Fondamenti di Informatica
Rappresentazione dell’informazione
„
„
„
Le informazioni vengono rappresentate mediante
sequenze di simboli
Nel caso dei simboli binari, le informazioni
(numeri, oggetti, parole) sono rappresentate da
sequenze dei due simboli (0 e 1)
Servono regole di manipolazione dei simboli
Ing. L..Testa Fondamenti di Informatica
Sistemi numerici
5
Sistemi numerici
„
Per determinare un sistema numerico serve:
„
„
un insieme limitato di simboli (le cifre), che
rappresentano quantità prestabilite (1, 2, V, X,
M)
le regole per costruire i numeri:
„
„
sistemi numerici posizionali
sistemi numerici non posizionali
Ing. L.Testa - Fondamenti di Informatica
Sistemi numerici
„
„
Sistemi numerici non posizionali:
„ valore delle cifre è indipendente dalla posizione
Sistemi numerici posizionali:
„ il valore delle cifre dipende dalla loro posizione
all’interno del numero
(ogni posizione ha un peso)
Ing. L.Testa - Fondamenti di Informatica
Sistemi numerici posizionali
„
Esempio:
N = d3 d2 d1 d0 ; V(N) = d3*p3 + d2*p2 + d1*p1 + d0*p0
„
„
„
N Æ rappresentazione del numero
V(N) Æ valore del numero
Sistemi a base fissa:
„
pi = ri
„
„
dove:
r è la base del sistema
di rappresentano le cifre
Ing. L.Testa - Fondamenti di Informatica
Sistemi posizionali a base fissa
N = dn-1 dn-2 … d1 d0
V(N) = dn-1*rn-1 + dn-2*rn-2 + … + d1*r1 + d0*r0
„
Proprietà
„ È a rango illimitato (ogni numero intero vi può
essere rappresentato)
„
„
È a rappresentazione unica (ad ogni numero
intero corrisponde un solo insieme ordinato di cifre)
È irridondante (ad ogni insieme ordinato di cifre
corrisponde un solo numero non rappresentato da altri
insiemi ordinati)
Ing. L.Testa - Fondamenti di Informatica
Sistema decimale
„
„
È un sistema numerico posizionale a base fissa
Il sistema decimale utilizza:
„ r = 10
„ d = 0,1,2,3,4,5,6,7,8,9
Ing. L.Testa - Fondamenti di Informatica
Sistema decimale
8427
=
8*103 + 4*102 + 2*101 + 7*100
Ing. L.Testa - Fondamenti di Informatica
Sistema binario
„
„
„
Anche il sistema binario è un sistema numerico
posizionale a base fissa
Il sistema binario utilizza:
„ r = 2
„ d = 0,1
Ogni cifra è detta bit (da BInary digiT)
Ing. L.Testa - Fondamenti di Informatica
Sistema binario
1011 = 1*23 + 0*22 + 1*21 + 1*20 = 1110
Ing. L.Testa - Fondamenti di Informatica
Altri sistemi utilizzati
„
„
Sistema ottale:
„ r = 8
„ d = 0,1,2,3,4,5,6,7
Sistema esadecimale:
„ r = 16
„ d = 0,1,2,3,4,5,6,7,8,9,A,B,C,D,E,F
Ing. L.Testa - Fondamenti di Informatica
Conversioni di base
Dal sistema binario a quello decimale
„
„
Utilizzando la definizione:
„ 10102 = (1*8 + 0*4 + 1*2 + 0*1)10 =
= (8+2)10 = 1010
Oppure si può utilizzare il seguente formato:
„ N = ((dn-1*r + dn-2)*r + dn-3) …)*r + d0
Ing. L.Testa - Fondamenti di Informatica
1
Conversioni di base
Dal sistema decimale a quello binario
Esempio: 11510 = 1110011 2:
„
115
1
d0
d1
2
57
1
2
28
0
d2
2
14
0
d3
2
7
1
d4
2
3
1
d5
2
1
1
d6
Ing. L.Testa - Fondamenti di Informatica
Numeri frazionari
E’ possibile anche rappresentare numeri frazionari:
„ le potenze variano anche nel campo negativo
V(N) =
Σi di*ri = dn-1*rn-1 +…+ d0*r0 + d-1*r-1 +…+ d-m*r-m
N = dn-1 dn-2 … d1 d0 . d-1 d-2 … d-m+1 d-m
Ing. L.Testa - Fondamenti di Informatica
2
0
Conversioni di base
(per numeri frazionari)
Dal sistema binario a quello decimale
„
Sempre utilizzando la definizione:
0.1012 = 0*20 + 1*2-1 + 0*2-2 + 1*2-3=
= (0.5+0.125)10 = 0.62510
Ing. L.Testa - Fondamenti di Informatica
Conversioni di base
(per numeri frazionari)
Dal sistema decimale a quello binario
„
Esempio: 0.62510 = 0.101 2:
0.625 *
2
1.250 *
2
0.500 *
2
1.000
Ing. L.Testa - Fondamenti di Informatica
0.62510 = 0.101
2
Conversioni di base
Dal sistema decimale a quello binario
N.B.: Per convertire un numero composto da una parte
intera e una frazionaria in un altro sistema numerico,
occorre convertire separatamente le due parti e
successivamente giustapporre.
Ing. L.Testa - Fondamenti di Informatica
Conversione da binario ad esadecimale
100010112
1000 1011
8Bh
Ing. L.Testa - Fondamenti di Informatica
16 = 24 !!!
Numero di cifre necessario
„
Le macchine hanno vincoli spaziali:
„ è necessario conoscere il massimo valore
rappresentabile:
„ con n bit si può rappresentare al massimo il
numero 2n -1
„ è facile determinare che
n = INT( log2 (X+1) )
Ing. L.Testa - Fondamenti di Informatica
Operazioni aritmetiche
„
„
Per effettuare operazioni è necessario conoscere
la definizione del comportamento per ogni coppia
di simboli
Per ogni operazione esiste una tabella
Ing. L.Testa - Fondamenti di Informatica
Somma binaria
„
„
La tabella di definizione è:
„ 0 + 0 = 0
„ 0 + 1 = 1
„ 1 + 0 = 1
„ 1 + 1 = 0
con riporto di 1
„ 1 + 1 + 1 = 1
con riporto di 1
Esempi
Ing. L.Testa - Fondamenti di Informatica
Sottrazione binaria
„
„
La tabella di
„ 0 - 0
=
„ 1 - 0
=
„ 1 - 1
=
„ 0 - 1
=
definizione è:
0
1
0
1
con prestito di 1 dal
bit di peso superiore
Esempi
Ing. L.Testa - Fondamenti di Informatica
Moltiplicazione e divisione
„
„
Si utilizzano le stesse procedure:
„ per la moltiplicazione:
somma e scorrimento
„ per la divisione:
differenza e scorrimento
Esempi
Ing. L.Testa - Fondamenti di Informatica
Rappresentazione dei numeri
nei calcolatori
Rappresentazione dei numeri nei calcolatori
„
„
Esiste un limite al numero di bit impiegati per
rappresentare un numero
Tale limite dipende da:
„ intervallo di variabilità
„ occupazione di memoria
Ing. L.Testa - Fondamenti di Informatica
Overflow e Underflow
„
„
Sono condizioni in cui si ha un errore nella
rappresentazione del risultato
Generalmente la rappresentazione è formata da
un numero finito di bit: se si supera tale limite si
ha errore
Ing. L.Testa - Fondamenti di Informatica
Numeri positivi
„
„
„
La rappresentazione di numeri positivi non crea
problemi
Si può avere overflow se il risultato delle
operazioni richiede un numero maggiore di bit di
quanto disponibile
Esempio: somma modulo 16
Ing. L.Testa - Fondamenti di Informatica
Numeri negativi
„
Esistono diverse possibilità di rappresentazione:
„
modulo e segno
„
complemento a 2
n
Ing. L.Testa - Fondamenti di Informatica
Modulo e segno
„
Convenzione per il bit più significativo:
„
„
„
0 : segno positivo
1 : segno negativo
esistono due rappresentazioni per lo ‘0’
+ 5 ---> 00101
- 10 ---> 11010
+ 0 ---> 00000
- 0 ---> 10000
Ing. L.Testa - Fondamenti di Informatica
Complemento a 2
„
„
(complemento alla base)
Dato X in base r di n cifre:
rn – X (complemento alla base del numero X)
Se X=01011, r=2, n=5
25-X = 100000 – 01011 = 10101
„
Regoletta pratica: il complemento a 2 si trova analizzando i bit del
numero a partire da destra: si riportano invariati tutti gli zeri fino al
primo bit a 1, si riporta invariato questo stesso bit a 1, si
complementano (0Æ1, 1Æ0) tutti gli altri bit
Ing. L.Testa - Fondamenti di Informatica
Complemento a 2
„
complemento a 2:
„
„
„
(complemento alla base)
per definizione il complemento a 2 di X è 2n - X
unica rappresentazione dello ‘0’
I numeri positivi sono rappresentati dal loro modulo e hanno il
bit più significativo (segno) posto a zero. I numeri negativi sono
rappresentati dal complemento a 2 del corrispondente numero
positivo, segno compreso. Pertanto, i numeri negativi hanno il
bit più significativo sempre a 1.
„
Esempio:
+3 <=> 00011
- 3 <=> 11101
Ing. L.Testa - Fondamenti di Informatica
Uso dei numeri negativi
„
„
Modulo e segno:
„ la somma algebrica di numeri positivi e negativi
può generare problemi
„ servono sistemi hardware specifici per la
gestione corretta del formato
Complemento a due:
„ la somma algebrica non genera problemi
Ing. L.Testa - Fondamenti di Informatica
Complemento a 2
„
Motivazione:
„ Sia dato un numero di bit n
„ i numeri che si possono rappresentare sono
n
nel range [0 - 2 -1]
„ si vuole calcolare A-B
n
„ si sostituisce -B con (2 -B)
n
„ si ottiene A+(2 -B)
„ La sottrazione si esegue mediante una somma!
Ing. L.Testa - Fondamenti di Informatica
Numeri negativi:
intervallo valori rappresentabili
Rappresentazione modulo e segno
-2n-1 + 1 ≤ N ≤ 2n-1 - 1
Rappresentazione in complemento a due
-2n-1 ≤ N ≤ 2n-1 - 1
Ing. L.Testa - Fondamenti di Informatica
Rappresentazione numeri reali
„
„
I numeri reali sono nel range [-∞ ÷ +∞]
Talvolta è necessaria una rappresentazione estesa
sulla retta dei reali
„ con 3 simboli
[+/-], X, Y, Z ∈ {0,1,…9} è
possibile rappresentare -999 ÷ +999
„ oppure
9 * 10[+/-] 99
[+/-] 99
„ oppure [+/-] 9 * 10
Ing. L.Testa - Fondamenti di Informatica
Virgola mobile
„
„
E’ la risposta alla necessità di manipolare
numeri di ordini di grandezza diversi
Notazione scientifica - numeri espressi nella forma:
X.YYY * 10WW
„ X: parte intera
„ Y: parte frazionaria
„ W: esponente
Ing. L.Testa - Fondamenti di Informatica
Virgola mobile
„
„
Nomenclatura:
A = M * BE
„ M: mantissa
„ B: base
„ E: esponente
Necessita di un segno per la mantissa e uno per
l’esponente
Ing. L.Testa - Fondamenti di Informatica
Virgola mobile
„
Forma normalizzata:
numero = ± 1.XXXXXXX * 2a
„
„
.XXXXXXX parte frazionaria
a è detto esponente vero
Ing. L.Testa - Fondamenti di Informatica
Virgola mobile
„
Rappresentazione standard (IEEE P754)
„ Segno: 1 bit di segno (0 per i positivi, 1 per i negativi)
„
„
Esponente: l’esponente vero è rappresentato come
numero senza segno su 8 bit usando la
rappresentazione eccesso 127 (il valore che quindi si
rappresenta è a+127; il valore dell’esponente vero
dovrà essere in modulo minore di 127)
Mantissa: vengono rappresentati i primi 23 bit della
parte frazionaria della forma normalizzata (hidden bit :
la parte intera di peso 20 viene sottintesa)
Ing. L.Testa - Fondamenti di Informatica
Virgola mobile
„
Rappresentazione IEEE P754 (32 bit)
„
„
„
1 bit per il segno
8 bit per l’esponente (rappresentazione eccesso 127)
23 per la mantissa (parte frazionaria - normalizzata)
Segno Esponente
S
E
Mantissa
F
N = (-1)S * 2E-127 * 1.F
Ing. L.Testa - Fondamenti di Informatica
Virgola mobile - precisione
S
(1 bit)
E
(8 bit)
F
(23 bit)
32 bit (singola precisione), M=127
S
(1 bit)
E
(11 bit)
F
(52 bit)
64 bit (doppia precisione), M=1023
S
(1 bit)
E
(15 bit)
F
(112 bit)
128 bit (quadrupla precisione), M=16383
Ing. L.Testa - Fondamenti di Informatica
Virgola mobile
„
Esempi usando: B=10, 2 cifre all’esponente e 8
alla mantissa:
„
+1
0 01 10000000
„
-63517,8
1 05 63517800
„
-0,000635178 1 97 63517800
„
-8,75 * 10-13 1 88 87500000
Fondamenti di Informatica
46
Virgola mobile
„
Moltiplicazione e divisione:
„ si moltiplica o si dividono le mantisse in
modo consueto
„ si sommano o si sottraggono gli esponenti
„ si normalizza
„ Esempio: 10,4 * 200 =
0 02 10400000 * 0 03 20000000 =
0 05 20800000
Ing. L.Testa - Fondamenti di Informatica
Virgola mobile
„
Somma e sottrazione:
„ si uguagliano gli esponenti
„ le mantisse vengono sommate
„ aggiustamento in caso di traboccamento
„ Esempio: 10,4 + 2 =
0 02 10400000 + 0 01 20000000 =
0 02 10400000 + 0 02 02000000 =
0 02 12400000 = 12,4
Ing. L.Testa - Fondamenti di Informatica
Virgola mobile
„
Approssimazioni:
„
34,56 + 0,005 =
0 02 3456 + 0 98 5000 =
0 02 3456 + 0 02 0000 =
0 02 3456 = 34,56
„
La precisione è data dal numero di cifre della
mantissa:
„
Doppia precisione: doppia lunghezza della
mantissa (range invariato, precisione raddoppiata)
Ing. L.Testa - Fondamenti di Informatica
Memorizzazione su calcolatore
e codici
Memorizzazione su calcolatore
„
„
„
L'unità atomica è il bit (BInary DigiT)
L'insieme di 8 bit è detta byte
Altre forme di memorizzazione:
„ Word (16 bit)
„ Double-word (32 bit)
„ Quad-word (64 bit)
Ing. L.Testa - Fondamenti di Informatica
Intervalli di variabilità
„
bit:
Numero di configurazioni: 2
intervallo di variabilità: [0-1]
„
byte:
Numero di configurazioni: 256
intervallo di variabilità:
dipende dal tipo di memorizzazione
Ing. L.Testa - Fondamenti di Informatica
Tipi di memorizzazione
„
„
„
Modulo: 256 configurazioni,
[0, 255]
Modulo e segno: 256 configurazioni,
[-127, +127]
Complemento a 2: 256 configurazioni,
[-128, +127]
Ing. L.Testa - Fondamenti di Informatica
Intervalli di variabilità
„
Word:
„
Double-word: [0, 232-1]
„
Quad-word:
Ing. L.Testa - Fondamenti di Informatica
[0, 216-1]
[0, 264-1]
Convenzioni
„
Floating point:
„
„
„
mantissa: 23 bit
segno: 1 bit
esponente: 8 bit
Ing. L.Testa - Fondamenti di Informatica
Codici
„
Codice: sistema di simboli che permette la
rappresentazione dell’informazione
0
„
Esempi:
„
Decodifica agevole vs codici compressi
Ing. L.Testa - Fondamenti di Informatica
Definizioni
„
„
„
„
SIMBOLO: entità di cui non si da qui una
definizione formale
STRINGA: sequenza finita di simboli
giustapposti (lunghezza della stringa, stringa
vuota)
ALFABETO: insieme finito di simboli
LINGUAGGIO: insieme di stringhe di simboli
tratti da un alfabeto
Ing. L.Testa - Fondamenti di Informatica
Esempi di alfabeti
„
„
„
Alfabeto italiano:
{A, B, C, D, …Z}
Alfabeto greco:
{α, β, γ, δ, ...ω}
Alfabeto binario:
{0, 1}
Ing. L.Testa - Fondamenti di Informatica
Alfabeto usato dal calcolatore
„
„
„
„
„
„
Interruttore (aperto/chiuso)
Foro su scheda (aperto/chiuso)
Transistor (in conduzione/spento)
Tensione (alta/bassa)
Dominio di magnetizzazione (↑/↓)
Riflettività di un’areola (alta/bassa)
Ing. L.Testa - Fondamenti di Informatica
Alfabeto usato dal calcolatore
„
„
Gli elaboratori utilizzano una logica e un’aritmetica
binaria
Ai due stati di un dispositivo vengono associati i
due simboli 0 e 1
Ing. L.Testa - Fondamenti di Informatica
Codifica dei simboli
„
„
E’ necessario determinare delle regole di
corrispondenza, dette codifiche
La codifica mette in corrispondenza (biunivoca)
ogni simbolo appartenente all’alfabeto più ricco
con una stringa di simboli appartenente
all’alfabeto più ridotto.
Ing. L.Testa - Fondamenti di Informatica
Codifica
„
„
Problema:
codificare i simboli dell’alfabeto A utilizzando
stringhe del linguaggio L, con A qualsiasi e
L={ stringhe di N bit }
Cardinalità C dell’alfabeto A:
numero di elementi di A
Ing. L.Testa - Fondamenti di Informatica
Codifiche ridondanti
„
Se C e’ la cardinalità, si deve avere:
N ≥ log2 C = M
cioè:
se
se
C ≤ 2N
M⎤ =N
M⎤ <N
è senza ridondanza
è con ridondanza
Ing. L.Testa - Fondamenti di Informatica
Distanza di Hamming
„
E’ definita come il minimo numero di bit di cui
differiscono due parole qualsiasi del codice
se N=M
si ha che
se c’è ridondanza,
Ing. L.Testa - Fondamenti di Informatica
H=1
H≥1
Rilevazione e correzione di errori
„
La ridondanza può servire per rilevare o
correggere errori nel codice
„
Num di errori rilevati: R = H-1
„
Num di errori corretti:
H −1
C≤
2
Ing. L.Testa - Fondamenti di Informatica
Esempio di codifica ridondante
„
„
Parità:
si ottiene dal codice non ridondante aggiungendo
un simbolo in modo che il numero di ‘1’ sia pari
(parità pari) o dispari (parità dispari).
Avendo H=2 può solo rilevare un errore
Ing. L.Testa - Fondamenti di Informatica
Codice BCD
„
BCD: Binary Coded Decimal
Simbolo: Codifica:
0
1
2
3
4
8
9
…
0000
0001
0010
0011
0100
1000
1001
Ing. L.Testa - Fondamenti di Informatica
Operazioni sui BCD
„
„
E’ usato spesso quando l’elaborazione è ridotta,
mentre la visualizzazione è frequente
Problema della correzione (+6)
Ing. L.Testa - Fondamenti di Informatica
Codifica dei testi
„
„
Si utilizza una tabella (arbitraria)
Standard oggi (quasi) universalmente riconosciuto
Codice ASCII
American Standard Code for Information Interchange
Ing. L.Testa - Fondamenti di Informatica
Codice ASCII
„
„
Si utilizzano 7 bit
quindi
128 simboli diversi
ASCII esteso (8bit)
„ diverse estensioni in dipendenza dal paese
„ oppure aggiunge la parità
Ing. L.Testa - Fondamenti di Informatica
Codice ASCII
Ing. L.Testa - Fondamenti di Informatica
Codice ASCII - note
„
„
„
I caratteri alfabetici sono consecutivi e in ordine
(alfabetico)
La distanza tra una lettera minuscola e la
corrispondente maiuscola è costante
Le cifre decimali sono consecutive e in ordine
(da 0 a 9)
Ing. L.Testa - Fondamenti di Informatica
Scarica