Gestione e Masterizzazione di
file immagini, file mp3 e video
1a Lezione: Martedì 11 Dicembre
2007 - Formato
immagine/audio/video
In questa lezione




Che cos'è una jpg?
…e altri formati per immagini?
Che cos'è l'mp3?
…e altri formati audio?
Che cos'è una jpg?



Ma prima di parlare di jpg…chi mi sa
dire che cos’è un formato?
Un formato è semplicemente un modo
per salvare le parti elettroniche che
compongono i file di un computer.
La sigla JPEG o JPG è l'acronimo di Joint
Photographic Experts Group.
Che cos'è una jpg? (2)

Questo tipo di immagine usa una compressione con
perdita di dati. La perdita dei dati consiste nel fatto
che alcuni dati che formavano l’immagine vengono
persi durante il processo di compressione. Questo
corrisponde a una perdita di qualità nell'immagine,
direttamente proporzionale al livello di compressione
che sceglierai. Possiamo dire che a bassi livelli di
compressione la perdita di qualità è praticamente
nulla e non si percepisce a occhio nudo, ma se
aumentiamo il livello di compressione dobbiamo
controllare che l'immagine sia comunque di buona
qualità, perché la perdita di dati in questo caso può
essere rilevante.
Che cos'è una jpg? (3)



Usa questo tipo di formato per immagini a tinte non piatte, cioè
per immagini fotografiche o con immagini con sfumature
leggere e continue. Il formato Jpeg non è sicuramente adatto
per il trattamento di immagini vettoriali o contenenti
testo….allora usa questo formato di esportazione (Jpeg) per
riportare sul web immagini ottenute tramite scansione di
fotografie, comunque per tutte quelle che necessitano di un
numero di colori superiore a 256.
Ricorda che questo formato non supporta le trasparenze.
Non è invece ideale per disegni geometrici, testo o icone, per
cui sono utilizzati comunemente i formati PNG e GIF.
Che cos'è una jpg? (4)


Dato che, come abbiamo già detto, il formato
è a perdita di dati non è una buona soluzione
salvare un'immagine JPEG da un'altra
immagine JPEG. La cosa migliore è ottenere
immagini JPEG dall'immagine originale.
Esiste anche un formato chiamato JPEG
selettivo. Questo permette di esportare
un'immagine con una diversa compressione
applicata alle varie parti che la compongono.
Che cos'è una jpg? (5)


Attualmente JPEG è lo standard di compressione delle immagini
fotografiche più utilizzato. Le estensioni più comuni per questo
formato sono .jpeg, .jpg, .jfif, .JPG, .JPE, anche se il più comune
in tutte le piattaforme è .jpg.
Lo standard JPEG definisce due metodi di compressione di base,
uno basato sull'uso della trasformata discreta in coseno (DCT)
con compressione di tipo "lossy" cioè con perdita di
informazione, l'altro sull'uso di un metodo predittivo con
compressione di tipo "lossless" cioè senza perdita di
informazione. L'algoritmo base dello JPEG di tipo "lossy" viene
detto "baseline", inoltre sono state definite delle estensioni
opzionali del metodo "lossy" per la compressione di tipo
gerarchico e progressivo.
…e altri formati per immagini?






Windows bitmap (.bmp)
GIF
RAW
Png
TIFF
…
Windows bitmap (.bmp)




Windows bitmap è un formato dati utilizzato per la rappresentazione di immagini
sui sistemi operativi Microsoft Windows. Noto soprattutto come formato di file,
fu introdotto con Windows 3.0 nel 1990.
Le bitmap, come sono comunemente chiamati i file d'immagine di questo tipo,
hanno generalmente l'estensione .bmp, o meno frequentemente .dib (deviceindependent bitmap).
Sono state sviluppate tre versioni del formato bitmap. La prima e più
comunemente utilizzata è la versione 3: non esistono versioni antecedenti. Le
versioni successive 4 e 5 si incontrano piuttosto raramente
Una delle caratteristiche essenziali del formato bitmap che ne hanno fatto per
molto tempo la fortuna è la velocità con cui le immagini vengono lette o scritte
su disco, molto maggiore se paragonata a quella di altri tipi di file, soprattutto
sulle macchine più lente. Nelle bitmap non compresse la rappresentazione dei
dati nella memoria RAM è in gran parte simile, spesso identica, a quella dei dati
su disco: il processore non è costretto ad effettuare calcoli laboriosi durante le
operazioni di codifica e di decodifica e il tempo di accesso ai dati è spesso
limitato solo dall'hardware del drive.
GIF




La sigla GIF è acronimo di Graphic Interchange Format.
Questo tipo di compressione, al contrario del JPEG non lavora a
perdita di dati, ma può esportare solo immagini che contengono
al massimo 256 colori. Se l'originale contiene un numero più
elevato di colori, la perdita di qualità sarà significativa. Il
formato GIF usa colori a 8 bit ed è efficace per comprimere
immagini vettoriali, geometriche o testo.
Il formato GIF supporta la trasparenza, quindi puoi far emergere
lo sfondo attraverso l'immagine senza vincolare le immagini
stesse al solo formato rettangolare o quadrato.
Le immagini GIF permettono anche di creare delle piccole
animazioni, le GIF ANIMATE, perché supportano anche
fotogrammi multipli. I GIF animati si realizzano con semplici tool
grafiche e con la tecnica del cartone animato.
RAW

Il formato RAW è un particolare metodo di
memorizzazione dei dati descrittori di
un'immagine. Ciò permette di non avere
perdite di qualità della registrazione su un
qualsiasi supporto rispetto ai segnali catturati
dal sensore e successivamente composti per
interpolazione dal processore d’immagine
della fotocamera nelle sue tre componenti
fondamentali RGB (RED, GREEN, BLUE).
png








Il formato PNG è acronimo di Portable Network Graphic.
Questo tipo di formato non è supportato da tutti i tipi di browser, ma è tuttavia possibile
installare un plug-in per visualizzare le immagini PNG. Non usare questo formato se il tuo
sito dovrà essere accessibile a un grande numero di utenti, tuttavia è utile sapere come
funziona, quali sono le sue caratteristiche e quali opportunità offre.
Questo formato supporta colori fino a 32 bit e può contenere la trasparenza. E' un tipo di
compressione senza perdita di dati, anche per alte profondità di colore. Purtroppo però
produce file di grandi dimensioni.
Esistono due tipi di file PNG:
PNG-8
PNG-24
Il formato PNG-8 usa colori a 8 bit e presenta molte analogie con i file di tipo GIF. Risulta
utile per la compressione di aree a tinta unita e mantiene i dettagli nitidi.
Il formato PNG-24 supporta colori a 24 bit e presenta molte analogie con i file di tipo JPEG.
È adatto sia per le immagini fotografiche che per le immagini geometriche e in più ha il
vantaggio di supportare la trasparenza anche su più livelli.
Glossario foto



Risoluzione: numero di pixel dell’immagine
Pixel: elementi puntiformi che compongono la
rappresentazione di una immagine nella
memoria di un computer. Ciascun pixel, che
rappresenta il più piccolo elemento autonomo
dell'immagine, è caratterizzato dalla propria
posizione e da valori quali colore e intensità,
variabili in funzione del sistema di
rappresentazione adottato.
Fotografia: insieme di pixel.
Programmi

Ditemi voi..
Che cos'è l'mp3?


MP3 (o, più esattamente MPEG-1/2 Audio Layer 3) è un
algoritmo di compressione audio in grado di ridurre
drasticamente la quantità di dati richiesti per riprodurre un
suono, rimanendo comunque una riproduzione fedele del file
originale non compresso .
Molti ritengono di qualità accettabile per il formato MP3 il bitrate
di 128 kilobits al secondo, qualità che si avvicina a quella di un
CD. Questo bitrate è il risultato di un tasso di compressione che
si avvicina al rapporto di 11.02:1. Tuttavia test di ascolto
mostrano che, attraverso un po' di pratica, molti sono in grado
di distingure un formato MP3 a 128 kbit/sec da un CD originale.
Per molti altri, 128 kbit/s è una qualità di ascolto bassa.
Che cos'è l'mp3? (2)


Una caratteristica importante dell'MP3 è la perdita di dati dovuta
alla compressione – è il modo con cui si rimuove l'informazione
dal file audio originale allo scopo di risparmiare spazio. Nei
moderni codificatori MP3 gli algoritmi più efficaci fanno di tutto
per assicurare che i suoni rimossi siano quelli che non possono
essere rilevati dall'orecchio umano. Questo risultato è stato
ottenuto anche grazie alla scienza della psicoacustica.
Il bit rate è il numero di unità binarie che fluiscono al secondo
ed è variabile per i file MP3. La regola generale è che maggiore
è il bitrate, più informazione è possibile includere dall'originale,
maggiore è la qualità del file audio compresso
Che cos'è l'mp3? (3)


Lo standard MPEG-1 non definisce specifiche precise per i
codificatori MP3. L'algoritmo di decodifica e il formato del file,
invece sono definiti molto bene. Si presume che il creatore dello
standard abbia escogitato un algoritmo per rimuovere
appropriate parti di informazioni da un file originale, o piuttosto
una rappresentazione in dominio di frequenza (MDCT). Questo
processo si basa tipicamente sulla codifica psico acustica, ossia
vengono rimossi quei suoni che l'orecchio umano non è in grado
di percepire sia mediante l'orecchio che il cervello.
Come risultato, vi sono molti codificatori MP3 differenti, ognuno
in grado di riprodurre file di qualità differente; al 30 settembre
2001 il migliore codificatore ad alto bitrate (128 kbit/s e
superiori) è LAME. Per i bitrate più bassi il miglior codificatore è
il Fraunhofer, ma vi sono diverse opinioni. La decodifica MP3, è
tuttavia ben definita da uno standard.
…e altri formati audio?





WMA
RealAudio
AC-3
OGG
…
WMA


Il Windows Media Audio (WMA) è uno
standard per file audio inventato dalla
Microsoft.
I file con estensione WMA sono file di tipo
Advanced Systems Format (.asf) il cui audio è
compresso con il codec WMA. L'unica
differenza tra i due formati, al di là delle
estensioni, è il tipo MIME, che per gli .asf è
video/x-ms-asf e per i .wma è audio/x-mswma. A parte questo, la struttura di base dei
due file è identica.
Real Audio

Il RealAudio è un formato audio
proprietario
sviluppato
da
RealNetworks. La prima versione di
RealAudio venne realizzata nel 1995.
L'ultima versione, RealAudio 10.5, è
stata rilasciata nel corso del 2006.
AC3


Il sistema di compressione psicoacustica utilizzando dal Dolby Digital si chiama AC3. Un
segnale audio stereo PCM lineare (quindi non compresso) a 48 kHz/16 bit, richiede 768
kbps per essere codificato, pertanto un segnale stereo di questo tipo necessiterebbe di 1536
kbps, ed un segnale a 5 canali di 3840 kbps. L'AC3 permette di ridurre questi valori anche di
un fattore superiore a 10, richiedendo circa 400 kbps per codificare audio 5.1, e meno di
200 kbps per codificare audio stereo. Tanto maggiore è il fattore di compressione,
ovviamente, tanto maggiore è la probabilità che il livello di rumore introdotto a causa della
perdita di informazioni diventi udibile, causando artefatti di varia natura. Per questo motivo,
tanto maggiore è il bitrate utilizzato per la codifica tanto migliore sarà l'aderenza alla qualità
dell'audio originale non compresso che ci si può aspettare.
L'AC3 è un sistema di codifica di tipo ibrido, che impiega tecnologie di codifica backward e
forward adaptive. Il decoder e l'encoder condividono infatti un algoritmo di codifica noto e
non modificabile, che viene sempre utilizzato per la compressione e la decompressione del
dati audio digitali. Il decoder, quindi, sa come decodificare i dati anche in assenza di
informazioni sull'encoder: questo metodo è detto "backward adaptive" ed ha il vantaggio di
essere molto efficiente, ma lo svantaggio di non essere rinnovabile (se si cambia l'algoritmo
base dell'encoder si devono anche cambiare i decoder) e di richiedere una discreta
complessità nel decoder. Per ovviare a questo secondo problema, l'algoritmo base dell'AC3 è
molto semplice seppure accurato, pertanto non è troppo dispendioso in termini
computazionali
OGG


Vorbis è un algoritmo open source per la compressione audio
digitale di tipo lossy, diretta antagonista di altri standard come
MP3. A parità di qualità percepita, permette una maggiore
compressione rispetto al formato MP3, ottenuta mediante
avanzate ricerche di psicoacustica.
Tra i difetti attribuiti vanno citati la relativa pesantezza
dell'algoritmo di decodifica rispetto al collaudato MP3, e
soprattutto una certa tendenza al pre-echo, ovvero un
innaturale fantasma sonoro che sembra precedere di alcuni
brevi istanti ogni brusco aumento di pressione sonora.
L'esempio che tipicamente viene portato è quello di una sonata
di pianoforte con attacchi di fortissimo dal silenzio, oppure il
suono delle nacchere.
Programmi

Cercate con google e la prossima
lezione ne parliamo