Gestione e Masterizzazione di file immagini, file mp3 e video 1a Lezione: Martedì 11 Dicembre 2007 - Formato immagine/audio/video In questa lezione Che cos'è una jpg? …e altri formati per immagini? Che cos'è l'mp3? …e altri formati audio? Che cos'è una jpg? Ma prima di parlare di jpg…chi mi sa dire che cos’è un formato? Un formato è semplicemente un modo per salvare le parti elettroniche che compongono i file di un computer. La sigla JPEG o JPG è l'acronimo di Joint Photographic Experts Group. Che cos'è una jpg? (2) Questo tipo di immagine usa una compressione con perdita di dati. La perdita dei dati consiste nel fatto che alcuni dati che formavano l’immagine vengono persi durante il processo di compressione. Questo corrisponde a una perdita di qualità nell'immagine, direttamente proporzionale al livello di compressione che sceglierai. Possiamo dire che a bassi livelli di compressione la perdita di qualità è praticamente nulla e non si percepisce a occhio nudo, ma se aumentiamo il livello di compressione dobbiamo controllare che l'immagine sia comunque di buona qualità, perché la perdita di dati in questo caso può essere rilevante. Che cos'è una jpg? (3) Usa questo tipo di formato per immagini a tinte non piatte, cioè per immagini fotografiche o con immagini con sfumature leggere e continue. Il formato Jpeg non è sicuramente adatto per il trattamento di immagini vettoriali o contenenti testo….allora usa questo formato di esportazione (Jpeg) per riportare sul web immagini ottenute tramite scansione di fotografie, comunque per tutte quelle che necessitano di un numero di colori superiore a 256. Ricorda che questo formato non supporta le trasparenze. Non è invece ideale per disegni geometrici, testo o icone, per cui sono utilizzati comunemente i formati PNG e GIF. Che cos'è una jpg? (4) Dato che, come abbiamo già detto, il formato è a perdita di dati non è una buona soluzione salvare un'immagine JPEG da un'altra immagine JPEG. La cosa migliore è ottenere immagini JPEG dall'immagine originale. Esiste anche un formato chiamato JPEG selettivo. Questo permette di esportare un'immagine con una diversa compressione applicata alle varie parti che la compongono. Che cos'è una jpg? (5) Attualmente JPEG è lo standard di compressione delle immagini fotografiche più utilizzato. Le estensioni più comuni per questo formato sono .jpeg, .jpg, .jfif, .JPG, .JPE, anche se il più comune in tutte le piattaforme è .jpg. Lo standard JPEG definisce due metodi di compressione di base, uno basato sull'uso della trasformata discreta in coseno (DCT) con compressione di tipo "lossy" cioè con perdita di informazione, l'altro sull'uso di un metodo predittivo con compressione di tipo "lossless" cioè senza perdita di informazione. L'algoritmo base dello JPEG di tipo "lossy" viene detto "baseline", inoltre sono state definite delle estensioni opzionali del metodo "lossy" per la compressione di tipo gerarchico e progressivo. …e altri formati per immagini? Windows bitmap (.bmp) GIF RAW Png TIFF … Windows bitmap (.bmp) Windows bitmap è un formato dati utilizzato per la rappresentazione di immagini sui sistemi operativi Microsoft Windows. Noto soprattutto come formato di file, fu introdotto con Windows 3.0 nel 1990. Le bitmap, come sono comunemente chiamati i file d'immagine di questo tipo, hanno generalmente l'estensione .bmp, o meno frequentemente .dib (deviceindependent bitmap). Sono state sviluppate tre versioni del formato bitmap. La prima e più comunemente utilizzata è la versione 3: non esistono versioni antecedenti. Le versioni successive 4 e 5 si incontrano piuttosto raramente Una delle caratteristiche essenziali del formato bitmap che ne hanno fatto per molto tempo la fortuna è la velocità con cui le immagini vengono lette o scritte su disco, molto maggiore se paragonata a quella di altri tipi di file, soprattutto sulle macchine più lente. Nelle bitmap non compresse la rappresentazione dei dati nella memoria RAM è in gran parte simile, spesso identica, a quella dei dati su disco: il processore non è costretto ad effettuare calcoli laboriosi durante le operazioni di codifica e di decodifica e il tempo di accesso ai dati è spesso limitato solo dall'hardware del drive. GIF La sigla GIF è acronimo di Graphic Interchange Format. Questo tipo di compressione, al contrario del JPEG non lavora a perdita di dati, ma può esportare solo immagini che contengono al massimo 256 colori. Se l'originale contiene un numero più elevato di colori, la perdita di qualità sarà significativa. Il formato GIF usa colori a 8 bit ed è efficace per comprimere immagini vettoriali, geometriche o testo. Il formato GIF supporta la trasparenza, quindi puoi far emergere lo sfondo attraverso l'immagine senza vincolare le immagini stesse al solo formato rettangolare o quadrato. Le immagini GIF permettono anche di creare delle piccole animazioni, le GIF ANIMATE, perché supportano anche fotogrammi multipli. I GIF animati si realizzano con semplici tool grafiche e con la tecnica del cartone animato. RAW Il formato RAW è un particolare metodo di memorizzazione dei dati descrittori di un'immagine. Ciò permette di non avere perdite di qualità della registrazione su un qualsiasi supporto rispetto ai segnali catturati dal sensore e successivamente composti per interpolazione dal processore d’immagine della fotocamera nelle sue tre componenti fondamentali RGB (RED, GREEN, BLUE). png Il formato PNG è acronimo di Portable Network Graphic. Questo tipo di formato non è supportato da tutti i tipi di browser, ma è tuttavia possibile installare un plug-in per visualizzare le immagini PNG. Non usare questo formato se il tuo sito dovrà essere accessibile a un grande numero di utenti, tuttavia è utile sapere come funziona, quali sono le sue caratteristiche e quali opportunità offre. Questo formato supporta colori fino a 32 bit e può contenere la trasparenza. E' un tipo di compressione senza perdita di dati, anche per alte profondità di colore. Purtroppo però produce file di grandi dimensioni. Esistono due tipi di file PNG: PNG-8 PNG-24 Il formato PNG-8 usa colori a 8 bit e presenta molte analogie con i file di tipo GIF. Risulta utile per la compressione di aree a tinta unita e mantiene i dettagli nitidi. Il formato PNG-24 supporta colori a 24 bit e presenta molte analogie con i file di tipo JPEG. È adatto sia per le immagini fotografiche che per le immagini geometriche e in più ha il vantaggio di supportare la trasparenza anche su più livelli. Glossario foto Risoluzione: numero di pixel dell’immagine Pixel: elementi puntiformi che compongono la rappresentazione di una immagine nella memoria di un computer. Ciascun pixel, che rappresenta il più piccolo elemento autonomo dell'immagine, è caratterizzato dalla propria posizione e da valori quali colore e intensità, variabili in funzione del sistema di rappresentazione adottato. Fotografia: insieme di pixel. Programmi Ditemi voi.. Che cos'è l'mp3? MP3 (o, più esattamente MPEG-1/2 Audio Layer 3) è un algoritmo di compressione audio in grado di ridurre drasticamente la quantità di dati richiesti per riprodurre un suono, rimanendo comunque una riproduzione fedele del file originale non compresso . Molti ritengono di qualità accettabile per il formato MP3 il bitrate di 128 kilobits al secondo, qualità che si avvicina a quella di un CD. Questo bitrate è il risultato di un tasso di compressione che si avvicina al rapporto di 11.02:1. Tuttavia test di ascolto mostrano che, attraverso un po' di pratica, molti sono in grado di distingure un formato MP3 a 128 kbit/sec da un CD originale. Per molti altri, 128 kbit/s è una qualità di ascolto bassa. Che cos'è l'mp3? (2) Una caratteristica importante dell'MP3 è la perdita di dati dovuta alla compressione – è il modo con cui si rimuove l'informazione dal file audio originale allo scopo di risparmiare spazio. Nei moderni codificatori MP3 gli algoritmi più efficaci fanno di tutto per assicurare che i suoni rimossi siano quelli che non possono essere rilevati dall'orecchio umano. Questo risultato è stato ottenuto anche grazie alla scienza della psicoacustica. Il bit rate è il numero di unità binarie che fluiscono al secondo ed è variabile per i file MP3. La regola generale è che maggiore è il bitrate, più informazione è possibile includere dall'originale, maggiore è la qualità del file audio compresso Che cos'è l'mp3? (3) Lo standard MPEG-1 non definisce specifiche precise per i codificatori MP3. L'algoritmo di decodifica e il formato del file, invece sono definiti molto bene. Si presume che il creatore dello standard abbia escogitato un algoritmo per rimuovere appropriate parti di informazioni da un file originale, o piuttosto una rappresentazione in dominio di frequenza (MDCT). Questo processo si basa tipicamente sulla codifica psico acustica, ossia vengono rimossi quei suoni che l'orecchio umano non è in grado di percepire sia mediante l'orecchio che il cervello. Come risultato, vi sono molti codificatori MP3 differenti, ognuno in grado di riprodurre file di qualità differente; al 30 settembre 2001 il migliore codificatore ad alto bitrate (128 kbit/s e superiori) è LAME. Per i bitrate più bassi il miglior codificatore è il Fraunhofer, ma vi sono diverse opinioni. La decodifica MP3, è tuttavia ben definita da uno standard. …e altri formati audio? WMA RealAudio AC-3 OGG … WMA Il Windows Media Audio (WMA) è uno standard per file audio inventato dalla Microsoft. I file con estensione WMA sono file di tipo Advanced Systems Format (.asf) il cui audio è compresso con il codec WMA. L'unica differenza tra i due formati, al di là delle estensioni, è il tipo MIME, che per gli .asf è video/x-ms-asf e per i .wma è audio/x-mswma. A parte questo, la struttura di base dei due file è identica. Real Audio Il RealAudio è un formato audio proprietario sviluppato da RealNetworks. La prima versione di RealAudio venne realizzata nel 1995. L'ultima versione, RealAudio 10.5, è stata rilasciata nel corso del 2006. AC3 Il sistema di compressione psicoacustica utilizzando dal Dolby Digital si chiama AC3. Un segnale audio stereo PCM lineare (quindi non compresso) a 48 kHz/16 bit, richiede 768 kbps per essere codificato, pertanto un segnale stereo di questo tipo necessiterebbe di 1536 kbps, ed un segnale a 5 canali di 3840 kbps. L'AC3 permette di ridurre questi valori anche di un fattore superiore a 10, richiedendo circa 400 kbps per codificare audio 5.1, e meno di 200 kbps per codificare audio stereo. Tanto maggiore è il fattore di compressione, ovviamente, tanto maggiore è la probabilità che il livello di rumore introdotto a causa della perdita di informazioni diventi udibile, causando artefatti di varia natura. Per questo motivo, tanto maggiore è il bitrate utilizzato per la codifica tanto migliore sarà l'aderenza alla qualità dell'audio originale non compresso che ci si può aspettare. L'AC3 è un sistema di codifica di tipo ibrido, che impiega tecnologie di codifica backward e forward adaptive. Il decoder e l'encoder condividono infatti un algoritmo di codifica noto e non modificabile, che viene sempre utilizzato per la compressione e la decompressione del dati audio digitali. Il decoder, quindi, sa come decodificare i dati anche in assenza di informazioni sull'encoder: questo metodo è detto "backward adaptive" ed ha il vantaggio di essere molto efficiente, ma lo svantaggio di non essere rinnovabile (se si cambia l'algoritmo base dell'encoder si devono anche cambiare i decoder) e di richiedere una discreta complessità nel decoder. Per ovviare a questo secondo problema, l'algoritmo base dell'AC3 è molto semplice seppure accurato, pertanto non è troppo dispendioso in termini computazionali OGG Vorbis è un algoritmo open source per la compressione audio digitale di tipo lossy, diretta antagonista di altri standard come MP3. A parità di qualità percepita, permette una maggiore compressione rispetto al formato MP3, ottenuta mediante avanzate ricerche di psicoacustica. Tra i difetti attribuiti vanno citati la relativa pesantezza dell'algoritmo di decodifica rispetto al collaudato MP3, e soprattutto una certa tendenza al pre-echo, ovvero un innaturale fantasma sonoro che sembra precedere di alcuni brevi istanti ogni brusco aumento di pressione sonora. L'esempio che tipicamente viene portato è quello di una sonata di pianoforte con attacchi di fortissimo dal silenzio, oppure il suono delle nacchere. Programmi Cercate con google e la prossima lezione ne parliamo