Piccola Guida ai File Musicali Contenuti • • • • I formati audio più diffusi MP3 Come scaricare file musicali da Internet Ascoltare musica sul PC sufficiente a rappresentare ogni singolo campione. 1 byte è composto da 8 bit che possono assumere i valori di 0 o 1. Sono quindi possibili 28 sequenze di 0 e 1, cioè 256 diversi valori. Ma con campionamenti di qualità elevata, come quelle utilizzate per i CD Audio (ben 44.100 campioni/secondo) l'identificazione diventa problematica. Pertanto vengono usati 2 byte cioè 16 bit, disponendo così di 216 = 65.536 possibili valori per ogni campione. Aumenta, in tal modo, quella che viene definita risoluzione. Ma non è finita. Il brano di 10 secondi dell'esempio è diventato a questo punto di 44.100 x 10 x 2 = 882.000 byte! Questo vale solo per un canale. Ma se il brano è stereo, cioè utilizza due canali, occorre moltiplicare ancora per 2, arrivando alla ragguardevole dimensione di 1.764.000 byte. Se la durata è di un minuto i byte diventano 10.584.000, se è di 1 ora 635.040.000., cioè circa 600 MB (!), che è infatti quasi la massima dimensione registrabile su un CD Audio. I formati audio più diffusi Ricapitolando. La qualità di un brano audio digitale e, di conseguenza, la sua dimensione dipendono da tre fattori: il numero di campioni per secondo, la risoluzione e i canali. Il prodotto di questi tre elementi è definito bitrate, cioè bit per secondo, ovvero bps. Il bitrate dei brani presenti sui CD audio è di 1411,2 kbps. L'enorme crescita di Internet ha fortemente contribuito allo sviluppo di sofisticate tecniche di compressione dei file multimediali, al fine di garantire una maggiore rapidità nella trasmissione dei dati. L'esigenza di ridurre le dimensioni dei file si è concretizzata, per quanto riguarda i formati audio e video, nella nascita dello standard MPEG (Motion Picture Experts Group). L'elevato rapporto di compressione e il mantenimento della qualità sonora sono i fattori che hanno favorito l'impressionante popolarità dei file musicali MP3 (= MPEG 1 Layer III), di cui parlo in dettaglio nell'omonimo capitolo di questa guida. Tuttavia, girovagando su Internet, o semplicemente, accendendo il PC, è normale imbattersi in altri formati audio, spesso più adatti per creare effetti sonori o commentare musicalmente giochi, applicazioni multimediali, pagine Web. Vediamoli da vicino. Alla luce di quanto detto è evidente che il formato .WAV non è utilizzabile per diffondere musica su Internet o per memorizzare brani sul PC, a causa dell'eccessivo dispendio di risorse che il suo uso comporta. Viene, però, largamente utilizzato per creare effetti sonori, specialmente nei programmi e nei giochi o per personalizzare facilmente eventi particolari anche in una pagina Web. Ad es.: il vagito del mio sito neonato sulla Home Page o il gridolino di disappunto per l'eventuale impossibilità del browser a visualizzare i frame, sono stati da me registrati con il semplice registratore di suoni di Windows. File Wave Quando accendi il PC vieni accolto, all'apparire del desktop di Windows, dal suono "ambient" di The Microsoft Sound.wav, una manciata di eteree noticine uscite dal pentagramma di Brian Eno. Questo è un file Wave; wave vuol dire onda e nel caso specifico, onda sonora. L'insieme delle vibrazioni che parte da una sorgente sonora (strumento musicale, orchestra, voce, acqua che scorre in un ruscello) e arriva, attraverso l'aria, al nostro orecchio è definibile come onda sonora. Il fenomeno puramente fisico delle onde che colpiscono il timpano viene da noi percepito, grazie alle cellule cerebrali, come suono. I suoni possono essere registrati digitalmente, attraverso la tecnica del "campionamento", scomponendo, cioè, l'onda sonora in tanti minuscoli "pezzettini", chiamati campioni, e attribuendo a ciascuno un valore. E' evidente che maggiore è la quantità di campioni in un secondo, vale a dire la loro frequenza, maggiore è la qualità del suono riprodotto. Ma è altrettanto vero che tanto più numerose sono le informazioni da memorizzare tanto più grande è la quantità di risorse necessaria a conservarle. E questo spiega le grosse dimensioni dei file .WAV. Se infatti utilizziamo 1 byte per identificare ciascun campione e i campioni per secondo sono 22.050 (qualità media) avremo un file di 220.500 byte per un suono di soli 10 secondi. Andiamo avanti. Con l'aumentare della qualità sonora, cioè del numero di campioni per secondo, 1 byte non è più Per concludere voglio sottolineare il fatto che il formato Wave non è altro che la registrazione in digitale di suoni reali, suoni che hanno avuto origine da una fonte esterna al PC. In un brano musicale .WAV la batteria, il pianoforte, la chitarra, il basso o la voce si sentono allo stesso modo indipendentemente dal PC su cui il file viene ascoltato (a parità di qualità acustica dei componenti hardware, naturalmente). Questo può sembrare ovvio ma per altri formati audio le cose vanno diversamente. MP3 Come ho precisato nel capitolo dedicato ai formati audio il grosso svantaggio dei file WAV è la dimensione: 5 minuti di musica WAV "pesano" 50 MB! Sarebbe molto complicato diffondere musica su Internet con queste premesse. In base a ricerche svolte nell'ambito della psicoacustica, disciplina che studia il suono dal punto di vista della percezione, si è dimostrato che non tutti i suoni che arrivano al timpano vengono uditi; il che vuol dire che di quei famosi 44.100 campioni al secondo, contenuti in un file WAV di massima qualità, l'uomo ne riesce a percepire molti meno. Questo dipende dall'adattamento dinamico della soglia di udibilità. Se senti il walkman in metropolitana, l'ascolto è buono quando sei fermo alle stazioni. Ma, dopo la partenza, il rumore prodotto dall'aumento della velocità copre massicciamente la musica che esce dalle cuffiette. Analogamente, soprattutto in brani rock o pop, i frequenti innalzamenti di volume, operati da alcuni strumenti, provocano la mancata percezione dei suoni più deboli. In quei momenti, infatti, la soglia di udibilità aumenta e tutte le frequenze al di sotto di essa vengono "mascherate". Su questa base sono stati sviluppati algoritmi complessi per eliminare dai file audio i suoni cosiddetti irrilevanti. Questi algoritmi hanno, inoltre, semplificato la codifica di campioni adiacenti simili (ridondanti). Il risultato è una consistente riduzione delle dimensioni dei file, dovuta alla loro compressione. A questo punto vorrei fare una digressione per evitare equivoci sul significato della parola compressione. Molto spesso su Internet sono presenti programmi, o altri file da scaricare, in formato compresso ZIP, RAR o simili. Questa forma di compressione è ben diversa da quella operata sui file audio. Essa agisce sul contenuto dei file più o meno con le stesse modalità della moltiplicazione rispetto all'addizione. Ad esempio: posso scrivere 2+2+2+2+2+2+2+2+2+2 ma con 2x10 faccio prima; analogamente, per rappresentare, all'interno di un file, una sequenza di venti simboli #, posso utilizzare la forma 20x#, occupando, in tal modo, meno spazio. Quando, però, decomprimo il file sull'hard disk ripristino il suo formato originale; la compressione, è, quindi, temporanea e completamente reversibile. Viceversa, gli algoritmi di compressione audio (ad eccezione delle operazioni basate sul principio della ridondanza) agiscono in maniera irreversibile, modificando permanentemente il contenuto del file. La riduzione delle dimensioni avviene attraverso un processo di eliminazione, non di codifica "abbreviata". Se, ad esempio, trasformo un file wave in MP3 e poi nuovamente converto l'MP3 in WAV, quest'ultimo sarà notevolmente diverso dal file originale: moltissime informazioni si sono perse per strada. Il bello, però, è che l'orecchio umano praticamente non se ne accorge. Un file audio compresso, infatti, suona altrettanto bene quanto un file WAV 10 volte più grande. E' proprio l'elevata resa sonora, unita alla consistente riduzione nelle dimensioni dei file, che ha fatto la fortuna dello standard di compressione audio più famoso al mondo: MPEG 1 layer III. Per il popolo di Internet, semplicemente: MP3. KB diviso 1.024 = 4,5776367188 MB, circa 4,6 MB. Il nostro file si è ridotto di 10 volte abbondanti! Si parla, in questo caso, di rapporto di compressione 10:1. Nella tabella sottostante sono riepilogati i calcoli appena illustrati. Calcolo delle dimensioni di un file audio di 5 minuti WAV <-> MP3 WAV UdM Operazione UdM MP3 WAV 1.411,2 128 kbps x 1000 bit = bit 128.000 1.411.200 1.411.200 128.000 bit x 300 sec. = bit 38.400.000 423.360.000 423.360.000 38.400.000 bit / 8 bit = byte 4.800.000 52.920.000 52.920.000 4.800.000 byte / 1.024 byte = KB 4.687,5 51.679,6875 51.679,6875 4.687,5 KB / 1.024 KB =~ MB 4.6 50 Aumentando il rapporto di compressione la dimensione diminuisce (il bitrate si abbassa) con una conseguente riduzione della qualità: • Qualità CD 128 kbps (stereo) rapporto 10:1 .......... 112 kbps (stereo) rapporto 12:1 • Qualità prossima a CD 96 kbps (stereo) rapporto 16:1 • Qualità radio FM 64 kbps (stereo) rapporto 24:1 Cosa vuol dire MP3? In principio fu... il Motion Picture Experts Group, ovvero sia il gruppo di geniacci che ha studiato i metodi di compressione per immagini in movimento e suoni. L'acronimo è passato poi agli standard da loro messi a punto: MPEG 1 (filmati e audio), MPEG 2 (TV digitale), MPEG 4 (applicazioni multimediali). Lo standard MPEG 1, in particolare, si compone di tre algoritmi, chiamati layer, numerati con cifre romane, I, II e III, e basati su livelli crescenti di compressione. Il layer III, l'algoritmo più complesso, si è evoluto ulteriormente grazie alle ricerche del Fraunhofer IIS, che ha sviluppato un apposito codificatore e un player. Da qui è iniziata l'ascesa inarrestabile di questo metodo di compressione che ha determinato l'ultima grande rivoluzione in campo musicale dello scorso secolo: la diffusione di migliaia e migliaia di brani su Internet. MP3 è l'abbreviazione di MPEG 1 layer III e identifica i file audio che utilizzano questo algoritmo. MP3 .......... 56 kbps (stereo) rapporto 26:1 • Qualità radio migliore di AM 32 kbps (mono) rapporto 24:1 • Qualità radio migliore di onde corte 16 kbps (mono) rapporto 48:1 • Qualità telefono 8 kbps (stereo) rapporto 96:1 Ma quanto spazio si risparmia? In apertura ho ricordato che un file WAV della durata di 5 minuti occupa 50 MB di spazio. Questa dimensione è calcolabile facilmente utilizzando il bitrate, che è il numero di bit complessivi in un secondo di riproduzione. Questo valore è di 1411,2 kbps (= 1.411.200 bit) in un file Wave di massima qualità (CD audio). Per 5 minuti, cioè 300 secondi, abbiamo un totale di 1.411.200 x 300 = 423.360.000 di bit. Ora, dal momento che 1 byte = 8 bit, 1 KB = 1.024 byte, 1 MB = 1.024 KB, dividendo 423.360.000 per 8 otteniamo il valore di 52.920.000 byte, che diviso per 1.024 dà un totale di 51.679,6875 KB che diviso, a sua volta, per 1.024 porta al risultato di 50,4684448242 MB, circa 50 MB, per l'appunto. Applicando a questo file l'algoritmo di compressione MPEG 1 layer III, il bitrate scende, mantenendo inalterata la qualità, a 128 kbps. Ripetendo le stesse operazioni ecco i nuovi valori: 128.000 x 300 sec. = 38.400.000 bit diviso 8 = 4.800.000 byte diviso 1.024 = 4.687,5 Per un ascolto accettabile il rapporto di compressione di un file musicale MP3 stereo non può superare il valore di 24-26:1, anche se, quando si parla di "pari qualità", si fa riferimento, ovviamente, alla qualità CD. In conclusione un file MP3 che si sente tanto bene quanto un CD Audio occupa 10 volte meno spazio.