I file audio - B. MURRU

Piccola Guida ai File Musicali
Contenuti
•
•
•
•
I formati audio più diffusi
MP3
Come scaricare file musicali da Internet
Ascoltare musica sul PC
sufficiente a rappresentare ogni singolo campione. 1 byte è composto da 8 bit che possono assumere
i valori di 0 o 1. Sono quindi possibili 28 sequenze di 0 e 1, cioè 256 diversi valori. Ma con
campionamenti di qualità elevata, come quelle utilizzate per i CD Audio (ben 44.100
campioni/secondo) l'identificazione diventa problematica. Pertanto vengono usati 2 byte cioè 16 bit,
disponendo così di 216 = 65.536 possibili valori per ogni campione. Aumenta, in tal modo, quella
che viene definita risoluzione. Ma non è finita.
Il brano di 10 secondi dell'esempio è diventato a questo punto di 44.100 x 10 x 2 = 882.000 byte!
Questo vale solo per un canale. Ma se il brano è stereo, cioè utilizza due canali, occorre
moltiplicare ancora per 2, arrivando alla ragguardevole dimensione di 1.764.000 byte. Se la durata è
di un minuto i byte diventano 10.584.000, se è di 1 ora 635.040.000., cioè circa 600 MB (!), che è
infatti quasi la massima dimensione registrabile su un CD Audio.
I formati audio più diffusi
Ricapitolando. La qualità di un brano audio digitale e, di conseguenza, la sua dimensione dipendono
da tre fattori: il numero di campioni per secondo, la risoluzione e i canali. Il prodotto di questi tre
elementi è definito bitrate, cioè bit per secondo, ovvero bps. Il bitrate dei brani presenti sui CD
audio è di 1411,2 kbps.
L'enorme crescita di Internet ha fortemente contribuito allo sviluppo di sofisticate tecniche di
compressione dei file multimediali, al fine di garantire una maggiore rapidità nella trasmissione dei
dati. L'esigenza di ridurre le dimensioni dei file si è concretizzata, per quanto riguarda i formati
audio e video, nella nascita dello standard MPEG (Motion Picture Experts Group). L'elevato
rapporto di compressione e il mantenimento della qualità sonora sono i fattori che hanno favorito
l'impressionante popolarità dei file musicali MP3 (= MPEG 1 Layer III), di cui parlo in dettaglio
nell'omonimo capitolo di questa guida.
Tuttavia, girovagando su Internet, o semplicemente, accendendo il PC, è normale imbattersi in altri
formati audio, spesso più adatti per creare effetti sonori o commentare musicalmente giochi,
applicazioni multimediali, pagine Web. Vediamoli da vicino.
Alla luce di quanto detto è evidente che il formato .WAV non è utilizzabile per diffondere musica
su Internet o per memorizzare brani sul PC, a causa dell'eccessivo dispendio di risorse che il suo
uso comporta. Viene, però, largamente utilizzato per creare effetti sonori, specialmente nei
programmi e nei giochi o per personalizzare facilmente eventi particolari anche in una pagina Web.
Ad es.: il vagito del mio sito neonato sulla Home Page o il gridolino di disappunto per l'eventuale
impossibilità del browser a visualizzare i frame, sono stati da me registrati con il semplice
registratore di suoni di Windows.
File Wave
Quando accendi il PC vieni accolto, all'apparire del desktop di Windows, dal suono "ambient" di
The Microsoft Sound.wav, una manciata di eteree noticine uscite dal pentagramma di Brian Eno.
Questo è un file Wave; wave vuol dire onda e nel caso specifico, onda sonora.
L'insieme delle vibrazioni che parte da una sorgente sonora (strumento musicale, orchestra, voce,
acqua che scorre in un ruscello) e arriva, attraverso l'aria, al nostro orecchio è definibile come onda
sonora. Il fenomeno puramente fisico delle onde che colpiscono il timpano viene da noi percepito,
grazie alle cellule cerebrali, come suono.
I suoni possono essere registrati digitalmente, attraverso la tecnica del "campionamento",
scomponendo, cioè, l'onda sonora in tanti minuscoli "pezzettini", chiamati campioni, e attribuendo
a ciascuno un valore.
E' evidente che maggiore è la quantità di campioni in un secondo, vale a dire la loro frequenza,
maggiore è la qualità del suono riprodotto. Ma è altrettanto vero che tanto più numerose sono le
informazioni da memorizzare tanto più grande è la quantità di risorse necessaria a conservarle. E
questo spiega le grosse dimensioni dei file .WAV. Se infatti utilizziamo 1 byte per identificare
ciascun campione e i campioni per secondo sono 22.050 (qualità media) avremo un file di 220.500
byte per un suono di soli 10 secondi. Andiamo avanti.
Con l'aumentare della qualità sonora, cioè del numero di campioni per secondo, 1 byte non è più
Per concludere voglio sottolineare il fatto che il formato Wave non è altro che la registrazione in
digitale di suoni reali, suoni che hanno avuto origine da una fonte esterna al PC. In un brano
musicale .WAV la batteria, il pianoforte, la chitarra, il basso o la voce si sentono allo stesso modo
indipendentemente dal PC su cui il file viene ascoltato (a parità di qualità acustica dei componenti
hardware, naturalmente). Questo può sembrare ovvio ma per altri formati audio le cose vanno
diversamente.
MP3
Come ho precisato nel capitolo dedicato ai formati audio il grosso svantaggio dei file WAV è la
dimensione: 5 minuti di musica WAV "pesano" 50 MB! Sarebbe molto complicato diffondere
musica su Internet con queste premesse.
In base a ricerche svolte nell'ambito della psicoacustica, disciplina che studia il suono dal punto di
vista della percezione, si è dimostrato che non tutti i suoni che arrivano al timpano vengono uditi;
il che vuol dire che di quei famosi 44.100 campioni al secondo, contenuti in un file WAV di
massima qualità, l'uomo ne riesce a percepire molti meno. Questo dipende dall'adattamento
dinamico della soglia di udibilità.
Se senti il walkman in metropolitana, l'ascolto è buono quando sei fermo alle stazioni. Ma, dopo la
partenza, il rumore prodotto dall'aumento della velocità copre massicciamente la musica che esce
dalle cuffiette. Analogamente, soprattutto in brani rock o pop, i frequenti innalzamenti di volume,
operati da alcuni strumenti, provocano la mancata percezione dei suoni più deboli. In quei momenti,
infatti, la soglia di udibilità aumenta e tutte le frequenze al di sotto di essa vengono "mascherate".
Su questa base sono stati sviluppati algoritmi complessi per eliminare dai file audio i suoni
cosiddetti irrilevanti. Questi algoritmi hanno, inoltre, semplificato la codifica di campioni adiacenti
simili (ridondanti). Il risultato è una consistente riduzione delle dimensioni dei file, dovuta alla
loro compressione.
A questo punto vorrei fare una digressione per evitare equivoci sul significato della parola
compressione. Molto spesso su Internet sono presenti programmi, o altri file da scaricare, in
formato compresso ZIP, RAR o simili. Questa forma di compressione è ben diversa da quella
operata sui file audio. Essa agisce sul contenuto dei file più o meno con le stesse modalità della
moltiplicazione rispetto all'addizione. Ad esempio: posso scrivere 2+2+2+2+2+2+2+2+2+2 ma con
2x10 faccio prima; analogamente, per rappresentare, all'interno di un file, una sequenza di venti
simboli #, posso utilizzare la forma 20x#, occupando, in tal modo, meno spazio. Quando, però,
decomprimo il file sull'hard disk ripristino il suo formato originale; la compressione, è, quindi,
temporanea e completamente reversibile. Viceversa, gli algoritmi di compressione audio (ad
eccezione delle operazioni basate sul principio della ridondanza) agiscono in maniera irreversibile,
modificando permanentemente il contenuto del file. La riduzione delle dimensioni avviene
attraverso un processo di eliminazione, non di codifica "abbreviata". Se, ad esempio, trasformo un
file wave in MP3 e poi nuovamente converto l'MP3 in WAV, quest'ultimo sarà notevolmente
diverso dal file originale: moltissime informazioni si sono perse per strada. Il bello, però, è che
l'orecchio umano praticamente non se ne accorge. Un file audio compresso, infatti, suona
altrettanto bene quanto un file WAV 10 volte più grande.
E' proprio l'elevata resa sonora, unita alla consistente riduzione nelle dimensioni dei file, che ha
fatto la fortuna dello standard di compressione audio più famoso al mondo: MPEG 1 layer III. Per
il popolo di Internet, semplicemente: MP3.
KB diviso 1.024 = 4,5776367188 MB, circa 4,6 MB. Il nostro file si è ridotto di 10 volte
abbondanti! Si parla, in questo caso, di rapporto di compressione 10:1. Nella tabella sottostante
sono riepilogati i calcoli appena illustrati.
Calcolo delle dimensioni di un file audio di 5 minuti WAV <-> MP3
WAV
UdM
Operazione
UdM
MP3
WAV
1.411,2
128
kbps
x 1000 bit =
bit
128.000
1.411.200
1.411.200
128.000
bit
x 300 sec. =
bit
38.400.000
423.360.000
423.360.000
38.400.000
bit
/ 8 bit =
byte
4.800.000
52.920.000
52.920.000
4.800.000
byte
/ 1.024 byte =
KB
4.687,5
51.679,6875
51.679,6875
4.687,5
KB
/ 1.024 KB =~
MB
4.6
50
Aumentando il rapporto di compressione la dimensione diminuisce (il bitrate si abbassa) con una
conseguente riduzione della qualità:
•
Qualità CD
128 kbps (stereo) rapporto 10:1
..........
112 kbps (stereo) rapporto 12:1
•
Qualità prossima a CD
96 kbps (stereo) rapporto 16:1
•
Qualità radio FM
64 kbps (stereo) rapporto 24:1
Cosa vuol dire MP3?
In principio fu... il Motion Picture Experts Group, ovvero sia il gruppo di geniacci che ha studiato i
metodi di compressione per immagini in movimento e suoni. L'acronimo è passato poi agli standard
da loro messi a punto: MPEG 1 (filmati e audio), MPEG 2 (TV digitale), MPEG 4 (applicazioni
multimediali).
Lo standard MPEG 1, in particolare, si compone di tre algoritmi, chiamati layer, numerati con cifre
romane, I, II e III, e basati su livelli crescenti di compressione.
Il layer III, l'algoritmo più complesso, si è evoluto ulteriormente grazie alle ricerche del
Fraunhofer IIS, che ha sviluppato un apposito codificatore e un player. Da qui è iniziata l'ascesa
inarrestabile di questo metodo di compressione che ha determinato l'ultima grande rivoluzione in
campo musicale dello scorso secolo: la diffusione di migliaia e migliaia di brani su Internet. MP3 è
l'abbreviazione di MPEG 1 layer III e identifica i file audio che utilizzano questo algoritmo.
MP3
..........
56 kbps (stereo) rapporto 26:1
•
Qualità radio migliore di AM
32 kbps (mono) rapporto 24:1
•
Qualità radio migliore di onde corte
16 kbps (mono) rapporto 48:1
•
Qualità telefono
8 kbps (stereo) rapporto 96:1
Ma quanto spazio si risparmia?
In apertura ho ricordato che un file WAV della durata di 5 minuti occupa 50 MB di spazio. Questa
dimensione è calcolabile facilmente utilizzando il bitrate, che è il numero di bit complessivi in un
secondo di riproduzione. Questo valore è di 1411,2 kbps (= 1.411.200 bit) in un file Wave di
massima qualità (CD audio). Per 5 minuti, cioè 300 secondi, abbiamo un totale di 1.411.200 x 300
= 423.360.000 di bit. Ora, dal momento che 1 byte = 8 bit, 1 KB = 1.024 byte, 1 MB = 1.024 KB,
dividendo 423.360.000 per 8 otteniamo il valore di 52.920.000 byte, che diviso per 1.024 dà un
totale di 51.679,6875 KB che diviso, a sua volta, per 1.024 porta al risultato di 50,4684448242 MB,
circa 50 MB, per l'appunto. Applicando a questo file l'algoritmo di compressione MPEG 1 layer III,
il bitrate scende, mantenendo inalterata la qualità, a 128 kbps. Ripetendo le stesse operazioni ecco
i nuovi valori: 128.000 x 300 sec. = 38.400.000 bit diviso 8 = 4.800.000 byte diviso 1.024 = 4.687,5
Per un ascolto accettabile il rapporto di compressione di un file musicale MP3 stereo non può
superare il valore di 24-26:1, anche se, quando si parla di "pari qualità", si fa riferimento,
ovviamente, alla qualità CD. In conclusione un file MP3 che si sente tanto bene quanto un CD
Audio occupa 10 volte meno spazio.