Il suono digitale – capitolo 1 ___________________________________________________________________________ Il Suono Digitale Capitolo 1 - Dal segnale analogico al segnale digitale Introduzione pag 1 Vantaggi del segnale digitale pag 2 Svantaggi della rappresentazione digitale pag 2 Schema della catena audio che utilizza tecnologie digitali pag 3 Il segnale analogico pag 3 Il segnale digitale pag 5 Il teorema del campionamento pag 7 Il fenomeno dell’aliasing pag10 Sample rate e percezione sonora pag13 Ricostruzione del segnale analogico a partire da quello originale pag13 Introduzione Avrete senz’altro visto, nella sezione riguardante il segnale analogico che la rappresentazione analogica del suono lavora per “analogia” ovvero la curva continua nel tempo costituita dalle variazioni di ampiezza dell’onda di pressione acustica, viene rappresentata da un’analoga curva continua nel tempo i cui punti sono le variazioni di tensione elettrica. Questa seconda curva può essere memorizzata all’interno dei solchi di un disco in vinile o nel campo magnetico di un nastro e riproduce fedelmente le variazioni di ampiezza del suono acustico. La rappresentazione digitale del suono invece non riproduce la curva continua di ampiezza con una curva analoga ad essa, ma è una successione finita di numeri (discreta) che rappresentano di volta in volta il valore dell’ampiezza in istanti successivi di tempo. Pertanto, in ambito analogico si ha un curva continua che approssima una curva continua mentre in ambito digitale si ha una successione di numeri che approssima una curva continua. I numer costituenti la successione digitale vengono rappresentati in ambito binario e sono chiamati campioni (sample). I loro valori si riferiscono alla tensione elettrica del segnale analogico. Silvio Relandini www.audiomidi-educational.it 1 Il suono digitale – capitolo 1 ___________________________________________________________________________ Vantaggi del segnale digitale Perché è importante poter trasformare il suono dal segnale analogico a quello digitale? I vantaggi del codice digitale, costituito da una sequenza finita di dati, sono innumerevoli: 1) essendo un numero determinato, cosentono di dimensionare opportunamente i supporti di memorizzazione (hard disk, nastri) 2) non inducono fenomeni di degradazione del segnale durante le operazioni di copia del segnale stesso: infatti copiando ripetutamente lo stesso segnale analogico si ottiene una degradazione sempre maggiore della qualità del segnale in quanto l’operazione di copia deve nuovamente approssimare con una curva continua la curva che era stata memorizzata in precedenza e questo introduce sempre più errori. Invece, fare una copia di numeri non comporta alcun errore: la curva memorizzata in precedenza rimane sempre la stessa, non subisce alterazioni nella copia. 3) le operazioni di manipolazione (termine tecnico tradotto in inglese con le parole processing, editing) del segnale digitale sono operazioni aritmetiche che comporteranno il cambiamento di alcuni numeri. Se si vuole incrementare l’intensità di un suono basta moltiplicare i suoi numeri per il fattore desiderato di amplificazione. Invece, nel corrispondente caso analogico, bisogna utilizzare un dispositivo elettronico per accrescere l’ampiezza della curva in questione. 4) il segnale digitale può avere algoritmi in grado di correggere gli errori introdotti dai supporti per la memorizzazione (compact disc, dvd, dat, ecc.) e dai dispositivi di trasmissione (via cavo, via satellite). Gli errori “digitali” consistono nel leggere alcuni numeri, rappresentanti il segnale, in maniera differente rispetto a come erano stati memorizzati. Un sistema digitale, grazie alla finitezza del codice, conosce quali sono le rappresentazioni possibili, e quindi è in grado di rilevare e correggere alcuni errori mediante l’introduzione di informazioni aggiuntive rispetto al segnale vero e proprio. Svantaggi della rappresentazione digitale La rappresentazione digitale del segnale audio porta anche degli svantaggi: 1) è necessaria la realizzazione di un’interfaccia di comunicazione tra l’interno e l’esterno dell’elaboratore, costituita tipicamente da una scheda audio che ospita i convertitori AD (analogico-digitale) e DA (digitale-analogico) 2) i processi di conversione inducono approssimazioni del segnale. Silvio Relandini www.audiomidi-educational.it 2 Il suono digitale – capitolo 1 ___________________________________________________________________________ 3) per avere una qualità del segnale comparabile con i migliori sistemi analogici occorrono grandi capacità di memoria, di calcolo e di velocità di trasmissione per la memorizzazione, la manipolazione e il trasferimento del segnale, comportando ovviamente costi maggiori. Per fortuna la tecnologia è in rapida evoluzione e nel corso degli anni ha consentito di adottare numerose soluzioni per mitigare questi svantaggi. La tecnolgia digitale applicata all’audio è piuttosto recente e risale dall’inizio degli anni ’80. Schema della catena audio che utilizza tecnologia digitale Quando si considera la catena audio di un processo di registrazione e riproduzione che utilizza un computer per l’acquisizione, l’editing e la memorizzazione dei segnali dobbiamo pensare al seguente schema: Suono acustico microfono Suono analogico Convertitore A/D Suono digitale Convertitore D/A Suono analogico monitor Suono acustico Come possiamo osservare, il suono subisce una serie di modificazioni dette trasduzioni ovvero dei processi che trasformano il segnale da una forma energetica in un’altra: la trasduzione che opera la trasformazione acustica-analogica è effettuata tramite il microfono, quella analogica-digitale e viceversa dai convertitori AD e DA, quella analogica-acustica da un diffusore (monitor, speaker). Il segnale analogico In un processo puramente analogico, il microfono cattura le variazioni di pressione dell’aria e le “trasduce” in un segnale elettrico, ovvero, i valori della pressione x del segnale in ingresso vengono convertiti nei valori di tensione y del segnale in uscita, in modo che le variazioni di y rappresentino ancora le variazioni di x. Silvio Relandini www.audiomidi-educational.it 3 Il suono digitale – capitolo 1 ___________________________________________________________________________ Viceversa, il diffusore è un trasduttore elettroacustico ha in ingresso un segnale i cui valori esprimono una variazione di tensione y che trasduce in un segnale d’uscita i cui valori x rappresentano una variazione di pressione x. Anche l’orecchio è un trasduttore elettroacustico: come il microfono, trasduce l’energia acustica in impulsi nervosi di tipo elettrico. Le variazioni di tensione descrivono “esattamente” il segnale acustico. Il debole segnale elettrico in uscita da un microfono risulta essere molto debole e pertanto deve passare attraverso un preamplificatore e un amplificatore prima di essere registrato tipicamente su un nastro magnetico; qui una testina elettromagnetica produce un campo magnetico sulla pellicola di polvere o ossido di ferro o ancora ferro-cromo che è presente sul nastro. Il campo magnetico, fatto variare nel tempo dalla corrente elettrica della corrente sulla testina, orienta in modo ordinato le particelle di polvere di ferro. Dai supporti di memorizzazione analogici il segnale può essere prelevato mediante un lettore adeguato (ad esempio un giradischi, in cui la testina trasduce l’andamento dei microsolchi in un segnale elettrico), amplificato e mandato ai diffusori acustici, che trasducono il segnale elettrico in un segnale sonoro acustico. Se un sistema è di alta fedeltà (e di conseguenza abbastanza costoso), le curve di ampiezza sonora iniziale e finale sono piuttosto simili. Comunque sia, gli elementi della catena introducono del rumore e della distorsione più o meno accentuata a seconda della qualità delle macchine e dei cavi. Il rumore è un segnale indesiderato ad ampio spettro che si aggiunge al segnale analogico. Quando presenta un livello di segnale piuttosto omogeneo in tutte le frequenze è detto rumore bianco (è il tipo rumore, fruscio, che si percepisce passando manualmente da un canale radio FM ad un altro). Per la riduzione del rumore (noise reduction) dai supporti analogici sono stati sviluppati vari sistemi il cui più noto è quello della Dolby. Per stimare l’ammontare di rumore introdotto da un sistema analogico, si utilizza una grandezza chiamata rapporto segnale-rumore (Signal-to-Noise-Ratio - SNR) che è definita come il rapporto tra la massima ampiezza utile del segnale e l’ampiezza del rumore presente SNR = max ampiezza segnale/ampiezza rumore Silvio Relandini www.audiomidi-educational.it 4 Il suono digitale – capitolo 1 ___________________________________________________________________________ È chiaro che maggiore è il rapporto SNR, migliore sarà la qualità del segnale. Si usa esprimerlo in decibel: SNR (in dB) = 20 log (max ampiezza segnale/ampiezza rumore) Un altro parametro utilizzato per esprimere la qualità del dispositivo audio analogico è la gamma dinamica (dynamic range) ovvero il rapporto tra l’ampiezza massima e quella minima presenti nel segnale. È misurata in decibel e pertanto esprime la differenza tra l’ampiezza massima e l’ampiezza minima presenti nel segnale in che significa che un segnale audio che passa da un pianissimo a un fortissimo o viceversa presenta un’estesa gamma dinamica. Ovviamente un sistema analogico migliore è un sistema che approssima meglio la gamma dinamica del segnale in ingresso. La presenza di un rumore nel segnale analogica limita la gamma dinamica riducendola. La distorsione è una modifica non voluta della forma d’onda (e quindi dello spettro) di un segnale audio. Nei componenti elettronici, la distorsione aumenta con l’ampiezza. Per ampiezza utile si intende quella massima alla quale non si presentano effetti di distorsione, ovvero quella alla quale la distorsione è mantenuta al di sotto di una certa soglia di tolleranza prefissata. Se osserviamo i parametri di un’onda, la distorsione può essere in frequenza, ampiezza e fase. Un tipico caso di distorsione in frequenza è presente nella nostra percezione uditiva perchè l’orecchio risponde in modo differente alle diverse frequenze e quindi la forma d’onda percepita è differente dalla quella in ingresso. Il segnale digitale Il segnale digitale (numerico, discreto) è una successione di numeri che rappresentano l’ampiezza del segnale in precisi e ravvicinati istanti di tempo. Lo strumento che effettua la trasduzione analogica-digitale è il convertitore AD mentre il procedimento è detto campionamento del suono. Cosa vuol dire campionare un segnale? Vuol dire trovare una rappresentazione discreta per qualcosa che in origine è una variazione continua. Ad un tempo fissato e ripetuto da un circuito di clock, interno al convertitore, lo strumento effettua una lettura di ampiezza del segnale in ingresso che associa ad un campione (sample). Passato un tempo pari al precedente, viene effettuata una nuova lettura e creato un Silvio Relandini www.audiomidi-educational.it 5 Il suono digitale – capitolo 1 ___________________________________________________________________________ nuovo campione. Il tempo che trascorre tra un campione e il successivo è detto tempo di campionamento. Nella figura seguente è mostrato un segnale analogico che viene campionato. I sample sono indicati con dei pallini rossi. Se diminuiamo il tempo che trascorre tra un campione e il successivo otteniamo un maggior numero di letture, ovvero di campioni, nell’unità di tempo. L’immagine successiva mostra lo stesso segnale campionato con un tempo di campionamento parì alla metà di quello dell’immagine precedente. Il numero dei campioni che vengono creati al secondo stabilisce il tasso o frequenza di campionamento (sample rate - SR), espresso in hertz. Si preferisce parlare di Silvio Relandini www.audiomidi-educational.it 6 Il suono digitale – capitolo 1 ___________________________________________________________________________ frequenza soltanto quando si parla di cicli al secondo per un segnale, impiegando il nome tasso o velocità quando si parla di campioni al secondo. In inglese, la confusione viene evitata usando il termine frequency per la frequenza vera e propria, e il termine rate per i campioni. Se ad esempio utilizziamo una SR di 10 Hz significa che in un secondo avremo 10 campioni e pertanto il tempo di campionamento sarà pari a 0,1 secondi (1/10). Se invece SR = 100 Hz, allora avremo 100 campioni e il tempo di campionamento sarà pari a 0,01 secondi (1/100). Ovviamente più è alta la sample Rate e maggiore sarà la risoluzione, ovvero la qualità con cui approssimiamo la curva analogica. Il teorema del campionamento (Nyquist) Se ho un segnale da campionare la cui frequenza è F, qual è la sample rate minima che posso utilizzare per il campionamento di quel segnale, senza incappare in una serie di fenomeni tali da distorcere il segnale? Consideriamo un semplice segnale periodico puro (un suono sinusoidale). Ogni ciclo di oscillazione si compone di una fase positiva e di una negativa e pertanto per campionare questa alternanza mi occorrono almeno due campioni. Il teorema di H. Nyquist (detto del campionamento), formulato nel 1928, afferma che considerato un segnale di frequenza F, lo si può campionare a patto che si utilizzi una sample rate che sia almeno il doppio di F. Silvio Relandini www.audiomidi-educational.it 7 Il suono digitale – capitolo 1 ___________________________________________________________________________ S R ≥ 2F Nel caso però che il segnale da campionare sia periodico complesso, ovvero costituito da numerose componenti sinusoidali (parziali armoniche e non armoniche), come nella figura seguente che riproduce lo spettro acustico di un simile segnale, occorre stabilire quale sia la F del segnale da prendere in considerazione. In questo caso bisogna considerare la parziale con frequenza maggiore in quanto è quella che più velocemente alterna l’oscillazione sinusoidale tra la fase positiva e quella negativa. Nella figura la parziale in questione è stata colorata di rosso e pertanto F = 440 Hz: ciò significa che per campionare questo segnale dovrò utilizzare una sample rate almeno pari a 880 Hz. In tal caso la formulazione del teorema di Nyquist è la seguente: considerato un segnale audio, lo si può campionare a patto che si utilizzi una sample rate che sia almeno il doppio della frequenza F relativa alla componente sinusoidale più elevata presente nello spettro acustico. Silvio Relandini www.audiomidi-educational.it 8 Il suono digitale – capitolo 1 ___________________________________________________________________________ S R ≥ 2FMax Questo però significa che il segnale da campionare deve avere una componente più acuta nello spettro individuabile ovvero che deve essere limitato nella banda acustica. Tutte le componenti di frequenza superiore devono essere eliminate dallo spettro. Siamo ora in grado di formulare pienamente il teorema del campionamento: preso un segnale audio limitato in banda, per campionarlo occorre utilizzare una sample rate che sia almeno il doppio della frequenza F relativa alla componente sinusoidale più acuta presente nello spettro acustico del segnale. Soffermiamoci un attimo: la banda del segnale deve essere limitata ossia deve esserci una frequenza massima all'interno del segnale, che non deve mai essere superata. Poi, misurata questa frequenza massima, il teorema afferma che la sample rate da utilizzare deve essere almeno doppia di questa frequenza massima perchè il campionamento possa essere realizzato con successo. Ad esempio: se vogliamo campionare un segnale audio la cui frequenza massima sia, per ipotesi, 300Hz (ovvero l'onda sonora più "veloce" compie 300 cicli al secondo), la sample rate dovrà essere come minimo di 600Hz, ossia dovranno essere presi almeno 600 campioni in un secondo. Se però dobbiamo campionare un segnale che arrivi, ad esempio, fino a 15.000 Hz, sarà necessaria una frequenza di campionamento di almeno 30.000Hz, ossia si dovranno prendere almeno 30.000 misurazioni al secondo. Nella pratica, in ragione del fatto che lo spettro udibile è compreso tra i 20 e i 20.000Hz, sarebbe sufficiente prendere una sample rate di 40.000Hz per campionare ogni possibile suono udibile dall'uomo. Ciò che avviene nella digitalizzazione rispetta il teorema del campionamento procedendo in senso inverso. Stabilito un tasso di campionamento SR, occorre eliminare dal segnale tutte quelle frequenze che sono oltre la metà di SR; quindi, se SR = 11.000 campioni al secondo, occorre eliminare dal segnale tutte le frequenze superiori a 5500 Hz. Per far ciò si utilizza un filtro passabasso che elimina (o meglio attenua) tutte le frequenze sopra quella di riferimento (detta frequenza di taglio o di cutoff). Ovviamente tale filtro è detto passabasso (LP, lowpass filter) in quanto fa “passare” solamente le frequenze sotto la frequenza di taglio, ed è detto di antialiasing in quanto evita il fenomeno dell’aliasing, noto anche come foldover. Silvio Relandini www.audiomidi-educational.it 9 Il suono digitale – capitolo 1 ___________________________________________________________________________ Quindi, prima di campionare il segnale occorre filtrarlo in modo da eliminare una parte del suo spettro che potrebbe causare il problema dell’aliasing. Il fenomeno dell’aliasing Abbiamo visto che se si utilizza una SR superiore al doppio della frequenza di una componente sinusoidale, questa verrà campionata bene. Vediamo il caso in cui SR = 2F In tal caso, per campionare bene il segnale dovremmo avere una buona dose di fortuna in quanto per prendere i campioni sui picchi dovrebbe esserci uno sfasamento di un quarto di periodo (90°) tra il segnale sinusoidale e l’inizio del campionamento. Se però siamo altrettanto sfortunati da effettuare l’operazione in fase con il segnale allora i campioni saranno presi quando il segnale passerà per lo zero e come risultato avremo un segnale campionato le cui ampiezze sono nulle. Silvio Relandini www.audiomidi-educational.it 10 Il suono digitale – capitolo 1 ___________________________________________________________________________ Per questo motivo il campionamento è detto critico. Vediamo cosa succede se la SR è inferiore a 2F ovvero: SR < 2F In questo caso il numero dei campioni preso per ogni ciclo di oscillazione è inferiore a due e ciò vuol dire che il signale risultante ricostruito è di frequenza più bassa rispetto all’originale. Questa frequenza è chiamata spuria in quanto non era presente nel segnale analogico in ingresso. Questo fenomeno è chiamato aliasing. Qual è la frequenza FS del segnale spurio? Si calcola in base alla seguente formula: FS = F - SR Se ad esempio il segnale da campionare ha una frequenza pari a 1000 Hz e utilizziamo una SR pari a 1500 Hz, allora si avrà una frequenza spuria pari a FS = 1000 – 1500 = -500 Hz Un valore della frequenza negativa non ha senso, equivale solamente a dire che il segnale campionato presenta una controfase e l’orecchio la percepirà quindi come una 500 Hz. Per comprendere meglio il fenomeno consideriamo l’immagine seguente. Silvio Relandini www.audiomidi-educational.it 11 Il suono digitale – capitolo 1 ___________________________________________________________________________ Supponiamo di utilizzare una SR = 800 Hz, tale cioè da indurre un campionamento critico sulla componente (rossa) con frequenza 4F (400 Hz) e un fenomeno di aliasing sulla componente ultima (4,4 F, ovvero 440 Hz) che darà come risultato una componente spuria con frequenza pari a 40 Hz e in controfase. Silvio Relandini www.audiomidi-educational.it 12 Il suono digitale – capitolo 1 ___________________________________________________________________________ Le conseguenze dell’aliasing possono essere molto nefaste e dipendono dai rapporti che le frequenze spurie hanno con le altre frequenze presenti nel segnale. Ad esempio, nel caso in cui la frequenza spuria sia molto vicina a una frequenza già presente nel segnale, si potrebbe verificare un fenomeno di battimenti. Riassumento: per una parziale del segnale da campionare sono necessari almeno due campioni per ciascun periodo del segnale: nel periodo di una sinusoide, infatti, il segnale cambia direzione due volte. Inoltre, poiché in un segnale complesso sono presenti più parziali, occorre che il campionamento prelevi almeno due campioni per la parziale di frequenza massima presente nel segnale quindi la SR deve essere almeno il doppio della frequenza massima presente nel segnale di ingresso per evitare il fenomeno dell’aliasing. Sample Rate e percezione sonora Poiché l’uomo percepisce segnali di frequenza massima pari a 20.000 Hz, è sufficiente scegliere una SR vi valore oltre 40.000 campioni al secondo, per non avere perdite significative nella qualità del segnale ricostruito e il fenomeno dell’aliasing. La SR relativa al compact disc è pari a 44.100 campioni al secondo ed è quindi sufficiente a rappresentare correttamente il segnale audio di partenza. Per eliminare le frequenze dal segnale in ingresso, occorre filtrare il segnale in modo da far passare solo le frequenze al di sotto della metà del tasso di campionamento. Il dispositivo che permette di fare questa operazione è un filtro passabasso che abbiamo visto essere detto di antialiasing. L’eliminazione delle frequenze più elevate in realtà è una semplificazione in quanto il filtro riesce solo ad attenuare le frequenze indesiderate. La frequenza che fissa la soglia oltre la quale le frequenze vengono attenuate è detta frequenza di taglio o di cutoff. Ricostruzione del segnale analogico a partire da quello digitale Le stesse tematiche che riguardano il filtro passabasso riappaiono nella ricostruzione del segnale analogico, quando il filtro deve eliminare i cambi repentini di intensità dovuti alla successione di tensioni generate dal convertitore DAC in corrispondenza della lettura dei singoli campioni dal segnale digitalizzato. Questi cambi sono rapidissimi perché la tensione rimane costante fino alla conversione del campione successivo risultando in un segnale “a scalini”. Nei casi reali l’intervallo di tempo tra Silvio Relandini www.audiomidi-educational.it 13 Il suono digitale – capitolo 1 ___________________________________________________________________________ due conversioni successive è di decimillesimi di secondo (ad esempio, a 44.100 campioni al secondo l’intervallo è di 0,023 millisecondi). Ma il segnale analogico di partenza non può avere questi cambi di intensità così veloci perché è stato utilizzato un flitro passa basso per eliminare le componenti superiori alla metà del tasso di campionamento. Per la ricostruzione corretta del segnale pertanto occorre filtrare nuovamente il segnale digitale mediante un filtro passabasso tarato come il filtro usato nella fase di campionamento. Il segnale che arriverà ai diffusori sarà molto simile a quello originale catturato dal microfono. La conversione inversa, da digitale ad analogico è compiuta dal Convertitore DigitaleAnalogico (DAC - Digital-to-Analogue Converter). Il DAC genera delle tensioni elettriche che sono proporzionali ai campioni del segnale digitale, in corrispondenza degli istanti di tempo stabiliti dall’orologio interno. Un interpolatore si occupa di smussare i gradini dovuti al “salto” da un valore di tensione al valore vicino. Il segnale viene amplificato e mandato ai diffusori per la trasduzione in segnale acustico. Silvio Relandini www.audiomidi-educational.it 14