Dal segnale analogico al segnale digitale

Il suono digitale – capitolo 1
___________________________________________________________________________
Il Suono Digitale
Capitolo 1 - Dal segnale analogico al segnale digitale
Introduzione
pag 1
Vantaggi del segnale digitale
pag 2
Svantaggi della rappresentazione digitale
pag 2
Schema della catena audio che utilizza tecnologie digitali
pag 3
Il segnale analogico
pag 3
Il segnale digitale
pag 5
Il teorema del campionamento
pag 7
Il fenomeno dell’aliasing
pag10
Sample rate e percezione sonora
pag13
Ricostruzione del segnale analogico a partire da quello originale
pag13
Introduzione
Avrete senz’altro visto, nella sezione riguardante il segnale analogico che la
rappresentazione analogica del suono lavora per “analogia” ovvero la curva continua
nel tempo costituita dalle variazioni di ampiezza dell’onda di pressione acustica, viene
rappresentata da un’analoga curva continua nel tempo i cui punti sono le variazioni di
tensione elettrica. Questa seconda curva può essere memorizzata all’interno dei solchi
di un disco in vinile o nel campo magnetico di un nastro e riproduce fedelmente le
variazioni di ampiezza del suono acustico.
La rappresentazione digitale del suono invece non riproduce la curva continua di
ampiezza con una curva analoga ad essa, ma è una successione finita di numeri
(discreta) che rappresentano di volta in volta il valore dell’ampiezza in istanti
successivi di tempo.
Pertanto, in ambito analogico si ha un curva continua che approssima una curva
continua mentre in ambito digitale si ha una successione di numeri che approssima
una curva continua.
I numer costituenti la successione digitale vengono rappresentati in ambito binario e
sono chiamati campioni (sample). I loro valori si riferiscono alla tensione elettrica del
segnale analogico.
Silvio Relandini www.audiomidi-educational.it
1
Il suono digitale – capitolo 1
___________________________________________________________________________
Vantaggi del segnale digitale
Perché è importante poter trasformare il suono dal segnale analogico a quello digitale?
I vantaggi del codice digitale, costituito da una sequenza finita di dati, sono
innumerevoli:
1) essendo un numero determinato, cosentono di dimensionare opportunamente i
supporti di memorizzazione (hard disk, nastri)
2) non inducono fenomeni di degradazione del segnale durante le operazioni di copia
del segnale stesso: infatti copiando ripetutamente lo stesso segnale analogico si
ottiene una degradazione sempre maggiore della qualità del segnale in quanto
l’operazione di copia deve nuovamente approssimare con una curva continua la curva
che era stata memorizzata in precedenza e questo introduce sempre più errori.
Invece, fare una copia di numeri non comporta alcun errore: la curva memorizzata in
precedenza rimane sempre la stessa, non subisce alterazioni nella copia.
3) le operazioni di manipolazione (termine tecnico tradotto in inglese con le parole
processing,
editing)
del
segnale
digitale
sono
operazioni
aritmetiche
che
comporteranno il cambiamento di alcuni numeri. Se si vuole incrementare l’intensità di
un suono basta moltiplicare i suoi numeri per il fattore desiderato di amplificazione.
Invece, nel corrispondente caso analogico, bisogna utilizzare un dispositivo elettronico
per accrescere l’ampiezza della curva in questione.
4) il segnale digitale può avere algoritmi in grado di correggere gli errori introdotti dai
supporti per la memorizzazione (compact disc, dvd, dat, ecc.) e dai dispositivi di
trasmissione (via cavo, via satellite). Gli errori “digitali” consistono nel leggere alcuni
numeri, rappresentanti il segnale, in maniera differente rispetto a come erano stati
memorizzati. Un sistema digitale, grazie alla finitezza del codice, conosce quali sono le
rappresentazioni possibili, e quindi è in grado di rilevare e correggere alcuni errori
mediante l’introduzione di informazioni aggiuntive rispetto al segnale vero e proprio.
Svantaggi della rappresentazione digitale
La rappresentazione digitale del segnale audio porta anche degli svantaggi:
1) è necessaria la realizzazione di un’interfaccia di comunicazione tra l’interno e
l’esterno dell’elaboratore, costituita tipicamente da una scheda audio che ospita i
convertitori AD (analogico-digitale) e DA (digitale-analogico)
2) i processi di conversione inducono approssimazioni del segnale.
Silvio Relandini www.audiomidi-educational.it
2
Il suono digitale – capitolo 1
___________________________________________________________________________
3) per avere una qualità del segnale comparabile con i migliori sistemi analogici
occorrono grandi capacità di memoria, di calcolo e di velocità di trasmissione per la
memorizzazione, la manipolazione e il trasferimento del segnale, comportando
ovviamente costi maggiori. Per fortuna la tecnologia è in rapida evoluzione e nel corso
degli anni ha consentito di adottare numerose soluzioni per mitigare questi svantaggi.
La tecnolgia digitale applicata all’audio è piuttosto recente e risale dall’inizio degli anni
’80.
Schema della catena audio che utilizza tecnologia digitale
Quando si considera la catena audio di un processo di registrazione e riproduzione che
utilizza un computer per l’acquisizione, l’editing e la memorizzazione dei segnali
dobbiamo pensare al seguente schema:
Suono
acustico
microfono
Suono
analogico
Convertitore
A/D
Suono
digitale
Convertitore
D/A
Suono
analogico
monitor
Suono
acustico
Come possiamo osservare, il suono subisce una serie di modificazioni dette trasduzioni
ovvero dei processi che trasformano il segnale da una forma energetica in un’altra: la
trasduzione che opera la trasformazione acustica-analogica è effettuata tramite il
microfono, quella analogica-digitale e viceversa dai convertitori AD e DA, quella
analogica-acustica da un diffusore (monitor, speaker).
Il segnale analogico
In un processo puramente analogico, il microfono cattura le variazioni di pressione
dell’aria e le “trasduce” in un segnale elettrico, ovvero, i valori della pressione x del
segnale in ingresso vengono convertiti nei valori di tensione y del segnale in uscita, in
modo che le variazioni di y rappresentino ancora le variazioni di x.
Silvio Relandini www.audiomidi-educational.it
3
Il suono digitale – capitolo 1
___________________________________________________________________________
Viceversa, il diffusore è un trasduttore elettroacustico ha in ingresso un segnale i cui
valori esprimono una variazione di tensione y che trasduce in un segnale d’uscita i cui
valori x rappresentano una variazione di pressione x.
Anche l’orecchio è un trasduttore elettroacustico: come il microfono, trasduce
l’energia acustica in impulsi nervosi di tipo elettrico.
Le variazioni di tensione descrivono “esattamente” il segnale acustico. Il debole
segnale elettrico in uscita da un microfono risulta essere molto debole e pertanto deve
passare attraverso un preamplificatore e un amplificatore prima di essere registrato
tipicamente su un nastro magnetico; qui una testina elettromagnetica produce un
campo magnetico sulla pellicola di polvere o ossido di ferro o ancora ferro-cromo che
è presente sul nastro. Il campo magnetico, fatto variare nel tempo dalla corrente
elettrica della corrente sulla testina, orienta in modo ordinato le particelle di polvere di
ferro.
Dai supporti di memorizzazione analogici il segnale può essere prelevato mediante un
lettore adeguato (ad esempio un giradischi, in cui la testina trasduce l’andamento dei
microsolchi in un segnale elettrico), amplificato e mandato ai diffusori acustici, che
trasducono il segnale elettrico in un segnale sonoro acustico.
Se un sistema è di alta fedeltà (e di conseguenza abbastanza costoso), le curve di
ampiezza sonora iniziale e finale sono piuttosto simili.
Comunque sia, gli elementi della catena introducono del rumore e della distorsione più
o meno accentuata a seconda della qualità delle macchine e dei cavi. Il rumore è un
segnale indesiderato ad ampio spettro che si aggiunge al segnale analogico. Quando
presenta un livello di segnale piuttosto omogeneo in tutte le frequenze è detto rumore
bianco (è il tipo rumore, fruscio, che si percepisce passando manualmente da un
canale radio FM ad un altro).
Per la riduzione del rumore (noise reduction) dai supporti analogici sono stati
sviluppati vari sistemi il cui più noto è quello della Dolby.
Per stimare l’ammontare di rumore introdotto da un sistema analogico, si utilizza una
grandezza chiamata rapporto segnale-rumore (Signal-to-Noise-Ratio - SNR) che è
definita come il rapporto tra la massima ampiezza utile del segnale e l’ampiezza del
rumore presente
SNR = max ampiezza segnale/ampiezza rumore
Silvio Relandini www.audiomidi-educational.it
4
Il suono digitale – capitolo 1
___________________________________________________________________________
È chiaro che maggiore è il rapporto SNR, migliore sarà la qualità del segnale. Si usa
esprimerlo in decibel:
SNR (in dB) = 20 log (max ampiezza segnale/ampiezza rumore)
Un altro parametro utilizzato per esprimere la qualità del dispositivo audio analogico è
la gamma dinamica (dynamic range) ovvero il rapporto tra l’ampiezza massima e
quella minima presenti nel segnale. È misurata in decibel e pertanto esprime la
differenza tra l’ampiezza massima e l’ampiezza minima presenti nel segnale in che
significa che un segnale audio che passa da un pianissimo a un fortissimo o viceversa
presenta un’estesa gamma dinamica. Ovviamente un sistema analogico migliore è un
sistema che approssima meglio la gamma dinamica del segnale in ingresso. La
presenza di un rumore nel segnale analogica limita la gamma dinamica riducendola.
La distorsione è una modifica non voluta della forma d’onda (e quindi dello spettro) di
un segnale audio. Nei componenti elettronici, la distorsione aumenta con l’ampiezza.
Per ampiezza utile si intende quella massima alla quale non si presentano effetti di
distorsione, ovvero quella alla quale la distorsione è mantenuta al di sotto di una certa
soglia di tolleranza prefissata.
Se osserviamo i parametri di un’onda, la distorsione può essere in frequenza,
ampiezza e fase. Un tipico caso di distorsione in frequenza è presente nella nostra
percezione uditiva perchè l’orecchio risponde in modo differente alle diverse frequenze
e quindi la forma d’onda percepita è differente dalla quella in ingresso.
Il segnale digitale
Il
segnale
digitale
(numerico,
discreto)
è
una
successione
di
numeri
che
rappresentano l’ampiezza del segnale in precisi e ravvicinati istanti di tempo. Lo
strumento che effettua la trasduzione analogica-digitale è il convertitore AD mentre il
procedimento è detto campionamento del suono.
Cosa vuol dire campionare un segnale? Vuol dire trovare una rappresentazione
discreta per qualcosa che in origine è una variazione continua. Ad un tempo fissato e
ripetuto da un circuito di clock, interno al convertitore, lo strumento effettua una
lettura di ampiezza del segnale in ingresso che associa ad un campione (sample).
Passato un tempo pari al precedente, viene effettuata una nuova lettura e creato un
Silvio Relandini www.audiomidi-educational.it
5
Il suono digitale – capitolo 1
___________________________________________________________________________
nuovo campione. Il tempo che trascorre tra un campione e il successivo è detto tempo
di campionamento. Nella figura seguente è mostrato un segnale analogico che viene
campionato. I sample sono indicati con dei pallini rossi.
Se diminuiamo il tempo che trascorre tra un campione e il successivo otteniamo un
maggior numero di letture, ovvero di campioni, nell’unità di tempo. L’immagine
successiva mostra lo stesso segnale campionato con un tempo di campionamento parì
alla metà di quello dell’immagine precedente.
Il numero dei campioni che vengono creati al secondo stabilisce il tasso o frequenza di
campionamento (sample rate - SR), espresso in hertz. Si preferisce parlare di
Silvio Relandini www.audiomidi-educational.it
6
Il suono digitale – capitolo 1
___________________________________________________________________________
frequenza soltanto quando si parla di cicli al secondo per un segnale, impiegando il
nome tasso o velocità quando si parla di campioni al secondo. In inglese, la
confusione viene evitata usando il termine frequency per la frequenza vera e propria,
e il termine rate per i campioni.
Se ad esempio utilizziamo una SR di 10 Hz significa che in un secondo avremo 10
campioni e pertanto il tempo di campionamento sarà pari a 0,1 secondi (1/10). Se
invece SR = 100 Hz, allora avremo 100 campioni e il tempo di campionamento sarà
pari a 0,01 secondi (1/100).
Ovviamente più è alta la sample Rate e maggiore sarà la risoluzione, ovvero la qualità
con cui approssimiamo la curva analogica.
Il teorema del campionamento (Nyquist)
Se ho un segnale da campionare la cui frequenza è F, qual è la sample rate minima
che posso utilizzare per il campionamento di quel segnale, senza incappare in una
serie di fenomeni tali da distorcere il segnale?
Consideriamo un semplice segnale periodico puro (un suono sinusoidale). Ogni ciclo di
oscillazione si compone di una fase positiva e di una negativa e pertanto per
campionare questa alternanza mi occorrono almeno due campioni.
Il teorema di H. Nyquist (detto del campionamento), formulato nel 1928, afferma che
considerato un segnale di frequenza F, lo si può campionare a patto che si utilizzi una
sample rate che sia almeno il doppio di F.
Silvio Relandini www.audiomidi-educational.it
7
Il suono digitale – capitolo 1
___________________________________________________________________________
S R ≥ 2F
Nel caso però che il segnale da campionare sia periodico complesso, ovvero costituito
da numerose componenti sinusoidali (parziali armoniche e non armoniche), come nella
figura seguente che riproduce lo spettro acustico di un simile segnale, occorre stabilire
quale sia la F del segnale da prendere in considerazione.
In questo caso bisogna considerare la parziale con frequenza maggiore in quanto è
quella che più velocemente alterna l’oscillazione sinusoidale tra la fase positiva e
quella negativa. Nella figura la parziale in questione è stata colorata di rosso e
pertanto F = 440 Hz: ciò significa che per campionare questo segnale dovrò utilizzare
una sample rate almeno pari a 880 Hz.
In tal caso la formulazione del teorema di Nyquist è la seguente: considerato un
segnale audio, lo si può campionare a patto che si utilizzi una sample rate che sia
almeno il doppio della frequenza F relativa alla componente sinusoidale più elevata
presente nello spettro acustico.
Silvio Relandini www.audiomidi-educational.it
8
Il suono digitale – capitolo 1
___________________________________________________________________________
S R ≥ 2FMax
Questo però significa che il segnale da campionare deve avere una componente più
acuta nello spettro individuabile ovvero che deve essere limitato nella banda acustica.
Tutte le componenti di frequenza superiore devono essere eliminate dallo spettro.
Siamo ora in grado di formulare pienamente il teorema del campionamento: preso un
segnale audio limitato in banda, per campionarlo occorre utilizzare una sample rate
che sia almeno il doppio della frequenza F relativa alla componente sinusoidale più
acuta presente nello spettro acustico del segnale.
Soffermiamoci un attimo: la banda del segnale deve essere limitata ossia deve esserci
una frequenza massima all'interno del segnale, che non deve mai essere superata.
Poi, misurata questa frequenza massima, il teorema afferma che la sample rate da
utilizzare deve essere almeno doppia di questa frequenza massima perchè il
campionamento possa essere realizzato con successo.
Ad esempio: se vogliamo campionare un segnale audio la cui frequenza massima sia,
per ipotesi, 300Hz (ovvero l'onda sonora più "veloce" compie 300 cicli al secondo), la
sample rate dovrà essere come minimo di 600Hz, ossia dovranno essere presi almeno
600 campioni in un secondo.
Se però dobbiamo campionare un segnale che arrivi, ad esempio, fino a 15.000 Hz,
sarà necessaria una frequenza di campionamento di almeno 30.000Hz, ossia si
dovranno prendere almeno 30.000 misurazioni al secondo. Nella pratica, in ragione
del fatto che lo spettro udibile è compreso tra i 20 e i 20.000Hz, sarebbe sufficiente
prendere una sample rate di 40.000Hz per campionare ogni possibile suono udibile
dall'uomo.
Ciò che avviene nella digitalizzazione rispetta il teorema del campionamento
procedendo in senso inverso. Stabilito un tasso di campionamento SR, occorre
eliminare dal segnale tutte quelle frequenze che sono oltre la metà di SR; quindi, se
SR = 11.000 campioni al secondo, occorre eliminare dal segnale tutte le frequenze
superiori a 5500 Hz. Per far ciò si utilizza un filtro passabasso che elimina (o meglio
attenua) tutte le frequenze sopra quella di riferimento (detta frequenza di taglio o di
cutoff). Ovviamente tale filtro è detto passabasso (LP, lowpass filter) in quanto fa
“passare” solamente le frequenze sotto la frequenza di taglio, ed è detto di
antialiasing in quanto evita il fenomeno dell’aliasing, noto anche come foldover.
Silvio Relandini www.audiomidi-educational.it
9
Il suono digitale – capitolo 1
___________________________________________________________________________
Quindi, prima di campionare il segnale occorre filtrarlo in modo da eliminare una parte
del suo spettro che potrebbe causare il problema dell’aliasing.
Il fenomeno dell’aliasing
Abbiamo visto che se si utilizza una SR superiore al doppio della frequenza di una
componente sinusoidale, questa verrà campionata bene. Vediamo il caso in cui
SR = 2F
In tal caso, per campionare bene il segnale dovremmo avere una buona dose di
fortuna in quanto per prendere i campioni sui picchi dovrebbe esserci uno sfasamento
di un quarto di periodo (90°) tra il segnale sinusoidale e l’inizio del campionamento.
Se però siamo altrettanto sfortunati da effettuare l’operazione in fase con il segnale
allora i campioni saranno presi quando il segnale passerà per lo zero e come risultato
avremo un segnale campionato le cui ampiezze sono nulle.
Silvio Relandini www.audiomidi-educational.it
10
Il suono digitale – capitolo 1
___________________________________________________________________________
Per questo motivo il campionamento è detto critico.
Vediamo cosa succede se la SR è inferiore a 2F ovvero:
SR < 2F
In questo caso il numero dei campioni preso per ogni ciclo di oscillazione è inferiore a
due e ciò vuol dire che il signale risultante ricostruito è di frequenza più bassa rispetto
all’originale.
Questa frequenza è chiamata spuria in quanto non era presente nel segnale analogico
in ingresso. Questo fenomeno è chiamato aliasing.
Qual è la frequenza FS del segnale spurio? Si calcola in base alla seguente formula:
FS = F - SR
Se ad esempio il segnale da campionare ha una frequenza pari a 1000 Hz e
utilizziamo una SR pari a 1500 Hz, allora si avrà una frequenza spuria pari a
FS = 1000 – 1500 = -500 Hz
Un valore della frequenza negativa non ha senso, equivale solamente a dire che il
segnale campionato presenta una controfase e l’orecchio la percepirà quindi come una
500 Hz.
Per comprendere meglio il fenomeno consideriamo l’immagine seguente.
Silvio Relandini www.audiomidi-educational.it
11
Il suono digitale – capitolo 1
___________________________________________________________________________
Supponiamo di utilizzare una SR = 800 Hz, tale cioè da indurre un campionamento
critico sulla componente (rossa) con frequenza 4F (400 Hz) e un fenomeno di aliasing
sulla componente ultima (4,4 F, ovvero 440 Hz) che darà come risultato una
componente spuria con frequenza pari a 40 Hz e in controfase.
Silvio Relandini www.audiomidi-educational.it
12
Il suono digitale – capitolo 1
___________________________________________________________________________
Le conseguenze dell’aliasing possono essere molto nefaste e dipendono dai rapporti
che le frequenze spurie hanno con le altre frequenze presenti nel segnale. Ad
esempio, nel caso in cui la frequenza spuria sia molto vicina a una frequenza già
presente nel segnale, si potrebbe verificare un fenomeno di battimenti.
Riassumento: per una parziale del segnale da campionare sono necessari almeno due
campioni per ciascun periodo del segnale: nel periodo di una sinusoide, infatti, il
segnale cambia direzione due volte. Inoltre, poiché in un segnale complesso sono
presenti più parziali, occorre che il campionamento prelevi almeno due campioni per la
parziale di frequenza massima presente nel segnale quindi la SR deve essere almeno il
doppio della frequenza massima presente nel segnale di ingresso per evitare il
fenomeno dell’aliasing.
Sample Rate e percezione sonora
Poiché l’uomo percepisce segnali di frequenza massima pari a 20.000 Hz, è sufficiente
scegliere una SR vi valore oltre 40.000 campioni al secondo, per non avere perdite
significative nella qualità del segnale ricostruito e il fenomeno dell’aliasing. La SR
relativa al compact disc è pari a 44.100 campioni al secondo ed è quindi sufficiente a
rappresentare correttamente il segnale audio di partenza.
Per eliminare le frequenze dal segnale in ingresso, occorre filtrare il segnale in modo
da far passare solo le frequenze al di sotto della metà del tasso di campionamento. Il
dispositivo che permette di fare questa operazione è un filtro passabasso che abbiamo
visto essere detto di antialiasing. L’eliminazione delle frequenze più elevate in realtà è
una semplificazione in quanto il filtro riesce solo ad attenuare le frequenze
indesiderate. La frequenza che fissa la soglia oltre la quale le frequenze vengono
attenuate è detta frequenza di taglio o di cutoff.
Ricostruzione del segnale analogico a partire da quello digitale
Le stesse tematiche che riguardano il filtro passabasso riappaiono nella ricostruzione
del segnale analogico, quando il filtro deve eliminare i cambi repentini di intensità
dovuti alla successione di tensioni generate dal convertitore DAC in corrispondenza
della lettura dei singoli campioni dal segnale digitalizzato. Questi cambi sono
rapidissimi perché la tensione rimane costante fino alla conversione del campione
successivo risultando in un segnale “a scalini”. Nei casi reali l’intervallo di tempo tra
Silvio Relandini www.audiomidi-educational.it
13
Il suono digitale – capitolo 1
___________________________________________________________________________
due conversioni successive è di decimillesimi di secondo (ad esempio, a 44.100
campioni al secondo l’intervallo è di 0,023 millisecondi). Ma il segnale analogico di
partenza non può avere questi cambi di intensità così veloci perché è stato utilizzato
un flitro passa basso per eliminare le componenti superiori alla metà del tasso di
campionamento.
Per la ricostruzione corretta del segnale pertanto occorre filtrare nuovamente il
segnale digitale mediante un filtro passabasso tarato come il filtro usato nella fase di
campionamento. Il segnale che arriverà ai diffusori sarà molto simile a quello originale
catturato dal microfono.
La conversione inversa, da digitale ad analogico è compiuta dal Convertitore DigitaleAnalogico (DAC - Digital-to-Analogue Converter). Il DAC genera delle tensioni
elettriche che sono proporzionali ai campioni del segnale digitale, in corrispondenza
degli istanti di tempo stabiliti dall’orologio interno. Un interpolatore si occupa di
smussare i gradini dovuti al “salto” da un valore di tensione al valore vicino. Il segnale
viene amplificato e mandato ai diffusori per la trasduzione in segnale acustico.
Silvio Relandini www.audiomidi-educational.it
14