Lezione 6: Suono (1) Informatica e Produzione Multimediale Docente: Umberto Castellani Sommario Introduzione al suono Rappresentazione del suono Elaborazione digitale Introduzione Quando un corpo vibra la sua vibrazione si propaga nell’ambiente circostante sotto forma di onda di pressione (il suono). Il suono è sempre più indispensabile nelle applicazioni multimediali – Cinema (sourround), Videogiochi, il WWW, CDmultimediali, Radio, Ambienti immersivi Suono I suoni consistono in vibrazioni che formano un’onda, la cui ampiezza misura l’altezza dell’onda e il periodo è la distanza tra due onde. AMPIEZZA PERIODO TEMPO (sull’asse X si rappresenta il tempo, sull’asse Y si rappresenta la variazione della pressione dell’aria) Caratteristiche del suono Frequenza (o altezza) Ampiezza (o intensità) Forma d’onda(o Timbro) Rappresentazione spettrale del suono Frequenza (o altezza) La frequenza è il numero di periodi (o di vibrazioni) al secondo espressa in Hertz. – – 1Hz = 1 vibrazione al secondo 1 Kilo Hertz = 1.000 vibrazioni al secondo Intuitivamente: più il suono è acuto e maggiore è la sua frequenza Applet demo: http://lectureonline.cl.msu.edu/~mmp/ applist/sound/sound.html Frequenza: esempi Suono a 100 Hz Suono a 2000 Hz Ampiezza (o intensità) L’Ampiezza (o intensità) misura il volume del suono Si misura in decibel (Db), fa riferimento alla sensibilità dell’udito (da 0 a 140 Db) Db Ambiente 140 Soglia del dolore 120 Claxon a 1m. 100 Metropolitana 80 Traffico medio 70 Conversazione a 1 m. 60 Ufficio 40 biblioteca 20 Studio musicale 0 Soglia udibilità Ampiezza: esempio Suono a 1000 Hz 10, db in meno Suono a 1000 Hz, 10 db in più Forma d’onda Rappresenta il timbro del suono Intuitivamente la forma d’onda è la ‘carta d’identità’ del suono sintetizzatore chitarra Es: suoni con stessa intesità e stessa frequenza ma con forma d’onda diversa Analisi spettrale del suono La forma d’oda dipende dalle componenti frequenziali del suono Dall’analisi di fourier è possibile scomporre il suono nelle sue componenti Analisi spettrale: esempio Suono a 1000 Hz Suono composto Suono a 100 Hz Rappresentazione del suono Per essere ‘inserito’ nel calcolatore il suono deve essere digitale – – Occorre garantire la riproduzione del suono più verosimile alla sua versione originale (analogica) Occorre garantire la possibilità di elaborare il suono in maniera efficiente Rappresentazione analogica Rappresentazione analogica: la curva continua nel tempo della variazione di ampiezza viene rappresentata con una curva continua nel tempo della variazione di tensione elettrica. Si ha una rappresentazione continua Rappresentazione digitale Rappresentazione digitale: non si cerca di imitare le curve nel continuo ma si assegnano dei numeri che rappresentano l’ampiezza in istanti di tempo sucessivi. Si ha una rappresentazione discreta (che approssima una curva continua) Si avvale di una rappresentazione simbolica (codifica digitale per rappresentare i numeri – o digit) Digitale v.s. Analogico Pro: – Il digitale è più robusto al rumore – E’ più facile elaborare il suono digitale (i.e., numeri) Contro – Il digitale introduce una semplificazione del segnale – Il digitale occupa tanta memoria – Problema della traduzione digitaleanalogica Catena di registrazione analogica Il microfono trasduce in segnale elettrico le variazioni del segnale acustico L’amplificatore rende più ‘visibile’ il segnale Il segnale elettrico viene registrato su un supporto (es. nastro magnetico o disco in vinile) Il supporto viene conservato o trasmesso Il lettore del supporto ricompone il segnale elettrico I diffusori acustici trasducono il segnale elettrico in acustico Catena di registrazione digitale Analogamente – – Il segnale acustico viene tradotto in segnale elettrico Il segnale elettrico viene convertito in segnale digitale usando un Analogue to Digital converter (ADC) – L’ADC preleva i campioni del segnale ad istanti temporale fissati (sample rate SR) e li memorizza. Ogni campione viene codificato in numero Il segnale digitale viene memorizzato o trasmesso Catena di registrazione digitale Il suono digitale viene convertito in analogico attraverso il Digital to analogue converter (DAC). – Il Dac genera delle tensioni elettriche che sono proporzionali ai campioni del segnale digitale in corrispondenza degli istanti temporali di acquisizione Un interpolatore rende il segnale fluido in modo da togliere l’effetto a gradini del campionamento Il suono analogico elettrico viene convertito in suono acustico attraverso i diffusori acustici Digitalizzazione del suono La digitalizzazione del suono consiste nel passaggio da una rappresentazione acusticaanalogica ad una rappresentazione numerica. Si compone di due fasi: – Campionamento – Quantizzazione 011001101 Suono digitale QUANTIZZAZIONE Suono analogico CAMPIONAMENTO Suono campionato Campionamento Il campionamento è la discretizzazione del segnale analogico nel tempo. Si misura il valore dell’onda (ampiezza) in intervalli di tempo costante. Maggiore è il numero di misure (campioni) che si effettuano nell’unità di tempo e maggiore sarà la precisione della rappresentazione digitale. – E’ cruciale il numero di campioni al secondo o Sample rate (SR). Campionamento (2) Suono campionato a diverse frequenze di campionamento Campionamento (3) Teorema di Nyquist Quanto posso permettermi di ‘semplificare’ il suono ? Teorema di Nyquist: per digitalizzare un segnale (un suono) che contiene componenti di frequenze fino a x-hertz, occorre campionare ad un tasso di campionamento (SR) di almeno 2 x campioni al secondo. – Esempio: se il segnale contiene componenti frequenziali a 10.000 Hz, occorre prelevare almeno 20.000 campioni per secondo (SR=20.000) Campionamento (4) Di fatto nella digitalizzazione accade il processo inverso: – Si fissa il tasso di campionamento (sulla base della potenza della macchina – velocità e memoria) – Si eliminano dal segnale le frequenze che violano il teorema di Nyquist (applicando un filtro passa basso) Es: se SR=11.000 allora devo eliminare dal segnale tutte le componenti con frequeza maggiore di 5500 Hz Esempi Poiché la percezione dell’udito dell’essere umano arriva a max 20.000 herz un SR > di 40.000 è sufficiente per riprodurre il segnale senza perdita percettiva – Es: la qualità del suono audio CD è a 44.100 SR (per ciascun canale stereo) Riproduzione In fase di riproduzione del segnale digitale occorre convertire i singoli campioni in segnale acustico – Occorre garantire la velocità di decodifica dei campioni nell’unità di tempo (es. il dispositivo, per la qualità audio CD, deve garantire di decodificare 44.100 campioni al secondo) La velocità di lettura del supporto deve essere compatibile (es. floppy, HD, CD-ROM, DVD) La velocità di trasmissione deve essere compatibile (es. se il segnale viene trasmesso via Internet) Quantizzazione La quantizzazione consista nel rappresentare ciascun campione (valore di ampiezza) in un numero binario Di fatto per ogni campione sono a disposizione un numero prefissato di bit La parola binaria (o profondità di bit o risoluzione): è il numero di valori a disposizione per quantificare l’ampiezza Ogni parola individua un intervallo di ampiezza L’ampiezza misurata dal campionamento cade in un certo intervallo, si associa al tal campione il suo intervallo Quantizzazione: esempio Segnale quantizzato a diverse profondità di bit Quantizzazione: valori tipici La qualità ‘nastro’ è garantita con poco più di 8 bit per campione (28 = 256 valori di campionamento distinti) Nel CD-audio si usano 16 bit per campione (216 = 65.536 valori di campionamento distinti) nell’industria discografica si arriva a 24 bit N.b. l’orecchio umano non percepisce più di 216 = 65.536 livelli di quantizzazione distinti (capacità di dettaglio acustico della percezione umana) Esempio di quantizzazione Rappresentazione analogica Rappresentazione digitale Dinamica Dinamica: è misurata in decibel e rappresenta il rapporto fra il suono più forte e quello più debole che una stessa apparecchiatura (o un componente) può registrare e/o riprodurre. Molto semplicemente rappresenta la capacità di graduare in modo nitido l'intensità del suono (nel contesto complessivo) riproducendo nel giusto rapporto i picchi di intensità, i suoni di basso livello, e tutti i suoni la cui intensità è compresa trai due estremi. Quantizzazione e dinamica ad una maggiore profondità di bit corrisponde la possibilità di registrare e/o riprodurre una maggiore dinamica. N bit Db 4 24 db 8 48 db Es: i brani di musica classica hanno un alta dinamica, mentre la musica techno ha una dinamica molto limitata 12 72 db 16 96 db Riepilogo casi tipici: Audacity Programma free per l’editing audio di base http://audacity.sourceforge.net/