percezione sonora e algoritmi di compressione audio

PERCEZIONE SONORA E ALGORITMI DI COMPRESSIONE
AUDIO PSICOACUSTICI
Federico Corradi, Giugno 2009
>> ABSTRACT:
Si vuole studiare il funzionamento del sistema uditivo umano, in modo da
prevedere la sensazione uditiva in funzione dello stimolo che la provoca. In molte
applicazioni dell'acustica e dell'elaborazione del segnale sonoro diventa
strettamente necessario conoscere come il suono viene percepito da un essere
umano. La comprensione dei meccanismi di funzionamento dell’apparato uditivo
trova molte applicazioni pratiche, alcune di queste sono le tecniche di
compressione audio ad alta qualità e algoritmi di riconoscimento vocali. La ricerca
che si vuole efettuare ha come obiettivo lo studio di tecniche di compressione
audio psicoacustiche, basate su modelli fsiologici di percezione sonora.
Particolare attenzione verrà posta nelle tecniche di compressione audio di dipo
“lossy” (con perdita d'informazione). Le codifche lossy si dividono in due categorie:
Le codifche per modelli vengono utilizzate soprattutto per i segnali vocali,
mentre quelle nel dominio delle frequenze lavorano sullo spettro del segnale, il quale
viene codifcato con una quantizzazione non lineare guidata da un modello
psicoacustico che ha il compito di eliminare le informazioni frequenziali non
percepibili dall’orecchio umano.
@ ANATOMIA DELL'APPARATO UDITIVO UMANO ~ <
Verrà presentato il funzionamento del sistema uditivo umano, delineando le
caratteristiche fsiologiche fondamentali dal padiglione esterno [4,5] sino ad una veloce
descrizione della corteccia uditiva [1]. Si presenterà il modello del circuito elettrico
equivalente per una cella cocleare [6], che ha il compito di trasdurre il segnale meccanico
vibrazionale della coclea in segnale elettrico per il sistema nervoso.
@ LA SENSAZIONE SONORA ~ <
Si descriveranno alcuni modelli fsiologici della percezione dello stimolo sonoro [2].
Particolare attenzione verrà posta nelle tre sensazioni primarie che accompagnano
l’ascolto di un suono suono: altezza, intesità e timbro. Percezione di altezza e minima
variazione precepibile (JND) [7]. Sovrapposizione di suoni sinusoidali: battimenti del primo
e secondo ordine. Bande critiche. Suoni di combinazione. Consonanza percettiva.
@ ELABORAZIONE DELLO STIMOLO ACUSTICO NEL SISTEMA NERVOSO ~ <
In questa parte si parlerà dei vari tipi di cellule, neuroni e sinapsi che hanno il compito di
elaborare lo stimolo acustico [2]. Si descriveranno alcuni modelli temporali e spaziali al
fne di spiegare i fenomeni percettivi. Si defnirà il mascheramento e si analizzeranno le
curve di mascheramento per diversi suoni puri.
@ ALGORITMI DI COMPRESSIONE AUDIO PSICOACUSTICI ~ <
E' stato studiato il perceptual coding e si presenteranno alcune tecniche che comprimono i
segnali audio per evitare di codifcare alcune componenti dei segnali a cui l'orecchio
umano non è sensibile [3]: Frequency Masking e Temporal Masking. Verrà discusso nel dettaglio
il Signal-to-mask Ratio. Verranno anche discussi alcuni tra i principali standard per la
compressione audio che si basano su tecniche psicoacustuche: MPEG (layer 3), AAC,
Dolby A3C.
~ > [BIBLIOGRAFIA]
[1] Auditory Computation, Chapter 4, “Computational Analysis of Hair Cell and Auditory Nerve
Processes”, David C. Mountain, Allyn E. Hubbard , Harold L. Hawkins, Teresa A. McMullen,
Arthur N. Popper, Richard R. Fay, ed. Springer 1995.
[2] Auditory Computation, Chapter 5, “Physiological Models for Basic Auditory Percepts”, Bertrand
Delgutte, Harold L. Hawkins, Teresa A. McMullen, Arthur N. Popper, Richard R. Fay, ed.
Springer 1995.
[3] J. G. Roederer. “The Physics and Psychophysics of Music”. Springer Verlag, 1980.
[4] Aibara R, Welsh JT, Puria S, et al. (2001) “Human middle ear transfer function and cochlear
input impedance.” Hearing Research 152 100-109
[5] Ferrari Toniolo Simone, “La percezione acustica: un modello neurale cronotopico”, Tesi di laurea
specialistica, La Sapienza University, 2008.
[6] Dallos, P (1992) “The active cochlea.” J. Neurosci.
[7] de Cheveigné A (2004) “Pitch perception models.” in "Pitch", Edited by C.Plack and
A.Oxenham, New York, Springer Verlag.