SUBLIMEN.com
Sonorità ed Elementi Induttivi SubLiminali Benefici ed Evolutivi


Battimenti, Psicoacustica e
Ingegneria del Suono

Battimenti, Psicoacustica e Ingegneria del Suono


Ingegneria del Suono

Brani testuali by Corso Audio Multimediale di Marco Sacco

Testi ed immagini selezionati e supervisionati da Marco Stefanelli


2.2. L'orecchio umano  

L'orecchio umano agisce da trasduttore nel trasformare energia acustica, prima in energia meccanica e successivamente in energia elettrica. Una volta che l'energia è stata convertita dalla forma meccanica a quella elettrica dall'orecchio, gli impulsi elettrici arrivano al cervello attraverso delle terminazioni nervose. Qui vengono elaborati permettendo la percezione del suono e, dulcis in fundo, l'ascolto della musica. L'apparato uditivo è composto da tre sezioni: l'orecchio esterno, l'orecchio medio e l'orecchio interno.
L'analisi del funzionamento di queste tre sezioni ci permetterà di capire il meccanismo di percezione del suono e saremo in grado di individuare quali parametri modificare sul suono che stiamo trattando per ottenere il risultato che vogliamo. A questo proposito consideriamo la situazione seguente.
Supponiamo di eseguire un missaggio in cui è presente un flautino che ogni tanto fa capolino tra gli altri strumenti. Se vogliamo che sia una presenza eterea, avvolgente, indefinita, possiamo intervenire sul suono tagliandone le alte frequenze. Vedremo tra un momento che uno dei fattori più rilevanti per individuare la direzione di un suono è il suo contenuto di alte frequenze. Tradotto significa che riusciamo più facilmente ad individuare la direzione di un suono con un elevato contenuto di alte frequenze rispetto ad uno contenente solo basse frequenze. Dunque, se vogliamo che il flautino sia ben presente anche se lontano per esempio sulla destra del nostro mix, metteremo il pan-pot a destra e accentueremo le alte frequenze (facendo naturalmente attenzione a non snaturare la natura del suono...).

Figura 1 - L'orecchio umano


2.2.1. Orecchio esterno  

Il primo organo che il suono incontra quando raggiunge l'orecchio è il padiglione auricolare. Questo offre una vasta superficie al fronte sonoro e permette di raccogliere un'ampia porzione del fronte d'onda. Per ottenere una superficie più ampia si portando le mani alle orecchie come viene istintivo fare quando si ascolta un suono molto debole. Il suono viene riflesso dal padiglione auricolare e concentrato verso il condotto uditivo la cui lunghezza è mediamente pari a 3 cm.
Questo significa che quando un gruppo di frequenze di valore intorno a 3KHz arrivano all'orecchio, il canale uditivo entra in risonanza e dunque quelle frequenze subiscono una naturale amplificazione. Vedremo in quanti casi viene sfruttata questa grandezza in campo audio e allora sarete contenti di aver superato anche questo ostacolo per arrivare alla conoscenza di questo piccolo ma fondamentale valore.


2.2.2. Orecchio medio  

Il condotto uditivo termina su una membrana, il timpano, che vibra in accordo con il suono che ha raggiunto l'orecchio. Alla parte opposta del timpano sono collegati tre ossicini chiamati: martello, incudine e staffa. Questi hanno la funzione di amplificare la vibrazione del timpano e ritrasmetterla alla coclea, un ulteriore osso la cui funzione verrà spiegata tra un momento. Questa amplificazione si rende necessaria in quanto mentre il timpano è una membrana molto leggera sospesa in aria, la coclea è riempita con un fluido denso e dunque molto più difficile da mettere in vibrazione. I tre ossicini sono tenuti insieme da una serie di piccoli legamenti che hanno l'ulteriore funzione di impedire che seguano una vibrazione molto ampia con il rischio di rimanere danneggiati nel caso in cui l'orecchio venga sottoposto ad una pressione sonora troppo elevata. Un'apertura all'interno dell'orecchio medio porta alla cosiddetta tuba di Eustachio che consiste di un canale che conduce verso la cavità orale. La sua funzione è quella di dare uno sfogo verso l'esterno in modo da equilibrare la pressione atmosferica ai due lati del timpano (ecco perché sott'acqua è possibile compensare la pressione esterna, che aumenta con la profondità, aumentando la pressione interna tappando il naso e soffiandoci dentro).


2.2.3. Orecchio interno  

Questa sezione dell'orecchio effettua la conversione dell'energia meccanica in impulsi elettrici da inviare al cervello per l'elaborazione del suono. L'ultimo dei tre ossicini di cui sopra, la staffa, è in contatto con la coclea attraverso una membrana che viene chiamata finestra ovale. La coclea è un osso a forma di chiocciola contenente del fluido (è dotata di tre piccoli canali circolari orientati secondo le tre direzioni dello spazio che vengono utilizzati dal cervello per la percezione dell'equilibrio). Il fluido riceve la vibrazione dalla staffa attraverso la finestra ovale e la trasporta al suo interno dove è presente il vero organo deputato alla conversione dell'energia meccanica in energia elettrica: l'organo del Corti. All'interno dell'organo del Corti troviamo la membrana basilare che ospita una popolazione di ciglia, circa 4000, che vibrano in accordo con la vibrazione del fluido. Ogni gruppo di ciglia è collegato ad una terminazione nervosa in grado di convertire la vibrazione ricevuta dal fluido in impulsi elettrici da inviare al cervello per essere elaborati e percepiti come suoni. Il motivo per cui l'orecchio umano percepisce le frequenze in modo logaritmico deriva dalla composizione della membrana basilare. I gruppi di ciglia, chiamati bande critiche, infatti sono ognuno sensibili ad una finestra di ampiezza 1/3 di ottava dello spettro di frequenza. In altre parole la membrana basilare è suddivisa in settori ognuno sensibile ad una determinata banda di frequenza ognuna di ampiezza pari a 1/3 di ottava e si comporta come un analizzatore di spettro. Ogni volta che il suono aumenta di un'ottava, viene eccitata una parte della membrana sempre equidistante dalla precedente riproducendo così un comportamento di tipo logaritmico.


2.3. Percezione del suono da parte del cervello  

Senza entrare in discorsi filosofici che, per quanto interessanti non contribuirebbero a raggiungere le finalità di questo corso, diremo solo che la percezione di un suono, come quella della realtà del resto, è un concetto in gran parte soggettivo. Un suono in sé stesso è quello che è, ma la nostra percezione varia in quanto dipende da innumerevoli variabili. Alcune di queste variabili sono: la nostra posizione rispetto al suono, le condizioni del nostro apparato uditivo e soprattutto la forma che il cervello conferisce al suono. L'udito, al pari della vista che interpreta la luce, è capace di percepire solo una parte delle onde acustiche che ci circondano e dunque restituisce un quadro parziale. Inoltre le onde percepite vengono elaborate dal cervello che così 'interpreta' i suoni che deve elaborare. Nel seguito verrà descritto il comportamento del suono dal punto di vista della sua percezione e si mostrerà come in determinate condizioni sia evidente l'azione del cervello che interpreta la realtà sonora piuttosto che restituirla fedelmente. Un esempio molto eloquente in proposito viene descritto nel seguito e prende il nome di battimenti.



Grafico 1 - Forma d'onda di un classico battimento


2.3.1. Battimenti  

Quando siamo in presenza di due suoni le cui frequenze differiscono di poco, percepiamo un ulteriore suono simile a un battito il cui ritmo è dato dalla differenza delle due frequenze originarie. Se queste frequenze sono troppo diverse tra di loro il cervello non è più in grado di percepire il suono differenza. Questo dipende dal fatto che le due frequenze, per essere percepite come battimento, debbono eccitare ciglia appartenenti alla stessa banda critica. La frequenza del battimento è pari al numero di volte che le due sinusoidi componenti vanno in fase e fuori fase in un secondo. Vediamo un esempio pratico. Consideriamo due sinusoidi pure di frequenza pari a 400 Hz e 405 Hz. Quando le due sinusoidi vengono sommate danno luogo ad una nuova forma d'onda che viene percepita come battimento.


2.3.4. Mascheramento   

Una frequenza con ampiezza elevata può mascherare frequenze vicine con ampiezze inferiori in quanto frequenze vicine vengono decodificate da ciglia appartenenti alla stessa banda critica. Questa proprietà viene massicciamente sfruttata per realizzare algoritmi di compressione dei dati audio in formato digitale quali l'MP3 e l'ATRAC impiegato sui sistemi MiniDisc. Tali algoritmi consentono compressioni dell'ordine di 5:1.


2.3.5. Effetto Doppler  

Questo fenomeno si verifica quando o la sorgente sonora o l'ascoltatore sono in movimento. Il classico esempio che viene sempre fatto è quello della sirena di un'ambulanza che arriva di gran carriera, ci supera e prosegue sfrecciando via nella notte.
Facciamo riferimento alla figura precedente in cui l'ambulanza è ferma e la sirena emette un suono che, essendo di una certa frequenza, genera dei fronti d'onda a distanza costante l'uno dall'altro. Quando invece il mezzo è in movimento e si avvicina all'ascoltatore, la stessa sirena genera un suono con dei fronti d'onda più ravvicinati rispetto a quando il mezzo era fermo perché muovendosi comprime i fronti d'onda. Dato che ora i fronti d'onda sono più ravvicinati percepiamo una frequenza più alta cioè un suono più acuto. Quando il mezzo ci supera (e sfreccia via nella notte), allontanandosi distanzia i fronti d'onda e dunque in questa fase percepiamo un suono più grave perché ci arriva una frequenza più bassa.


2.3.6. Curve isofoniche   

Sono grafici molto importanti che permettono di avere un riferimento su come l'orecchio umano reagisca alle diverse frequenze. Sono state ricavate elaborando i dati su un campione statistico sottoposto ad una serie suoni prodotti in una camera anecoica. Tale camera viene disegnata con lo scopo di ridurre al minimo le riflessioni sulle pareti in modo che l'ascoltatore sia raggiunto unicamente dal segnale diretto. Le curve indicano come l'orecchio umano reagisca diversamente alle varie frequenze in termini di intensità sonora percepita. Supponiamo di avere una sorgente sonora in grado di generare onde sinusoidali con frequenza variabile e ampiezza costante. Fissando l'ampiezza per esempio a 80 dBspl noteremmo che un ascoltatore percepisce le basse frequenze come aventi un volume molto basso e man mano che frequenza viene aumentata avrebbe la percezione che anche il volume aumenta (mentre la pressione sonora realmente generata è sempre di 80 dBspl). Questo comportamento si spiega con il fatto che l'orecchio umano ha una percezione diversa dell'intensità sonora al variare della frequenza. Le curve isofoniche sono dette tali in quanto indicano il valore di dBspl necessario per percepire un suono sempre allo stesso volume lungo ogni curva. La frequenza di riferimento per ogni curva è 1KHz e a tale frequenza, il valore di dBspl è pari al valore che identifica una particolare curva e che prende il nome di phon. Per esempio la curva isofonica a 40 phon è quella che a 1 KHz ha un'ampiezza di 40 dBspl.

Grafico 2 - Curve isofoniche

Cominciamo a dare un'occhiata a questi grafici che sembrano un pò ostici e vediamo di capirci qualcosa:
Prendiamo una delle curve, per esempio quella a 80 phon e seguiamola dalle basse verso le alte frequenze. Vediamo che a 20 Hz è necessario produrre una pressione sonora di 118 dBspl e questo ci mostra come l'orecchio umano abbia una minore sensibilità alle basse frequenze. Scorrendo la curva verso le alte frequenze vediamo che affinchè l'orecchio percepisca sempre la stessa intensità sonora sono necessari livelli di pressione sonora più bassi. A 1KHz incontriamo il valore di riferimento della curva isofonica che stiamo considerando, dunque 80 dBspl. Oltre questo valore vediamo che la curva ha un minimo in corrispondenza dei 3KHz e vediamo come affinchè l'orecchio percepisca sempre la stessa pressione sonora, la frequenza di 3 KHz deve generare 70 dBspl. Confrontando questo valore con quello a 20 Hz notiamo una differenza di circa 50 dBspl in meno, è una differenza enorme. Questo valore di minimo dipende dal fatto che la frequenza di risonanza del canale uditivo è di circa 3 KHz e dunque tale frequenza viene percepita già a bassi valori di dBspl. Oltre i 3 KHz la curva risale mostrando il livello di dBspl necessario per avere la stessa percezione di volume alle alte frequenze. Le curve vengono mostrate per diversi valori di phon in quanto il comportamento dell'orecchio varia ai diversi valori della pressione sonora. Notiamo come per elevati valori della pressione sonora, l'andamento delle curve isofoniche è quasi piatto.

Figura 2 - Elaborazione del suono al computer

Suggerimento

Il controllo di loudness negli amplificatori da casa è regolato proprio dall'andamento di queste curve. Quando il volume è molto basso, l'inserimento del circuito di loudness avrà come effetto quello di aumentare le basse frequenze allineandone l'ampiezza con le altre. Per volumi elevati, questo allineamento avviene in modo naturale da parte dell'orecchio e dunque l'azionamento del loudenss a questi volumi avrà un effetto pressoché nullo.


2.3.6.1. Descrizione delle curve isofoniche  


2.3.6.1.1. Soglia di udibilità (0 phons)  

La curva isofonica più bassa di tutte viene denominata soglia di udibilità e indica la più piccola variazione di pressione che l'orecchio è in grado di individuare alle diverse frequenze. Ricordiamo che queste curve sono ottenute elaborando dati statistici e dunque che i valori che stiamo considerando possono avere differenze anche notevoli da individuo a individuo.  


2.3.6.1.2. Soglia del dolore (120 phons)  

Per pressioni sonore i cui valori si trovano al di sopra di questa curva l'orecchio comincia a percepire dolore fisico e per esposizioni prolungate si possono generare danni non reversibili.
Il volume ideale per eseguire un missaggio (mixdown) è intorno a 80-90 phons. A questi valori il bilanciamento dei volumi delle frequenze è abbastanza uniforme. Se il mixdown venisse eseguito a un volume troppo basso, per esempio a 40 phons, si avrebbe una minore percezione dei bassi e si potrebbe essere tentati ci compensare agendo sugli equalizzatori. Una volta però che il nostro mix fosse riascoltato al 80 phons risulterebbe inondato di bassi...


  2.4. Psicoacustica  

La psicoacustica studia i meccanismi di elaborazione del suono da parte del cervello. La conoscenza di questi meccanismi è fondamentale nella pratica sul suono poichè permette, effettuando le opportune manipolazioni, di ottenere effetti sonori molto sofisticati. Uno dei fattori più importanti nell'elaborazione del suono deriva dal fatto che il cervello si trova a elaborare due flussi di informazione contemporaneamente: quelli che provengono dall'orecchio destro e da quello sinistro. Sono le differenze, a volte anche minime, tra questi due segnali che determinano la nascita di una nuova informazione associata alla composizione delle due onde sonore. In questo caso parliamo di suono stereofonico. Quando invece i due segnali che arrivano alle orecchie sono esattamente uguali parliamo di suono monofonico.

Figura 3 - Distanza dal segnale sorgente e fase

2.4.1.1. Differenze di tempo (fase)  

Dalla figura precedente si vede come la distanza dalla sorgente onora delle due orecchie sia diversa e ciò si traduce in una differenza nel tempo di arrivo (denominato tempo di interarrivo) di ciascun segnale.
Naturalmente ciò implica una differenza di fase in quanto ritardo in tempo e differenza di fase sono intrinsecamente correlate.

Grafico 3 - Grafico di Binaural beat (20Hz) in modulazione di frequenza e differenza di fase (180°)


2.4.1.2. Differenze di ampiezza  

Le ampiezze dei due segnali sono diverse sia perché l'ampiezza diminuisce all'aumentare della distanza sia perché il segnale che deve raggiungere l'orecchio più lontano deve aggirare l'ostacolo della testa e nel fare ciò perde energia. Inoltre le frequenze più alte non riusciranno proprio a superare l'ostacolo quindi i due segnali differiranno anche per il contenuto in frequenza. Questo è il motivo per cui risulta difficile individuare la direzione di provenienza delle basse frequenze: queste sono in grado di oltrepassare gli ostacoli senza una perdita di energia rilevante e dunque i suoni che arrivano alle due orecchie sono pressochè identici. Nel caso in cui la sorgente sonora sia esattamente dietro l'ascoltatore, la direzione viene individuata poichè viene riscontrata una mancanza delle alte frequenze che vengono bloccate dal padiglione auricolare.


2.4.1.3. Differenze nel contenuto armonico  

Riferendoci alla figura precedente vediamo che una delle due onde deve "girare attorno" alla testa per raggiungere l'orecchio più lontano. Ciò comporta una leggera perdita sulle alte frequenze a causa della diffrazione.

Grafico 4 - Analisi in frequenza di Binaural beat - Battimento binaurale o biauricolare in differenza di frequenza


2.4.2. Fusione binaurale  

È quella facoltà del cervello per la quale due segnali simili che arrivano alle due orecchie vengono fusi in un unico segnale; il nuovo segnale è per così dire una creazione del cervello che non esiste nella realtà. Consideriamo per esempio uno xilofono. Eseguiamo una linea melodica e la registriamo su una traccia, successivamente eseguiamo la stessa linea con qualche leggera modifica e la registriamo su un'altra traccia. Facciamo suonare le due linee contemporaneamente mandando una linea sul canale sinistro e l'altra linea sul canale destro. Quello che ne esce è una terza linea melodica derivante dalla fusione delle due precedenti ma che nella realtà non esiste. Questo è uno dei segreti della magia della musica: i singoli strumenti eseguono delle linee melodiche e se facciamo attenzione riusciamo ad isolarle ed ad ascoltarle singolarmente, anche quando gli strumenti suonano tutti insieme. Ma quando lasciamo questa prospettiva e ci spostiamo su un piano più astratto, è in quel momento che riusciamo a percepire ciò che non esiste, la combinazione di tutti i suoni che creano un'armonia: è in quel momento che la musica nasce!

Testi (C) 2001-2005 by Marco Sacco www.audiosonica.com - Grafici e immagini (C) Amadeux