Tu sei qui

Libro di acustica

La registrazione del suono

LA REGISTRAZIONE DEL SUONO

La registrazione del suono è collegata alla necessità di convertire le vibrazioni dell’aria, (che come abbiamo visto raggiungono il nostro orecchio e costituiscono lo stimolo sonoro) in segnali elettrici. Viceversa la riproduzione del suono consiste nella conversione dei segnali elettrici in adeguate vibrazioni dell'aria.
Gli strumenti necessari alla registrazione del suono partono dal microfono per essere conservati su un supporto di memorizzazione come il vecchio nastro magnetico, oppure in forma di piccoli solchi come il vecchio disco. Tale modalità di registrazione del segnale elettrico è detta analogica.
Un microfono è un trasduttore che riceve energia dalle vibrazioni dell’aria e la converte in energia di oscillazioni elettriche.
I microfoni possono esseredi vario tipo:

  1. a condensatore
  2. piezoelettrico
  3. elettromagnetico

Viceversa la riproduzione avviene attraverso la lettura delle informazioni analogiche da un nastro, oppure dai microscopici solchi del giradischi, la preamplificazione del segnale, la amplificazione e l'invio agli altoparlanti che mettono in vibrazione l'aria.

Dalla modalità analogico si è passati alla registrazione e riproduzione digitale. I supporti di archiviazione restano ancora di tipo magnetico (nastri o dischi magnetici) oppure in forma di piccole tacche come sui CD o sui DVD. Rispetto alla modalità analogica di registrazione degli anni passati, quella digitale mira alla archiviazione di informazioni di tipo numerico costituite da gruppi di bit.
Pertanto nell'elenco degli strumenti necessari alla registrazione sopra esposto, occorre inserire in fase di registrazione dopo la cattura del segnale da parte del microfono e la preamplificazione, un convertitore del segnale da analogico a digitale che solitamente è abbreviato con le lettere A/D. Il segnale convertito in numerico viene quindi archiviato.
In fase di riproduzione occorre un lettore del segnale numerico e un convertitore da digitale a analogico (D/A), per poi proseguire come sopra descritto alla amplificazione del segnale per essere inviato agli altoparlanti.


LA CONVERSIONE DA ANALOGICO A DIGITALE

Il processo di conversione prevede due operazioni fondamentali:

  1. il campionamento del segnale analogico
  2. la codifica numerica.

Per il campionamento di un segnale sonoro da analogico a digitale occorre innanzitutto organizzare la suddivisione del tempo in piccoli intervalli che siano a distanza sempre uguale. Ad ogni intervallo fissato, si misura e si preleva l'ampiezza del segnale corrispondente. Sia il numero di divisioni del tempo e sia i possibili valori di ampiezza da archiviare, vanno scelti con il riferimento alla frequenza e all'ampiezza del segnale che si deve campionare e alla maggiore o minore accuratezza che si vuole ottenere nella fase inversa di riproduzione.
Le due operazioni sopra descritte possono essere osservate in una rappresentazione grafica su assi cartesiani. Nella figura 23 sull'asse delle x (quella del tempo) abbiamo indicato 16 suddivisioni, mentre sul quella delle y 8 divisioni per i valori positivi e 8 per i valori negativi di ampiezza. Ad ogni suddivisione temporale si registra l'ampiezza corrispondente, valore che resterà stabile per la durata dell'intervallo e potrà variare solo allo scadere temporale dell'intervallo successivo.
Sull'onda originale sono stati evidenziati dei punti più marcati di riferimento. L'onda che si otterrà dal campionamento avrà una forma tipica a scaletta come si può osservare nella figura 23.

Figura 23 Figura 23
Figura 23 Figura 23 per la stampa in rilievo


LA SCELTA DELLA FREQUENZA DI CAMPIONAMENTO

Il primo dei due valori in gioco è la suddivisione temporale per effettuare la registrazione dell'ampiezza dell'onda. Tale valore è detto frequenza di campionamento, ed è un valore che deve essere scelto in modo adeguato al fine della corretta interpretazione del segnale analogico da convertire.

Il teorema di Nyquist riporta che è necessario utilizzare una frequenza di campionamento almeno doppia della più alta frequenza presente nel segnale da campionare. Solo in questo caso è possibile almeno rispettare, se non tanto la precisione della forma d'onda, almeno la frequenza della stessa.

La figura 24 riporta un esempio nel quale la frequenza di campionamento è insufficiente per ricostruire il segnale di ingresso. Il segnale si compone di 4 onde, con 4 picchi positivi e 4 picchi negativi. I campioni della figura sono soltanto 6 che riproducono una forma d'onda non adeguata rispetto alla forma originale.

Figura 24 Figura 24
Figura 24 Figura 24 per la stampa in rilievo

Il campo di udibilità non supera i 20 mila Hz e pertanto il valore della frequenza di campionamento necessaria deve essere almeno doppia di tale valore. Lo standard utilizzato per la registrazione dei CD è di 44.100 Hz. In termini di tempo corrispondono a successioni di 22,7 microsecondi, ossia la differenza di tempo tra due campionamenti è di 22,7 miscosecondi.

La conversione dal segnale analogico a digitale può dar luogo a segnali udibili alterati.
Se si produce un battimento tra la frequenza di campionamento e una frequenza campionata si può avere il fenomeno di aliasing”, cioè la comparsa di un segnale spurio di frequenza pari alla differenza tra le due frequenze.
Un esempio molto comune di aliasing in campo visivo è quello per cui a volte le ruote della automobili in un film appaiono girare in senso inverso. Questo segnale spurio potrà sovrapporsi al segnale effettivo quando la frequenza di campionamento non è pari ad almeno il doppio della massima frequenza presente nel segnale. L'esempio della figura 24 chiarisce perché è opportuno che la frequenza di campionamento sia più del doppio della frequenza massima udibile.
Inoltre è anche opportuno introdurre in un sistema di conversione un filtro antialiasing, per eliminare l’effetto indesiderato su eventuali armonici superiori non udibili.

Il secondo valore in gioco oltre alla frequenza di campionamento è definizione della codifica dell'ampiezza del campione.
L'esempio della figura 25 mostra che a parità di frequenza di campionamento, la forma d'onda si riproduce in modo più adeguato se aumentano i possibili valori dei campioni. La prima immagine mostra la forma d'onda con due soli valori possibili (0 e 1 ossia un bit per i valori e un bit per il segno) e la stessa forma con possibili 4 valori positi e negativi (da 0 a 3 ossia a 2 bit per i valori e un bit per il segno).

Figura 25 Figura 25
Figura 25 Figura 25 per la stampa in rilievo

Utilizzare adeguati valori di campionamento è fondamentale per poter garantire la qualità di quella che è detta "dinamica" dei suoi e della musica che può passare dal pianissimo a fortissimo con una escursione che può essere anche superiore a 70 - 80 dB. Quella teorica fissata per i CD è di 96dB. Una opportuna codifica, tenendo presente che si deve rappresentare anche il segno che viene a sottrarre un bit, deve essere di almeno di 16 bit, ossia 2^16 che corrispondono a 65.536 valori, ossia una scala che parte da -32768 a +32768. Il valore di 16 bit è utilizzato come standard per i CD audio, mentre altri formati come i DVD audio supportano una profondità fino a 24 bit.
Considerando che la relazione tra la profondità (ossia i valori indicati in bit) e l'intervallo dinamico (che si indica in dB) può essere indicato approssimativamente con il rapporto di 1/6, ne consegue che aumentando di un bit la definizione, la dinamica aumenta di circa 6 dB. Perciò con 16 bit è possibile ottenere una dinamica teorica di 16*6 ossia 96 db, mentre con 24 bit è possibile ottenere una dinamica teorica di 24*6 ossia di circa 144 dB.
Qualora si utilizzasse un basso valore di risoluzione di quantizzazione per un segnale di debole intensità si presenta un tipico rumore di quantizzazione che risulterebbe fastidioso quando amplificato L'esempio sonoro successivo presenta un suono di pianoforte che nel momento in cui va smorzandosi presenta il tipico rumore di quantizzazione.


ESEMPIO SONORO

Le figure seguenti presentano lo stesso segnale che mantiene il valore di risoluzione del campione a 16 bit, e riduce i valori di frequenza di campionamento da 44.100 Hz, il secondo a 22050 Hz, il terzo a 11025 Hz e infine l'ultimo a 8000 Hz. la forma d'onda perde man mano la sua forma per ridursi ad una onda sempre più semplice.

Figura 27 Figura 27
Figura 27 Figura 27 per la stampa in rilievo

L'ascolto di un esempio musicale (incipit del concerto per violino e archi di Mendelssohn) rende maggiormente il decadimento della fedeltà del segnale originale.

Esempio a 44100Hz e 16 bit Esempio a 22050Hz e 16 bit
Esempio a 11025Hz e 16 bit Esempio a 8000Hz e 16 bit
Esempio a 3000Hz e 16 bit

Di seguito si rappresenta graficamente sempre lo stesso segnale in cui si mantiene la frequenza di campionamento a 44.100 Hz, ma si riduce la risoluzione da 16 bit a 8 bit.

Violino 44100Hz 16 bit
Violino 44100Hz 16 bit

Violino 44100Hz 8 bit
Violino 44100Hz 8 bit

L'ascolto degli esempi successivi per i tre valori di risoluzione (16, 8 e 4 bit) rende maggiormente il decadimento della fedeltà del segnale originale.

Esempio a 44100Hz e 16 bit Esempio a 44100Hz e 8 bit
Esempio a 44100Hz e 4 bit

Le dimensioni in termini di valori in byte per registrare un'ora di musica di qualità come quella del CD sono molto elevate e corrispondono a 44.100 Hz di frequenza di campionamento e 16 bit di risoluzione che per la stereofonia vanno duplicati e che corrispondono come di seguito:
16 (bit di risoluzione) * 44100 (frequenza di campionamento) * 3600 (secondi) * 2 (canali della stereofonia) = 5,08E+09 bit. Tale valore espresso in Mbyte (sapendo che 8 bit corrispondono ad un byte) corrispondono a 635,04 Mbyte Il CD inoltre contiene, oltre ai dati audio, anche altre informazioni, come quelle di correzione degli errori e altre di tipo generale come numero del brano, tempo trascorso, titolo del brano ecc.

Theme by Danetsoft and Danang Probo Sayekti inspired by Maksimer