Tu sei qui

Libro di acustica

CD e MP3

IL CD STANDARD

Esso è un dischetto di materiale plastico del diametro di 12 cm.

I dati sono riportati sul disco sotto forma di tacche larghe circa 0.5 mm, lunghe da 0,8 a 3,2 mm in relazione al tipo di codice digitale (segnale audio, sincronismo, controllo) che contengono, e distanziate lateralmente di 1,6 mm.

Le tacche sono incise su di una sola faccia del disco e sono allineate su di una traccia disposta a spirale che inizia dalla parte interna del disco. L’incisione ha una profondità di una frazione di mm.

Nei DVD tutte queste dimensioni sono dimezzate, e inoltre i DVD possono avere due livelli diversi di scrittura.

La distanza tra una traccia e la successiva è di circa 1.6 m (la metà nei DVD). La regione incisa va da un raggio di 25 mm a uno di 58, e ha quindi una estensione di 33 mm, per cui le spirali sono in numero di 33 mm / 1.6 mm = 20.625.
La lunghezza totale della traccia si ottiene moltiplicando questo numero per la lunghezza media di una spirale (260 mm) e vale 5.38 km.
Il disco ruota ad una velocità angolare variabile, in modo che la velocità di scorrimento della traccia rispetto alla testina di lettura sia sempre di 1.2 m/sec. La durata totale massima della riproduzione sonora è dunque di 5.38 km / 1.2 m/sec = 75 minuti.


COME AVVIENE LA LETTURA DEL CD

La lettura richiede un sottile raggio di luce laser (lunghezza d’onda dell’ordine di 780 nm nei CD e 650 nm nei DVD) che incide sulle tracce e viene riflesso. Se il raggio incide su una regione priva di tacche, viene completamente riflesso indietro. La riflessione da parte delle tacche è invece molto minore. La struttura ottica di un lettore di CD si fonda sulla presenza di un prisma che deflette il fascio di luce. Un fotodiodo rileva la luce e un circuito elettronico trasforma le variazioni in segnali quantizzati. Un elaboratore decodifica poi il segnale e lo invia ad un convertitore D/A.

Il promo problema è quello del mantenumento di tracce così piccolee peretanto il mantenimento della traccia non è meccanico, come nei giradischi tradizionali, ma elettronico, e si basa sull’utilizzo di fasci diversi (ottenuti dallo stesso fascio laser) e sul confronto tra le luminosità rispettive in funzione del tempo. Anche la corretta focalizzazione si basa sull’utilizzo di fasci diversi (ottenuti dallo stesso fascio laser) e sul confronto tra le luminosità rispettive in funzione del tempo.


MP3

La codifica audio utilizzata anche nei CD (codifica lineare) richiede l’immagazzinamento di 1.41 Mbit per ogni secondo di musica. Questo comporta anche che la trasmissione in tempo reale (ad esempio attraverso la rete) di un file audio così codificato richiede un flusso di dati (bit rate) di 1.41 Mbit/secondo. Ambedue questi aspetti della codifica lineare (la necessità di una elevatissima quantità di memoria e l’esigenza di flussi di dati ad alta velocità) pongono problemi che si cerca di superare con le codifiche percettive. Esse si basano sul fatto che il risultato finale deve essere valutato per la sua qualità percettiva piuttosto che per la sua corrispondenza fisica al suono registrato. Il principale fenomeno percettivo che viene tenuto presente è quello del mascheramento.

Il mascheramento agisce su suoni che si trovano relativamente vicini, in frequenza, al suono mascherante. Per questo motivo, la tecniche abituali di codifica percettiva effettuano innanzitutto una divisione della banda di frequenza utile (la metà della frequenza di campionamento) in sottobande (nel caso della codifica MPEG 1, in 32 sottobande di ampiezza uguale).
Un banco di filtri digitali separa le sottobande, e per ogni sottobanda vengono considerate “finestre” corrispondenti ad un numero fisso di campioni in corrispondenza di un certo intervallo temporale.
Una trasformata di Fourier veloce permette di individuare le componenti in frequenza presenti e la loro intensità. Per ogni sottobanda viene calcolato il valore medio sui campioni. In corrispondenza dei picchi di intensità di ogni sottobanda si calcolano le curve di mascheramento, tenendo conto anche degli effetti di ogni sottobanda sulle altre. Le bande dove i segnali risultano al di sotto del livello di udibilità così calcolato non vengono codificate. Le altre vengono normalizzate rispetto al valore medio (che può anche essere calcolato su un numero di punti maggiore) e codificate con un numero di bit che dipende dal rapporto tra il picco massimo del segnale e il nuovo livello di udibilità. Infatti, si fa in modo che il rumore di quantizzazione risulti inferiore al livello di udibilità calcolato.

Perciò dove è più elevato il rapporto segnale/livello di udibilità saranno necessari più bit (si ricordi la relazione approssimata Rapporto Segnale/Rumore = 6.n , dove n è il numero di bit), dove è più basso meno bit. Ma quanti sono i bit disponibili? Questo dipende dal bit rate prescelto per il file codificato. Il bit rate per la codifica lineare è di 1.41 Mbit/secondo. Le codifiche percettive realizzano una compressione rilevante rispetto a questo bit rate, e quindi anche rispetto all’occupazione di memoria.
Nel caso della codifica MPEG 1 si va da 64 Kb/sec (anche meno, per il parlato) fino a 448 Kbit/sec. Una qualità percettivamente indistinguibile da quella della codifica lineare si ottiene già a 128 Kbit/sec. Per ogni “finestra temporale” è dunque disponibile un certo numero di bit che viene allocato tra le sottobande (in modo fisso o in modo dinamico). Se restano dei bit, questi vengono tenuti di riserva per la finestra successiva. In certi tipi di codifica, il bit rate può anche essere variabile.


MPEG-1 AUDIO LAYER 1

La codifica MPEG-1 Audio Layer 1 è stata definita dal Motion Picture Expert Group (MPEG) dell’International Electrotechnical Commission (IEC) insieme con l’ International Standard Organisation (ISO). Lo standard ISO/IEC 11172 MPEG-1 risale al 1992. Esso prevede una finestra di ingresso di 384 campioni (corrispondenti ad un intervallo temporale di 8.7 ms per un campionamenti a 44,1 kHz). La banda passante di 20 kHz è divisa in 32 sottobande di uguale ampiezza, in ciascuna delle quali si calcolano 12 valori per finestra (uno ogni 32 campioni di ingresso). Questa operazione non è un sottocampionamento, perché viene effettuata nelle singole bande separatamente. Dunque, se i 12 campioni delle sottobande fossero codificati a 16 bit e tutte le bande fossero codificate, non si avrebbe nessuna riduzione del bit stream.
Infatti si avrebbero per ogni finestra di ingresso 32.12.16 bit = 6144 bit, numero esattamente uguale a quello dei bit della finestra di ingresso. La codifica MPEG-1 Audio Layer 1 assegna 4 bit per la codifica dei 12 valori di ogni sottobanda normalizzati al valore medio calcolato sull’intera finestra). A tale valore medio sono assegnati 6 bit. Se tutte le bande fossero codificate, il numero di bit in uscita per ogni finestra di ingresso sarebbe allora 32.12.4 + 32.6 = 1728 bit, con un rapporto di riduzione rispetto ai bit di ingresso di 1728/6144 = 0,28. Ma il rapporto diventa, in generale, molto più favorevole, perché solo una parte delle bande è codificata.


MP3

La codifica MP3 corrisponde al terzo livello di complessità della codifica percettiva MPEG-1 (Audio Layer 3). Essa comprende tutto quello che si è detto, e in più una serie di miglioramenti, tra cui la possibilità di variare la finestra temporale su cui è effettuata la trasformata di Fourier (più ampia per segnali stazionari, più ristretta per segnali variabili) un più efficace algoritmo di assegnazione dei bit alle sottobande una ulteriore riduzione del flusso di dati attraverso altre codifiche, come ad esempio quella fondata sulla lunghezza delle stringhe, usata nella trasmissione dei fax.

Theme by Danetsoft and Danang Probo Sayekti inspired by Maksimer