Vous êtes ici

Acoustic book

CD et MP3

Le Standard CD

C'est un disque plastique de 12cm de diamètre.

Les données y sont inscrites sur des encoches d'environ 0.5 mm de largeur et de 0.8 à 3.2 mm de large, en fonction du code digital (signal audio, synchronisation , contrôle) et de la capacité de contenance. Les encoches sont séparées latéralement de 1.6 mm.

Les encoches ne sont incisées que c'un seul côté du disque et sont alignées en spirales en partant du milieu du disque. L'incision a une profondeur d'une fraction de millimètre.

Dans les DVDs toutes ces dimensions ont été divisées par deux. De plus ils sont dotés de deux niveaux de lecture.

La distance entre chaque piste et la suivante est environ 1.6 mm (moitié pour DVD).
La partie incisée est comprise de 25 mm pour un rayon de 58, et a donc 33 mm d'extensinon pour les lesuqelles les spirales sont de 33mm/1.6mm = 20.625


Procédé de lecture du CD

La lecture nécessite un rayon laser fin (de longueur d'onde de l'orde de 780 nm pour un CD et 650nm pour un DVD) qui vient réfléchir sur les pistes. Si le rayon frappe une partie manquante dans une des encoches il est complètement reflété. La structure optique d'un lecteur CD est basée sur la présence d'un prisme qui dévie le rayon laser. Une photodiode détecte la lumière et un circuit electronique transforme les variations en signaux quantifiés. Un processeur interprète ensuite le signal et l'envoie à un convertisseur N/A ( numérique/analogique).


MP3

L'encodage audio utilisé dans les CDs (encodage linéaire) nécessite 1.41 Mbits par seconde de musique. Cela signifie que la transmission en temps réel (par internet par exemple ) d'une seconde d'un fichier audio demande un débit de donnée de 1.41 Mbts/seconde. Chacun de ces aspects (le besoin de place et un débit de données élevé) met en valeur les problèmes que nous essayons de surmonter avec des encodages appropriés. Ces encodages sont pensés en fonction de la qualité de la perception du fichier audio, et non sur sa correspondance physique avec le fichier original. Le phénomène le plus utilisé est le phénomène de masque (masquage?).

Le masquage agit sur les sons relativement proches en fréquence du son à masquer. C'est pour cette raison que les techniques habituelles d'encodage ne divisent que les bandes de fréquences pertinentes ( la moitié de la fréquence d'échantillonnage) en sous-bandes ( dans le cas du MPEG-1, en 32 sous-bandes d'amplitudes égales)
Plusieurs filtres digitaux séparent les sous-bandes. Dans chaque sous-bande il y a des "fenêtres" correspondant a nombre fixé d'échantillons dans un certain laps de temps.
La transformée de Fourier rapide permet d'identifier les composants aussi bien que leur intensité au sein de fréquences. On calcule la valeur moyenne des échantillons de chaque sous-bande. Les courbes de masquage sont calculées de manière à correspondre avec les pics d'intensité de chaque sous bande, tout en prenant en compte les effets de chaque sous-bande sur les autres. Les sous-bandes dont les niveaux d'audibilité calculés sont trop faibles ne sont pas encodées. Les autres sont normalisées comparé à une valeur moyenne( calculées sur un grand nombre de points) et encodées avec un nombre bits dépendant du ratio entre le pic de signal maximum et le nouveau niveau d'audibilité. En effet, il est important d'être sur que le bruit quantifié est plus bas que le niveau d'audibilité calculé.

De ce fait ,vont demander plus de bits, les endroits où le ratio signal / niveau d'audibilité ratio est le plus élevé ( signal / bruit = 6.n où n=nombre de bits.). Mais combien de bits sont disponibles? Cela dépend du taux choisi pour le fichier à encoder. Le taux d'encodage pour l'encodage linéaire est de 1.41Mbits/seconde. Les encodage pertinents permettent une compression conséquente du taux d'échantillonnage, et donc de la taille totale du fichier.
Pour l'encodage MPEG-1, on a des taux allant de 64KB/seconde (parfois moins pour un discours) jusqu'à 448Kbit/seconde. Une différence de qualité inaudible de l'encodage linéaire. Pour chaque "fenêtre de temps", il a donc un certain nombre de bits répartis dans les sous-banes (de façon statique ou dynamique). Si quelques bits restent, on les garde pour la prochaine fenêtre. Dans certain types d'encodage le taux d'échantillonnage peut être variable.


MPEG-1 Audio Layer 1

L'encodage MPEG-1 est défini par Motion Picture Expert Group (MPEG) de International Electrotechnic Commision (IEC) avec l'International Standard Organisation (ISO). Le Standard ISO/IEC 11172 MPEG-1 date de 1992. Cela permet une fenêtre d'entrée de 384 échantillons ( qui correspondent à un intervalle de 8.7 ms pour un échantillonnage à 44.1 kHz).
Une bande large de 20kHz est divisée en 32 sous bandes de largeurs égales , dans lesquelles on calcule 12 valeurs par fenêtre (une tous les 32 entrées d'échantillon). Cette opération n'est pas du sous- échantillonnage, parce qu'elle est effectuée individuellement dans chaque bande. Par conséquent, si les 12 échantillons de sous-bandes sont codées sur 16 bits et toutes les bandes codées, alors il n'y aura pas de réduction de le flux de bits. En réalité , il y aurait 32*12*16 bits = 6144 bits pour chaque fenêtre d'entrée, le même nombre de bits que ceux de la fenêtre d'entrée. L'encodage MPEG- 1 Audio Layer 1 donne 4 bits pur encoder les 12 valeurs de chaque sous bandes normalisées pour la même valeur calculées sur la fenêtre entière. On assigne 6 bits à cette valeur moyenne. Si toutes les bande étaient encodées, le nombre de bits sortant pour chaque fenêtre serait alors de 32*12*4+32*6= 1728 bits, avec une réduction de la proportion comparé aux bits entrant de 1728/1644= 0.28. Mais le ratio devien en général plus favorable parce qu'une partie seulement des bandes sont encodées.


MP3

L'encodage MP3 correspond au troisième niveau de complexité de l'encodage MPEG-1 (Audio Layer 3) . Il comprend tout ce dont on a parlé précédemment, avec une série d'améliorations dont la possibilité de varier la fenêtre dans laquelle la transformation de Fourier est effectuée (plus grande pour les signaux persistants, plus petits pour les signaux variables), un algorithme pour allouer les bits dans les sous-bandes et une réduction du flux de données avec d'autres encodages, comme ceux basés sur la longueur de ligne, utilisé dans les transmissions par fax.

Theme by Danetsoft and Danang Probo Sayekti inspired by Maksimer