Jesteś tutaj

Acoustic book

CD i MP3

STANDARD CD

Jest to plastikowa płyta o średnicy 12 cm.

Dane zapisywane są w postaci rowków o szerokości ok. 0,5 mm i długości od 0,8 do 3,2 mm w zależności od typu zapisanego na niej kodu cyfrowego (sygnału audio, synchronizacji, sterowania), a rozmieszczonych na szerokość w odległości 1,6 mm.

Rowki są wyżłobione tylko na jednej stronie płyty począwszy od środka. Ich głębokość wynosi ułamek milimetra.

W przypadku DVD wszystkie te wielkości są dwa razy mniejsze, a poza tym występują dwa poziomy zapisu.

Odległość pomiędzy ścieżkami wynosi około 1,6 m (w DVD dwa razy mniej). Rowki zajmują część płyty od 25 mm do 58 mm promienia, zatem występują na długości 33 mm, wobec tego ich liczba wynosi: 33 mm / 1,6 mm = 20,625.
Całkowitą długość ścieżki obliczamy, mnożąc tę liczbę przez średnią długość spirali (260 mm) i wynosi ona 5,38 km.
Płyta obraca się ze zmienną prędkością kątową, zatem prędkość przesuwu ścieżki wynosi zawsze 1,2 m/sec w stosunku do głowicy czytającej. Dlatego maksymalny czas odtwarzania wynosi 5,38 km / 1,2 m/sec = 75 minut.


ODCZYT PŁYTY CD

Odczyt wymaga delikatnego promienia światła laserowego (o długości fali rzędu 780 nm dla CD i 650 nm dla DVD), który pada na ścieżkę, a zaraz potem zostaje odbity. Jeżeli promień zderza się z powierzchnią pozbawioną rowków, zostaje całkowicie odbity. Natomiast jeśli odbija się od rowków, staje się o wiele słabszy. Struktura optyczna odtwarzacza płyt wymaga pryzmatu, dzięki któremu następuje odchylenie promienia światła. Fotodioda wykrywa światło, a układ elektroniczny przetwarza jego wahania na skwantowane sygnały. Z kolei procesor dekoduje sygnały i przekazuje je do konwertera D/A.

Głównym problemem jest niewielki rozmiar ścieżek. Odczyt nie jest mechaniczny, jak w przypadku ścieżek gramofonowych, lecz elektroniczny, polegający na wykorzystaniu różnych promieni (pochodzących z tego samego promienia laseru) i funkcji jasności w czasie. Również prawidłowa ostrość zależy od różnych wiązek światła (pochodzących z tej samej wiązki laserowej) oraz od funkcji jasności w czasie.


MP3

Kodowanie audio, stosowane także w CD (kodowanie liniowe) wymaga 1,41 Mbitów na sekundę muzyki. Te dwie cechy kodowania linearnego (potrzeba dużej pamięci i dużej szybkości przepływu danych) ukazują problemy, jakie próbujemy rozwiązać przez kodowanie percepcyjne. Polega ono na tym, że końcowy efekt ma być oceniany ze względu na jakość odbioru, nie zaś fizyczne podobieństwo do nagrywanego dźwięku. Głównym zjawiskiem percepcji branym pod uwagę jest maskowanie.

Maskowanie działa na dźwięki o stosunkowo podobnej częstotliwości do dźwięku maskującego. Dlatego zwykle stosowane techniki kodowania percepcyjnego polegają głównie na podziale pasma częstotliwości (stanowiącego połowę częstotliwości próbkowania) na podpasma (w przypadku MPEG kodowanie 1 na 32 podpasma o jednakowych amplitudach).
Zestaw filtrów oddziela od siebie podpasma, a w każdym podpaśmie istnieją „okna” odpowiadające ustalonej liczbie próbek w danym odcinku czasu.
Szybka transformacja Fouriera pozwala na określenie obecnych składników pod względem częstotliwości i natężenia. Dla każdego podpasma obliczane są średnie wartości próbek. W odniesieniu do maksymalnych wartości natężenia w każdym podpaśmie obliczane są krzywe maskujące, biorąc pod uwagę także wzajemne oddziaływanie podpasm na siebie. Pasma, w których sygnały są poniżej progu słyszalności wyliczonej w ten sposób, nie są kodowane. Pozostałe są normalizowane w odniesieniu do wartości średniej (która może być także wyliczona dla wielu punktów) i kodowane za pomocą pewnej liczby bitów wyznaczonej przez stosunek pomiędzy wartością maksymalną sygnału a nowym poziomem słyszalności. Ważne jest, aby szum kwantyzacji był mniejszy niż obliczony poziom słyszalności.

Dlatego im większy jest stosunek pomiędzy sygnałem a poziomem słyszalności, tym więcej bitów będziemy potrzebować (należy pamiętać, że przybliżona wartość proporcji sygnału do zakłócenia wynosi 6.n, gdzie n to liczba bitów), a im mniejsza proporcja, tym mniej bitów. Ile bitów możemy mieć do dyspozycji? To zależy od wartości "bit rate" (przepływności) wybranej do kodowania pliku. W przypadku kodowania liniowego wynosi 1.41 Mb/s. Kodowanie percepcyjnie pozwala stosować dużo mniejsze wartości, a także wymaga o wiele mniej pamięci. Kodowanie MPEG1 ma zakres od Kb/s (dla mowy nawet mniej) do 448 Kb/s. Już przy 128 Kb/s uzyskuje się jakość o niezauważalnej różnicy w porównaniu z kodowaniem liniowym.
Dla każdego „okna czasu” mamy do dyspozycji pewną liczbę bitów rozdzielonych pomiędzy podpasma (na stałe lub w sposób zmienny). Te, które pozostają, zachowywane są dla następnego okna. Przy niektórych typach kodowania przepływność (bit rate) może być również zmienna.


KODOWANIE MPEG-1 AUDIO LAYER 1

Kodowanie to zostało opracowane przez grupę ekspercką Motion Picture Expert Group pracującą przy Międzynarodowej Komisji Elektrotechnicznej wraz z ISO. Jest to standard pochodzący 1992 roku. Zapewnia on 384 próbek na wejściu (odpowiadających odstępom czasowym 8,7 ms dla 44,1 kHz). Pasmo o szerokości 20 kHz podzielone jest na 32 podpasma o jednakowej szerokości i dla każdego obliczonych jest 12 wartości ramkę (co 32 próbki wejściowe). Operacja ta nie jest podpróbkowaniem, gdyż wykonywana jest oddzielnie w każdym paśmie. Dlatego gdyby 12 próbek podpasm zostało zakodowanych przy 16 bitach i gdyby zostały zakodowane wszystkie pasma, nie byłoby żadnej redukcji strumienia bitów.
W rzeczywistości byłoby:
32x12x16 bitów = 6144 bitów dla każdego okna na wejściu. Kodowanie MPEG-1 Audio Layer 1 daje 4 bity, aby zakodować 12 wartości każdego podpasma normalizowanego do wartości średniej w całym oknie. Tej średniej wartości przyporządkowuje się 6 bitów.Gdyby zakodowane były wszystkie pasma, liczba bitów na wyjściu dla każdego okna wejściowego wynosiłaby 32x12x4 + 32x6 = 1728 bitów przy redukcji bitów na wejściu 1728/6144 = 0,28. Jednak stosunek ten jest dużo korzystniejszy, gdyż tylko część pasm jest kodowana.


MP3

Kodowanie MP3 odpowiada trzeciemu poziomowi kodowania percepcyjnego MPEG-1 (Audio Layer 3). Obejmuje wszystko, co powiedzieliśmy dotychczas, a dodatkowo szereg ulepszeń, m.in. możliwość zmiany okna czasu, w którym dokonywana jest transformacja Fouriera (szersze dla sygnałów statycznych, węższe dla sygnałów zmiennych), bardziej efektywny algorytm dla przydzielania bitów poszczególnym podpasmom, dalsza redukcja strumienia danych dzięki innym rodzajom kodowania, takim jak kodowanie oparte na długości szeregu, wykorzystywane przy transmisji faksowej.

Theme by Danetsoft and Danang Probo Sayekti inspired by Maksimer