Jesteś tutaj

Acoustic book

Nagrywanie dźwięku

NAGRYWANIE DŹWIĘKU

Nagrywanie dźwięku wiąże się z koniecznością przekształcania drgań powietrza (które, jak to stwierdziliśmy, docierają do naszych uszu i wzbudzają dźwięk) w sygnały elektryczne. Odtwarzanie dźwięku natomiast jest przetwarzaniem sygnałów elektrycznych na odpowiednie drgania powietrza. Do nagrywania dźwięku potrzebny jest przede wszystkim mikrofon i możliwość zapisania zebranych przez niego informacji, np. na dawnej taśmie magnetycznej lub w rowkach dawnej płyty. Taki sposób zapisu sygnałów elektrycznych nazywamy analogowym. Mikrofon jest przetwornikiem odbierającym energię drgań powietrza i przetwarzającym ją na energię oscylacji elektrycznych.
Są różnego rodzaju mikrofony, np.:

  1. Kondensatorowe,
  2. Piezoelektryczne,
  3. Elektromagnetyczne.

Odtwarzanie zaś następuje dzięki odczytywaniu analogowej informacji z taśmy lub mikroskopijnych rowków płyty gramofonowej, przedwzmacnianiu sygnału, wzmacnianiu i przesyłaniu do głośników, gdzie powietrze wprawiane jest w drgania.

Od analogowego do cyfrowego nagrywania i odtwarzania. Zapamiętywanie danych jest magnetyczne (taśmy lub dyski magnetyczne) lub w postaci niewielkich tłoczonych wgłębień (jak w przypadku CD lub DVD).
W porównaniu z analogowym sposobem nagrywania stosowanym w przeszłości, cyfrowe zapamiętywanie informacji ma na celu zapisywanie danych cyfrowo w grupach bitów. Dlatego do wyżej podanej listy urządzeń potrzebnych przy nagrywaniu w fazie rejestracji dźwięku po odebraniu sygnału z mikrofonu i przedwzmacniacza potrzebny jest konwerter sygnału z analogowego na cyfrowy, zwykle oznaczany symbolem A/D. Sygnał przetworzony na cyfrowy zostaje teraz zapisany w postaci danych. W fazie odtwarzania potrzebny jest czytnik sygnału cyfrowego oraz konwerter z postaci cyfrowej na analogową (D/A), aby jak poprzednio, móc wzmocnić sygnał i przesłać do głośników.


KONWERSJA Z POSTACI ANALOGOWEJ NA CYFROWĄ

Proces konwersji obejmuje dwa podstawowe procesy:

  1. Próbkowanie sygnału analogowego
  2. Kodowanie cyfrowe

W celu spróbkowania sygnału, który ma być przekształcony z analogowego na cyfrowy, należy przede wszystkim dokonać podziału czasu na bardzo małe równe odcinki. W każdym wyznaczonym punkcie czasu jest mierzona amplituda sygnału. Zarówno liczba odcinków, jak i wartości amplitud do rejestracji muszą być dobrane ze względu na częstotliwość i amplitudę próbkowanego sygnału, a także ze względu na wymaganą mniejszą lub większą dokładność odtwarzania.
Obie opisanej wyżej operacje można przedstawić na osi kartezjańskiej. Na rysunku 23 na osi x (osi czasu) zaznaczyliśmy 16 odcinków, a na osi y – 8 podziałek dla wartości dodatnich i 8 dla wartości ujemnych amplitudy. Dla każdego przedziału czasu jest odpowiadająca mu amplituda, wartość, która będzie stała przez cały odcinek czasu i może się zmienić dopiero po jego zakończeniu.
Na oryginalnej fali zauważyć można więcej punktów odniesienia. Fala otrzymana w wyniku pomiaru będzie miała typowy kształt drabiny, co można zobaczyć na rysunku 23.

Figure 23 Figure 23
Rysunek 23 Rysunek 23 do wydrukowania w brajlu


DOBÓR CZĘSTOTLIWOŚCI PRÓBKOWANIA

Pierwszą z dwóch wartości, jakie należy wziąć pod uwagę, jest podział czasu, potrzebny do zarejestrowania amplitudy. Wartość tę nazywamy częstotliwością próbkowania i jest to wartość, która musi być odpowiednio dobrana w celu dokonania właściwej interpretacji sygnału analogowego, który będzie przetwarzany.

Teoria Nyquista wykazuje, że konieczne jest zastosowanie częstotliwości próbkowania o wartości co najmniej dwukrotnie wyższej niż największa częstotliwość występująca w sygnale, który będzie próbkowany. W tym przypadku można zaobserwować, że ważniejsza jest częstotliwość niż wierne odzwierciedlenie kształtu wykresu.

Rysunek 24 pokazuje przykład, w którym częstotliwość próbkowania jest niewystarczająca do zrekonstruowania sygnału wejścia. Sygnał składa się z 4 okresów z 4 dodatnimi i 4 ujemnymi wartościami szczytowymi. Tylko 6 próbek na rysunku ma niewłaściwą postać w porównaniu z oryginalną.

Figure 24 Figure 24
Rysunek 24 Rysunek 24 do wydruku w brajlu

Ludzkie ucho nie słyszy zakresu powyżej 20 000 Hz i dlatego wartość wymaganej częstotliwości próbkowania musi być przynajmniej dwa razy większa od tej wartości. Wartość standardowa stosowana przy nagrywaniu CD wynosi 44 100 Hz. Jeżeli chodzi o czas, odpowiada to odcinkom 22,7 mikrosekund, tzn. odległość w czasie pomiędzy pobraniem dwóch kolejnych próbek wynosi 22,7 mikrosekund.

Po przetworzeniu sygnału z analogowego na cyfrowy możemy usłyszeć zniekształcony sygnał. Jeżeli nie zostaną spełnione warunki dotyczące częstotliwości próbkowania, możemy mieć do czynienia ze zjawiskiem aliasingu, tj. pojawieniem się w sygnale składowych o błędnych częstotliwościach.
Znanym przykładem aliasingu w dziedzinie obrazu jest sytuacja, kiedy widzimy na filmie koła samochodu kręcące się w odwrotnym kierunku. Ten niepożądany sygnał nałoży się na sygnał rzeczywisty, o ile częstotliwość próbkowania jest co najmniej dwa razy większa niż częstotliwość sygnału. Przykład pokazany na rysunku 24 wyjaśnia, dlaczego jest konieczne ustalanie częstotliwości próbkowania na poziomie ponad dwukrotnie wyższym niż maksymalna wartość odbieranej częstotliwości. Dobrze jest również zainstalować w systemie przetwarzania filtr, który eliminuje niepożądane efekty cichych tonów składowych.

Drugą wartością, poza częstotliwością próbkowania, jest określenie próbki amplitudy. Przykład widoczny na rysunku 25 pokazuje, że przy takiej samej częstotliwości próbkowania kształt fali jest odtwarzany najwłaściwiej, jeżeli dopuszczalne wartości próbki zwiększają się. Pierwszy obrazek ilustruje kształt fali przy tylko dwóch możliwych wartościach (0 i 1, tj. 1 bit dla wartości i 1 bit dla znaku), gdy tymczasem taki sam kształt z 4 możliwymi dodatnimi i ujemnymi wartościami (tj. od 0 do 3, czyli 2 bity dla wartości i 1 bit dla znaku).

Figure 25 Figure 25
Rysunek 25 Rysunek 25 do wydrukowania w brajlu

Stosowanie odpowiednich wartości próbkowania jest istotne dla zapewnienia dobrej jakości dynamiki dźwięku, od pianissimo do fortissimo, wznoszącego się w zakresie przekraczającym nawet 80 dB. Teoretycznie granica ustalona dla CD wynosi 96 dB. Odpowiednie kodowanie powinno być co najmniej na poziomie 16 bitów, np. 2^16, co odpowiada wartości 65,536, tj. skali -32768 to +32768. Wartość 16 bitów jest traktowana jako standardowa dla płyt audio CD, podczas gdy inne formaty, np. audio DVD wymagają 24 bitów. Z relacji pomiędzy głębokością próbkowania (tj. wartościami wyrażonymi w bitach) a dynamiką (wyrażaną w dB), która może być w przybliżeniu wyrażona jako stosunek 1/6, wynika, że zwiększenie wartości o 1 bit powoduje wzrost dynamiki o około 6 dB. Tak więc teoretycznie przy 16 bitach możemy uzyskać dynamikę 16 * 6 czyli 96 dB, a przy 24 bitach można teoretycznie osiągnąć 24 * 6 = 144 dB. Jeżeli zastosujemy niskie wartości rozdzielczości i kwantyzacji dla słabego natężenia sygnału, wystąpi typowy szum kwantyzacji, który po wzmocnieniu staje się denerwujący. Kolejny przykład przedstawia dźwięk fortepianu, który przy wybrzmieniu wykazuje typowy szum kwantyzacyjny.


PRÓBKA DŹWIĘKU

Kolejne przykłady mają taki sam sygnał, który ma rozdzielczość próbkowania na poziomie 16 bitów, a częstotliwość próbkowana kolejno: 44 100 Hz, 22 050 Hz, 11 025 Hz i ostatni 8000 Hz. Kształt fali stopniowo traci swoją postać i zostaje ona zredukowana do prostszej fali.

Figure 27 Figure 27
Rysunek 27 Rysunek 27 do wydrukowania w brajlu

Posłuchaj, jak zmienia się jakość w kolejnych przykładach (początek koncertu Mendelssohna na skrzypce i orkiestrę) z różnymi parametrami sygnału.

44100Hz i 16 bitów 22050Hz i 16 bitów
11025Hz i 16 bitów 8000Hz i 16 bitów
3000Hz i 16 bitów

Poniżej przedstawiono graficznie ten sam sygnał przy zachowaniu częstotliwości 44 100 Hz, lecz z rozdzielczością zredukowaną z 16 do 8 bitów.

Violin 44100Hz 16 bit
Skrzypce 44100Hz 16 bitów

Violin 44100Hz 8 bit
Skrzypce 44100Hz 8 bitów

Posłuchaj, jak spada jakość w kolejnych poniższych przykładach z trzema różnymi rozdzielczościami (16, 8 i 4 bity)

44100 Hz i 16 bitów 44100 Hz i 8 bitów
44100 Hz i 4 bity

Parametry nagrania 1 godziny muzyki dobrej jakości na CD są bardzo wysokie i wynoszą: częstotliwość próbkowania 44100 Hz i rozdzielczość 16 bitów. Do nagrania stereofonicznego muszą być zwielokrotnione i wynoszą:
16 (bity) * 44100 (częstotliwość próbkowania) * 3600 (sekundy) * 2 (kanały stereo) = 5,08 E +09 bitów. Wartość ta, wyrażona w Megabajtach (wiadomo, że 8 bitów odpowiada 1 bajtowi) wynosi 635.04 MB. CD zawiera nagranie audio plus dodatkowe informacje, takie jak korekta błędów oraz inne informacje ogólne jak: numer ścieżki, czas, tytuł utworu itd.

Theme by Danetsoft and Danang Probo Sayekti inspired by Maksimer