Cyfrowa regulacja głośności: Zalety i wady

Cyfrowa regulacja głośności to sposób na zarządzanie cyfrowymi źródłami dźwięku. Na pierwszy rzut oka może się to wydawać proste. Zamiast przepuszczać sygnał przez rezystory i tranzystory, elementy połączeniowe lub lampy, które składają się na analogową regulację głośności, można teraz elegancko i precyzyjnie obliczyć wartości kolejnych próbek po zmianie poziomu głośności. To jest prosta matematyka. Obliczenia te można wykonać na kartce papieru.

Ale cyfrowa regulacja głośności nie jest pozbawiona ograniczeń. Straty jakościowe są nieuniknione i mogą się znacznie różnić w zależności od parametrów sprzętu i sposobu jego implementacji. Cyfrowa regulacja głośności może powodować pogorszenie jakości sygnału z wielu powodów.

Obliczenia nie są dokładne do pewnego stopnia

Każda kolejna próbka w cyfrowym audio jest liczbą, która wskazuje wartość chwilową. Zapisy audio sygnałów PCM są liczbami całkowitymi zapisanymi w systemie binarnym, tzw. zero-jedynkowym. Próbki mają zwykle długość 16 lub 24 bitów. Systemy binarne umożliwiają również wykonywanie wszystkich operacji matematycznych, które są niezbędne do cyfrowego przetwarzania dźwięku. Dotyczy to również regulacji głośności. W wyniku tych obliczeń powstają nowe próbki sygnału audio. Wartości te mogą być modyfikowane w zależności od potrzeb. Nowe próbki mają z góry ustaloną liczbę bitów, która może być taka sama jak sygnał wejściowy lub inna.

Cyfrowa regulacja głośności jest w istocie prostym mnożeniem. Jak powiedzieliśmy w poprzednim akapicie, to mnożenie działa z liczbami w pewnym zakresie wartości. Ogranicza to naszą dokładność obliczeń. Musimy znać zakres błędu, do którego się tutaj odnosimy.

Zacznijmy od przypomnienia, że każdy bit ma zakres dynamiki 6dB. Dla 16-bitowego sygnału CD mamy 96dB. Regulacja głośności to taka sama konwersja z jednego bitu na sześć dB. Aby sterować głośnością, potrzebujemy na wyjściu o cztery bity więcej niż mamy na wejściu. Możemy zapewnić regulację głośności w zakresie 48dB (8bit*6dB), jeśli na wejściu mamy słowo 16-bitowe, a na wyjściu słowo 24-bitowe. Ponieważ na rynku jest wiele nagrań 16-bitowych i wiele przetworników 24-bitowych, warto wspomnieć, że możemy przejść z 16-bitów w 24-bity.

Co się stanie, jeśli nie będziemy mieli wystarczająco dużo bitów, aby wykonać dokładne obliczenia? Może wystąpić błąd kwantyzacji. Jeśli skompresujemy sygnał o 60dB używając 16-bitowego słowa wejściowego, a 24-bitowego słowa wyjściowego, to stracimy 12dB najcichszego (utniemy też dwa najmłodsze bity). Spowoduje to zniekształcenie. To zniekształcenie może być słyszalnie zdegradowane przez sygnał audio i będzie z nim skorelowane.

Walka z błędem kwantyzacji

Z powyższych uwag o błędzie kwantyzacji płynie prosty wniosek. Warto zwiększać precyzję liczb (lub stosować większą długość słowa) przy wykonywaniu obliczeń. Jeśli mamy 16-bitowy sygnał wejściowy i 32-bitową precyzję, to mamy zakres regulacji 96dB. To powinno wystarczyć z zapasem. Ta koncepcja jest często wykorzystywana w praktyce. Profesjonalne programy do edycji dźwięku używają precyzyjnych obliczeń. Można używać nawet słów 64-bitowych.

Niestety, zwiększanie liczby bitów nie jest skutecznym rozwiązaniem. Możliwe jest wykonywanie obliczeń z dużą precyzją poprzez redukcję błędów kwantyzacji do bardzo małych wartości. Należy jednak tak dobrać parametry wejściowe przetwornika C/A, aby zmniejszyć długość słowa do 16 lub 24 bitów. Problemem są zwroty błędu kwantyzacji. Błąd kwantyzacji nie jest znaczący, jeśli zachowamy słowo 24-bitowe. Staje się on jednak problemem, gdy przejdziemy na 16 bitów. Istnieje sposób na walkę z tym błędem. Chodzi o dithering.

Dither to nic innego jak szum, który jest dodawany do sygnału. Szum jest zwykle postrzegany jako coś negatywnego. W tym przypadku dobrze byłoby to zrobić. Zniekształcenia kwantyzacji, które są skorelowane z sygnałem audio, mają większy wpływ na postrzeganą jakość dźwięku. Sygnał zostanie zniekształcony, jeśli dodamy do niego szum przed obcięciem najbardziej znaczących bitów. Niemodulowany szum jest tym, co otrzymujemy zamiast modulowanych zniekształceń. Istnieje wiele optymalizacji, które można wykonać. Można również użyć zwykłego szumu o równomiernym rozkładzie pasma jako dither. Spełni on swoje zadanie w ten sposób, że korelacja sygnału z zniekształceniami kwantyzacyjnymi zostanie usunięta. Jednak ogólny poziom szumu będzie nadal wysoki. Jest lepszy sposób. Można przesunąć energię szumu poprzez użycie specjalnie ukształtowanego szumu jako "ditheru". Pozwala to na przesunięcie energii szumu z zakresu częstotliwości, w których ucho jest najbardziej wrażliwe, do wyższych częstotliwości, w których uszy są mniej wrażliwe. Aby zoptymalizować efekt dźwiękowy, dither może być stosowany w bardziej zaawansowanych układach cyfrowej regulacji głośności.

Zobacz również: Sprzęt Hi-End Heed audio

equalizer

Stopień konwersji z analogowego na cyfrowy

Obliczenia cyfrowe to nie jedyny problem. Ważne są również ograniczenia przetworników cyfrowo-analogowych. Chodzi tu o poziom szumów, nieliniowość i inne aspekty przetworników cyfrowo-analogowych w kontekście, o którym mówimy. Teoretyczny zakres dynamiki dla sygnału 16-bitowego wynosi 96dB, a dla sygnału 24-bitowego 144dB. Dno szumowe i zakres pracy liniowej dla dostępnych konwerterów (rozumianych jako układ scalony, a nie całe urządzenie), nie są tak wysokie jak dla innych urządzeń. Dla przykładu, starsze układy 16-bitowe mogły mieć zakres dynamiki nawet 90dBA. Natomiast nowoczesne układy 24-bitowe mogą mieć zakresy dynamiki 105dBA i 120dBA.

Co się dzieje, gdy na wejście konwertera podawany jest sygnał zredukowany cyfrowo. Przyjrzyjmy się temu zarówno od strony małego, jak i dużego sygnału.

Najpierw zobaczmy co się dzieje w zakresie małych sygnałów. Przetwornik ma stałą podłogę szumów i ograniczony zakres liniowości. Niezależnie od tego, jak wiele przetwarzania cyfrowego jest zrobione, poziom szumu tła na wyjściu przetwornika pozostaje stały. Jest to niekorzystna okoliczność, która jest łatwo krytykowana przez zwolenników analogowych regulatorów głośności. Układ analogowy będzie redukował zarówno sygnał użyteczny jak i szum generowany przez DAC, jeśli pozostawimy sterowanie cyfrowe. Chociaż zmniejszenie szumu przetwornika jest zaletą, trudno uznać to za dowód na wyższość analogowej regulacji głośności. Układ analogowy może również generować zniekształcenia lub szumy, a w niektórych przypadkach może wpływać na dopasowanie impedancji pomiędzy wejściami i wyjściami.

Na drugim końcu skali, duże sygnały mogą spowodować, że zmarnujemy część zakresu dynamiki przetwornika DAC. Górne 20dB zakresu pracy przetwornika C/A zostanie całkowicie zmarnowane, jeśli sygnał zostanie ściszony o 20dB w regulacji głośności.

Rola przetwornika C/A w układzie audio z cyfrową regulacją głośności może być opisana jako wąskie gardło. Szumy i rozdzielczość przetwornika tworzą stały limit na dole. Górna granica zakresu roboczego jest zmienna i zmniejsza się w miarę jak zwiększa się tłumienie poprzez regulację głośności.

Prawidłowa konfiguracja sprzętu

Nie ma znaczenia, czy analizujemy zniekształcenia kwantyzacji, czy szumy (zarówno zwykłe, jak i dither), czy też zakres dynamiki na wyjściu DAC. Jak widać, zawsze zalecane jest, aby cyfrowy regulator głośności wprowadzał jak najmniejsze tłumienie. Proporcja głośności sygnału do towarzyszącego mu szumu i zniekształceń jest lepsza, gdy tłumienie jest mniejsze.

Wyobraźmy sobie następujący scenariusz. Odtwarzacz plików wyposażony jest w cyfrowy regulator głośności, a poziom nominalny na jego wyjściu analogowym wynosi 4V. Sygnał wyjściowy z odtwarzacza jest podłączony do wejścia wzmacniacza mocy o czułości 0,5V. Możemy zmniejszyć poziom sygnału aż o 18dB, aby wyregulować głośność tak, aby wzmacniacz grał z maksymalną mocą.

Przyjrzyjmy się drugiemu przykładowi. Odtwarzacz o poziomie wyjściowym 2V jest podłączony do wzmacniacza mocy o czułości wejściowej 1V. Regulator głośności musi zmniejszyć sygnał o 6dB, aby wzmacniacz mógł grać z maksymalną mocą.

Jest to bardzo wymowne porównanie. Pierwszy przypadek pokazuje nam, że zmarnowaliśmy 18dB z zakresu dynamiki DACa. W drugim, tylko 6dB pozostaje niewykorzystane. Zyskujemy 12dB. W praktyce czasami konieczne jest doprowadzenie do wzmacniacza sygnału o wyższej czułości niż wejściowa. Kombinacja parametrów w drugim przykładzie jest bardzo dobra.

Przeanalizujmy to dalej. Załóżmy, że wzmacniacz z pierwszego przykładu ma moc 200W i jest połączony z kolumnami o wysokiej skuteczności. Aby uzyskać wymaganą głośność, używamy maksymalnie 20W. Możemy zmniejszyć głośność o 10dB, jeśli użyjemy 20W zamiast 200W. Regulator głośności i DAC wykorzystają wtedy 10dB więcej ze swojego zakresu. W sumie mamy 18dB+10dB=28dB. Lepiej unikać używania cyfrowej regulacji głośności z innymi urządzeniami.

Istnieje również możliwość wyboru różnych poziomów wyjściowych (np. 0,5V - 1V- 2V) w cyfrowych regulatorach głośności. Niestety ta funkcjonalność jest rzadko spotykana.

Cyfrowa regulacja głośności ma wiele zalet funkcjonalnych

Skupiliśmy się głównie na problemach cyfrowej regulacji głośności. Ma ona jednak wiele cennych zalet. Jest niezwykle precyzyjny i powtarzalny zarówno w zakresie regulacji głośności jak i balansu kanałów. Pokochają go osoby, które używają go do ustawiania głośności przy krytycznych odsłuchach lub pomiarach. Nie narazimy się na użycie mniej wiarygodnego potencjometru, a balans kanałów nie będzie się zmieniał w zależności od głośności. Jest łatwy do zintegrowania w urządzeniach wielokanałowych lub do realizacji funkcji balansu. Jest to na ogół rozwiązanie ekonomiczne, bo procesor do obliczeń jest niezbędnym elementem każdego komputera, odtwarzacza czy DAC-a.

DSD jest ograniczeniem

W artykule opisano działanie cyfrowej regulacji głośności z sygnałem typu PCM (modulacja impulsowa). Sygnał DSD (1-bitowy) nie jest kompatybilny z tym typem przetwarzania, w przeciwieństwie do PCM. Sygnały DSD są często konwertowane do PCM przed wykonaniem cyfrowej regulacji głośności. Istnieją również opcje regulacji głośności sygnałów DSD bez konieczności konwersji na PCM.

Podsumowanie

Spotkacie się Państwo zarówno z twierdzeniami, że cyfrowa regulacja działa lepiej niż analogowa, jak i z opiniami konstruktorów z renomowanych firm i recenzentów prasy branżowej. Nawet najbardziej zagorzali zwolennicy analogu przyznają, że sterowanie cyfrowe jest najlepsze dla wysokiej klasy systemów audio.

Sterowanie cyfrowe było popularne w przeszłości w odtwarzaczach CD z 16-bitowym sygnałem wejścia/wyjścia. Nie było to rozwiązanie ambitne, a straty były wysokie. Coraz powszechniejsze stawały się urządzenia wykorzystujące 24-bitową precyzję obliczeń. Coraz powszechniejsze stawały się też przetworniki cyfrowo-analogowe o rozdzielczości 24 bitów. Sekcja obliczeniowa może mieć także dłuższe słowa, np. 32 lub 64 bity. Nowoczesne układy scalone do konwersji CA mają zakres dynamiki przekraczający 120dBA. Daje to im dużą elastyczność. Cyfrowa regulacja głośności, która jest dobrze zaimplementowana, zasługuje na miano rozwiązania high-end.

Nie należy przy tym pomijać aspektu ekonomicznego. Wersja analogowa jest droższa od cyfrowej, ponieważ wykorzystuje bardzo drogie przedwzmacniacze.

Cyfrowy regulator głośności to najlepsza opcja dla tych, którzy do regulacji parametrów swojego sprzętu używają źródeł cyfrowych. Jest to zazwyczaj najbardziej przyjazna użytkownikowi, najlepsza jakościowo i najtańsza alternatywa dla analogu. Subiektywną sprawą jest ocena, czy komuś podoba się wybrany przez niego przedwzmacniacz analogowy.

Autor