Данная статья является как бы неформальным продолжением предыдущей: "Аналог vs Цифра: бой, которого не было". Поскольку вышеуказанная статья поимела широкий отклик (и имеет его до сих пор ;), я принял решение развить эту тему далее. Никаких графиков, как в предыдущей статье, приводить не буду - как выяснилось, для широкого читателя это где-то даже вредно. Поговорю о теме цифрового звука более развязно, стараясь затронуть темы, недостаточно хорошо освещённые в предыдущем эссе.

    Далее я буду в больших количествах употреблять слово "аудиофил". Замечу, что данное слово употребляется в основном как диагноз - не исключением будет и эта статья. Человека, который ценит качественный звук и разбирается в нём, обычно принято называть меломаном. А вот аудиофилия - это пристрастие к якобы "качественному" звуку, основанное на мифах, легендах и, как правило, отсутствии личного опыта и знаний.

    Что такое "качественный звук"?

    Самое смешное во всей истории споров о различных технологиях звуковоспроизведения - то, что точного определения "качественный звук" попросту не существует.

    Начнём с того, что один и тот же звук может быть качественным для одного индивида и совершенно некачественным для другого. Например, кто-то больше любит басы и страдает от их недостатка. А кому-то, напротив, нравятся "крепкие" высокие - и если они "мягковаты", то возникает дискомфорт при прислушивании. Что ещё более интересно, эти пристрастия к тем или иным диапазонам могут со временем меняться даже у одного и того же человека. Всё происходит оттого, что человеческое ухо - довольно субъективный инструмент восприятия звука. Ухо может "подстраиваться" под звук, нехило обманывая тем самым своего владельца (тут сразу вспоминаются кабели червонного золота, изготовленные по последнему слову нанотехнологий).

    "Слуховые тесты", которыми бредят аудиофилы, по сути подвержены диким погрешностям и вообще не могут серьёзно рассматриваться как достоверные доказательства "плохости" или "хорошести" звука. Невозможно дважды войти в одну и ту же воду - равнозначно невозможно услышать один и тот же звук, даже из одной и той же колонки.

    Далее, любая звуковоспроизводящая система априори будет искажённо передавать первоначальный звук. Звук был искажён ещё на записи, затем при обработке, а потом - в трактах усиления и акустической системе. Он никак не может быть стопроцентно соответствующим первоначальному по той простой причине, что идеальной технологии записи/воспроизведения не существует (и вряд ли когда-либо она появится). Более того: звук после записи искажают намеренно, для получения того или иного эффекта. Количество обработок, через которые проходит звук на современных студиях звукозаписи, исчисляется десятками. В результате всё получается красиво - точно так же, как на картинке голливудского фильма, которая далёка от реальности на 99%. Но тем не менее, звучит всё весьма хорошо (если, конечно, звукорежиссёр не был профаном). Поэтому, следует зарубить себе на носу: звук в конечном треке является очищенным, рафинированным. Причём рафинированным не с целью ухудшить его, а наоборот.

    Как правило, нужная звуковоспроизводящая система подбирается очень просто: по звуку. Вы включаете систему и слышите звук, который вам либо нравится, либо нет. Выискивать "прозрачность", "теплоту", "объёмность" - чистой воды аудиофилия, ни к чему хорошему в данном случае не приводящая. Звук системы либо нравится, либо нет - всё просто. И что интересно, с увеличением стоимости системы звук обычно улучшается. Странно это, или нет? Мне кажется - не очень.

    Конечно, люди с повышенными требованиями к звуку выбирают систему более детально. У меня, например, на этот случай есть с собой несколько треков - пара-тройка прослушиваний - и всё становится ясно. Идеальной АЧХ нет ни у одного усилителя - значит, надо выбрать тот, который наиболее приятно звучит (в конечном счёте, всё сводится к тому, насколько акустическая система хорошо воспроизводит те или иные частоты, необходимые индивиду для комфортного прослушивания). Причём, усилитель с идеальной АЧХ в субъективном тесте скорее всего проиграет усилителю, который воспроизводит определённые частоты с бОльшим усилением (или, наоборот, подавляет их) - как говорится, кому что.

    Сегодня в мире аудио господствуют цифровые технологии. Специалиста в данной области это удивлять никак не может: цифра является отличным способом сохранить и воспроизвести звук. Способом значительно более совершенным, нежели способы, существовавшие до него. Тем не менее, как это случается со всеми относительно новыми технологиями (хотя цифра "новой" уже не является), цифровые технологии до сих пор подвергаются не особенно заслуженной критике. "Критики", в основном, разделяются на два лагеря: люди, подкованные в теории и, соответственно, неподкованные и не имеющие вообще никакого опыта. Первые (видимо, в силу патологического консерватизма и личных пристрастий) изобретают мифы, способные воздействовать на вторых. Вторые с удовольствием эти мифы распространяют и спорят до упаду в конференциях, не понимая сути предмета как такового. При всём при этом, никак не изменяя того факта, что кругом всё оцифровано и в аналог обратно переводиться уже не будет.

    В общем-то, я не являюсь ярым защитником цифровых технологий записи/воспроизведения звука (на данный момент, это и не требуется). Мне приходилось слышать и аналог, и цифру. Звучат они, естественно, по-разному. Но кто сказал, что аналог звучит лучше? Это совершенно недоказуемо. Главное достоинство цифры - тиражируемость и вечность, огромные возможности пост-обработки. И звучит цифра, уж простите меня аудиофилы, ничем не хуже аналога. Точнее, она звучит лучше.

    В предыдущей статье я не осветил кое-каких "заветных" тем, с которыми типичные аудиофилы пытаются "разгромить" цифру. Темы, в общем, избитые и высосанные из пальца. Постараюсь разобрать их здесь поподробнее и надеюсь на то, что мне удастся устроить максимально понятный ликбез.

    Динамический диапазон.

    "Динамический диапазон!!!" - первый крик, с которым аудиофил бросается на амбразуру споров. Абсолютно все аудиофилы, с которыми я, бывало, разговаривал на тему звука, называли эти два слова. И абсолютно все они толком не знали истинного значения этих слов и реальной картины дела.

    Грубо говоря, динамический диапазон - разница между самым тихим и самым громким звуком. В общем случае, чем она больше - тем лучше: ведь это значит, что система может записать одинаково качественно и очень громкий звук, и крайне тихий. Динамический диапазон, рассчитанный для CD "по математике" - порядка 96 дБ. Динамический диапазон у лучших аналоговых носителей (без шумопонижения) - 50-60 дБ. Итого, вроде бы как получается 30-40 дБ выигрыша у цифры (что крайне много), но всё не так просто. Дело в том, что ниже диапазона 50-55 дБ у CD возрастает коэффициент нелинейных искажений, превышая допустимый 1%. То есть, у аналога динамический диапазон ограничен шумами, в которых теряется звук. А у цифры (в её CD-шном варианте) - допустимыми искажениями. Получается, что динамический диапазон в обоих случаях примерно одинаков (причём цифра не проигрывает, даже на этом этапе рассуждения). Однако, есть несколько нюансов.

    Первый нюанс. Что лучше: когда звук скрывается в шумах совсем, или когда он через шумы всё-таки прослушивается? Однако, пусть лучше звук будет, чем его не будет.

    Второй нюанс. Звук на уровне -50 дБ почти не слышен. Неверящие могут попробовать нормализовать любой звуковой файл до -50 дБ в каком-нибудь редакторе и послушать (естественно, не надо при этом выкручивать громкость на максимум - пусть она остаётся на обычном уровне). То есть, где-то там, за диапазоном в -50 дБ, у CD происходят искажения. Только услышать их путём не представляется возможности - вот в чём загвоздка, музыку на таком уровне просто никто не записывает - в этом диапазоне громкостей можно услышать разве что послезвучие в конце трека. Ну а у аналогового носителя там просто шум, и всё.

    Третий нюанс. Аудионаука давно уже знает о нелинейных искажениях на малых уровнях сигнала в CD (шум квантования). И давно уже есть технология, позволяющая эти искажения замаскировать (dither). Сия технология применяется в процессе создания AudioCD. Фактически, dither незаметен (из-за того, что воздействует на малые уровни, которые и так не слышно). Но можно сделать забавный опыт: dither на 8-битовом файле! Искажения при этом практически сойдут на нет (правда, за счёт увеличения шума), несмотря на низкое битовое разрешение. Таким образом, искажения в фактически неслышимом диапазоне уровней можно ещё и качественно замаскировать!

    И последний, четвёртый нюанс: все эти "страшные ограничения" динамического диапазона применимы только к CD. На студиях давно уже делают запись и обработку с битовым разрешением минимум в 18 бит (чаще - 24 бита). 24 бита предлагают динамический диапазон более 140 дБ, оставляя все аналоговые технологии далеко позади. Сейчас сложно сказать, какой формат устойчиво придёт на смену AudioCD, но можно точно сказать - он не будет разрешением в 16 бит. Впрочем, пока большинство устраивает даже AudioCD - исходя из вышесказанного, ничего странного в этом я не вижу.

    Таким образом, сказки об ограниченном динамическом диапазоне у цифры - не более, чем сказки. Которые, во-первых, привязаны к конкретному формату AudioCD, а во-вторых - даже у AudioCD с диапазоном всё в порядке.

    В комментариях разразился спор по поводу ДД у CD, так что дам дополнительные пояснения здесь. Дело в том, что цифровые технологии настолько совершенны, что практический (именно досягаемый) динамический диапазон у CD (16 бит) - порядка 120 дБ! Применяя dither и noise shaping, имея в распоряжении оригинальный звуковой файл 24 бит, можно сделать 16-битовый файл, где будут прослушиваться уровни сигнала -100 дБ и ниже. Расплатой за это будет шум, который сделает запись на таком уровне не то, что некачественной, а просто непригодной для прослушивания. Но факт есть факт: динамический диапазон у CD с использованием ухищрений просто огромен. Другое дело, что он такой никому особенно и не нужен. Во-первых, звуки на уровнях менее -50 дБ в записях практически не встречаются (исключая разве что "затухание" у треков или сравнительно редкие классические произведения), потому что это очень "тихая" зона. Ну а во-вторых, шум, появляющийся от dither-shaping, тоже не подарок. Всё, что нужно знать неискушённому читателю: динамический диапазон у CD превосходит любой аналоговый носитель звука, выпущенный в "доцифровую" эру.

    Джиттер.

    Джиттер (jitter) - нестабильность частоты дискретизации. Может возникать как при записи, так и при воспроизведении. Пугать окружающих страшным словом "джиттер" аудиофилы привыкли давно. На деле, всё просто. Джиттер возникает в некачественных АЦП/ЦАП - т.е., в дешёвых, бытовых и непрофессиональных. А в дорогих - профессиональных и высококачественных - джиттер отсутствует. Вот, собственно, и всё.

    Чаще всего джиттер встречается в дешёвых звуковых картах для компьютеров. Звуковая карта должна воспроизводить звук с совершенно разными частотами дискретизации (типично - от 8 до 48 кГц). Естественно, никто не будет вставлять в неё с десяток стабильных генераторов для разных частот. Сделают один генератор, а все нужные частоты получат с помощью синтезатора частот, который будет пропускать часть импульсов и таким образом генерировать нестабильную частоту дискретизации (производя джиттер).

    Называть джиттер "одной из проблем" цифрового звука - всё равно, что называть кассету "МК-60" проблемой аналогового. Если вы знаете, о чём я. ;)

    Уровень записи.

    Частенько приходится слышать, что из-за "проблем с цифровыми перегрузками" звукорежиссёры "занижают уровень записи" до запаса аж в 12-16 дБ. Что, естественно, приводит к возрастанию ошибок квантования, соответствующему искажению сигнала, а также уменьшению динамического диапазона. Хватает всего пары нюансов, чтобы разгромить и этот миф.

    Во-первых, ныне никто в 16 бит не пишет (а именно для такого битового разрешения и будет проблемой занижение уровня записи). То есть, проблема, возможно, существовала в 90-х годах у людей, пытавшихся записать что-то на звуковую карту класса SB16.

    Во-вторых, даже когда я делал запись в 16 бит, то никогда не оставлял такого громадного запаса и не занижал уровень до такого мизера. Просто потому, что это незачем делать: надо отрегулировать уровень записи до -3 -4 дБ и записывать в своё удовольствие. Кроме того, когда я работал с 16-ю битами, то занимался потрековой записью: каждому инструменту - свой трек (это обычная схема). При такой схеме, даже на 16 бит всё получается вкусно: каждый инструмент записан с большим динамическим диапазоном (поскольку инструменту "никто не мешает"). В финальном миксе, инструменты смешивались и реальный динамический диапазон оказывался больше, чем можно было достигнуть при записи "всё в куче".

    Этот ваш Котельников - только теория.

    Частенько приходится читать рассуждения о том, что практическое применение теоремы Котельникова, на основе которой делается запись и воспроизведение цифрового звука, сталкивается с очевидными проблемами - что, якобы, делает цифровой звук "не выдерживающим никакой критики". Проблемы действительно имеют место быть: что запись, что воспроизведение цифры сталкиваются с подводными камешками. Вопрос только в том, что камешки эти размером с пылинку, если учесть конечную разрешающую способность человеческого уха, которое просто не в состоянии эти камешки вычислить. Да и описание "проблем", как всегда, зиждется на голом формате AudioCD - как будто других не существует. Дело, как правило, осложняется ещё и тем, что аудиофилы представляют свои обличающие "слуховые тесты", полученные с mp3-плейера "JingHuang" в колонки Genius.

    При записи звука в основном возникает проблема ограничения входного спектра сигнала. Если этого не сделать, то частоты, находящиеся выше граничной (22.05 кГц для AudioCD) "переползут" при оцифровывании "вниз", создавая низкочастотные искажения (aliasing). Фильтрация сигнала - процесс нетривиальный и, в целом, полностью отфильтровать весь ВЧ спектр выше нужной частоты без значительных искажений полезных частот всё равно не получится. Однако, проблема легко решается использованием более высоких частот дискретизации (oversampling) - что при записи, что при обработке. Например, 88.2 кГц вместо традиционной 44.1 кГц (на студиях вряд ли кто-то в здравом уме ещё пишет в 44.1). При частоте выборки 88.2 кГц граничная частота входного сигнала - 44.1 кГц, что позволяет конструировать фильтры низких частот более "расслабленно", учитывая то, что нужным диапазоном в конечном счёте является диапазон частот до ~20 кГц.

    При воспроизведении цифрового звука возникают проблемы с интерполяцией: надо максимально точно восстановить исходный сигнал. Опять же, задача зачастую решается программным повышением частоты выборки (upsampling). Здесь аудиофилы радостно возопят о том, что для программной интерполяции нужны великие миллиарды операций и что ни один компьютер на такое не способен. В идеале - да, но на деле - можно применить весьма упрощённые формулы, достаточные для восстановления сигнала с таким качеством, которое аналоговым носителям и не снилось. Пример с графиками для этого дела приведён в предыдущей статье, где показано, насколько точно восстанавливается сигнал даже для формата AudioCD (коий традиционно принято пинать аудиофильскими ногами). Уточню также, что те графики я не стянул откуда-то из интернета, а построил их сам - с помощью своей же программы для моделирования систем цифровой обработки сигналов sDCAD. Суперкомпьютер с миллиардами операций для этого, по счастью, не потребовался.

    Плоский звук.

    От аудиофилов часто приходится слышать термин "плоский звук" применительно к цифре. Термин может варьироваться: "пластиковый", "искусственный", "неживой" и тому подобное. Чем же конкретно аналоговый звук отличается от цифрового?

    Во-первых, аналог характеризуется мягкостью (завалом) воспроизведения высоких частот. Мягкость возникает из-за банальных недостатков аналоговых технологий. В случае с винилом это инерционность иглы. В случае с магнитными лентами - постепенное размагничивание (возникающее сразу после записи). Короче говоря - аналог звучит мягко и деликатно (тем не менее, мягкость обязана "сжёвыванию" ВЧ).

    Иное дело цифра: что записал - то и получил. Если тракт звуковоспроизведения качественный - мы слышим то, что было записано - и ничего не теряется. Некоторые цифровые треки звучат очень жёстко потому, что их так записали - ничего удивительного здесь нет, мягкость нравится не каждому звукорежиссёру. Особенно учитывая направления в современной музыке, где принято искажать всё, что только возможно, включая голос вокалиста. Но дело в том, что цифра способна воспроизводить и мягкий звук - надо лишь соответствующим образом его записать.

    Слушатели "старой закалки" привыкли слышать с винила или ленты сочный "ухающий" бас, который появляется благодаря естественному завалу ВЧ и сопутствующим выделением на этом фоне НЧ. С появлением цифровых технологий звукорежиссёры получили возможность качественно оперировать всем спектром, в результате чего записи стали более насыщенными в высокочастотном плане. И они действительно звучат привлекательнее старых - если откинуть предрассудки. Впрочем, для получения мощного "ухающего" баса достаточно сделать простую операцию: прибавить низких. Если, конечно, ваш музыкальный центр вообще оборудован эквалайзером...

    В общем, появление цифровых технологий записи звука изменило и сам звук, который мы слышим с треков. Есть ли в этом что-либо удивительное? Не думаю. Плох ли цифровой звук? Нет, цифровой звук - хорош. При грамотном применении - как и со всем остальным.

    Будет также правильным в окончании всех разглагольствований упомянуть факт: в спорах о звуковых технологиях принято забывать о самой музыке. Мы до сих пор слушаем, к примеру, ранние записи "Битлз" и радуемся. Несмотря на то, что эти записи были сделаны на стиральных досках и целиком представить себе прогресс в области звуковых технологий, произошедший с тех времён, неподготовленному человеку едва ли возможно. У каждого музыканта свой взгляд на передачу идей, и поверьте мне на слово, меньше всего мы задумываемся о тёплом ламповом звуке и сферическом виниле в вакууме. Меньше всего музыкант думает о том, что кто-то будет слушать его запись с золотыми проводами и динамиками, около которых предварительно потанцевал шаман с бубном, заточив перед этим иглу звукоснимателя в пирамиде. Музыкант думает о том, чтобы донести свою мысль до слушателя. Прекрасно понимая, что в 90% случаев его музыка будет прослушиваться на весьма бюджетной аппаратуре, зачастую не выдерживающей никакой критики.

    И потом, вот уже лет тридцать мир находится под властью синтезированного звука. Звука, появляющегося не из живых инструментов, а из разнообразных электронных устройств. И понятия "плоский звук" относительно электронного инструмента не может существовать вообще. Кто сказал, что звук синтезатора, который мы слышим на записи, должен звучать как-то иначе?
    Автор http://saanvi.ru/fac.php?filename=warm_tube_sound_and_spheric_vinyl_in_vacuum.txt

    На этом веб-сайте используются файлы cookie для обеспечения эффективной навигации по странице. Подробнее …

    0.12639713287354 sec.