Зачем повышают частоту дискретизации - Звук - Каталог статей

В вопросах повышения качества цифрового звука специалисты в этой области согласны только в одном — с повышением частоты дискретизации качество звучания заметно улучшается. Причем под словом «улучшается» каждый понимает уже что-то свое. Все многообразие мнений по этому поводу сводится к следующему: звук становится прозрачнее, мягче, естественнее, более четко воспринимаются низкие частоты.

Однако эти нюансы замечают лишь подготовленные слушатели с хорошим музыкальным слухом на специально подобранном звуковом материале и при использовании технически совершенной аппаратуры.

Существует множество гипотез, объясняющих причину улучшения качества звучания повышением частоты дискретизации. Многие технические специалисты склоняются к версии, что эта связь объясняется искажениями, возникающими при фильтрации и интерполяции в процессе реконструкции звукового сигнала.

Возможно, что на современном техническом уровне качественные интерполяторы практически не реализуемы, поэтому вместо их совершенствования производители просто увеличивают частоту дискретизации. Возможно, дело вообще не в них.

Другая версия, которой придерживаются многие любители музыки, состоит в том, что при низкой частоте дискретизации, например 44100 Гц, в цифровом звуке полностью отсутствуют обертоны высоких звуков, основные частоты которых лежат выше 7 кГц, а на более низких частотах обертонов слишком мало для качественного восприятия музыки.

Действительно, многие музыкальные инструменты генерируют колебания частотой до 100 кГц. Правда, доля энергии, приходящаяся на полосу частот выше 20 кГц, составляет от 0,01 до 2% для звуков гармонической природы и от 0,02 до 68% для звуков, создаваемых тарелкой, треугольником или ударом о металлический обод барабана (rim shot — прим ред.).

Даже частотный диапазон речи на свистящих-шипящих звуках распространяется до 40 кГц. Сторонников этой версии не смущает, что человек не может воспринимать звуки частотой выше 20 кГц. Делаются смелые предположения, что ультразвуки воспринимаются в обход слуховой системы, например, через костную проводимость.

Разговоры о том, что обертоны, расположенные свыше 20 кГц, вносят немалый вклад в звучание, завершились созданием и широким внедрением аналого-цифровых преобразователей, использующих частоты дискретизации 96 кГц и 192 кГц; ожидается, что частота дискретизации увеличится до 384 кГц.

Если основываться на современных знаниях о восприятии звука человеком, то следует допустить, что связь между качеством цифрового звука и частотой дискретизации обусловлена трансформацией спектра ошибок квантования в звуковом диапазоне частот.

В технической литературе этот вопрос рассмотрен только для одной частной математической модели, когда музыка представляется сигналом с равномерным распределением по уровню и частоте. В этом случае ошибки квантования становятся шумом с равномерной спектральной плотностью от 0 Гц до частоты Найквиста.

При каждом удвоении частоты дискретизации спектральная плотность шума уменьшается вдвое, а отношение сигнал/шум увеличивается на 3 дБ. Так как предел разрешения по уровню давления составляет примерно 1 дБ, то маловероятно, чтобы эти децибелы оказали заметное влияние на восприятие звука в области высоких частот. На основе этих цифр абсолютно невозможно сделать даже предположительные выводы об изменении качества звучания.

Для того чтобы связать спектр ошибок квантования, частоту дискретизации и качество звучания, в настоящей статье предлагается в качестве модели музыки использовать тональный сигнал, как это принято для оценки качества звуковых трактов. Этот подход основывается в значительной мере на материалах, опубликованных в журнале «Звукорежиссер».

Результаты можно кратко сформулировать следующим образом. В отличие от аналогового, цифровой звук является продуктом амплитудной модуляции. Это проявляется в жесткой функциональной зависимости спектра ошибок квантования от коэффициента кратности частоты звукового сигнала F и частоты дискретизации fs, представляемого в виде отношения простых чисел y и x (k = fs/F = y/x). Частотный спектр ошибок квантования всегда дискретен и однозначно определяется коэффициентом кратности, составляющие этого спектра также однозначно определяются амплитудой звукового сигнала, выраженной в квантах. Это значит, что механизм формирования спектра ошибок квантования не зависит от числа используемых разрядов. С увеличением разрядности квантования спектр не меняется по форме и составу, а только смещается по уровню на 6 дБ с каждым дополнительным разрядом. (Бывают ситуации, когда изменение разрядности приводит к изменению спектра, — прим. ред.) Слуховое восприятие спектра ошибок квантования в значительной мере определяется частотной характеристикой слуха, которая, в свою очередь, очень сильно зависит от уровня звукового давления.

Частоты цифрового звука разделяются на кратные, когда х = 1, и субкратные, когда x >1. На кратных частотах спектр ошибок квантования гармонический и основным тоном является частота звукового сигнала. Если y число четное, то в спектре присутствуют только нечетные гармоники. Если y нечетное число, то в спектре присутствуют как нечетные, так и четные гармоники звукового сигнала.

На субкратных частотах в спектре ошибок квантования появляются составляющие ниже частоты звукового сигнала, вплоть до нуля, и нижняя граница спектра Fn(x) определяется формулой x — Fn(x) = F/x. При этом основным тоном звука ошибок квантования становится частота Fn(x), а все остальные составляющие, включая частоту звукового сигнала, — ее гармониками. Если на субкратной частоте yskr число четное, то в спектре присутствуют только нечетные гармоники частоты Fn(x). Если yskr нечетное число, то в спектре присутствуют как нечетные, так и четные гармоники этой частоты. Низкочастотные составляющие в спектре ошибок квантования приводят к возникновению призвуков в виде тона или созвучия. Они особенно заметны на высоких частотах звукового сигнала, когда отсутствует эффект частотной маскировки.

Для пояснения приведем пример спектра ошибок квантования при уровне звукового сигнала минус 30 дБ с 8-разрядным квантованием. Пусть fs = 48 кГц и F = 12800 Гц, тогда коэффициент кратности kskr = y/x = 48000/12800 = 15/4 и, следовательно, нижняя граничная частота Fn(x) = F/x = 3200 Гц, а спектр состоит из четных и нечетных гармоник этой частоты.

Когда частота звукового сигнала отклоняется от субкратного значения на небольшую величину, вокруг всех гармоник спектра, включая нулевую, возникают боковые полосы, резко увеличивается число составляющих спектра и уменьшается нижняя граница спектра, так как очень сильно увеличивается текущее значение x.

Пусть, например, приращение частоты звукового сигнала равно 1 Гц, тогда значение коэффициента кратности k = y/x = 48000/12801 = 16000/4267 и нижняя граничная частота спектра отклонения становится равной Fno = 12801/4267 = 3 Гц, а интервал между составляющими спектра уменьшается до 6 Гц.

При отклонении частоты звукового сигнала от субкратного значения всегда возникает низкочастотный звук, частота основного тона которого Ft(yskr) прямо пропорциональна величине отклонения DF = 1 Гц и значению yskr = 15, в рассматриваемом примере она равна 15 Гц (5 гармоника частоты Fno). Этот звук содержит множество гармоник, которые на 20…40 дБ выше уровня основного спектра, поэтому обычно слышны именно они. Составляющие тона отклонения возникают вокруг всех основных гармоник частоты Fn(x) с частотным интервалом 30 Гц, и именно они образуют боковые полосы спектра.

Исследование влияния частоты дискретизации на спектр ошибок квантования прежде всего проводилось на высоких частотах при отклонении частоты звукового сигнала от субкратных частот примерно на 1 Гц. Чтобы результаты такого исследования имели практический интерес, использовалось 16-разрядное квантование и измерения спектров проводились при уровне звукового сигнала ?78 дБ. При этом спектр и значение SNR такие же, как при 8-разрядном квантовании с уровнем сигнала ?30 дБ. На спектрограммах абсолютному порогу слышимости в области частот от 2 до 5 кГц соответствуют уровни ?120…?130 дБ. (Строго говоря, уровень звукового давления зависит не только от уровня сигнала в фонограмме, но и от положения регулятора усиления, — прим. ред.)

С математических позиций повышение частоты дискретизации проявляется в двух-, четырех- и более кратном увеличении значения коэффициента кратности на всех частотах звукового диапазона. Это значит, что меняются все коэффициенты кратности. Поэтому для проведения исследований все субкратные частоты разделили на три группы, отличающиеся тем, что y и x могут быть четными и нечетными: k1 = нечет/чет, k2 = нечет/нечет и k3 = чет/нечет, например, k1 = 13/4, k2 = 13/3 и k3 = 24/7. Статистически в этих группах примерно одинаковое число частот.

Из графиков спектров частот первой группы видно, что составляющие спектра ошибок квантования при 16-разрядном квантовании с частотой дискретизации 48 кГц на 20 …30 дБ превышают порог слышимости в области максимальной чувствительности слуха, поэтому они должны восприниматься на слух.

В первой группе субкратных частот при каждом удвоении частоты дискретизации вдвое уменьшается нижняя граничная частота Fn(x), пока x не станет нечетным числом. При этом с каждым удвоением частоты дискретизации вдвое уменьшается число гармоник спектра вместе с боковыми полосами.

С увеличением вдвое частоты дискретизации составляющие звука отклонения уменьшаются с 10 до 50 дБ! Причем в приведенном примере уменьшаются составляющие в области максимальной слышимости до уровня значительно ниже порога слышимости, поэтому на слух это должно быть заметно очень хорошо. При этом в соответствии с теорией отношение сигнал/шум действительно уменьшается примерно на 3 дБ. Но следует принять во внимание еще и тот факт, что этот спектр неравномерен.

Если частоту fs увеличить еще вдвое, до 384 кГц, то в приведенном спектре пропадет и подъем в области до нулевых частот, так как частота станет кратной с четным значением y. При еще большем увеличении частоты дискретизации спектр больше изменяться не будет, так как на кратных частотах передискретизация совершенно не эффективна.

Во второй группе субкратных частот механизм изменения спектра ошибок квантования совсем другой, и эффект от увеличения частоты дискретизации существенно меньше. В этой группе достаточно эффективно только двукратное увеличение частоты дискретизации. При этом коэффициент кратности y становится четным числом и поэтому в спектре пропадают все четные гармоники, включая нулевую, вместе со своими боковыми полосами.

Как видно из примера, в звуковом диапазоне в районе 4 кГц уровень спектральных составляющих уменьшается почти на 50 дБ и становится ниже порога слышимости (следует отметить, что такое сильное уменьшение — это просто удачное совпадение — прим. ред.).

Одновременно здесь действует еще один механизм уменьшения заметности ошибок квантования, который проявляется на нечетных гармониках спектра, — во всех боковых полосах с каждым удвоением частоты дискретизации вдвое уменьшается число составляющих спектра, поэтому громкость звучания ошибок квантования уменьшается.

Можно сделать предположение, что с увеличением частоты дискретизации звук становится прозрачнее и чище, так как становится все меньше некогерентных составляющих в спектре ошибок квантования.

Эффект от повышения частоты дискретизации более сильно проявляется при использовании сложных испытательных сигналов в виде суммы синусоидальных составляющих субкратных частот, относящихся к различным группам. На таком сигнале достаточно сильно возрастает число составляющих спектра ошибок квантования в наиболее слышимой зоне средних и верхне-средних частот от 1 до 6…7 кГц, и уровень большинства из них с повышением частоты дискретизации становится ниже порога слышимости.

Очевидно, тот, кто воспринимает на слух искажения при 16-разрядном квантовании с частотой дискретизации 48 кГц, почувствует разницу звучания этих ошибок на частотах дискретизации 96 и 192 кГц. Важно лишь понимать физику происходящих преобразований спектра ошибок квантования.

При 16-разрядном квантовании составляющие спектра ошибок квантования превышают порог слышимости только в области максимальной чувствительности слуха человека на 15…20 дБ.

Это значит, что с увеличением числа разрядов до 20 все составляющие спектра ошибок квантования будут ниже порога слышимости и повышение частоты дискретизации станет совершенно не нужным. (Это утверждение представляется спорным. Повышение частоты дискретизации может положительно сказываться на звучании и при высокой разрядности — прим. ред.). Очевидно, что эффективность повышения частоты дискретизации очень быстро увеличивается с уменьшением числа используемых разрядов.

При отклонении частоты звукового сигнала от кратного значения с увеличением частоты дискретизации эффект уменьшения заметности ошибок квантования наиболее проявляется на средних частотах, когда значение y коэффициента кратности является нечетным числом.

Для цифрового звука характерно, что между кратными частотами субкратные значения изменяются по одному закону и число их постоянно. Чем ниже частота, тем меньше интервал между кратными частотами, соответственно, уменьшается частотный интервал между субкратными частотами и они перестают различаться на слух.

Это проявляется в том, что ошибки квантования перестают быть слышны в виде тона отклонения, то есть исчезает дискретная структура и звук становится как бы аналоговым. При частоте дискретизации 48 кГц ошибки квантования не слышны на частотах ниже 1000 Гц, тогда как спектр отклонения хорошо виден.

Этот феномен естественно работает и при повышении частоты дискретизации, так как при каждом ее удвоении в звуковом диапазоне вдвое увеличивается число кратных частот, а интервал между ними, соответственно, уменьшается.

Это приводит к тому, что на высоких частотах становится все меньше субкратных частот, которые воспринимаются на слух, что равноценно улучшению качества звучания.

Автора настоящих строк природа не наградила хорошим слухом, поэтому все изложенное является результатом только умозаключений на основе подсказки компьютера.

Так как девиация порога слышимости составляет ±10 дБ, то улучшение звучания с повышением частоты дискретизации могут не заметить и многие другие, тем более что для этого требуется слишком дорогая аппаратура. Тем не менее, изложенный материал показывает, что с повышением частоты дискретизации слышимость ошибок квантования уменьшается достаточно сильно и это действительно может сделать цифровой звук чище, прозрачнее и ближе к естественному звучанию без всякой мистики относительно «восприятия ультразвука».

Вопрос о повышении частоты дискретизации в настоящее время носит сугубо коммерческий характер. Если существуют АЦП и ЦАП, хорошо работающие на высокой частоте, то надо ее применять без всякой связи с качеством звучания, так как при этом упрощается и, главное, удешевляется технология изготовления антиэлайзинговых фильтров и фильтров, используемых для реконструкции звуковых сигналов.

В отношении настоящей статьи продвинутые читатели могут возразить: к чему все эти спектры и нюансы, если везде используется dithering. Но прежде чем применять dithering, следует сначала понять, с чем, собственно, собираются бороться, стоит ли бороться и устраивает ли вас результат борьбы.

С технологией dithering не все так замечательно, как это описывается в технической рекламе, за которой стоят коммерческие интересы фирм-производителей.

Приходилось ли вам слышать 16-разрядный цифровой звук без применения этой технологии? Как вы думаете, если применить dithering при 8-разрядном квантовании — станет ли звучание лучше? Не факт, хотя спектрограммы ошибок квантования будут выглядеть замечательно.