что такое dither options

Что такое dither options

Дорогой читатель, ты уже наверняка сталкивался с загадочной и малопонятной опцией Dithering/Dither в серьезных программах-плеерах, будь то Foobar2K или же Neutron Music Player. Вопрос «Что же эта штука делает?» повисал в воздухе. Сегодня одним белым пятном станет меньше. И ты наконец научишься правильно ею пользоваться!

Немного теории

Цифровая звукозапись. В отличие от аналоговой, она призвана вместить музыку в конечную череду нулей и единиц. То есть, сколь большой ни была бы разрядность квантования и сколь высокой — его частота (будь то 16/44.1 или же студийные 24/192 и выше), точность записи всегда конечна.

Таким образом, в отличие от бесконечно плавной аналоговой записи, мы получаем пусть и максимально к ней приближенную, но все же упрощенную версию. Это можно сравнить с цифровым изображением. Сколь высоким ни было бы его разрешение, при определенном приближении/увеличении станут видны отдельные пиксели. Дела с цифровой звукозаписью обстоят примерно так же.

Шумы квантования во всей красе

В записи любого музыкального произведения могут встретиться растянутые во времени, слишком плавные частотные переходы, затяжные вокальные партии и прочие моменты. Именно тут и может возникать такое явление, как шум квантования. Когда колебания частот в описываемом произведении слишком незначтельны, чтобы их можно было запечатлеть на цифровой записи с выбранной частотой, аппаратура «принимает решение» упростить такие участки до единого значения, растянутого во времени.

Аналогом может служить изображение, сохраненное в упрощенной, оптимизированной для web палитре. Как видим, участки, отличающиеся друг от друга полутонами, заливаются здесь единым цветом. Такое изображение, конечно, можно назвать приближенным к оригиналу, но лишь в определенной степени.

Устранить слишком уж наглядные проявления такого эффекта и призван метод, названный дизерингом. Что же он собой представляет?

Принцип прост. В запись порционно добавляются специально сгенерированные неточности/шумы, накладывающиеся на те ее фрагменты, где имеют место шумы квантования. То есть на слишком длинные по мнению алгоритма однородные участки. Это позволяет привнести в звук ту естественность, которую он при квантовании утратил. Слушать такую запись по умолчанию приятнее.

Тот же метод применяется и для цифровых изображений в некоторых форматах с пережатием. К примеру, в PNG.

Практика

Вот тут начинается самое интересное. Разрядности современных студийных записей (24/192 и выше) вполне хватает для того, чтобы в 99,9% случаев избежать такого явления, как шумы квантования. Применение дизеринга для таких записей просто избыточно и привносит в них лишь дополнительную окраску звучания, пагубно влияющую на достоверность. Но, как мы знаем, «народным» является формат FLAC/ALAC с разрядностью 16/44.1. То есть полный аналог CD.

Что же происходит с изначальной студийной записью, когда с нее начинают штамповать CD-диски? Правильно! Детализация теряется. Плавные переходы, в которых не было места шумам квантования, все чаще сменяются ровными, как блин, участками. То есть происходит то же самое, что и при сохранении цифрового изображения с меньшим разрешением. На определенном расстоянии отличить их будет почти невозможно, но стоит подойти ближе/вслушаться и…

Вот тут на помощь звукорежиссеру со всей своей аптекарской точностью приходит беспристрастный алгоритм дизеринга, снабжая участки с шумами квантования порцией дополнительного, оживляющего их шума. Получаем эффект fight fire with fire. И звукозапись заново приобретает утраченную естественность и красоту. Но сохраняется ли при этом достоверность? Нет! Такая запись уже очень серьезно отличается от оригинала. Ведь она содержит в себе то, чего в изначальном произведении никогда не было. Пусть и в скрупулезно выверенных количествах.

А теперь вернемся к вопросу lossless-форматов. Откуда мы берем те самые FLAC 16/44.1? Давайте будем честны сами с собой. 90% таких файлов — это рипы с CD-дисков, а не прямая понижающая переоцифровка со студийных записей. Что же мы имеем? А то, что происходит повторное квантование с не самой высокой разрядностью 16/44.1. И этот процесс заново воскрешает участки с шумами квантования, «закрашивая одним цветом» то, что звукооператором при записи CD было профессионально разбавленно полезными шумами дизеринга. Именно для таких файлов и нужно включать заветную опцию Dither в foobar2K или Neutron.

Помимо этого варианта применения существует и другой. Он заключается в необходимости воспроизведения Hi-Res Audio файлов на аппаратуре, не поддерживающей bit-perfect декодирование таких файлов и стремящейся провести понижающую передискретизацию до тех самых 16/44.1 или 16/48 на лету. Прямо при воспроизведении. В таких случаях Dither также способен очень сильно выручить. По крайней мере, музыку станет комфортнее слушать. Исчезнет грязь и размытость. Звук станет более согласованным. Но повторюсь, не стоит обольщаться! Dithering все же пагубно влияет на достоверность звучания. И если у вас есть возможность обойтись без него, советую так и поступить.

На этом всё. Надеюсь, эта информация была вам полезна и теперь вы будете пользоваться опцией Dither аккуратно и с пониманием. До скорого!

34 комментария

С CD считывается цифра. Она уже готовая. Это не винил и не магнитная лента, где идет преобразование, (а, соответственно, и квантование) из аналогового сигнала в цифровой. Информация с CD считывается ровно в том виде, как была туда записана, без всякого квантования. В этом и смысл цифровых носителей информации. Так о каком «квантователе» при считывании цифровых данных вы говорите?

Читайте также:  что значит держишь марку

Мишаил, ниже я привел контр-аргументы. Увы, но не все так просто применительно к смене аудио-контейнеров.

Эта цитата взята из википедии. Пожалуйста, не путайте считывание данных с их преобразованием в wav-формат. Как вы сами и говорите, избыточность нужна для корректного считывания. Которое в свою очередь происходит при воспроизведении.
Переквантование же при риппинге происходит. Ведь меняется формат хранения тех самых данных.
Я не желаю и дальше с вами спорить. Пусть каждый останется при своем мнении. То, о чем я говорю, основано на личном опыте.
Квантование же при переводе WAV во FLAC проводится. Ведь мы имеем дело с абсолютно иным контейнером.
Для ликвидации же пробела в ваших знаниях о конвертации очень рекомендую ознакомиться вот с этим: http://audiophilesoft.ru/publ/my/foobar2000_converter_setup/11-1-0-27
Конвертер глубины бит и применение PCM с плавающей точкой как бы безальтернативно намекают на неизбежность промежуточного переквантования :).Но повторюсь, доказывать что-либо я не намерен. Вы в полном праве оставаться при своем мнении.

Простите Андрей, но это уже ни в какие ворота.
Раз и навсегда закройте этот вопрос:
Андрей, возьмите, в конце концов, любой 44/16 WAV файл и конвертните его в том же foobar во FLAC, И затем Этот flac конвертните обратно в WAV. Вы получите два побитно идентичных WAV файла.

. не имеют никакого отношения к формату FLAC 44/16

Квантование же при переводе WAV во FLAC проводится. Ведь мы имеем дело с абсолютно иным контейнером.

Ознакомьтесь на досуге о понятии «контейнер». И применительно к FLAC мы меняем лишь способ хранения цифровых данных, сами данные остаются неизменными.

Из вашей же логики следует, что упакованный в RAR файл, и распакованный из него будут разными, но это полный бред.

Ваш пример с конвертером фубара работает только в случае, когда мы задаем частоту квантования, отличную от исходной. В примере, с которого мы начали разговор, идет речь о формате 16/44, и никаких изменений формата не подразумевалось.

С CD считывается цифра. Она уже готовая.

Аргументы будут? Я свою позицию выразил достаточно четко и аргументированно, того же ожидаю и от оппонентов.
А подобные высказывания, извините, не рассматриваю в силу их несерьезности.

Браво! Трудно представить себе более дилетантскую статью про дизеринг. Особенно ярко автор раскрыл свои незнания в области цифрового аудио в своих комментариях. К сожалению, одним «белым пятном» меньше так и не стало.

1. ошибки квантования не имеют ничего общего с частотой. Сравнивать их с пикселями в изображении некорректно. Они не влияют на «плавность частотных переходов», как утверждает автор. Они лишь добавляют низкоуровневые шумы, но гораздо более неприятные, чем шум дизеринга, о котором так предостережительно говорит автор.

Андрей, я меломан. Про Dither в курсе, но до прочтения этой статьи пренебрегал (и пока продолжаю это делать). Дождусь ответа. Что хотелось узнать?
1. Если я слушаю рипы СD, или сами ли СD (фирменные и не очень), то они как раз в формате 16/44 и Dither для более приятного прослушивания включать? (Думаю, понял это правильно).
2. Главное. Много музыки имею в 24/192, но в большей степени она попадает ко мне в 32/192, а в последнее время и в DSD в 32/384. Для моей звуковой аппаратуры это избыточное качество. Остановился на 24/192. Поэтому процесс конвертации использую очень часто для понижения частоты дискредитации и разрядности (не последнее место занимает и избыточный размер файлов). Правило использую вроде устоявшееся: Все промежуточные операции выполняю в PCM. Если DSD 32/384, то путь таков DSD 32/384 => Wav 32/384 => Wav 32/192 => Wav 24/192 => Flac 24/192. И вот теперь задумался, много ли я теряю в качестве при понижении разрядности с 32 до 24 без включения дизеринга? Или этим можно пренебречь и просто наслаждаться музыкой? Спасибо.

не теряете, если делаете транкейт единожды. Шум квантования будет настолько низок, что услышать его будет практически невозможно.

Что-то тут смешались в кучу кони-люди. Попробую объяснить на пальцах.

При воспроизведении ЦАП 44.1 тысячи раз в секунду (или сколько задано форматом) читает значение в следующем фрейме и программирует свою аналоговую часть. Шум квантования при этом есть ВСЕГДА, это характеристика ЦАПа и его схемы аналогового преобразования. У современных ЦАПов это очень низкое значение, и куда важнее «тепловой» шум полупроводниковых компонентов. Тем не менее, шум квантования всегда присутствует.

Дизеринг действительно призван уменьшить шум квантования при уменьшении разрядности. Если ее уменьшить тупо, то в результирующем материале возникнут неприятные ступеньки, которые влекут за собой появление гармонических искажений. Хорошие алгоритмы дизеринга используют психоакустические модели и подмешивают шумовую составляющую в сигнал. Это позволяет добиться снижения воспринимаемого уровня шума на 10-12 Дб на длинных фейдах. Плюс к тому там еще задействована функция бланкинга для получения истинной тишины там, где надо.

RT-дизеринг foobar2K равно как и Neutron Player уже давно перешагнули за 120. Ну да ладно

Читайте также:  что значит отсканировать заявление

Лучший результат даст хороший звуковой интерфейс, который нативно, аппаратно, поддерживает любые частоты дискретизации и переменную разрядность. Конечно, если такого под рукой нет, то дизеринг поможет уменьшить шумы. Просто если мыслить в бескомпромиссных категориях, то я бы посоветовал медленным и печальным способом пересемплировать всю библиотеку и забыть про программную обработку в реальном времени по возможности. Ну а если возможности нет. тут уж никуда не деться.

Во-от. С этим полностью согласен. Жаль, что не все можно найти в хорошем качестве.

В статье есть несколько неявно описанных моментов с точки зрения новичка:
1. Глава «Практика»: из картинки со ступеньками возникает ощущение, что дизеринг нужно использовать при понижении частоты дискретизации.
2. «И звукозапись заново приобретает утраченную естественность и красоту»: то есть сначала происходит потеря естественности, а потом подмешивают шум и естественность восстанавливается?
3. «Именно для таких файлов и нужно включать заветную опцию Dither»: имется ввиду, что опцию рекомендуется включать всегда при прослушивании FLAC 16/44.1?

Т.е. Dither возвращает «то, что звукооператором при записи CD было профессионально разбавленно полезными шумами»? Это (галочка) касается только wasapi, или asio тоже?

Эта галочка касается любого режима, в опциях которого она существует. Ну а в каких случаях Dither выполняет полезные функции, описано в статье. Весьма однозначно 🙂

— то с вероятностью 99.9% эти статьи не представляют для тебя никакого интереса. Не говоря уже об информационной ценности. Я фокусируюсь на определенной целевой аудитории. Стремление же угождать всем не увенчается успехом.

Сергей, прости, но я предупреждал по поводу мата. Комментарий удаляется. Огромная просьба, дружище, пожалуйста, будь немного сдержанней в выражениях. Спасибо 🙂

Мене скушно. Ну ты хоть прочиткал. Хлебнул суть.
. iT ресурсы делятся на 3 категории. Туда куда ходишь когда нужно решить проблему. Туда куда лезешь чтоб развлечься. И те где меряются первичными половыми признаками высоколобые (тут нет цензурного слова). Кеддрюком стремительно из второго превращается в третье и это печалька потому что первым он никогда не был.

Категория «те, куда ходишь, чтобы узнать что-то новое» для тебя не существует исходя из этой логики. Ну ок 🙂

Источник

Что такое дитеринг: Окончательное руководство для начинающих

Мы ответим на все эти и другие вопросы в этой статье и постараемся сделать концепцию дизеринга как можно более понятной.

Что такое дитеринг?

Посмотрите этот видеоролик от Rowntree Audio для быстрой и простой демонстрации процесса дизеринга:

[VIDEO EMBED] https://www.youtube.com/watch?v=cLnuoQ6pIKk

Чтобы понять ответы на эти вопросы, необходимо сначала разобраться в том, как работает цифровое аудио.

Какое отношение имеет дизеринг к цифровому аудио

Уменьшение сигналов в размерах

Если вы хотите, чтобы ваша музыка была максимально доступной, вы должны уменьшить свои высококачественные записи, чтобы они соответствовали этим различным форматам. Таким образом, при экспорте аудиофайлов вы должны понизить дискретизацию (т.е. уменьшить битовую глубину). В то же время, при уменьшении битовой глубины не следует удалять нюансы и динамику звука.

Именно здесь вступает в игру сила dither.

Дизеринг: Прояснение искаженной концепции

Что бы произошло при преобразовании цифрового звука из более высокого разрешения в более низкое без применения дизеринга? Как вы можете себе представить, те блочные числа (те, которые представляют входящий сигнал), о которых мы упоминали ранее, стали бы скомканными и еще более блочными, превратив то, что раньше напоминало непрерывную волну, в нечто, больше похожее на лестницу. Этот процесс называется усечением и приводит к тому, что известно как ошибка квантования, искажение квантования или шум квантования.

Если вы знакомы с формами волн и тем, как звучат различные конфигурации в зависимости от внешнего вида, вы знаете, что эта ступенчатая форма звучит искаженно. Точнее говоря, пониженное дискретизированное аудио, не подвергнутое дитерингу, дает гармоники, которые коррелируют с исходным аудиосигналом и прорезают человеческое ухо довольно громко (гармоническое искажение).

Конечно, меньше всего вам хочется, чтобы непреднамеренные шумовые искажения распространялись по всему вашему первозданному аудио. Когда вы добавляете низкоуровневый шум в аудио перед процессом квантования, эти гармонические искажения, по сути, скремблируются и значительно теряют свое присутствие.

В конечном счете, дизеринг позволяет вашему миксу сохранить динамический диапазон и оригинальное общее звучание при доводке до более низкого разрешения.

Дизеринг полагается на случайные колебания

Если концепция дизеринга все еще не совсем ясна, помните, что все дело в рандомизации. Шум, который добавляет дизеринг к вашему аудио, является случайным и некоррелированным (вспомните «шипящий» звук, издаваемый белым шумом). В результате, те громкие коррелированные искажения, которые возникают при уменьшении битовой глубины аудио, не могут пробиться наружу.

Эта концепция добавления случайного шума к чему-либо возникает и при обработке изображений. Представьте, что вы смотрите на четкое изображение на телевизоре высокой четкости. Затем представьте себе просмотр того же изображения на старом телевизоре с гораздо меньшим разрешением. Много данных будет потеряно в этом процессе, создавая пикселированное изображение, изобилующее цветовой полосой (которая возникает, когда информация о цвете представлена неточно).

Этот переход от высокой четкости к низкой четкости может быть сглажен с помощью дизеринга. Вместо того чтобы непосредственно втискивать изображение в меньшее пространство, информация изображения сначала скремблируется, уменьшая глубину цвета. В итоге уменьшенное изображение сохраняет свою относительную форму, цвет и структуру.

Читайте также:  что делать если нет звука в триколор

Приведенный ниже рисунок даст вам лучшее понимание того, как работает дизеринг на изображениях.

Когда использовать дизеринг

Итак, когда следует добавлять дизеринг в аудио? Основное правило заключается в том, что при понижении дискретизации аудио (часто на этапе мастеринга или экспорта) всегда следует использовать дизеринг. Другими словами, используйте дизеринг всякий раз, когда в аудио появляются искажения квантования (а они появляются при изменении битовой глубины с большей на меньшую).

Дизеринг почти всегда следует выполнять во время прыжков или экспорта, или использовать в качестве последнего эффекта в цепи сигнала (некоторые лимитеры имеют собственную функцию дизеринга).

Когда не следует использовать дизеринг

Однако то, что дизеринг является стандартной практикой в цифровом аудиопроизводстве, не означает, что он всегда необходим. Например, если вы готовите трек к мастерингу с помощью мастеринг-инженера или eMastered, вам не следует делать дизеринг, поскольку это будет сделано за вас (как уже упоминалось выше, дизеринг обычно используется в процессе мастеринга).

Иногда можно обойтись без дизеринга, даже если он не требуется. В некоторых случаях добавленный шум не будет достаточно слышен, чтобы изменить что-либо в вашем аудио. В худшем случае, однако, ваша дорожка может получить заметное шипение, которое никто не хочет слышать. Чтобы обезопасить себя, следуйте вышеупомянутому правилу: используйте дизеринг только для сокрытия искажений квантования (т.е. при экспорте аудио из более высокой битовой глубины в более низкую).

Различные типы дизеринга

Различные DAW и плагины предлагают различные варианты dither. В Logic Pro X, например, можно использовать три основных типа дизеринга при сведении: POW-r #1, POW-r #2 и POW-r #3. Правильная настройка дизеринга для ваших целей будет в основном зависеть от динамического диапазона вашего аудио.

POW-r #1 Dithering

Эта первая категория дизеринга, предлагаемая Logic Pro, не обеспечивает формирование шума и лучше всего подходит для миксов с низким динамическим диапазоном.

POW-r #2 Dithering

В основном используется для речи (т.е. подкастов или радиопередач), POW-r #2 dithering (формирование шума) уменьшает шум в диапазоне частот 2 кГц и усиливает его в районе 14 кГц и выше, скрывая при этом искажения квантования. Эта мягкая эквализация хорошо подходит для прояснения многих типов вокала.

POW-r #3 Dithering

Что касается третьего варианта дизеринга в Logic Pro, то дизеринг (формирование шума) POW-r #3 лучше всего подходит для высокодинамичных миксов, таких как акустическая, оркестровая музыка или музыка больших групп. Модуляция/выравнивание шума, применяемые при этом типе дизеринга, превосходят возможности POW-r #2, что имеет смысл для более динамичных записей.

Другие виды дизеринга

Изучая другие DAW и плагины лимитеров/шумоподавителей, вы можете встретить такие термины, как «нет», «умеренный» и «ультра». Эти слова относятся к количеству шумоподавления, применяемого к данному сигналу. Вообще говоря, шумообразование, предлагаемое различными типами dither, уменьшает низкочастотное содержание сигнала (область 2 кГц) и усиливает его высокие частоты.

Вопросы и ответы по дизерингу

Должен ли я использовать дизеринг?

Если вы понижаете дискретизацию аудио с большей битовой глубины до меньшей (т.е. с 32-битной фиксированной точки до 24- или 16-битной), вам следует использовать дизеринг.

В каких случаях следует выполнять дизеринг звука?

Всегда используйте dither при экспорте, сведении или мастеринге аудио. Другими словами, используйте dither при снижении битовой глубины дорожки.

Нужно ли использовать дизеринг при мастеринге?

Да. На самом деле, процесс мастеринга часто является лучшим моментом для использования дизеринга, поскольку он позволяет скрыть любые нежелательные искажения квантования до снижения битовой глубины звука. Таким образом, ваш трек будет готов к воспроизведению на различных платформах и устройствах.

Ты слышишь, что происходит?

О: Если вы правильно наложите дитеринг на аудио, вы вообще не услышите шум низкого уровня, особенно в контексте. Конечно, можно услышать дизеринг, если применить его к тихим аудиофайлам и значительно увеличить громкость. Dither будет звучать как некая вариация белого шума (мягкий, постоянный, шипящий).

Можете ли вы услышать разницу между 16-битным и 24-битным звуком?

О: Если у вас нет хорошо натренированного уха или вы не слушаете высокодинамичную музыку на высококачественных колонках, вы вряд ли заметите разницу между 24- и 16-битным звуком.

Какой шум полезен для дизеринга?

Белый, коричневый и розовый шум могут быть полезны для дизеринга. Все они представляют собой разновидности «шипящего» звука, который вы можете узнать при настройке радиоприемника. Белый шум распределен по частотному спектру, коричневый шум находится на нижнем конце, а розовый шум находится где-то между ними.

Предпочтителен ли синий шумоподавитель?

Сглаживание синего шума полезно для сохранения достоверности изображения при снижении его разрешения на значительно низких частотах дискретизации. В Proceedings of the IEEE есть всестороннее исследование этого явления.

Имеет ли значение дизеринг?

Да, особенно если ваша песня имеет высокий динамический диапазон. Правильное дизеринг аудио при уменьшении его битовой глубины позволит уменьшить искажения квантования, сохранив или улучшив динамику.

Должен ли я делать допинг для Soundcloud?

Итоги по дитерингу

Источник

Строительный портал