что такое dsd dop
Прокрасться через черный ход [перевод]
На фоне растущего интереса к DSD (Direct Stream Digital) — главного формата записи на SACD-диски, я думаю, было бы полезно объяснить, что такое DoP. Да, я уже знаю слишком много слов из трех букв (TLA — Three Letter Acronyms).
DoP означает «DSD over PCM» и было изобретено группой производителей High-End-аудиотехники, которые старались донести великолепное звучание до всех нас. А PCM (или ИКМ — импульсно-кодовая модуляция) — это стандартный формат записи цифрового аудио, как, например, на CD.
Вот в чем состояла идея. Так как PCM-формат используется повсюду, и его понимают все цифровые плееры, компьютеры и ЦАПы, то вполне логично выбрать его кандидатом на звание универсального формата. Как вы понимаете, заставить всех производителей компьютеров и операционных систем перейти на что-то так редко используемое, как DSD, это непосильная задача, и такой проект, скорее всего, не пройдет. Но если нам удастся приспособить существующий формат вроде PCM, тогда это будет гораздо более легкая задача. Именно так и поступили эти люди.
В PCM-формате используется последовательность кадров (frames) или «снимков» для передачи данных. Каждый кадр – это отдельная группа аудиоданных, содержащая отсчеты для левого и правого каналов. На CD-диске мы имеем отсчеты (samples) музыкального сигнала, которые следуют с частотой 44,000 раз в секунду, один раз для левого, другой — для правого канала (так что процесс идет в два раза быстрее, чтобы получить две последовательности 44K отсчетов одновременно). А теперь мысленно возьмите два отсчета (левого и правого каналов) и вставьте их в пакет. Это и будет кадр, о котором говорят в PCM. Каждый кадр содержит один левый и один правый отсчет вместе с некоторой дополнительной информацией, которая объясняет оборудованию, чего надо ждать.
С другой стороны, DSD-формат не содержит никаких кадров; вместо этого он представляет постоянный поток битов, плотность которых зависит от музыки.
Отсюда следует весьма разумная мысль, которую реализовали создатели DoP. Они просто разбили DSD-поток на отдельные 16-битовые группы, и каждый 16-битовый блок был выделен из общего потока. Затем они объединили правую 16-битовую группу с левой 16-битовой группой, добавили идентификационную информацию и «приодели» ее так, чтобы компьютеры и ЦАПы думали, что это PCM. Так как для любых компьютеров или ЦАПов на USB-входе такой поток неотличим от PCM, он свободно проходит на ЦАП через USB, S/PDIF или AES/EBU. Очень умный ход, разумеется.
Для того чтобы согласовать скорость с одинарным или удвоенным потоком DSD, они использовали для PCM частоты дискретизации 176,4 кГц и 352,8 кГц соответственно.
Когда такой сигнал поступает на ЦАП, он конвертируется обратно в исходный поток за счет простого последовательного соединения всех битов. Тут нет никаких манипуляций с данными, биты не повреждаются и, если ваш ЦАП способен воспроизводить DSD, у вас все хорошо. Если же ваш ЦАП не поддерживает DSD, вы получите на выходе тишину.
(Комментарии читателей: тишина на выходе — у ЦАПа PS Audio, а для других на выходе может получиться «белый шум» с ограниченным спектром или же музыка, как у ЦАПа JRiver при 352.8/32)
Об авторе: Пол МакГоуэн (Paul McGowan) – директор (CEO) и сооснователь компании PS Audio Inc. из города Боулдер, Колорадо, конструирующей и выпускающей High-End аудиопродукты и сервисы.
Цифровой звук: DSD vs PCM
Цифровой звук. Как же много мифов крутится вокруг этой фразы. Сколько споров возникало между любителями удобства и качества цифры и приверженцами «живого воздушного» винилового звука помноженного на «тёплое ламповое» звучание. Кроме того, есть немало споров и между любителями «цифры»: достаточно ли 16х44.1 или нужно 24х192? Что лучше: мультибит или дельта-сигма? CDDA или SACD? PCM или DSD? В этой статье я попробую простым языком изложить азы цифрового звука, а так же более подробно остановлюсь на сравнении двух типов кодирования аналогового сигнала в цифровой: DSD и PCM.
Для начала ответим на вопрос, что есть цифровой звук? Чем он отличаются от аналогового? Если говорить кратко, математическим языком, аналоговый звуковой сигнал — непрерывная функция, цифровой звуковой сигнал — дискретная функция. Что это значит?
Аналоговый сигнал
Если нарисовать в воображении график синусоиды (именно так в чаще всего изображают звуковую волну): то, как бы мы его не увеличивали, стараясь рассмотреть все детали, — всегда будем видеть плавную гладкую линию: это аналоговый звуковой сигнал (рис. 1).
Рис. 1. Аналоговый сигнал
Аналоговый звук (запись) имеет множество параметров, с помощью которых можно оценить его качество. Рассмотрим три самых важных: частотный диапазон, динамический диапазон, искажения.
Частотный диапазон — набор частот, содержащихся в звуке. Принято считать, что частотный диапазон человеческого слуха 20… 20.000 Гц (иногда указывается 16 — 22.000 Гц). Сам по себе частотный диапазон музыки никакого интереса в плане оценки качества не представляет (к примеру, частотный диапазон все того же взлетающего самолета будет очень широк, а вокальной партии тенора — намного уже). Качественным параметром, скажем, наушников является потенциальный частотный диапазон, а оценивается он с помощью амплитудно-частотной характеристики (АЧХ). Идеальная АЧХ — прямая линия на всем диапазоне частот слуха – означает, что источник звука не усиливает и не ослабляет какие-то отдельные частоты, а значит извлекаемый звук совпадает с оригиналом.
Рис. 2. АЧХ MP3 файла 256 kbps
Динамический диапазон (ДД) — разность между самым тихим и самым громким звуком. Измеряется громкость в децибелах (дБ). Принято считать, что максимальная громкость, не наносящая травм человеку — это 130 дБ — звук взлетающего самолета, а минимальная слышимая громкость — 5… 10 дБ — на уровне шелеста листьев в маловетреную погоду. Естественно, что шелест листьев на фоне взлетающего самолета разобрать будет невозможно, да и слушать музыку с уровнем 130 дБ крайне неприятно. Поэтому принято считать, что комфортный ДД для прослушивания музыки — 80… 100 дБ.
Искажения – не что иное, как отклонение сигнала от оригинала.
Принципы представления звука в цифровом виде
Что же происходит при оцифровке аналогового звука? Не будем углубляться в технические аспекты, разберем все, как говорится, на бумаге: для этого нарисуем нашу воображаемую «идеальную» синусоиду и будем измерять величину сигнала через равные промежутки времени (этот процесс называется дискретизацией или квантованием): мы получим некий последовательный набор значений — это и будет наш цифровой сигнал, полученный методом импульсно-кодовой модуляции (PCM) (рис. 3).
Рис. 3. Преобразование аналогового сигнала в PCM
Два основных параметра качества PCM сигнала — это частота и разрядность. Частота — это количество измерений за одну секунду, чем их больше — тем с большей точностью передаётся сигнал. Частота измеряется в герцах: 44100 Hz, 192000 Hz и др. Разрядность — количество возможных значений величины сигнала (точность передачи величины). Чем больше вариантов — тем больше точность сигнала. Разрядность измеряется в битах: 16 bit (65.536 возможных значений, ДД 96 дБ), 24 bit (16.777.216 значений, ДД 144 дБ) и др.
Рис. 4. Преобразование аналогового сигнала в DSD
Такой вид представления цифрового звука называется импульсно-плотностной модуляцией, чаще всего для него используется аббревиатура DSD. Фактически, единственный качественный параметр такого сигнала — частота. Но так как частоты используются очень высокие (от 2.822.400 Hz), такие цифры сложно запомнить, принято делить частоту DSD сигнала на 44.100 Hz. Полученное число и является показателем качества: DSD64 (ДД 120 дБ), DSD128, DSD256 и т.д.
Восстановление аналогового сигнала из «цифры»
Но оцифровка аналогового сигнала – это полдела. Для прослушивания цифровой музыки нужно выполнить обратное преобразование. Для начала рассмотрим, каким образом превратить в звук цифровой DSD поток. Как мы уже знаем, этот поток представляет из себя высокочастотный (2,8 МГц и более) двухуровневый сигнал, средняя величина этого сигнала меняется со звуковой частотой. То есть, если подходить к решению задачи максимально просто, — нужно отфильтровать все высокочастотные составляющие DSD потока, оставив только полезный звуковой сигнал (частоты до 20. 22 кГц). Делается это с помощью аналогового фильтра низкой частоты (ФНЧ). Простейший ФНЧ – это RC цепочка. Сигнал полученный, после прохождения этой цепочки, показан на рис. 5.
Рис. 5. Восстановление аналогового сигнала из DSD
Как видим, полученный график лишь отдаленно напоминает исходную синусоиду. Но не забываем, что мы «применили» простейший фильтр, улучшая схему фильтра можно добиться практически полного отсутствия высокочастотного шума и получить аналоговый звук с хорошими качественными показателями.
Для восстановления аналогового сигнала из цифрового PCM недостаточно только лишь аналогового ФНЧ, нужно предварительно расшифровать цифровые данные, для этого используются цифро-аналоговые преобразователи (ЦАПы). Бывают они разных типов, но описывать их все в задачи данной статьи не входит. Остановимся на 2-х самых распространённых типах в звуковой технике. Во-первых, это так называемый ЦАП лестничного типа (его ещё называют мультибитным). Как вы, наверное, догадались, такой ЦАП преобразует PCM поток цифровых данных в поток величин звукового сигнала, которые на графике выглядят как лестница (рис. 6). Как и в случае DSD, обязательно использование аналогового фильтра для сглаживания «ступенек».
Рис. 6. Восстановление аналогового сигнала из PCM
Зачастую, в таких преобразователях используется промежуточная передискретизация цифрового PCM сигнала в более высокие значения частоты (например, 192 кГц): это уменьшает «ступеньки», что позволяет упростить схему аналогового фильтра.
Второй тип ЦАП – дельта-сигма – использует передискретизацию в ещё большие значения частоты с одновременным уменьшением разрядности до одного бита. Ничего не напоминает? Это же знакомый нам DSD сигнал! Как далее обработать такой сигнал и превратить его в аналоговый, мы уже рассматривали выше.
Применение PCM и DSD, достоинства/недостатки
Где же мы можем встретить каждый из способов кодирования? PCM формат очень распространён: CDDA диски, DVD Audio, файлы MP3, FLAC, ALAC, AAC, звук в фильмах, и далее, и далее, проще сказать, когда не-PCM. Super Audio CD диски, DSD диски, файлы DSF, DFF — это DSD формат. Что же всё-таки лучше? При воспроизведении какого формата мы получим более качественный звук?
В статьях, посвященных DSD формату, описано множество преимуществ перед PCM, но все ли описываемые преимущества верны или это мифы, придуманные для обывателей, не разбирающихся в технической составляющей, чтобы отвоевывать рынок, плотно занятый PCM форматом? Давайте кратенько пройдемся по списку.
Рис. 7. Динамический диапазон / шум при преобразовании между DSD и PCM
Что такое DSD-аудио? Как это работает и где взять файлы?
Сохранить и прочитать потом —
Похоже, формат DSD вновь входит в моду. Большинство новых цифровых устройств обеспечивают его поддержку, а каталог доступных альбомов внушает уважение – особенно у любителей джаза и классики.
Что же это такое и чем отличается от других систем записи цифровых сигналов, применяющихся в компакт-дисках и других форматов Hi-Res-аудио? Давайте узнаем.
Подробнее о PCM
Цифровые потоки записываются в виде комбинации двух состояний, 0 и 1; но для того, чтобы эту информацию можно было использовать, она должна быть организована особым образом. Почти во всех случаях используется система под названием PCM (Pulse Code Modulation, импульсно-кодовая модуляция).
Давайте вначале вспомним, как именно работает PCM.
При использовании PCM исходная форма аналогового аудиосигнала описывается при помощи двух параметров. Первый – это величина. На компакт-диске она представлена 16-разрядными цифровыми данными, что дает возможность задавать 65 536 различных уровней сигнала.
Для адекватного представления исходной формы сигнала ее необходимо измерять с точно отмеренными регулярными интервалами. Эти отсчеты выполняются 44 100 раз в секунду. Число выглядит случайным, однако его выбор был очень продуманным – оно обеспечивает покрытие полного диапазона слышимых человеком частот (от 20 Гц до 20 кГц).
DSD and SACD
Технология DSD (Direct Stream Digital) использует другой подход. Она была разработана в середине 90-х как способ архивирования старых аналоговых записей.
Предполагалось, что это будет более простой и экономичный с точки зрения занимаемой памяти способ хранения цифровых музыкальных данных по сравнению с PCM. Что особенно важно, DSD также изначально разрабатывался с учетом возможности преобразования в файлы формата PCM с частотой дискретизации, кратной 44,1 кГц.
Примерно в то же время компании Sony и Philips работали над заменой CD, который в конечном итоге принял форму SACD. Система DSD представлялась идеальной основой для создания нового формата – в частности, благодаря превосходной защите от копирования.
Основным достоинством DSD была простота и вытекающая из нее дешевизна реализации. Эта технология требовала меньшего уровня обработки, чем PCM, благодаря чему можно было применять более простые и намного менее дорогие ЦАП.
Как работает DSD?
DSD использует один бит информации, который говорит только о том, больше или меньше предыдущего фрагмента аналогового сигнала оказывается текущий. По сравнению с 65 тысячами разных значений, которые может принимать сигнал PCM, всего лишь два (0 в случае, если уровень сигнала нового отсчета ниже, и 1 – если он выше) у сигнала DSD кажутся категорически недостаточными для передачи нужной информации.
Однако нехватка информации компенсируется очень высокой частотой дискретизации – более 2,8 миллиона раз в секунду, что в 64 раза превышает соответствующий параметр для CD. Из-за этого DSD-формат стандартного разрешения нередко обозначают как DSD64, а его версии с удвоенной и учетверенной частотой дискретизации – как DSD128 и DSD256, соответственно. Существует даже спецификация DSD512, хотя нам не доводилось слышать, чтобы с ее применением был записан какой-то материал.
Записи в стандартном формате DSD по-прежнему достаточно редки по сравнению с альтернативными вариантами в PCM, а с повышенным разрешением встречаются еще намного реже. Однако поклонники DSD утверждают, что этот формат обеспечивает максимальную близость к аналоговому звучанию.
Если бы можно было увидеть цифровой поток формата DSD, нарисовать соответствующий аналоговый сигнал стало бы возможно, просто взглянув на распределение нулей и единиц. Чем больше нулей, тем меньше его величина; чем больше единиц, тем она больше. Если два значения встречаются примерно поровну, уровень сигнала близок к нулевому.
В чем недостатки формата DSD?
Плеер Astell & Kern AK70 mkII перед воспроизведением преобразует файлы формата DSD в PCM
Все это прекрасно, но у формата DSD есть и минусы. В частности, в нем сложно работать с записями.
Для выполнения любых обработок записи – например, эквализации, редактирования, управления динамическим диапазоном и добавления реверберации – обычно приходится преобразовывать DSD в PCM, выполнять необходимые преобразования и затем конвертировать обратно в DSD.
Этот способ сложно назвать простым и прямолинейным, однако он применяется практически для каждой студийной записи, выполненной по технологии DSD. Все дело в отсутствии подходящего оборудования и соответствующего программного обеспечения.
В описании диска может встретиться обозначение DXD. Это означает, что исходный сигнал в DSD был преобразован в PCM с параметрами 24 бит/352 кГц и обрабатывался в этом виде. Несмотря на то, что название, намеренно или нет, звучит похоже на DSD, по сути, это просто PCM с очень высоким разрешением.
Кроме того, аналоговому сигналу, полученному из DSD, присущ высокий по сравнению с PCM уровень шума. Продуманные технологии позволяют инженерам вывести эти шумы за границу слышимого диапазона частот и оптимизировать качество звука и шкалу динамики в пределах слышимого спектра. Высокочастотный шум обычно отфильтровывается.
Относится ли формат DSD к Hi-Res-аудио?
Насколько высокое разрешение имеют записи в DSD? Точно установить соотношение между PCM и DSD невозможно, но базовый формат примерно соответствует PCM с параметрами дискретизации 24 бит/88,2 кГц.
Заявленный динамический диапазон DSD составляет около 120 дБ в пределах слышимости. Для сравнения, у обычных CD он равен 96 дБ, а теоретический максимум записей в 24/192 достигает 144 дБ.
Большие числа смотрятся впечатляюще, но на деле даже диапазона CD более чем достаточно для любой записи.
Как воспроизводить DSD-файлы?
Chord Hugo 2 способен воспроизводить файлы вплоть до DSD512
В последние годы цифровые компоненты все чаще поддерживают воспроизведение DSD; это связано с повышением доступности скачиваемых аудиозаписей. Проверьте, поддерживают ли этот формат ваши портативный музыкальный, сетевой плеер и/или ЦАП.
Самые современные цифровые устройства среднего и высшего класса, как правило, обладают такой поддержкой; если ваши компоненты относятся к их числу, обязательно добавьте этот формат к уже привычным FLAC и WAV. Некоторые флагманские смартфоны также совместимы с DSD. И даже пользователи Apple iPhone могут воспроизводить DSD-файлы при помощи дополнительного оборудования.
На сайтах для скачивания музыки время от времени можно встретить обозначения DSF и DFF. Это две разновидности DSD-файлов; все, что реально нужно о них знать – всегда выбирайте версию DSF, если ваш плеер ее поддерживает, поскольку она лучше работает с метаданными (такими как имя исполнителя, название песни, обложка альбома и тому подобные).
Где купить аудиофайлы в формате DSD?
Альбомы в DSD можно приобрести на сайте HDtracks
Большинство крупных сайтов для аудиофилов предлагают возможность покупки DSD-файлов для скачивания. Можно начать с таких источников, как HDtracks, Highresaudio и Primephonic.
Если же вы предпочитаете физические форматы и являетесь обладателем совместимого проигрывателя, SACD можно найти почти повсюду.
Подготовлено по материалам портала «What Hi-Fi?», май 2020 г.
О формате SACD/DSD. Описание технологии, воспроизведение, конвертирование
В качестве продолжения цикла статей об экзотических алгоритмах кодирования и носителях аудиоданных (уже можно почитать про DVD-Audio, HDCD и DTS/DTS-CD) хочу рассказать о таком интересном стандарте, как SACD.
1. SACD диски. Формат DSD
Super Audio Compact Disc — как и Audio CD — результат сотрудничества компаний Sony и Philips. Разработка стандарта была завершена в 1999 году — через 17 лет после выхода Red Book (CDDA).
SACD представляет собой оптический диск с высокой плотностью данных, по физическим размерам и объёму данных соответствующий диску DVD. Также у DVD и SACD совпадает длина волны считывающего лазера — 650 нм против 780 у CDDA (именно увеличение частоты позволило увеличить плотность питов и, как следствие, объём носителя). Одной из отличительных особенностей SACD является использование золота в качестве отражающего слоя (вместо алюминия). Это увеличивает отражающую способность, долговечность дисков, но также обуславливает их высокую стоимость.
Особый интерес представляет собой содержимое диска — данные в формате Direct Stream Digital. DSD — это однобитный поток с очень высокой частотой дискретизации: стандартные файлы DSD64 имеют частоту семлирования 2822,4 кГц (в 64 раза больше частоты для CDDA). По сути это тот самый поток, который получается на выходе сигма-дельта АЦП.
Особенностью сигма-дельта АЦП является кодирование не абсолютного значения уровня сигнала в конкретный момент времени, а его приращения.
Схема сигма-дельта АЦП
На выходе этого АЦП мы получаем нули и единицы, следующие с очень высокой частотой. Причем уровень сигнала пропорционален сумме закодированных за единицу времени приращений (1 означает «+1», а 0 — «-1»).
Подробнее об алгоритме работы данного АЦП можно почитать здесь. Вкратце — такой способ квантования позволяет получить широкий динамический диапазон (около 120 дБ) и очень низкий уровень шумов в слышимом диапазоне частот — за счет формовки шума (noise shaping) они вытесняются в сверхзвуковую область и могут быть легко отфильтрованы. Также, благодаря многократному превышению частоты Найквиста, такой способ помогает избежать фазовых задержек в области верхней граничной частоты (однако степень влияния этого фактора на качество звучания точно не установлено) и уменьшить влияние джиттера.
Итак, главным преимуществом SACD является отсутствие необходимости в так называемой децимации — понижении частоты дискретизации — ведь в действительности это промежуточное преобразование происходит в случае со всеми остальными форматами аудио, использующими PCM (CDDA, DVD-A). Т. е. при оцифровке студийной записи на выходе АЦП мы фактически получаем DSD поток, затем его приходится преобразовывать в PCM с повышенной разрядностью, но более низкой частотой дискретизации, что уже представляет собой алгоритм с потерями. И — что самое интересное — при воспроизведении, непосредственно перед цифро-аналоговым преобразованием (а, как известно, в аудиотехнике используется именно дельта-сигма ЦАП), частоту дискретизации всё равно придется повышать, выполняя преобразование в тот самый 1-битный DSD формат, в котором данные были сняты с АЦП.
Таким образом SACD позволяет хранить аудио в «первозданном» виде, и в таком же виде подавать их при воспроизведении на ЦАП. Отсутствие промежуточной децимации упрощает схемотехнику устройств и позволяет добиться более высоких показателей качества.
Примечание: к сожалению, ко всему вышесказанному нужно добавить большую «ложку дёгтя»: во многих случаях на студиях звукозаписи для мастеринга записей всё же используется промежуточное преобразование в PCM. Несмотря на то, что в 2000 году был разработан формат DSDIFF (расширение файлов *.dff), предназначенный для записи, редактирования и мастеринга аудио непосредственно в DSD представлении, его возможности весьма ограничены, и на многих студиях для сведения и мастеринга используется формат Digital eXtreme Definition. DXD по сути представляет собой стандартизированный PCM аудио с очень высокой частотой — 352.8 или 384 кГц и разрядностью 24 или 32 бит. Этот формат был придуман и использовался для мастеринга записей с высоким разрешением на студиях звукозаписи Pyramix (Merging Technologies), производивших SACD. Таким образом, для большинства SACD и DSD дисков исходником является именно DXD.
Существуют различные вариации стандартов SACD/DSD — с разной степенью оверсемплинга. Они обозначаются цифрой, равной отношению частоты дискретизации DSD к частоте дискретизации CDDA (44.1 kHz). SACD использует формат DSD64 (2822.4 kHz/ 44.1 kHz = 64), также разработаны и новые спецификации DSD128, DSD256 и DSD512, дополнительно увеличивающие частоту в 2, 4 и 8 раз. Таким образом мы получаем максимальную частоту 22579,2 кГц для DSD512, однако найти такие записи очень сложно, и далеко не все DSD-ЦАП их поддерживают. Кроме того, есть разрешения DSD, базирующиеся на частоте 48 кГц: например, 48kHz based DSD128 будет иметь частоту не 2822.4, а 3072 кГц, и т. д.
SACD поддерживает конфигурацию каналов 2.0 и 5.1, причем на одном SACD могут содержаться две дорожки — стерео и многоканальная. Многоканальная дорожка обязательно представляется в сжатом виде (сжатие без потерь; для стерео — опционально), так называемом DST формате (Direct Stream Transfer), который обеспечивает сжатие в 2—3 раза.
Так же, как и DVD, SACD бывают одно- и двухслойные. На однослойных SACD может содержаться CDDA слой для обратной совместимости с проигрывателями без поддержки технологии SACD (такие диски называются гибридными).
2. Защита SACD от копирования. Распространение аудио в формате DSD
Все SACD диски обладают специальной защитой (на физическом уровне), которая позволяет считывать SACD слой только лицензированным производителем устройствам, которые оснащены специальным ключом. Тем не менее, в интернете можно найти раздачи SACD рипов. Снятие рипов выполняется с помощью PlayStation 3 (или подходящего проигрывателя со специальной прошивкой) и специальной программы SACD Ripper для ПК. Рип представляет собой так называемый SACD-R образ (как правило в формате ISO). Этот образ можно записать (тем же ImgBurn, например) на DVD диск и далее слушать на стационарном SACD проигрывателе.
Таким образом мы видим, что технология SACD не включает в себя ничего принципиально нового — по сути это поток данных с АЦП, записанный на носитель вроде DVD. Весомое различие между SACD и DVD диском (кроме защиты от копирования) заключается лишь в размере сектора — 2064 вместо 2048 байт. Похоже, что этот трюк был придуман в коммерческих целях, и во многом именно поэтому ни один оптический привод для ПК не читает SACD диски.
Кроме SACD дисков DSD аудио также может распространяться и в виде файлов, в том числе записанных на так называемый DSD disc. Спецификация была разработана Sony и представляет собой DVD или Blue-ray носитель с файлами формата DSF (DSD Storage Facility), содержащими стерео звук. Многоканальное аудио стандартном не поддерживается, хотя формат DSF открытый и вполне может содержать многоканальное аудио, которое будут читать программные плееры (например, foobar2000). Минусом Sony DSF, как контейнера для хранения DSD, является отсутствие поддержки DST сжатия. Для поддержки DST сжатия следует использовать более сложный контейнер Philips DSDIFF, о котором было сказано ранее.
3. Как воспроизвести SACD?
Воспроизвести SACD диск на приводе ПК, как я уже сказал, невозможно, поэтому далее я буду рассматривать исключительно воспроизведение образов (SACD-R, DSD-Disc).
3.1 Воспроизведение на устройствах с поддержкой DSD
Если Вы счастливый обладатель звуковой карты / ЦАП с поддержкой DSD, поздравляю — вы сможете успешно воспользоваться преимуществами Super Audio CD. Как настроить правильный вывод DSD — я расскажу ниже.
3.1.1 Native DSD и DoP
Существует два варианта доставки DSD потока на ЦАП: native («родной») DSD и DoP (DSD over PCM). В первом варианте поток поступает на карту именно в том виде, о котором шла речь выше — с очень высокой частотой дискретизации и разрядностью 1 бит. Второй же вариант был разработан для совместимости с существующими PCM-транспортами (чтобы не сочинять новые алгоритмы передачи, а использовать уже имеющиеся для PCM) и представляет собой простое мультиплексирование высокочастотного 1-битного потока в 24-битный PCM с более низкой частотой, в котором старшие 16 бит содержат фрагмент DSD потока, а младшие 8 — специальный DoP-маркер, служебную информацию, говорящую, что данные являются не обычным PCM, а упакованным DSD потоком. Так, для передачи стандартного DSD64 с частотой 2822.4 кГц используется PCM формата 24 бит 176.4 кГц, который легко можно передать по USB, S/P-DIF и другим привычным интерфейсам. С повышением частоты DSD, соответственно, повышается и частота PCM-носителя. Так как поддержка PCM с частотой 705,6 кГц весьма скудная, то проигрывание DSD256 через DoP уже, как правило, не представляется возможным. Также нужно отметить, что процесс мультиплексирования/демультиплексирования самый что ни на есть простой и не предполагает никаких потерь информации/качества. Приведу пример в десятичной системе: представьте, что у вас есть значения 2, 5, 3, 6, 9, 0 и т. д., и вы называете их своему товарищу по-очереди — это обычная передача. Теперь представьте, что Вы условились читать имеющиеся значения «пачками», трехзначными числами — 253, 690 и т. д. — а товарищ будет по-прежнему записывать цифры по отдельности — это и есть мультиплексирование/демультиплексирование. Более чем просто, не правда ли?
3.1.2 Настройка foobar2000
Итак, приступим к настройке воспроизведения. Наш инструментарий для воспроизведения SACD образов (имеющих формат ISO) включает в себя последние версии foobar2000 с плагинами SACD Decoder, DSD Processor и ASIO-драйвером DSD Transcoder (скачать можно там же, одним архивом с foo_input_sacd), а также ASIO-драйвер ASIO Proxy, который может нам понадобиться вместо DSD Transcoder в некоторых случаях.
Теперь нужно определиться, что мы имеем в плане оборудования. В моём распоряжении на данный момент находится USB-ЦАП iFI nano iDSD. Итак, смотрим в спецификацию и видим, что наше устройство поддерживает PCM вплоть до 384 кГц и DSD вплоть до 12.4 МГц. Таким образом, это означает поддержку всех форматов PCM (в спецификации это не указано, но карта поддерживает разрядность до 32-бит), включая DXD, поддержку DSD64 и DSD128 через DoP или native DSD, а также, дополнительно, поддержку DSD256 — только через native DSD (в последней версии прошивки добавлена поддержка вывода DSD256 также и в режиме DoP).
Вот, как выглядят настройки SACD декодера в нашем случае:
Настройки SACD декодера для DSD вывода
Здесь мы включили декодирование в формате DSD и включили использование DSD Processor. Кстати, если вы хотите, чтоб в плеере работали визуализации, можете установить декодирование в формате DSD+PCM, однако помните, что это негативно отразится на производительности. Остальные настройки:
Editable tags — включает возможность редактирования тегов. При этом новые теги пишутся не в файл образа, а в XML файлы в папке foobar2000/sacd_metabase.
Store tags with ISO — если включено, XML файл со значениями тегов сохраняется в той же папке, что и ISO образ.
Linked 2CH/MCH Tags — создаёт связь между тегами стерео и многоканальной версий трека, так что изменения в одном варианте влекут изменения и для второго.
Edited Master Playback — включает воспроизведение оригинальной мастер-записи, включая участки, которые не были включены при разметке SACD-диска. При этом фактическое время звучания некоторых треков может быть на несколько секунд больше, что может привести к неверному отображению текущей позиции воспроизведения.
Настройки DSD процессора для iFi nano iDSD
DSD процессор нам нужен для того, чтобы сконвертировать неподдерживаемые форматы DSD в максимальный поддерживаемый. Кстати говоря, с сожалением отмечу, что по данным разработчика для преобразования DSD->DSD используется промежуточное преобразование в PCM (хотя и весьма качественное). Для nano iDSD я включил конвертацию DSD512 в DSD256 с использованием SDM Type D — максимально качественный фильтр 5-го порядка, использующий расчеты в 64-битном формате с плавающей точкой. Для интересующихся различиями между разными типами сигма-дельта модуляторов — SDM Type A/B/C/D — привожу таблицу:
Sample&Hold выключено (эта опция включает упрощение алгоритма за счет использования интерполяции нулевого порядка, что помогает снизить нагрузку на процессор, но негативно отражается на качестве).
Настройки DSD Transcoder для iFi nano iDSD
Тут я просто установил вывод всех форматов DSD в режиме native. Параметр Transition отвечает за добавление тишины в начало треков, его можно увеличить, если вы заметите, что треки начинают звучать не сразу. Параметр Sample position override необходим, если в плеере некорректно отображается позиция воспроизведения (прошедшее/оставшееся время).
Далее осталось только выбрать вывод DSD на транскодер:
Кстати говоря, выбранная разрядность здесь роли не играет, т. к. конвертер глубины бит при DSD выводе не используется.
3.1.3 Проверка работоспособности настроек
Как видите, семпл воспроизводится, а в панели iFi (панель устройства ASIO можно открыть двойным кликом по названию в списке устройств ASIO — см. выше) отображается частота нативного DSD256.
3.1.4 Настройка для нескольких DSD устройств
Это всё хорошо, но только если вы пользуетесь для воспроизведения DSD только одним устройством. А что делать, если устройств несколько, и у них разная поддержка DSD (например, один ЦАП поддерживает DSD256, а другой — нет) — ведь в таком случае нужно будет постоянно менять настройки DSD процессора? В этом случае на помощь приходит ASIO Proxy и Custom channel mappings в foobar2000. Установите драйвер ASIO Proxy и затем добавьте новый пресет для ASIO, перейдя в настройках в Playback->Output->ASIO и нажав Add new в разделе Custom channel mappings. В открывшемся окне выберите драйвер foo_dsd_asio и введите подходящее название:
После этого нажмите Configure — появится окно настройки ASIO Proxy.
Настройки ASIO Proxy для iFi nano iDSD
Как видите, ASIO Proxy совмещает в себе функционал DSD транскодера и DSD процессора, позволяя настроить все параметры индивидуально для каждого устройства. Для своего ЦАП я выбрал настройки аналогичные приведённым ранее.
Обратите внимание: в ASIO Proxy кроме стандартных режимов DSD и DoP есть еще специальные режимы DoP для ЦАП-ов dCS и exD.
После сохранения настроек осталось выбрать устройство вывода DSD: ASIO: iFi nano iDSD custom и убедиться, что воспроизведение работает. Так и есть, панель iFI по-прежнему отображает частоту 11289.6 кГц.
Теперь можно аналогично создать новые пресеты ASIO с установками для любого другого ЦАП — затем останется лишь переключать при необходимости устройства вывода.
3.1.5 Устранение проблем
Если вы настроили всё согласно моей инструкции и спецификации своего устройства, но DSD поток не воспроизводится или воспроизводится с искажениями/щелчками, то попробуйте следующее:
Если плеер (или вся система) тормозит и/или наблюдаются искажения, обратите внимание на загруженность процессора, в частности на то, сколько процессорных ресурсов потребляет foobar2000 (можно посмотреть в Диспетчере задач Windows). Если плеер слишком перегружает систему — попробуйте убрать из него лишние визуализации. Также большую нагрузку на процессор при старте трека может давать Waveform Seekbar, т. к. он дополнительно декодирует и анализирует всю запись (попробуйте временно удалить плагин).
Если воспроизведение идёт с щелчками или искажениями: откройте панель вашего ASIO устройства (для этого поставьте воспроизведение на стоп, зайдите в Preferences->Playback->Output->ASIO и дважды щёлкните по названию ASIO драйвера) и проверьте настройки буфера вывода. Например, драйвер iFi пишет, когда размер буфера вывода не соответствует выбранному режиму и текущей частоте дискретизации:
Чтобы увидеть это предупреждение, нужно открыть панель устройства во время воспроизведения DSD, но чтобы изменить настройки воспроизведение обязательно нужно остановить.
Если вы испытываете проблемы с выводом DSD и видите такое предупреждение, увеличьте буфер вывода. Чтобы проверить, действительно ли проблема в буфере — установите максимально безопасный режим (Extra Safe) и увеличивайте размер буфера до тех пор, пока во время проигрывания не перестанет отображаться предупреждение. Даже если у вас другая панель — всё равно попробуйте увеличить буфер, часто это помогает от щелчков и искажений.
Поменяйте режим вывода DSD на DoP (или наоборот) — возможно, с одним из них драйвер работает лучше.
Обновите драйвер и (после обновления драйвера) прошивку (Firmware) вашего ЦАП — это может помочь, если проблемы воспроизведения связаны с каким-то багом в ПО. За последними драйверами/прошивками и инструкциями обращайтесь на сайт производителя устройства.
3.2 Настройка декодирования и вывода в PCM
Если пока Вы не располагаете DSD-совместимым устройством — что ж, не беда, можно просто преобразовать DSD в PCM с высоким разрешением. Также декодирование в PCM понадобится, если вам необходимо выполнять дополнительную обработку потока с помощьюб DSP (как я писал выше, при выводе DSD потока все обработчики отключаются).
Настройки SACD декодера для вывода PCM
В настройках декодера можно задать целевую частоту дискретизации и алгоритм преобразования DSD в PCM. Multistage является SSE-оптимизированным алгоритмом и использует плавающую точку с одинарной (32fp) или двойной (64fp) точностью. Direct метод является более медленным (примерно на 40% медленнее Multistage) и выполняет фильтрацию частот выше 30 кГц. Installable FIR режим позволяет загрузить одну из приложенных к плагину предустановок ФНЧ, давая таким образом возможность выбирать граничную частоту.
Спектр аудио 192 кГц, полученного алгоритмом Multistage (64fp). На графике виден высокий уровень шума в сверхзвуковом диапазоне, обусловленный нойз-шейпингом
Лично я советую выбрать режим Direct (64fp, 30kHz LF), чтобы исключить интермодуляции от ультразвуковых частот, и максимальную частоту дискретизации, а в DSP (обязательно в самое начало цепочки) поставить SoX ресемплер до опорной частоты звуковой карты (её, в свою очередь, установить максимальной). Касаемо настроек — рекомендую почитать мою статью про качественный вывод звука.
Воспроизведение SACD-R в foobar2000. В плейлист загружены сжатые в DST стерео и 5.1 дорожки (битрейт отображается для декодированного DSD). На ВЧ шум на спектрограмме отсутствует, т. к. использован 30 кГц ФНЧ
4. Конвертирование SACD
Конвертирование SACD и DSD ничем не отличается от преобразования того же Hi-Res рипа 24/192 или т.п., единственное что предварительно необходимо настроить декодер для вывода PCM (или DSD+PCM), причем достаточно переключить в одни из этих режимов, настроить необходимые параметры, после чего можно вернуть режим вывода DSD — во время конвертирования декодер будет работать в режиме PCM. Всё остальное уже описано в статье Преобразование аудио высокой разрядности в 16 бит/44.1 кГц стерео.