Форматы передачи видеосигналов SDI/HD-SDI: задачи, описание и функциональность
14 октября 2019 года завершился двухлетний масштабный проект Правительства РФ – полный переход отечественного телевещания в цифровой формат. Эта реформа – закономерный результат технического прогресса в развитых странах: европейские государства активно переходят на цифровое вещание. В статье рассмотрим особенности работы с форматом SDI и тонкости перехода с аналогового формата видео на цифровое.
14 октября 2019 года завершился двухлетний масштабный проект Правительства РФ – полный переход отечественного телевещания в цифровой формат. Эта реформа – закономерный результат технического прогресса в развитых странах: европейские государства активно переходят на цифровое вещание.
Причины всеобщего перехода на «цифру»
Перспективность цифрового вещания не вызывает вопросов.
Во-первых, современное оборудование и всеобщая компьютеризация и цифровизация влияют на современный мир. Появились программные способы обработки сигналов, методы монтажа и обработки видео, недоступные для «плёнки».
Free-Flow является запатентованной технологией британского производителя KVM-оборудования Adder Technology
В-третьих, качество цифрового видео значительно превосходит аналоговое. Аналоговый сигнал при передаче сильно деформируется, в зависимости от расстояния, числа компонентов тракта, погоды. Возникали помехи в виде «полосок», «звездочек», постороннего шума, зависания видео.
В-четвертых, современная видеоаппаратура (мониторы, телевизоры, иное оборудование) может раскрыть весь свой потенциал только с «цифрой». Такие операции, как, например, набирающее популярность интерполяционное масштабирование (достижение изображения наилучшего качества в цвете и яркости пикселя, основываясь на значениях окружающих пикселей), актуальны в современном вещании. Однако они либо невозможны в сочетании с традиционными сигналами, либо возможны, но с применением преобразователей.
Но стоит понимать, что эти несомненные плюсы могут так и не стать преимуществами. Дело в том, что сигналы в процессе обработки множество раз перемещаются между студией и аппаратной, между серверами и компьютерами редакторов, монтажеров и операторов. Такие неоднократные перемещения с преобразованиями аналоговых сигналов в цифровые чреваты теми же проблемами, что и при трансляции чистого аналогового сигнала.
Производители видео- и звукозаписывающего оборудования предлагают телестудиям широкий выбор устройств, исключающих критически важные преобразования аналогового сигнала в цифровой. В идеале лучшим техническим решением было бы вовсе исключить промежуточные преобразование сигналов, кроме последнего, когда непосредственно перед эфиром необходимо преобразовать цифровой сигнал в аналоговый.
Что такое SDI
Чтобы перейти на цифровое телевещание, студиям, прежде всего, придется организовать инфраструктуру для передачи видео в «цифре» без потерь. Перепрокладывать всю кабельную сеть было бы очень дорогим и времязатратным шагом, тем более что под трансляцию цифрового сигнала можно адаптировать уже имеющиеся коаксиальные сети, ранее служившие для передачи аналогового. Для этого необходимо лишь оснастить аппаратные комплексы дополнительными устройствами без необходимости обновления уже имеющейся кабельной системы.
Вопреки устоявшемуся мнению, просто перевести аналоговый сигнал в цифровой недостаточно. Телесигнал, который передается в эфир, имеет сложную структуру: композитное видео плюс аудио в виде частотно-модулированной поднесущей. Но студийная кабельная сеть в основном однолинейная, а не трехлинейная, как это мыслится для передачи цифрового телесигнала.
Специально под эти нужды был разработан особый формат цифрового видео – SDI (Series Digital Interface). Так называемый последовательный цифровой интерфейс транслирует одновременно три сигнала: два – цветоразностных и один – яркости, – а также обеспечивает точную передачу видеосигнала на значительные расстояния.
Проблемы внедрения формата SDI
При оцифровке высокочастотных сигналов возникают трудности с обработкой данных больших объемов, что, в свою очередь, негативно сказывается на скорости передачи. Диапазон частот сигнала достигает сотен мегагерц. Нужная скорость и сохранение изначальной формы сигналов достигается расширенной полосой тракта. Полоса представляет собой выраженную синусоиду, где наглядно видно такое явление, как джиттер. Джиттер – это своего рода дрожание фронтовых фаз. Это дрожание провоцирует возникновение ошибок и помех. Низкочастотный джиттер (НЧ-дрейф) появляется на частоте ниже 10 Гц и практически не влияет на качество передачи. Высокочастотный же приводит к помехам и ошибкам. Расчет минимального значения для ВЧ-джиттера:
Проблему устраняют, как правило, восстановлением тактовой частоты сигналов. Однако стоит учесть, что существует порог деформирования сигнала, по достижении которого сигнал не восстановить без ущерба для восприятия.
Современное KVM оборудование позволяет передавать сигналы видео, аудио и USB в одном пакете (по одному кабелю) без потерь практически на любые расстояния. См., например, решения:
Некоторые технические особенности формата SDI
Типы кабелей для передачи сигналов в формате SDI и требования к сетям
| Коаксиальный кабель | Оптоволоконный кабель | |||||||||||||||||||||||||||||||||||||||||||
| Важные характеристики | 75 Ом с терминалами BNC |
| Стандарт | Название | Когда введен | Битрейты | Примеры форматов видео |
|---|---|---|---|---|
| SMPTE 259M | SD-SDI | 1989 | 270 Мбит/с, 360 Мбит/с, 143 Мбит/с и 177 Мбит/с | 480i, 576i |
| SMPTE 344M | ED-SDI | 540 Мбит/с | 480p, 576p | |
| SMPTE 292M | HD-SDI | 1998 | 1,485 Гбит/с и 1,485/1,001 Гбит/с | 720p, 1080i |
| SMPTE 372M | Dual Link (двухканальный) HD-SDI | 2002 | 2,970 Гбит/с и 2,970/1,001 Гбит/с | 1080p60 |
| SMPTE 424M | 3G-SDI | 2006 | 2,970 Гбит/с и 2,970/1,001 Гбит/с | 1080p60 |
| SMPTE ST-2081 | 6G-SDI | 2015 | 6 Гбит/с | 2160p30 |
| SMPTE ST-2082 | 12G-SDI | 2015 | 12 Гбит/с | 2160p60 |
| SMPTE ST-2083* | 24G-SDI | 24 Гбит/с | 2160p120 |
* Рабочая группа 32NF-70 в процессе работы над стандартом ST-2083 для передачи по SDI данных со скоростью 24 Гбит/с.
Скорости передачи данных
Для передачи последовательного цифрового видеосигнала используется несколько скоростей передачи данных:
Другие интерфейсы
SMPTE 297-2006 описывает оптоволоконную систему для передачи последовательных (побитово) цифровых сигналов. Он предназначен для передачи сигналов SMPTE ST 259 (от 143 до 360 Мбит/с), сигналов SMPTE ST 344 (540 Мбит/с), сигналов SMPTE ST 292-1/-2 (1,485 Гбит/с и 1,485/1,001 Гбит/с) и сигналов SMPTE ST 424 (2,970 Гбит/с и 2,970/1,001 Гбит/с). В дополнение к спецификации оптических систем, ST 297 также определяет проведение испытаний безопасности лазера и маркировку всех оптических интерфейсов, указывающую на соответствие безопасности, применение и функциональную совместимость.
Формат данных
В приложениях SD и ED формат последовательных данных имеет ширину 10 бит, тогда как в приложениях HD ширина равна 20 бит, разделенных на два параллельных 10-битовых потока данных (известных как Y и C). SD поток данных устроен следующим образом:
Cb Y Cr Y’ Cb Y Cr Y’
в то время как HD потоки данных устроены так:
Y Y Y’ Y Y’ Y Y’ Y Y’ C Cb Cr Cb Cr Cb Cr Cb Cr
Для всех интерфейсов SDI (за исключением устаревших композитных кодировок) основной кодировкой цвета является YCbCr формат 4:2:2. Канал яркости (Y) кодируется в полной полосе частот (13,5 МГц в 270 Мбит/с SD,
75 МГц в HD), выборка двух каналов цветности (Cb и Cr) по горизонтали уменьшается, и они кодируются в уменьшенной вдвое полосе частот (6,75 или 37,5 МГц). Отсчеты Y, Cr и Cb совмещаются (выбираются в один и тот же момент времени), а отсчет Y’ получается в промежутке и находится по времени посередине между двумя соседними Y отсчетами.
Вышеприведенное описание отсчетов яркости Y относится и к отсчетам цветности C. Обозначения Cr и Cb далее относятся к «цветоразностным» сигналам красного и синего. В этой статье рассматривается только основная цветовая кодировка SDI, но возможны и другие цветовые кодировки при рассмотрении интерфейса в качестве общего 10-битного канала данных. Использование других цветовых кодировок, а также преобразование цветового пространства в и из цветового пространства RGB описано ниже.
Полезная нагрузка видео (а также полезная нагрузка вспомогательных данных) может использовать любое 10-битовое слово в диапазоне от 4 до 1019 (от 00416 до 3FB16) включительно; значения 0–3 и 1020–1023 (3FC16–3FF16) зарезервированы и не могут появляться где-либо в полезной нагрузке. Эти зарезервированные слова предназначены для двух целей; они используются как для пакетов синхронизации, так и для заголовков вспомогательных данных.
Пакеты синхронизации
Пакет синхронизации (известный как опорный временной сигнал или TRS (timing reference signal)) появляется непосредственно перед первым активным отсчетом в каждой строке и сразу после последнего активного отсчета (и перед началом области гашения по горизонтали (перед началом строчного гасящего импульса)). Пакет синхронизации состоит из четырех 10-битовых слов, первые три слова всегда одинаковы – 0x3FF, 0, 0; четвертое слово состоит из 3 битов флагов вместе с кодом исправления ошибок. В результате существует 8 различных вариантов пакетов синхронизации.
В HD-SDI и двухканальных интерфейсах пакеты синхронизации должны появляться одновременно в обоих потоках данных: и в Y, и в C (некоторая задержка между двумя кабелями в двухканальном интерфейсе допустима; оборудование, поддерживающее двойной канал, дожно буферизовать ведущий канал, чтобы позволить другому каналу догнать первый). В SD-SDI и расширенной версии интерфейса есть только один поток данных, и, следовательно, в один момент времени приходит только один пакет синхронизации. Формат пакетов синхронизации одинаков во всех версиях последовательного интерфейса SDI.
Биты флагов в четвертом слове (обычно называемом XYZ словом) называются H, F и V. Бит H указывает на начало строчного гасящего импульса; и биты синхронизации, идущие непосредственно перед областью гашения по горизонтали, должны иметь бит H, установленный в единицу. Такие пакеты обычно называются пакетами EAV (End of Active Video, конец активного видео). Аналогично, в пакете, появляющемся непосредственно перед началом активного видео, бит H установлен в 0; это SAV (Start of Active Video, старт активного видео) пакет.
Аналогично, бит V используется для указания начала области гашения по вертикали (кадрового гасящего импульса); EAV пакет с V=1 указывает, что следующая строка (строки считаются со старта EAV) является частью вертикального интервала гашения, а EAV пакет с V=0 указывает, что следующая строка является часть активного изображения.
Бит F используется в чересстрочном и в кадрово сегментированном форматах, чтобы указать, относится ли строка к первому или второму полю (или сегменту). В форматах прогрессивной развертки бит F всегда устанавливается в 0.
Счетчик строк и CRC
В последовательном интерфейсе SDI высокой четкости (и в двухканальном HD) предусмотрены дополнительные контрольные слов для повышения надежности интерфейса. В этих форматах четыре отсчета, непосредственно следующие за пакетами EAV (но не после SAV пакетов), содержат проверочное поле циклического избыточного кода и индикатор счетчика строк. Поле CRC предоставляет CRC для предыдущей строки (CRC вычисляются независимо для потоков Y и C) и может быть использовано для обнаружения битовых ошибок в интерфейсе. Поле счетчика строк показывает номер текущей строки.
В интерфейсах SD и HD не предусмотрены поля CRC и счетчика строк. Вместо этого, для CRC проверки данных может использоваться специальный дополнительный пакет данных, известный как EDH пакет.
Нумерация строк и отсчетов
Каждому отсчету в полученном потоке данных назначается нуникальные номера строки и отсчета. Во всех форматах первому отсчету, следующему за SAV пакетом, назначается номер отсчета 0; следующий отсчет – это отсчет 1; и так далее до XYZ слова в следующем SAV пакете. В интерфейсах SD, где есть только один поток данных, нулевой отсчет – это Cb отсчет; первый отсчет – это Y отсчет; второй отсчет – это Cr отсчет, а третий отсчет – это Y’ отсчет; далее шаблон повторяется. В интерфейсах HD каждый поток данных обладает собственной нумерацией отсчетов, поэтому нулевой отсчет Y потока – это Y отсчет; следующий отсчет – это Y’ отсчет, и так далее. Аналогично, нулевой отсчет в C потоке – это Cb, затем идет Cr, затем снова Cb.
Строки нумеруются последовательно, начиная с 1, вплоть до количества строк в кадре заданного формата (обычно 525, 625, 750 или 1125 (Sony HDVS)). Определение строки 1 несколько условно; тем не менее, она однозначно определяется соответствующими стандартами. В 525-строчных системах первая строка области гашения по вертикали (кадрового гасящего импульса) является строкой 1; тогда как в других чересстрочных системах (625 и 1125 строк) строка 1 – это первая строка после перехода бита F в ноль.
Обратите внимание, что строки считаются начальными в EAV, тогда как нулевой отсчет – это отсчет после SAV. Это приводит к некоторой путанице: первый отсчет в полученной строке в видео 1080i – это отсчет номер 1920 (первый EAV отсчет в этом формате), а конец строки – это следующий отсчет 1919 (последний активный отсчет в этом формате). Обратите внимание, что это поведение несколько отличается от аналоговых видеоинтерфейсов, где переход между строками считается выполненным на синхроимпульсе, который появляется примерно в середине строчного гасящего импульса (области гашения по горизонтали).
Нумерация каналов
Нумерация каналов касается только многоканальных интерфейсов. Первому (основному) каналу присваивается номер 1, последующим каналам назначаются номера, увеличиваемые на единицу; поэтому второй (вспомогательный) канал в двухканальной системе – это канал 2. Номер канала в заданном интерфейсе указывается в пакете VPID, расположенном в вертикальном пространстве дополнительных данных.
Обратите внимание, что уровень данных в двойном канале сконструирован таким образом, что основной канал может быть передан в одноканальный интерфейс и при этом создавать пригодное (хотя и несколько ухудшенное) видео. Вспомогательный канал обычно содержит такие данные, как дополнительные младшие разряды (в 12-битных форматах), несопоставленные отсчеты в сэмплированном видео 4:4:4 (поэтому основной канал всё еще содержит действительный 4:2:2), альфа-канал или каналы данных. Если вспомогательный канал в конфигурации 1080p с двойным каналом отсутствует, первый канал всё еще будет содержать действительный сигнал 1080i.
В случае с видео 1080860, 59,94 или 50 Гц в двойном канале, каждый канал содержит действительный сигнал 1080i с той же частотой полей. Первый канал содержит 1-ю, 3-ю и 5-ю строки нечетных полей и 2-ю, 4-ю, 6-ю и т.д. строки четных полей; а второй канал содержит четные строки нечетных полей и нечетные строки четных полей. Когда два канала объединяются, результатом является изображение с прогрессивной разверткой с более высокой частотой кадров.
Вспомогательные данные
Как и SMPTE 259M, SMPTE 292M поддерживает стандарт SMPTE 291M для вспомогательных данных. Вспомогательные данные предоставляются как стандартизированный транспорт для полезной нагрузки, не содержащей видео, в последовательном цифровом сигнале; они используются для вложенного звука, скрытых субтитров, временного кода и других видов метаданных. Вспомогательные данные обозначаются пакетом из трех слов, состоящим из 0, 3FF, 3FF (противоположно заголовку пакета синхронизации), за которым следует идентификационный код из двух слов, слово счетчика данных (указывающее на размер полезной нагрузки, равный 0–255 слов), реальная полезная нагрузка и одно слово контрольной суммы. Коды, запрещенные в полезной нагрузке видео, так же запрещены и в полезной нагрузке вспомогательных данных.
Конкретные применения вспомогательных данных включают в себя вложенный звук, EDH, VPID и SDTI.
В двухканальных приложениях вспомогательные данные чаще всего встречаются в основном канале; вспомогательный канал должен использоваться для вспомогательных данных только в том случае, если в основном канале нет места. Единственным исключением из этого правила является пакет VPID; действующий пакет VPID должны содержать оба канала.
Вложенный звук
Оба последовательных интерфейса и HD, и SD обеспечивают 16 каналов вложенного звука. Эти два интерфейса используют различные методы инкапсуляции аудио: SD использует стандарт SMPTE 272M, тогда как HD использует стандарт SMPTE 299M. В любом случае сигнал SDI может содержать вместе с видео до 16 вложенных аудиоканалов (8 пар) с аудио 48 кГц, 24 бит. Обычно аудио идет в формате PCM 48 кГЦ, 24 бит (20 бит в SD может быть расширено до 24 бит), что непосредственно совместимо с цифровым аудиоинтерфейсом AES3. Они помещаются в (горизонтальные, строчные) интервалы гашения, когда SDI сигнал не несет ничего полезного, поскольку приемник генерирует собственные сигналы гашения из TRS сигнала.
В двухканальных приложениях доступны 32 канала звука, так как каждая линия связи может содержать до 16 аудиоканалов.
SMPTE ST 299-2:2010 расширяет интерфейс 3G SDI, чтобы иметь возможность передавать 32 аудиоканала (16 пар) по одной линии связи.
Поскольку интерфейс стандартной разрешения не несет контрольной суммы CRC и другой проверки целостности данных, пакет EDH (Error Detection and Handling, обнаружение и обработка ошибок) может быть опционально помещен в вертикальный интервал видеосигнала. Этот пакет включает в себя значения CRC как для активного изображения, так и для всего поля (исключая те строки, в которых может происходить переключение, и которые не должны содержать полезных данных); оборудование может вычислить свои собственные значения CRC и сравнить их с принятыми CRC, чтобы обнаружить возможные ошибки.
EDH обычно используется только с интерфейсом стандартной четкости; наличие слов CRC в HD интерфейсе делает EDH пакеты ненужными.
Для описания видеоформата всё чаще используются пакеты VPID (Video Payload Identifier, идентификатор полезной нагрузки видео). В ранних версиях последовательного интерфейса SDI всегда можно было однозначно определить видеоформат, подсчитав количество строк и отсчетов между H и V переходами в TRS сигнале. С введением двухканальных интерфейсов и стандартов с сегментированными кадрами это становится невозможным; таким образом, стандарт VPID (определен в SMPTE 352M) обеспечивает способ однозначного определения формата полезной нагрузки видео.
Полезная нагрузка и гашение видео
Активная часть видеосигнала определяется как те отсчеты, которые следуют за SAV пакетом и предшествуют следующему EAV пакету; где соответстующие EAV и SAV пакеты имеют бит V, установленный в ноль. В активной части хранится информация о текущем изображении.
Кодирование цвета
В последовательном интерфейсе SDI возможно несколько цветовых кодировок. По умолчанию (и это наиболее распространенный случай) – это 10-битные линейно дискретизированные видеоданные, закодированные как 4:2:2 YCbCr (YCbCr – это цифровое представление цветового пространства YPbPr). Отсчеты видео сохраняются, как описано выше. Слова данных соответствуют уровням сигналов соответствующих видеокомпонентов, а именно:
Обратите внимание, что масштабирование каналов яркости и цветности не одинаково. Минимумы и максимумы этих диапазонов представляют собой предпочтительные значения пределов сигнала, хотя полезная нагрузка видео может выходить за пределы этих диапазонов (при условии, что в полезной нагрузке видео никогда не используются зарезервированные значения 0–3 и 1020–1023). Кроме того, соответствующий аналоговый сигнал также может выходить за границы этого диапазона.
Колориметрия
Поскольку и YPbPr, и YCbCr получены из цветового пространства RGB, требуется преобразование. В цифровом видео обычно используются три колориметрии:
Другие кодировки цвета
Двухканальные и 3 Гбит/с интерфейсы в дополнение к 4:2:2 YCbCr поддерживают другие кодирования цвета, а именно:
Области гашения по горизонтали и по вертикали
Для участков областей гашения по вертикали и по горизонтали, которые не используются для вспомогательных данных, рекомендуется присваивать отсчетам яркости кодовое слово 64 (40 hex), а отсчетам цветности – кодовое слово 512 (200 hex); оба этих значения соответствуют уровню 0 мВ. Допускается кодирование аналоговых данных в вертикальном интервале гашения (таких как временной код или тестовые сигналы) без прерывания интерфейса, но такое использование является нестандартным (для передачи метаданных предпочтительным средством являются вспомогательные данные). Однако преобразование сигналов аналоговой синхронизации и пакетной передачи в цифровой вид не рекомендуется; и в этом нет необходимости при использовании цифрового интерфейса.
У разных форматов изображений разные требования к цифровому гашению, например, все так называемые 1080-строчные HD форматы имеют 1080 активных строк, а общее количество строк составляет 1125, из которых оставшиеся входят в область гашения.
Поддерживаемые видеофоматы
Различные версии последовательного цифрового интерфейса SDI поддерживают множество видеоформатов.



Последовательный цифровой интерфейс SDI использует разъемы BNC


