РУБРИКИ |
Система сжатия подвижных изображений MPEG-2 |
РЕКОМЕНДУЕМ |
|
Система сжатия подвижных изображений MPEG-2Система сжатия подвижных изображений MPEG-2
Поволжская государственная академия телекоммуникаций и информатики Кафедра ТВ и РВ Курсовая работа по дисциплине «Перспективные системы радиосвязи, звуковое и телевизионное вещание». Тема: «Методы сжатия движущихся изображений MPEG – 2». Выполнил: Ст-маг. гр. МТ-32 Гусейнов Т.А. Проверил: К.т.н., доц. Горчаков Б.М. Самара, 2004 Рецензия Содержание: Введение……………………………………………….…….…………..4 2. Процесс кодирования………………………………………8 3. Профили MPEG-2………………………………………….10 4. Особенности стандарта MPEG-2…………………………11 1. Общие сведения о потоке данных. Програм- мный поток………………………………………..………………....12 2. Транспортный поток………………………………………13 3. Подход к потоку видеоданных MPEG-2 как к потоку данных………………………………………………………………..15 Введение Стандарты сжатия движущихся изображений MPEG (Motion Picture Experts Стандарты MPEG-1 и MPEG-2 имеют много общего, но между ними есть и различия. Метод кодирования движущихся изображений, используемый в стандартах MPEG-1 и MPEG-2, сочетает внутрикадровое кодирование, направленное в основном на уменьшение психофизиологической избыточности в отдельных кадрах, и межкадровое кодирование, с помощью которого уменьшается избыточность, обусловленная межкадровой корреляцией. Подробно оба вида кодирования рассмотрены ниже. Целые кадры и фрагменты могут кодироваться с применением совместно межкадрового и внутрикадрового кодирования (так называемый гибридный метод) или только с применением внутрикадрового кодирования. Определены три основных части стандарта MPEG-2: . 13818-1 – Systems – устанавливает правила объединения потоков; . 13818-3 – Audio – определяет кодовое представление сигналов звукового сопровождения; . 13818-2 – Video – регламентирует кодовое представление и процесс декодирования, сжатие потока за счет устранения пространственной и временной избыточности. 1.Основные понятия стандарта MPEG-2 Как уже было сказано, представление сигналов в форме MPEG-2 позволяет
обращаться с видео и звуковыми потоками как с потоками компьютерных данных. . видеопоследовательность; . группа изображений; . изображение; . срез; . макроблок; . слайс; . блок. Видеопоследовательность – элемент потока видеоданных высшего уровня. I (Intra-coded picture) – изображение кодируется с использованием только той информации, которая заложена в нем самом; устраняется пространственная избыточность; P (Predictive coded picture) – изображение, при кодировании которого формируется разность между исходным изображением и предсказанием, полученным на основе предшествующих или последующих I. B (Bidirctory predictive coded picture) – изображение, при кодирование которого используется предсказание, сформированное на основе предшествующих и последующих I или P. При кодировании Р и В используются межкадровое кодирование, устраняющее и пространственную и временную избыточность. Серия изображений, содержащих одно I называется группой изображений, стрелками показывается направление предсказания. Чем больше группа – тем больше компрессия (Рис.1). Рис 1.1 Видеопоследовательность трех видов изображений с предсказаниями (стрелками указаны направления предсказаний) 2. Компрессия изображений в MPEG-2. 2.1 Процесс сокращения избыточности С информационной точки зрения, каждое изображение представляет собой
три прямоугольных матрицы отсчетов изображений: яркостную Y и две цветности Каждое изображение делится на срезы, которые состоят из макроблоков. Сокращение пространственной избыточности выполняется в изображении типа В случае чересстрочной развертки каждый кадр состоит из двух полей. В случае кадрового кодирования кодируемым изображением является полный кадр, который целиком хранится в запоминающем устройстве кодера. Кадровое кодирование выбирается в случаях, когда изменения во втором поле кадра относительно первого поля того же кадра незначительны. В случае полевого кодирования кодируемым изображением является каждое поле по отдельности. Первое поле кадра может использоваться для предсказания макроблоков второго поля и наоборот. 2.2 Процесс кодирования Возможно два основных режима работы кодера компрессии – с постоянной
скоростью потока и с постоянным уровнем качества декодируемого изображения. В режиме с постоянным качеством используется фиксированная матрица квантования, но при этом скорость потока компрессированных данных является переменной. Соответственно, чем больше деталей, выше активность изображения, тем больше скорость потока. Такой режим можно использовать при записи на дисковые носители в условиях отсутствия ограничении на объем, однако возможны ограничения на скорость воспроизведения – она не может быть произвольно большой. Если запись компрессионного потока производится не в условиях реального
времени, то можно использовать и другие способы управления скоростью. Т.к. стандарт MPEG не регламентирует сам процесс кодирования, а
изображения (блоки представления) рассматриваются как результат
декодирования блоков доступа, то декодер может приступить к декодированию
изображения типа В только после того, как получены предыдущие и последующие
блоки. Во избежание установки буферов, кодирование изображений
выстраивается в порядке декодирования, т.е. вместо I-B-B-P формируют I-Р-В- 2.3 Профили MPEG-2 Для наибольшей эффективности применения на практике и совместимости
оборудования стандарта MPEG-2 от разных производителей, выделено несколько
подмножеств синтаксиса и семантики, называемые профилями. Профиль – это
подмножество стандарта для специализированного применения, задающее
алгоритмы и средства компрессии. Уровни внутри каждого профиля связаны с
параметрами компрессии изображения (табл. 1). Профили MPEG-2: Simple –
простой; Main – основной; SNR (Signal to Noise Ratio) – с масштабируемым
квантованием; Spatial – с масштабируемым пространственным разрешением; High Таблица 1. Профили стандарта MPEG-2 Например, профиль SNR, как и Spatial, поддерживают все типы изображений, используя обычное кодирование на основе предсказания с компенсацией движения; 422 обеспечивает полное разрешение, соответствующее рекомендации ITU-R 601, монтаж с точностью до кадра, допускает многократную перезапись. 2.4 Особенности стандарта MPEG-2 Стандарт MPEG-2 не определяет защиту от ошибок, но предусматривает такую возможность. Важной особенностью стандарта является масштабируемость, которая определяется как возможность получения изображения из части полного потока данных. Предусмотрены следующие виды масштабируемости [1]: . масштабируемость по пространственному разрешению заключается в получении от одного источника видеоинформации двух телевизионных сигналов с разными параметрами по разрешающей способности. Базовый слой содержит достаточно информации для воспроизведения обычной четкости, а дополнительный слой содержит данные для воспроизведения изображения в высокой четкости; . масштабируемость по отношению сигнал/шум дает возможность получить от одного источника информации изображения с двумя уровнями отношения сигнал/шум, фактически с двумя уровнями качества, как это было рассмотрено в 2.2; . масштабируемость по времени позволяет получать от одного источника видеоинформации с двумя уровнями разрешающей способности по времени – чересстрочной разверткой 25 Гц, или прогрессивной 50 Гц; . масштабируемость по разделению данных позволяет использовать для передачи два канала связи. По одному из них (более помехозащищенному) передается базовый слой, по другому (соответственно, менее защищенному) менее критичные к ошибкам данные. 3. Поток видеоданных MPEG-2. 3.1 Общие сведения о потоке данных. Программный поток Упрощенная структура потока данных на выходе кодера MPEG-2 показана на Рис 3.1. Рис 3.1 Структура потока данных Регламентированы две возможные формы единого потока – программный и транспортный. Первый шаг на пути получения единого потока – формирование пакетного элементарного PES-потока. PES-пакеты состоят из заголовка и данных пользователя. Можно установить фиксированную длину всех пакетов, а можно согласовать начало проекта с началом блока доступа. В начале заголовка идет 32 битный код старта, состоящий из стартового префикса и идентификатора. Спецификация определяет разрешенные значения чисел в поле идентификатора для 32 элементов потока звука и 16 элементов потока видеоданных. Особую значимость имеют биты Р и D флага 2, указывающие на наличие полей с метками времени представления и времени декодирования, обеспечивающие синхронизацию данных в декодере. Для программного потока характерно все выше сказанное, только с
условием, что заголовки блока должны появляться не реже, чем через 0,7 сек. 3.2 Транспортный поток Этот поток может объединять пакетные элементарные потоки, переносящие данные нескольких программ с независимыми временными базами. Один транспортный поток может переносить до 8175 элементарных потоков. Он состоит из коротких пакетов фиксированной длины. Процесс объединения подчиняется ряду ограничений: . первый байт каждого PES-пакета должен быть первым байтом полезной нагрузки; . каждый транспортный пакет может содержать данные лишь одного PES- пакета; . если PES-пакет не имеет длину, кратную 184 байтам, то один из транспортных пакетов не заполняется полностью, а оставляет место для адаптации. Структура транспортного потока оптимизирована для условий передачи данных в каналах связи с шумами: для разрешения проблем, связанных с действием шума, добавляются 16 проверочных байтов кода Рида–Соломона, что позволяет исправить 8 битов. Пакет начинается 4байтного заголовка, который не является уникальным, однако в купе с определенной длиной пакета 188 байт, упрощает определение. Для опознавания пакетов, принадлежащих одному элементарному потоку, используется 13 битный идентификатор. Важный компонент структуры – счетчик непрерывности, который инкрементирует последовательности элементарных пакетов, принадлежащих одному потоку. Это позволяет определить потерю одного из пакетов и маскировать ошибки Идентификатором принадлежности транспортного пакета к определенному потоку является значение PID, а для распознавания элементарных потоков и объединения их в телевизионную программу служит PSI, который должен передаваться в потоке. Определено четыре вида таблиц с программной информацией: . таблица соединения программ PAT (сообщает список номеров всех программ); . таблица плана программ PMT (сведения о программе и её элементарные потоки); . таблица условного доступа CAT. Все вместе таблицы образуют иерархический индексный механизм. Принципы мультиплексирования элементарного и транспортного потоков, из которых складывается телевизионная программа, указаны в приложении А. Благодаря небольшой длине пакета транспортный поток может переносить несколько телевизионных программ с разными временными базисами, но за это приходится платить более сложной схемой мультиплексирования. Кадры телевизионного изображения поступают на вход кодера MPEG-2 с
постоянной частотой, точно с такой же частотой они должны воспроизводится. Компенсацию задержек и синхронизацию обеспечивают метки времени, которые ставятся в соответствии каждому блоку доступа и сообщается декодеру точное время извлечения блока. Текущее системное время обеспечивается опорным генератором, однако, должен быть некоторый сдвиг, т.к. метка сообщает время в будущем. Сдвиг должен быть достаточно большим, чтобы блок доступа прошел буфер. Для синхронизации времени текущее время кодера регулярно передается декодеру (в единицу периода частоты 27 МГц). Метки программного времени должны появляться не реже, чем раз в 0,1 сек. Метки не должны сопровождать каждый блок доступа, они переносятся в заголовках PES- пакетов. 3.3 Подход к потоку видеоданных MPEG-2 как к потоку данных Основной целью создания стандарта MPEG-2 было желание работать с
потоком видеоданных как с любым потоком данных, обрабатываемым, например,
сигнальным процессором. Благодаря этому, возможен монтаж программы,
компрессированной MPEG-2, однако смонтированная программа должна обладать
всеми свойствами потока данных MPEG-2. Возможности монтажа предоставляет
студийный профиль 422, реализованный в формате видеозаписи BETACAM SX. Транскодирование (изменение скорости потока с использованием параметров первоначального кодирования) позволяет минимизировать искажения процесса. Широкое распространение видеокомпрессии делает все более необходимым объединение кодированных программ не только без декодирования, но и без изменения содержания блоков доступа. По своей сути это, конечно, не просто коммутация, а сращивание потоков, при котором полученный поток будет соответствовать синтаксису и семантике MPEG-2 – склейка потоков. Но есть и проблемы коммутации потоков: . P и B кадры не могут быть восстановлены без опорных изображений, а это возможно при коммутации; . компрессия изображения требуется для передачи разных интервалов времени; . изображения, занимающие разные интервалы времени в компрессированной форме, после декодирования должны воспроизводится через равные промежутки времени. Стандартные кодеры (декодеры) MPEG-2 работают с таким буфером, что это и происходит, однако, при коммутации параметры меняются скачком, что может привести к нарушению работы буфера и потери синхронизации. 4. Кодеры MPEG-2. В стандартах MPEG не описано построение кодера, а лишь определен синтаксис потока данных на его выходе. Поэтому структурная схема кодера, представленная в приложении Б лишь отображает основные операции, выполняемые при кодировании и обеспечивающие получение выходного потока данных с требуемыми параметрами по которым декодер любой фирмы производителя, но канонического построения сможет восстановить видеоизображение. Задача кодирующего оборудования состоит в том, чтобы преобразовать
различные форматы входных видеосигналов в единую форму – транспортный
поток, сегодня все большую популярность приобретают кодеры MPEG-2 с
выходом Ethernet. Стандарт MPEG определяет структуру потока и эталонный
кодер, но не накладывает ограничений на построение и алгоритм работы. Важные функции выполняет предпроцессор – осуществление цифровой
фильтрации и синхронизации кадров, производит дополнительную временную
обработку и шумоподавление. Стандартным решением для кодера считается
наличие двух стереоканалов звука. Предусматривается подача как цифрового . Разрешение по видео: Full D1; ѕ D1; ? D1; Ѕ D1; SIF; QSIF; . Разрешение отображаемой картинки: 720х 576 (max PAL) и 720х 480 (max NTSC). Более высокое разрешение обеспечит большую четкость, но потребует увеличения скорости потока; . Структура группы изображений (GOP): число и последовательность кодированных кадров I, P, B; . Скорость кодирования до 15 Мбит/сек; . Скорость выходного транспортного потока должна быть равной или выше скорости видео- и звуковых потоков плюс таблицы данных; . Частота дискретизации звука (32, 44.1 или 48 кГц): чем выше частота, тем лучше качество воспроизведения, но и выше скорость; . Установки фильтров: в случае, если кодер имеет композитный видеовход, можно выбрать гребенчатый или режекторный фильтр для разделения сигналов яркости и цветности. Ввиду все большего повсеместного распространения SDH, для потокового вещания телевизионных программ по сетям IP используются соответствующие кодеры MPEG-2 с выходом IP, ниже приведены основные характеристики подобного рода кодеров: . Передача нескольких каналов «живого» телевидения по IP-сетям, некоторые модели могут принимать до шести аналоговых сигналов и кодировать их в режиме реального времени в формат MPEG-2; . Вещание по IP-сетям в режимах Multicast и Unicast; . Наличие входных интерфейсов: аналогового композитного или SDI, что позволяет работать с любыми источниками сигнала; . Кодирование в форматы MPEG-2 с максимальным разрешением 720х 576; . Наличие выходных интерфейсов 10100 Base T Ethernet Full Duplex или Half Duplex (RJ-45), при этом используются сетевые протоколы UDP Multicast/Unicast и RTP Multicast/Unicast. Реализация преимуществ цифрового сжатия в немалой степени зависит от восстанавливающих устройств, которые по возможностям и цене можно разделить на две группы: устройства профессионального назначения и абонентские приемные устройства. Они различаются по числу входных интерфейсов, наличием или отсутствием модульной конструкции, степенью интеллектуальности программного обеспечения, поддержка различных профилей и скоростей, а также многими другими признаками. Заключение Не компрессированные цифровые видео- и звуковые сигналы формируют
большой поток, в среднем для одной программы требуется 270 Мбит/сек. . большее число программ в одной и той же полосе ВЧ–спектра (больше четырех); . меньше излучаемая мощность, необходимая для обеспечения той же зоны покрытия; . лучшее качество передачи; . возможность создания сети наземного вещания на одной частоте; . возможность мобильного приема; . возможность одновременной передачи вспомогательной информации. Несмотря на все плюсы системы, главным её минусом является то, что гибкость стандарта оборачивается трудностями в обеспечении, эксплуатации, совместимости. Именно поэтому MPEG-2 является открытым стандартом, дополнения и переработки в который вносятся постоянно. Список использованных источников »Горячая линия – Телеком», 2001. – 224 с. – изд. ООО «Издательство 625», №3, 2000 – с 4-48. 625. – изд. ООО «Издательство 625», №7, 2003 – с. ----------------------- I B B P B B Данные польз. Заголовок GOP Расшир. и польз. Расшир. зг. ВП Заголовок ВП Заголовок изобр. Расшир. и польз. Данные изобр. Конец ВП |
|
© 2010 |
|