Автор: Пользователь скрыл имя, 23 Февраля 2013 в 09:07, реферат
Эпоха аналогового телевидения неуклонно близится к концу. Недаром Еврокомиссия обязала все страны, входящие в Европейский Союз, закончить полный переход к цифровому телевещанию уже к 2015 г. Причин такой тотальной "нелюбви" к аналоговому вещанию очень много. Не последнюю роль сыграло отсутствие единого телевизионного стандарта. На сегодняшний день их три: NTSC, PAL и SECAM. Они несовместимы: получить цветное изображение на телевизоре другого стандарта практически невозможно.
По стандарту MPEG-1 потоки видео- и аудиоданных передаются со скоростью 150 Кбайт/с (как в односкоростном CD-ROM-проигрывателе) и управляются путем выборки ключевых видеокадров и заполнением только областей, изменяющихся между кадрами.
MPEG-1 оптимизирован для использования с разрешением: 352 ppl (point per line — точек на линии), 240 lpf (line per frame — линий в кадре), 30 fps (frame per second — кадров в секунду) с цветовой схемой YCBCr (где Y— яркостная составляющая, СB=В-У и Cr=R-Y — цветоразностные) и, к сожалению, обеспечивает качество видеоизображения более низкое, чем видео, передаваемое по телевизионному стандарту.
Перед началом кодирования происходит анализ видеоинформации, выбираются ключевые кадры, которые не будут изменяться при сжатии, а также кадры, при кодировании которых часть информации будет удаляться. Всего выделяется три типа кадров:
- кадры типа I (Intra frame) — ключевые кадры, которые сжимаются без изменений;
- кадры типа Р (Predirected frame). При кодировании этих кадров часть информации удаляется, а при воспроизведении используется информация от предыдущих I или Р кадров;
- кадры типа В (Bidirectional frame). При кодировании потери информации еще более значительны, а при воспроизведении используется информация от двух предыдущих I или Р кадров.
Наличие В кадров в видеоролике — тот фактор, благодаря которому MPEG-1 имеет высокий коэффициент сжатия, но не очень высокое качество. При кодировании формируется цепочка кадров разных типов (рис.5). Наиболее типичная последовательность — IBBPBBPBBIBBPBBPBB... Соответственно, очередь воспроизведения по номерам кадров будет выглядеть так: 1423765...
По окончании разбивки кадров на разные типы начинается процесс подготовки к кодированию. С I кадрами это достаточно просто: кадр просто разбивается на блоки, которые имеют размеры 8x8 пикселей. А вот для того, чтобы сильнее сжать кадры типа Р и В, используется алгоритм предсказания движения.
Рис.5
В качестве входной информации алгоритм предсказания движения получает блок текущего кадра (8x8 пикселей) и аналогичные блоки от предыдущих кадров (I- или Р- типа). После обработки имеется следующая информация:
- вектор движения текущего блока относительно предыдущих;
- разница между текущим и
предыдущими блоками, которая
и подвергается дальнейшему
Вся избыточная информация удаляется,
благодаря чему и достигается
столь высокий коэффициент
Дальше начинается само кодирование. Процесс кодирования содержит в себе 3 стадии:
- преобразование Фурье (
- квантование (Quantization) — перевод данных из непрерывной формы в дискретную;
- преобразование полученных
Кодирование звука осуществляется отдельным звуковым кодером. По мере развития формата MPEG-1, звуковые кодеры неоднократно переделывались, становясь все эффективнее. К моменту окончательной стандартизации формата MPEG-1 было создано три звуковых кодера этого семейства: Layer I, Layer II (иногда называют Musicam по названию стандарта, послужившего прообразом) и Layer III. Принципы кодирования основаны на том, что для человеческого уха в несжатом звуке (CD-audio) передается много избыточной информации. Принцип сжатия работает на "эффектах маскировки" некоторых звуков (например, если идет сильный звук на частоте 1000 Гц, то более слабый звук на частоте 1100 Гц человек уже не слышит, чувствительность слуха падает примерно на 100 мс после окончания сильного звука). Психоакустическая модель (Psycoacustic), используемая в MPEG-1, разбивает весь частотный спектр на части, в которых уровень звука считается одинаковым, а затем удаляет звуки, не воспринимаемые человеком из-за эффектов маскировки.
Синхронизация аудио- и видеоданных осуществляется с помощью специально выделенного потока данных под названием System stream. Этот поток содержит встроенный таймер, который работает с частотой 90 кГц и содержит 2 слоя: системный с таймером и служебной информацией для синхронизации кадров с аудиотреком и компрессионный с видео- и аудиопотоками.
В современном цифровом телевидении используется стандарт MPEG-2, разработанный в 1992 г. Компрессия по стандарту MPEG-2 основана на том, что более 97% цифровых данных, представляющих видеосигнал, дублируются, т.е. являются избыточными и могут быть удалены без особого ущерба качеству изображения.
Применительно к видео избыточность бывает двух видов: пространственная (дублирование информации в пределах одного кадра) и временная (дублирование в последовательно расположенных кадрах). Алгоритм MPEG-2 анализирует видеоизображение в поисках повторений и избавляется от них. После удаления избыточности в формате MPEG-2 обеспечивается качественное видеоизображение при более низкой скорости передачи данных.
Вкратце этапы кодирования таковы:
- оцифровка видео, если оно было в аналоговом виде, и масштабирование до нужного размера кадра;
- перевод изображения из
- анализ близкорасположенных
- двумерное дискретное
- адаптивная квантизация этих
коэффициентов (происходит
- дальнейшее сжатие с помощью RLE и кодов Хаффмана (без потерь);
- к полученным закодированным кадрам добавляются служебные заголовки, и получается PES (Packetized Elementary Stream).
Основным параметром, который задается MPEG-2-кодеру, является битрейт (объем выходного потока в битах за единицу времени). Чем он больше, тем более качественной получается картинка, хотя, конечно, неумелым кодированием можно все испортить. Ориентируясь на заданный битрейт, кодер должен динамически подстраивать параметры алгоритмов, используемых на разных этапах, чтобы битрейт выходного потока был как можно ближе к этому значению, но при этом минимально теряя в качестве. Задача однозначного решения не имеет, производители кодеров решают ее по-разному.
При кодировании аудиосигналов обеспечивается поддержка многоканальности (5+1 каналов — left, center, right, left surround, right surround + sub-woofer), и появился стандарт AAC (Advanced Audio Coding — прогрессивное кодирование звука) с очень высоким качеством звука (скоростью 64 Кбит/с на канал).
Разработанный следом формат MPEG-3 для телевидения высокой четкости (HDTV) с максимальным разрешением 1920x1080 точек при 30 кадрах/с и скоростью потока 20...40 Мбит/с не давал принципиальных улучшений по сравнению с MPEG-2 и благополучно "вымер".
Спецификации стандарта MPEG-4 были установлены в 1998 г. и приняты в качестве международного стандарта в 2000 г. Стандарт MPEG-4 задает принципы работы с изображением и звуком для трех областей: интерактивного мультимедиа (включая продукты, распространяемые на оптических дисках и через сеть), графических приложений (синтетического контента) и цифрового телевидения. Помимо аудио и видео, формат позволяет работать с естественными и синтезированными компьютером 2D- и 3D-объектами, производить привязку их взаимного расположения и синхронизацию друг относительно друга, а также указывать их интерактивное взаимодействие с пользователем. Кроме того, формат обеспечивает доступ к мультимедийной информации через каналы различной пропускной способности.
Алгоритм компрессии видео в MPEG-4 работает по той же схеме, что и в предыдущих форматах. При кодировании исходного изображения кодек ищет и сохраняет ключевые кадры, на которых происходит смена сюжета. А вместо сохранения промежуточных кадров прогнозирует и сохраняет лишь информацию об изменениях в текущем кадре по отношению к предыдущему. Полученная таким образом информация сжимается по алгоритмам компрессии. Но, в отличие от предыдущих форматов, которые делили изображение на прямоугольники, при обработке изображений кодек оперирует объектами произвольной формы. К примеру, человек, двигающийся по комнате, будет воспринят как отдельный объект, перемещающийся относительно неподвижного объекта — заднего плана. Естественно, алгоритмы поиска и обработки подобных объектов требуют гораздо больше вычислительных ресурсов, нежели в случае MPEG-1/2.
Звуковая часть MPEG-4 также объектно-ориентирована. Аудио-объекты описываются на языке BIFS, что позволяет располагать источники звука в трехмерном пространстве сцены, управлять их характеристиками и применять к ним различные эффекты независимо друг от друга, перемещать источник звука при перемещении связанного с ним визуального объекта и т.п.
Для кодирования аудиообъектов MPEG-4 предлагает наборы музыкальных инструментов(для живых звуков и синтезированных). Для этого введено два языка: SAOL (Structured Audio Orchestra Language) и SASL (Structured Audio Score Language). Как следует из названия, первый задает оркестр, а второй — то, что этот оркестр должен играть. Каждый инструмент оркестра представлен набором элементов цифровой обработки сигналов — синтезаторов и цифровых фильтров, которые все вместе и синтезируют нужный звук. С помощью SAOL можно запрограммировать практически любой нужный инструмент, природный или искусственный звук. Сначала в декодер загружается набор инструментов, а затем поток данных SASL заставляет этот оркестр играть, управляя процессом синтеза.
В MPEG-4 картинка разделяется на различные элементы, называемые "медиаобъекты" (media objects), описывается структура этих объектов и их взаимосвязи, а затем они собираются в видеозвуковую сцену. Таким образом, видеозвуковая сцена состоит из медиаобъектов, которые объединены в иерархическую структуру:
- неподвижные картинки (например, фон);
- видеообъекты (говорящий человек);
- аудиообъекты (голос, связанный с этим человеком);
- текст, связанный сданной
- синтетические объекты,
Такой способ представления данных позволяет:
- перемещать и помещать медиа-
- трансформировать объекты (
- собирать из отдельных
- изменять текстуру объекта (например, цвет), манипулировать объектом (заставить ящик передвигаться по сцене);
- изменять точку наблюдения за сценой.
Важнейшая особенность MPEG-4 в том, что окончательная сборка сцены происходит на приемном конце (в компьютере или телевизоре), и пользователь сам может формировать получаемое изображение, играя роль телережиссера. Более того, среди допустимых пользовательских команд есть изменение точки наблюдения, удаление, добавление и перемещение объектов внутри сцены и многое другое. Конечно, такое воздействие должно быть разрешено создателем аудиовизуального потока информации. Команды пользователя могут быть обработаны в декодере или пересланы на передающую сторону.
4. Прием цифрового ТВ
Телевизор, которым мы пользуемся сегодня, принять цифровой сигнал не в состоянии. Но это вовсе не означает, что "ящик" надо успеть заменить до 2015 г. Годится любой, даже самый старый телеприемник, лишь бы у него был обычный антенный вход. Посредником между телевизором и средой распространения сигнала послужит декодер (рис.6), так называемый "set-top-
box" ("коробка, установленная сверху"). Это и в самом деле "коробочка", которая обычно ставится на телевизор (рис.7). Устройство принимает цифровой сигнал, преобразует его в аналоговый и подает на вход ТВ-приемника, так что зрителю остается только выбрать канал. Set-top-box (STB) способен принимать программы ЦТВ стандартной четкости SDTV (Standard Definition TV) из различных физических каналов. Изображение выводится на обычный телевизор с 625 строками, а звук — на любую стереосистему.
Рис. 6
Рис. 7
Другой путь постепенного перехода
к полностью цифровому
На рис.8 представлена функциональная схема цифро-аналогового (гибридного) телевизора с встраиваемым DVB-T модулем. Телевизор предназначен для приема сигналов аналогового и цифрового эфирного телевидения стандарта DVB-T в диапазоне рабочих частот 51.. .858 МГц. При доработке шасси серийно выпускаемого телевизора (УСЦТ-200) адаптируется для установки в него через специальный разъем дополнительной цифровой DVB-T платы. Суть адаптации заключается в следующем: