Разработка программы компрессий цифрового видеосигнала

Автор: Пользователь скрыл имя, 19 Января 2012 в 19:11, дипломная работа

Описание работы

В данном дипломном проекте рассмотрим существующие стандарты в области цифрового видео, и алгоритм компрессии цифрового видеосигнала.

Скачать полностью (599.25 Кб) Сколько стоит заказать работу?

Работа содержит 1 файл

алсугур.doc

— 1.06 Мб (Скачать)

ВВЕДЕНИЕ

В настоящее время одной из наиболее быстро развивающихся областей информационной отрасли является направление мультимедиа-технологий, включающее в себя такие задачи как ввод, компрессия, обработка, передача и отображение аудио-, видео- и графической информации. Наибольший интерес из перечисленных задач представляет задача компрессии видеоинформации, включающая в себя не только методы быстрой обработки больших объемов данных, но и концептуально новые подходы к кодированию информации, ориентированные непосредственно на формат представления видеоданных. Современные методы кодирования и компрессии видеоинформации находят применение в разнообразных областях; от передачи и хранения оцифрованных видеоматериалов до спутниковых цифровых телекоммуникационных систем. Внимание к компрессии видеоинформации особенно возросло в последнее десятилетие в связи с появлением и доступностью цифровых телекоммуникационных систем и в, частности, систем телеконференцсвязи и систем 1Р-видеотелефонии.

Создание новейших цифровых устройств обработки, передачи и хранения видеоданных связано с радикальным изменением технологических возможностей современных процессорных систем. Использование новейших процессоров с производительностью несколько миллиардов операций в секунду и многозадачных операционных систем обеспечивает реализацию обработки нескольких видеопотоков в режиме реального времени, что невозможно было осуществить ранее. В то же время при анализе пригодности существующих алгоритмов для задач обработки видеоданных в реальном масштабе времени следует учитывать достаточно высокую стоимость подобного рода вычислительных средств, а также непрерывно возрастающие требования к качеству передаваемого видеосигнала.

Критерии качества преобразованного и передаваемого видеоматериала в современных системах обработки и передачи видеоинформации достаточно высоки, и требуемое качество видеосигнала должно быть не хуже, чем при обычном телевещании. Однако, как правило, эти требования вступают в противоречие с требованиями приемлемой производительности алгоритма компрессии и стоимости арендуемого канала связи. На сегодняшний день, по существу, для достижения высокого качества видеосигнала необходим канал, пропускная способность которого, с учетом наличия большого числа пользователей в данном канале, обеспечивала бы в пересчете на одного пользователя ту же эквивалентную скорость передачи информации, которая предоставляется при передаче телевизионной картинки (=270 Мбит/с). Практически это означает, что при реальном трафике, совместно используемом большим числом клиентов, требуемая пропускная способность канала должна составлять единицы и десятки Гбит/с [1].

С другой стороны, известные алгоритмы и методы видеокомпрессии обладают сравнительно малым коэффициентом компрессии при низкой трудоемкости и высоком качестве кодирования или характеризуются высоким коэффициентом компрессии при высокой трудоемкости. Алгоритмы, обладающие высоким коэффициентом компрессии, являются либо ориентированными только на определенный класс или тип видеосигнала и не могут использоваться для видеосигналов произвольной природы, либо имеют высокую трудоемкость, что делает затруднительным построение на их базе систем реального времени с обработкой нескольких видеопотоков одновременно. Решение данной проблемы видится в использовании более простых методов обработки видеопотоков, особенно в рамках многоканальных систем реального времени.

Кроме того, использование алгоритмов и методов компрессии видеоинформации в системах многоканальной связи требует решения других сложных задач. В частности, необходимо выявление и устранение

возникающих в процессе передачи видеосигнала ошибок, появление которых связано с особенностями применяемых для передачи видеоданных протоколов и сред передачи информации. Также определенную трудность представляет разработка эффективного механизма управления скоростью выходного битового потока для более эффективного распределения полосы пропускания канала связи между множеством абонентов при условии минимизации времени, затрачиваемого на обработку.

Таким образом, является актуальной разработка алгоритма, решающего на основе единого математического аппарата задачу эффективной компрессии видеоданных с низкой трудоемкостью, при достаточном уровне качества, без жесткой привязки к характеру видеоданных, с возможностью управления скоростью выходного битового потока.

Главным мотивирующим фактором развития алгоритмов компрессии видеоданных можно считать:

- стоимостные характеристики оборудования;

- доступность объемов систем хранения данных;

- пропускную способность цифровых коммуникаций;

- оценку параметров движения.

На рынке существует значительное количество популярных алгоритмов компрессии видеосигнала, однако они перестают отвечать возрастающим требованиям потребителей security-рынка. Ведь большинство существующих форматов созданы несколько лет назад под другой тип потребителя, и к ним не могли быть применены сформированные сегодня требования к компрессии/декомпрессии и качеству изображения.

Основной проблемой в работе с подвижными изображениями являются большие объемы данных, с которыми приходится иметь дело. Например, при записи на компакт-диск в среднем качестве на него можно поместить несколько тысяч фотографий, более 10 часов музыки и всего полчаса видео. Видео телевизионного формата – 720*576 точек и 25 кадров в секунду в системе RGB – требует потока данных примерно 240Мбит/с. При этом обычные методы сжатия, ориентированные на кодирование отдельных кадров (в том числе и JPEG), не спасают положения, поскольку даже при уменьшении битового потока в 10-20 раз он остается чересчур большим для практического использования.

При сжатии подвижных изображении учитывается наличие в них нескольких типов избыточности:

- когерентность (одноцветность) областей изображения – незначительное изменение цвета изображения в его соседних пикселях; это свойство изображения используется при его разрушающем сжатии всеми известными методами;

- избыточность в цветовых плоскостях, отражающую высокую степень связи интенсивностей различных цветовых компонент изображения и важность его яркостной компоненты;

- подобие между кадрами – использование того факта, что при скорости 25 кадров в секунду различие в соседних кадрах очень незначительно.

Появилось достаточно большое число внутрифирменных стандартов.

1. ОБЩАЯ ЧАСТЬ

Классификация устройств обработки видеосигналов

Сегодня словами "видеообработка" и "цифровое видео" уже никого не удивишь. За последнее десятилетие устройства обработки видеосигналов прошли огромный путь развития, появилось множество специальных терминов и способов обработки видеоизображения. Мы попытаемся рассказать о некоторых устройствах и методах обработки видеосигналов. Все устройства обработки видеосигналов (УОВ) можно разделить на несколько категорий:

Специализированные устройства, выполняющие ограниченный набор функций и работающие, как правило, в реальном времени. К этой категории относятся всевозможные видеомикшеры, видеокоммутаторы, генераторы спецэффектов, синхронизаторы, транскодеры и т. д.
Устройства обработки видеосигналов на базе компьютеров PC, Macintosh, Silicon Graphics, Amiga, Alfa DEC и т. д. Обычно эти устройства выполняются в виде плат или внешних блоков активно взаимодействующих с компьютером при помощи программного обеспечения. Такие устройства редко работают в реальном времени, но имеют практически неограниченные возможности.
Управляющие и вспомогательные устройства, которые управляют видеоаппаратурой (видеомагнитофонами, видеокамерами, видеомикшерами, коммутаторами и т. д.). Они могут быть как автономными, так и входить в состав компьютерного видеокомплекса. К этой категории относятся видеомонтажные контроллеры, платы линейного видеомонтажа, управляющие системы и т. д.

Следует отметить, что большинство вышеперечисленных устройств используют цифровую обработку сигналов, которая либо имеет ряд преимуществ, либо является единственно возможной. Цифровая техника достаточно специфична, поведение интеллектуальных машин иногда противоречит повседневному опыту человека и трудно воспринимается. Специальное образование, вскрывающее подноготную цифровых процессов, снимает такие трудности.

Однако приходится считаться с тем, что подавляющее большинство работников вещательных организаций и компаний, а тем более представителей частных и домашних видеостудий не знакомы с математической логикой, теорией и физикой цифровых процессов обработки многомерных массивов данных и другими премудростями соответствующих научных дисциплин и, вероятнее всего, никогда не познакомятся. Все что им надо - это адаптированное изложение основ и особенностей поведения цифровых систем. Специальной литературы этого рода у нас нет, но необходимость в ней - огромная.

Как устроен телевизионный сигнал

Известно, что человеческий глаз воспринимает как единое целое красную (Red), зеленую (Green) и синюю (Blue) части видимого спектра. Таким образом, цветовое восприятие человека трехкомпонентное. Конечно, мы воспринимаем больше цветовых оттенков - считается, что 16 миллионов - но для нас, в силу особенностей цветового восприятия, все они сводятся к комбинациям этих трех главных цветов (в теории цвета их называют опорными). Исходя из этого, все телевизионные камеры и другие технические датчики цветных изображений формируют три сигнала - R, G, B, а в телевизионных и компьютерных мониторах экран одновременно сканируют три электронных луча, вызывая световые вспышки красного, зеленого и синего цветов. Глаз же при этом воспринимает только результирующее изображение во всем богатстве цветов реального мира.

В то же время для телепереноса цветного изображения через эфир технически эффективнее кодировать цвет иным образом. Дело в том, что глаз менее чувствителен к пространственным изменениям оттенков цвета, чем к изменениям яркости. Поэтому цветовая информация может передаваться с меньшей пространственной четкостью (разрешением). В результате исходные RGB-видеосигналы в телевидении перед передачей преобразуют (кодируют) в сигнал яркости Y и два цветоразностных сигнала U и V:

Y = 0.299R + 0.587G + 0.114B, U = R - Y, V = B - Y, при этом U и V передаются с разрешением, в два раза меньшим, чем Y. Такое уменьшение объема передаваемой информации позволяет строить более дешевые системы. Выбор вышеуказанных коэффициентов преобразования определяется жестким требованием двусторонней совместимости черно-белых и цветных приемников - яркостной сигнал Y совпадает с формируемым в ч/б системах, ч/б приемники воспринимают только его. Что касается цветовых сигналов U и V, то они добавляются к яркостному сигналу путем модуляции специального гармонического сигнала (цветовой поднесущей) на частоте, лежащей в пределах спектра сигнала Y. В результате полосы яркостного сигнала и полного видеосигнала совпадают.

Модуляция поднесущей может осуществляться по амплитуде, фазе или частоте согласно U- и V- значениям. При приеме для точного определения величин модуляции необходима привязка к опорной несущей. Для этого в начале каждой строки передаются пакеты немодулированной несущей - так называемые синхроимпульсы. Таким образом телевизионный видеосигнал, с определенными оговорками, представляет собой композицию трех сигналов Y, U, V и синхроимпульсов. Такой сигнал называют композитным.

При приеме в цветном телевизоре осуществляется обратный процесс восстановления (декодирования):

R = Y + U, B = Y + V, G = Y - 0.509U - 0.194V

Телевизионное изображение воспроизводится путем последовательного сканирования электронными лучами по покрытому электролюминисцирующим веществом экрану. Сканирование происходит слева направо вдоль горизонтальных линий (телевизионных строк) и сверху вниз по строкам. Лучи пробегают строку за строкой сверху вниз до самого низа экрана, а затем возвращаются назад, и опять - слева-направо сверху-вниз. За счет инерционности глаза в процессе подобного сканирования вызываемые цветовые вспышки света сливаются в линии, а затем в полное изображение. В результате полный телевизионный кадр представляет собой совокупность последовательно высвечиваемых линий, передающих пространственное распределение изображения. Установлено, что для восприятия человеческим глазом этой совокупности как целого она должна обновляться не реже 50 раз каждую секунду. В телевидении был реализован чересстрочный режим развертки, при котором за каждый проход луч пробегает только половину линий - сначала четные, затем - нечетные. Таким образом, каждый телевизионный кадр оказывается разделенным на два полукадра - их называют полями. В результате, когда мы говорим о вертикальной частоте в 50 Гц, кадровая оказывается в два раза меньше - 25 Гц.

Информация о работе Разработка программы компрессий цифрового видеосигнала