Разработка программы компрессий цифрового видеосигнала

Автор: Пользователь скрыл имя, 19 Января 2012 в 19:11, дипломная работа

Описание работы

В данном дипломном проекте рассмотрим существующие стандарты в области цифрового видео, и алгоритм компрессии цифрового видеосигнала.

Работа содержит 1 файл

алсугур.doc

— 1.06 Мб (Скачать)

    

 
Рисунок.1.6 Аналого-цифровое преобразование. 

    Кодовые слова можно передавать в параллельной или последовательной формах (рис. 1.6). Для передачи в параллельной форме надо использовать n линий связи (в примере, показанном на рисунке, n = 4). Символы кодового слова одновременно передаются по линиям в пределах интервала дискретизации. Для передачи в последовательной форме интервал дискретизации надо разделить на n подинтервалов - тактов. В этом случае символы слова передаются последовательно по одной линии, причем на передачу одного символа слова отводится один такт. Каждый символ слова передается с помощью одного или нескольких дискретных сигналов - импульсов. Преобразование аналогового сигнала в последовательность кодовых слов, поэтому часто называют импульсно-кодовой модуляцией.

    Форма представления слов определенными  сигналами определяется форматом кода. Можно, например, устанавливать в  пределах такта высокий уровень  сигнала, если в данном такте передается двоичный символ 1, и низкий - если передается двоичный символ 0 (такой способ представления, показанный на рис. 6, называют форматом БВН - Без Возвращения к Нулю). В примере рис. 6 используются 4-разрядные двоичные слова (это позволяет иметь 16 уровней квантования). В параллельном цифровом потоке по каждой линии в пределах интервала дискретизации передается 1 бит 4-разрядного слова. В последовательном потоке интервал дискретизации делится на 4 такта, в которых передаются (начиная со старшего) биты 4-разрядного слова.

    Операции, связанные с преобразованием аналогового сигнала в цифровую форму (дискретизация, квантование и кодирование), выполняются одним устройством - аналого-цифровым преобразователем (АЦП). Сейчас АЦП может быть просто интегральной микросхемой. Обратная процедура, т.е. восстановление аналогового сигнала из последовательности кодовых слов, производится в цифро-аналоговом преобразователе (ЦАП). Сейчас существуют технические возможности для реализации всех обработок сигналов звука и изображения, включая запись и излучение в эфир, в цифровой форме. Однако в качестве датчиков сигнала (например, микрофон, передающая ТВ трубка или прибор с зарядовой связью) и устройств воспроизведения звука и изображения (например, громкоговоритель, кинескоп) пока используются аналоговые устройства. Поэтому аналого-цифровые и цифро-аналоговые преобразователи являются неотъемлемой частью цифровых систем.

    Цифровые  сигналы можно описывать с  помощью параметров, типичных для  аналоговой техники, например таких, как  полоса частот. Но их применимость в  цифровой технике является ограниченной. Важным показателем, характеризующим цифровой поток, является скорость передачи данных. Если длина слова равна n, а частота дискретизации FD, то скорость передачи данных, выраженная в числе двоичных символов в единицу времени (бит/с), находится как произведение длины слова на частоту дискретизации: C = nFD . 

    
    1. Цифровое  представление компонентного  видеосигнала
 
 

    Компонентный  телевизионный видеосигнал может  быть представлен в цифровой форме  в соответствии с Рекомендацией ITU-R 601. Эта рекомендация устанавливает правила раздельной дискретизации, квантования и кодирования сигнала яркости Y и двух цветоразностных сигналов R-Y (Cr) и B-Y (Cb). Частота дискретизации для яркостного сигнала Y установлена равной 13,5 МГц, для цветоразностных сигналов - 6,75 МГц, т.е. частота дискретизации яркостного сигнала в 2 раза больше частоты дискретизации цветоразностных сигналов. Если взять, как принято, в качестве условной (базовой для иерархии цифровых стандартов) единицы частоту 3,375 МГц, то частоты дискретизации яркостного и двух цветоразностных сигналов будут находиться в соотношении 4:2:2, которое и дает часто используемое название стандарта.

    

 

    Рисунок 1.7 Кодирование компонентного видеосигнала (4:2:2). 

    При таких значениях частот дискретизации  можно практически преобразовать  без искажений в цифровую форму  сигнал яркости в полосе до 5,75 МГц, а цветоразностные сигналы - в полосе до 2,75 МГц (надо помнить о запасном интервале между граничной частотой сигнала и половиной частоты дискретизации). Стандарт 4:2:2 используется в качестве базового при оценке других вариантов дискретизации, и на значение 5,75 МГц часто ссылаются как на границу полной полосы ТВ сигнала. Рис. 1.7 показывает дискретизацию компонентного телевизионного сигнала на примере сигнала цветных полос. Длина кодового слова - 10 двоичных разрядов - битов (в первоначальном варианте - 8 битов), что позволяет перенумеровать 1024 уровня квантования. Однако числа 0..3 и 1020..1023 резервируются для цифровых синхронизирующих сигналов. Для квантования яркостного сигнала выделяется 877 уровней (значение черного в видеосигнале соответствует уровню квантования 64, а номинальное значение белого - уровню 940).

    Для квантования цветоразностных сигналов выделяется 897 уровней, причем нулевому значению аналогового сигнала соответствует  уровень квантования 512.Кодированию  подлежат гамма-корректированные сигналы. Приведенные диапазоны уровней квантования часто используются при сравнении с другими вариантами квантования. В этом случае на них часто ссылаются как на показатели динамического диапазона или полного разрешения по уровню сигнала, поскольку число уровней квантования определяет шум квантования и, соответственно, динамический диапазон. В этом же смысле иногда говорят о 10-битном разрешении.

    

 
Рисунок 1.8 Кодирование компонентного видеосигнала (4:2:2). Структура дискретизации. 

    Частоты дискретизации представляют гармоники  строчной частоты, что обеспечивает неподвижную ортогональную структуру  отсчетов ТВ изображения (рис. 1.8). Величинам 13,5 и 6,75 МГц кратна, как частота строчной развертки стандарта телевизионного разложения 625/50, так и частота развертки стандарта 525/60. Собственно, выбор в качестве базовой именно частоты 3,375 МГц во многом связан с соображениями кратности с частотами строчной развертки двух мировых стандартов разложения. Это важно потому, что позволило ввести единый мировой стандарт цифрового кодирования компонентного видеосигнала, при котором в активной части строки содержится 720 отсчетов яркостного сигнала и по 360 - каждого цветоразностного. Различие в системах 625/50 и 525/60 заключается в разном числе строк и несколько отличающейся длительности интервала гашения. Полная скорость передачи цифрового компонентного видеосигнала составляет 10 х 13,5 + 10 х 6,75 + 10 х 6,75 = 270 Мбит/с.

    

 
Рисунок 1.9 Кодирование  компонентного видеосигнала (4:4:4). 

    Существуют  и другие форматы представления  компонентного сигнала в цифровом виде. Кодирование по стандарту 4:4:4 предполагает использование частоты 13,5 МГц для всех трех компонентов: R, G, B или Y, Cr, Cb (рис. 1.9). Это означает, что все компоненты передаются в полной полосе. Для каждого компонента в активной части кадра оцифровывается 576 строк по 720 элементов. Скорость цифрового потока при 10-битовом слове составляет 405 Мбит/с.

    

 
Рисунок 1.10 Кодирование  компонентного видеосигнала (4:4:4:4). 

    Формат 4:4:4:4 описывает кодирование четырех сигналов (рис.10), три из которых являются компонентами видеосигнала (R, G, B или Y, Cr, Cb), а четвертый (альфа-канал) несет информацию об обработке сигнала, например, о прозрачности изображения переднего плана при наложении нескольких изображений. Дополнительным четвертым сигналом может также быть сигнал яркости Y в дополнении к сигналам основных цветов R, G, B. Частота дискретизации всех сигналов - 13,5 МГц, т.е. все сигналы передаются в полной полосе. Скорость передачи данных при 10 битах на слово равна 540 Мбит/с.

    

 
Рисунок 1.11 Кодирование  компонентного видеосигнала (4:1:1). 

    Формат 4:1:1 предлагает двукратное уменьшение частоты дискретизации цветоразностных сигналов (в сравнении со стандартом 4:2:2). Яркостной сигнал Y дискретизируется с частотой 13,5 Мгц, а цветоразностные (Cr и Cb) - 3,375 Мгц. Это означает и двукратное уменьшение горизонтального разрешения в цвете. В активной части кадра 576 строк, каждая из которых содержит 720 элементов сигнала яркости и по 180 - цветоразностных сигналов (рис. 1.11).Формат 4:2:0 предлагает изображение, в котором яркостная компонента Y содержит в активной части кадра 576 строк по 720 отсчетов, а цветоразностные компоненты Cr и Cb - 288 строк по 360 отсчетов (рис. 1.12).

    

 
Рисунок 1.12 Кодирование  компонентного видеосигнала (4:2:0). 

    Варианты  кодирования 4:1:1 и 4:2:0 характеризуются одинаковой скоростью передачи данных - 202,5 Мбит/с для длины кодового слова в 10 бит и 162 Мбит/с - для 8 бит на слово. Если передавать только активную часть изображения (без обратного хода), то величина цифрового потока при 8 битах на слово составит 124 Мбит/с. Цифровые сигналы этих двух форматов могут быть получены из сигналов стандарта 4:2:2 путем предварительной обработки и децимации (прореживания отсчетов) с целью сокращения скорости потока. Формат 4:1:1 оказывается более удобным для систем со стандартом разложения 525/60, а формат 4:2:0 - для систем 625/50. Это связано с тем, что потеря вертикальной четкости более заметна в системе с меньшим числом строк (525/60), а потеря горизонтальной четкости более заметна в системе 625/50.

    

 
Рисунок 1.13 Кодирование  компонентного видеосигнала (3:1:1). 

    Находит применение формат 3:1:1, в котором  уменьшено (в сравнении с 4:2:2) горизонтальное разрешение и для яркостной компоненты (с 720 до 540), и для цветоразностных (с 360 до 180). Активная часть кадра содержит 576 строк с 540 отсчетами яркостной компоненты и 180 отсчетами для цветоразностных (рис. 1.13). Скорость передачи данных формата 3:1:1 составляет 135 Мбит/с при 8 битах на один отсчет. Для значительного сокращения скорости потока (например, в CD-ROM приложениях) разрешение яркостной компоненты снижается примерно в 2 раза по вертикали и по горизонтали, а цветоразностных - в 4 раза по вертикали и в 2 раза по горизонтали (в сравнении со стандартом 4:2:2).

    

 
Рисунок 1.14 Кодирование  компонентного видеосигнала CIF (Common Interchange Format). 

    Такой вид представления описывается  форматом CIF (Common Interchange Format). Один кадр этого формата содержит в активной части 288 строк по 352 отсчета для  яркостной компоненты и 144 строки по 176 отсчетов для цветоразностных  компонент (рис. 1.14). При передаче только активной части изображения скорость потока составляет около 30 Мбит/с при 8 битах на отсчет. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

    2. СПЕЦИАЛЬНАЯ ЧАСТЬ 

    2.1 Экономические аспекты компрессии видеосигнала

     

    Сейчас, когда необходимость максимально эффективного использования каждого тенге обозначилась остро как никогда, существует способ снижения стоимости доставки сигнала через спутник: цифровая видеокомпрессия.

    Чтобы понять смысл компрессии, представим баржу, плывущую по реке от фермы до городского рынка. Стоимость доставки пшеницы будет определяться тем, сколько места она займет на барже. Но у вас есть волшебная машина, которая может сжать вашу пшеницу в два раза и цена доставки уменьшится вдвое. Когда вы доплывете до рынка, машина вернет вашему зерну первоначальный размер, и вы его продадите. Цифровая компрессия - это "волшебная машина" для телевизионного сигнала, которая его "сжимает" и он занимает меньшую полосу частот в спутниковом канале связи. После приема сигнала на Земле он восстанавливает свой первоначальный объем с помощью цифрового оборудования для доставки на телеприемник. Результат - уменьшение расходов на аренду спутника и высококачественное цифровое телевизионное изображение.

    На  сегодняшний день технология цифровой видеокомпрессии применяется телевизионными эфирными вещателями, кабельными сетями, промышленным телевидением, коммерческими службами "direct-to-home" и является реальной альтернативой аналоговой трансляции сигнала. Названные выше пользователи находят цифровую видеокомпрессию эффективным способом снижения требований к полосе частот спутникового канала и, соответственно, уменьшению своих расходов.

    Для перехода от аналоговой к цифровой технологии существуют веские причины  как экономического, так и технического характера. И вещатели, и промышленное ТВ, и компании, эксплуатирующие спутники, только выиграют от перехода на новую технологию независимо от того, только они начинают осваивать спутниковое вещание или же уже ищут возможности его расширения. Рассмотрим поближе технологию цифровой видео-компрессии.  

    2.1.1 Процесс компрессии 
 

    Типичный  цифровой некомпрессированный видеосигнал  представляет собой информационный поток 150 Мбит/с. Алгоритм компрессии использует тот факт, что видеосигнал состоит  из отдельных элементов изображения  или пикселов. Каждый кадр содержит тысячи и тысячи пикселов. Видеосигнал компрессируется одним из двух способов - либо внутри-кадровым, либо межкадровым. Внутри-кадровая компрессия происходит внутри каждого отдельного кадра, а межкадровая использует последовательность кадров.

Информация о работе Разработка программы компрессий цифрового видеосигнала