Разработка программы компрессий цифрового видеосигнала

Автор: Пользователь скрыл имя, 19 Января 2012 в 19:11, дипломная работа

Описание работы

В данном дипломном проекте рассмотрим существующие стандарты в области цифрового видео, и алгоритм компрессии цифрового видеосигнала.

Работа содержит 1 файл

алсугур.doc

— 1.06 Мб (Скачать)

    Межкадровая компрессия, сохраняющая высокое  качество видеоданных.

    Motion Wavelet исключает компрессию на  основе психовизуальной модели  восприятия движущейся картинки человеком, в отличие от MPEG2, MPEG4 и его многочисленных подвидов. Характеристика этой модели полезна для повышения эффективности компрессии видеоданных, где требуется только просмотр записи «вживую», например, художественные ленты на DVD-дисках. Однако в системах видеонаблюдения важной частью работы является не просмотр движущейся картинки, а покадровый просмотр или «стоп-кадр» видеозаписи в случае детального анализа событий. Способ межкадровой компрессии в Motion Wavelet позволяет сохранить равно высокое качество как опорных кадров, так и промежуточных.

    Возможность масштабирования изображения без  применения математических алгоритмов

    Вейвлет-преобразование производится методом разложения изображения  на несколько слоев по аналогии с  прогрессивным методом компрессии JPEG. Однако каждый слой несет исчерпывающую информацию, позволяющую производить просмотр видеоданных в меньшем разрешении. Это свойство алгоритма позволяет регулировать нагрузку на цифровые каналы передачи данных, исключая трансляцию избыточно-качественного изображения на АРМ оператора 

      

    Отсутствие  «эффекта блоков» на картинке при  высокой степени компрессии

    Motion Wavelet полностью свободен от главного  недостатка своих предшественников: благодаря использованию вейвлет-преобразования, изображения в этом формате не содержат знаменитой «решетки» из блоков по 8 пикселей. 

    

 

    Рисунок 2.2 Глубина хранения архива в зависимости от метода компрессии. 

    2.5 Сжатие видео 
 

    При сжатии видео используются следующие  статистические характеристики:

    1. Пространственная  корреляция:  дискретное  косинусное  преобразование  8х8 точек.

    2. Особенности человеческого зрения -  невосприимчивость  к   высокочастотным составляющим: скалярное квантование коэффициентов ДКП с потерей качества.

      3. Большая пространственная корреляция  изображения  в  целом:  предсказание первого низкочастотного коэффициента преобразования  в  блоке  8х8  (среднее значение всего блока).

    4. Статистика  появления  синтаксических  элементов  в   наиболее   вероятном кодируемом потоке: оптимальное кодирование векторов движения,  коэффициентов ДКП, типов макроблоков и пр.

    5. Разряженная   матрица   квантованных   коэффициентов   ДКП:    кодирование повторяющихся нулевых элементов с обозначением конца блока.

    6. Пространственное маскирование: степень квантования макроблока.

    7. Кодирование  участков  с  учетом  содержания  сцены:  степень  квантования макроблока.

     8. Адаптация к локальным характеристикам  изображения:  кодирование  блоков, тип макроблока, адаптивное квантование.

    9. Постоянный  размер  шага  при  адаптивном   квантовании:   новая   степень квантования  устанавливается  только  специальным  типом  макроблока  и   не передается по умолчанию.

    10. Временная избыточность: прямые и  обратные  векторы  движения  на  уровне макроблоков 16х16 точек.

    11. Кодирование  ошибки  предсказаний  макроблоков   с   учетом   восприятия: адаптивное квантование и квантование коэффициентов преобразования.

    12. Малая ошибка предсказания:  для  макроблока  может  быть  сигнализировано отсутствие ошибки.

    13. Тонкое кодирование ошибки предсказания на уровне макроблоков:  каждый  из блоков внутри макроблока может быть кодирован или пропущен.

    14. Векторы движения - медленное движение фрагмента  изображения  со  сложным рисунком: предсказание векторов движения.

    15. Появления и исчезновения: прямое и обратное предсказание в B- фреймах.

      16. Точность   межкадрового   предсказания:    билинейно    интерполированные (фильтрованные) разности блоков. В реальном мире движения объектов от  кадра к кадру редко попадают на границы точек.  Интерполяция  позволяет выяснить настоящее положение объекта, зачастую увеличивая эффективность сжатия  на  1дБ.

    17. Ограниченная активность движения в  P- фреймах:  пропущенные  макроблоки. Когда вектор движения и ошибка предсказания нулевые. Пропущенные  макроблоки очень желательны в кодированном потоке, поскольку не занимают  битов,  кроме как в заголовке следующего макроблока.

    18. Компланарное  движение  в  B- фреймах :  пропущенные  макроблоки.   Когда вектор движения тот же, а ошибка предсказания нулевая.

     

    Сравнительная таблица алгоритмов сжатия видеоизображения
    В таблице приведено сравнение  основных алгоритмов сжатия видеоизображения
Сжатие Преимущества Недостатки Идеальное применение
JPEG Промышленный  стандарт, это значит, что камеры, которые создают файлы JPEG, могут «просматриваться» с помощью самых разнообразных систем видео управления.  
Нет видимого ухудшения при 10-20 кратном сжатии.  
Эффективен с очень активными сценами.  
Особенно легко применять спецэффекты (проигрывание / пауза / перемотка назад /  перемотка вперед / шаг вперед / назад и т.п.)
При высоких  коэффициентах сжатия видео кажется  ступенчатым.  
Неэффективно при сжатии умеренно активных сцен.  
Скорости передачи данных 8 Мб/с типичны, поэтому их трудно передавать и почти невозможно хранить.
Хранение фотографий или фотоснимков с видео.  
CCTV с очень низкой частотой передачи кадров (<5 IPS), но с высоким уровнем активности сцен.  
Напр.,
DiBos v7 гибридный видеорегистратор.
M-JPEG То же, что JPEG, за исключением того, что изображения  в формате JPEG воспроизводятся в  быстрой последовательности. Как у JPEG. Как у JPEG, но особенно характерно для систем видеонаблюдения благодаря простоте. Популярность заставила рынок CCTV принять низкую частоту передачи данных (3.75 IPS) в качестве «нормы».
H.320 
H.261
Почти то же, что MPEG, но оптимизировано для двухсторонней  передачи с низкой задержкой через ISDN. При 128 Кб/с (2 ISDN B каналы) качество изображения и частота обновления изображения приемлемы. Низкое качество при более высоких пропускных способностях. Видео конференции  и видеофоны. Из-за большого диапазона  частот (от 64 до 1920 Кбит/с), может использоваться почти во всех сетях (LAN, WAN).
H.263 Оптимизировано  для низкой скорости передачи данных (ниже 64 Кб/с). Низкое качество при более высоких пропускных способностях. Подключения через  мобильную сеть стандарта GSM, модем  и аналоговые телефонные линии.
MPEG-1 Видео с качеством VHS на очень дешевых дисках CD. Качество VHS считается  многими неуместным ограничением качества. Дешевые видео CD (VCD). Аудио компонент (так называемый слой аудио Audio Layer 3) MPEG-1 известна как MP3.
MPEG-2 Наилучшее качество видео, которое могут обеспечить современные системы видеонаблюдения. Интенсивная передача данных, обычно 2.5-15 Mб/с для камеры. Видео для вещания, диски DVD, LAN TV, hi-fi стерео звук. Напр., Bosch VideoJet 8008 и VIP X1 кодирующее и декодирующее устройство.
MPEG-4 (часть  2) Очень эффективно при высокой частоте кадров, где  разница между последующими кадрами  уменьшается. Полоса частот обычно составляет 100-1000 Кб/с для камеры. Малая эффективность  при очень низкой частоте передаче кадров или очень высокой активности сцены. Если скорость передачи данных ограничена, на видеоизображении появляются паразитные узоры и ступенчатый  эффект. В системах видеонаблюдения, особенно если используется высокая скорость передачи данных или если активность большинства сцен низкая или средняя. Напр., Bosch VIP X2 и VIP XD кодирующее и декодирующее устройство или Bosch DiBos v8 гибридный видеорегистратор.
H.264 (то  же, что MPEG-4 часть 10) Перспективная технология для телевещания, более  эффективная, чем применяемый в данный момент MPEG-4 часть 2. Требуется мощная обрабатывающая аппаратная база и более  высокое время задержки. Следующее поколение MPEG-4, будет использоваться на DVD с  жестким диском, HDTV и платном телевидении.
Wavelet Видео выглядит лучше даже при высоком сжатии, потому что человеческий глаз воспринимает размытое изображение лучше, чем разрозненные блоки. При очень сильном  сжатии видео становится размытым, а не ступенчатым. Несовместимость  между разными производителями. В системах видеонаблюдения.   Напр., Bosch Divar XF.
Fractal Высокий коэффициент  сжатия для изображений, имеющих  большие зоны с повторениями, такие  как небо, вода и т.п. Медленно сжимается, требует интенсивной обработки. Несовместимость между разными производителями. Узкоспециализированное  сжатие фотографий, напр., сжатие фото на пропусках с микросхемами, где  время сжатия не имеет значения.
 
    
 

    

2.6 Существующие стандарты в области цифрового видео 
 

    

Стандарт Cell

    

Компания   Sun   Microsystems   предложила    свой    стандарт    компрессии идеоизображения  --  Cell.  Существуют  два  метода  компрессии  по   этому стандарту:  CellA  и  CellB.  Метод  CellA  требует  большей  вычислительной мощности для компрессии/декомпрессии сигнала, чем  метод  CellB.  Поэтому  в системах  видеоконференций,  требующих  работы  видео  в  реальном  времени, используется метод CellB. В этом методе изображение делится  на  4х4  группы пикселов, называемых ячейками (cell). В основу алгоритма компрессии  положен метод  BTC  (Block  Truncation  Coding).  16  пикселов   в   каждой   ячейке преобразуются  в  16-битовую  маску  цветности   и   две   8-битовых   маски интенсивности, поэтому для кодировки 384 битов требуются всего 32 бита.  Это означает степень сжатия 12:1. Преимущество метода Cell  заключается  в  том, что  в  процессе  декомпрессии  можно  использовать  графические   примитивы Windows-подобных систем.

    

Такие примитивы  выполняются аппаратно  стандартными графическими   акселераторами,   что   позволяет   пользоваться   аппаратной декомпрессией,  используя  стандартное  оборудование,  уже  установленное  вкомпьютере.

    

Стандарт NV

    

Подразделение PARC компании Xerox предложило  метод  компресии  NV  (Network Video).  Метод используется  чаще   всего   в   системах   телеконференций, работающих  в  Internet.  На  первом  шаге  алгоритма  текущее   изображение сравнивается  с  предыдущим  и  выделяются  области,  в  которых   произошли значимые изменения. Компрессии и последующей пересылке  подвергаются  только эти области. В зависимости от того, что является  лимитирующим  фактором  --полоса пропускания канала связи или  вычислительная  мощность  оборудования, для компрессии используются либо преобразование Фурье,  либо  преобразование Гаара.

    

После квантования  преобразованного  изображения  достигается  степень сжатия до 20:1.

    

Стандарт CU-SeeMe

    

В  экспериментальной  системе  видеоконференций  CU-SeeMe,  разработанной  в Корнуэлльском   университете,   входное   изображение   представляется    16 градациями серого цвета с 4 битами на  пиксел.  Изображение  разбивается  на блоки пикселов общим количеством 8х8.  Кадр  сравнивается  с  предыдущим,  и пересылаются  только  блоки,  в  которых   произошли   значимые   изменения.

    

Компрессия  этих  блоков  происходит  по  алгоритму   сжатия   без   потерь, разработанному специально для системы CU-SeeMe. С  учетом  возможных  потерь данных в канале связи  периодически  пересылаются  и  неизменившиеся  блоки. Степень сжатия изображения составляет 1,7:1. Алгоритм компрессии  изначально был разработан для аппаратно-программной платформы Macintosh. Он работает  с восемью 4-битными пикселами как 32-битными  словами.  Для  системы  CU-SeeMe минимальная пропускная способность канала  связи  должна  быть  не  ниже  80 Кбит/с.

    

Стандарт Indeo

    

Фирма  Intel  разработала  метод  компрессии/декомпрессии  Indeo.  В  основе метода лежит  расчет  изображения  текущего  кадра  по  данным  предыдущего.

    

Передача кадра  происходит только  в  том  случае,  если  расчетные  значения значимо отличаются от реальных. Компрессия осуществляется по методу 8х8  FST (Fast  Slant  Transform),  в котором используются  только   алгебраические операции сложения и вычитания. Степень  сжатия  в  методе  Indeo  составляет 1,7:1. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

    

3. ЭКОНОМИЧЕСКАЯ ЧАСТЬ 
 

    

Для того чтобы  оценить экономическую целесообразность рассматриваемого программного продукта необходимо рассчитать затраты на его  создание, складывающиеся из затрат на алгоритмизацию и программирование задачи, затрат на отладку программы, для расчета которых необходимо определить трудоемкость программирования и найти стоимость одного машино-часа.

    

Экономическая целесообразность программного продукта заключается в экономии трудозатрат  по сравнению с ручной обработкой и получение более достоверной информации за короткой время. 

    

3.1 Определение трудоемкости  программирования 
 

    

Трудоемкость  программирования – это затраты  времени на составление программного продукта.

    

Трудоемкость  программирования определяется по типовым  нормам программирования.

    

Для определения  трудоемкости программирования используется следующая формула:

    

       (3.1)

    

Информация о работе Разработка программы компрессий цифрового видеосигнала