Кодирование и сжатие аудио-информации

Автор: Пользователь скрыл имя, 13 Декабря 2011 в 23:32, реферат

Описание работы

Первой предварительной операцией, которая производится с аналоговым звуком является фильтрация, в результате которой выделяется требуемый частотный диапазон для соответствующего канала и удаляются помехи. Эта операция производится при помощи низкочастотных, высокочастотных или полосовых фильтров. Амплитудно-частотные характеристики низкочастотного и полосового фильтров :
Семплирование и квантизация
Следующим комплексом операций является собственно оцифровка, которая состоит из дискретизации сигнала по времени, т.е. разбиении сигнала на временные отрезки с заданным шагом дискретизации и измерения амплитуды сигнала в данные моменты времени.

Работа содержит 1 файл

лекции.doc

— 1.15 Мб (Скачать)

      - в компьютерной технике применяется  в основном RGB (и αRGB),

      -  в печатной технике CMYK.

  • Количество цветов в видеоматериале определяется числом бит, отведённым для кодирования цвета каждого пикселя ( bits per pixel, bpp):
  • 1 бит позволяет закодировать 2 цвета (обычно чёрный и белый), 2 бита - 4 цвета,  …,16 бит - 65 536 цветов,
  • 24 бита - 16 777 216 цветов.
  • В компьютерной технике имеется стандарт и 32 бита на пиксель (αRGB).

Ширина  видеопотока (для  цифрового видео)

  • Ширина (скорость) видеопотока или битре́йт (bit rate) - это количество обрабатываемых бит видеоинформации за секунду времени  «бит/с».
  • Чем выше ширина видеопотока, тем в общем лучше качество видео.
  • ширина видеопотока:
  • формата VideoCD составляет  1 Мбит/с,
  • DVD составляет около 5 Мбит/с.
  • HDTV использует ширину видеопотока около 10 Мбит/с.
  • Различают два вида управления шириной потока в видеокодеке:
  • - постоянный битрейт (англ. constant bit rate, CBR). Используется для безбуферных систем реального времени и для прямого эфира (например, для телеконференций)
  • - переменный битрейт (англ. variable bit rate, VBR). Используется для буферизованных видеотрансляций и передачи сохранённого видеоматериала по компьютерным сетям

Стандарты и методы цветового  кодирования (передачи видеоинформации)

  • С начала развития техники цветного телевидения разными комитетами по стандартизации и в зависимости от имеющей место частоты промышленной сети было разработано несколько различных методов формирования кадра и систем передачи телевизионного сигнала. Их называют методами(системами) цветового кодирования.
  • В настоящее время существуют аналоговые и цифровые системы телевидения.
  • Помимо систем цветового кодирования существуют стандарты, которые описывают различные параметры телевизионных сигналов, способы ввода сигнала в телевизор, сопряжения звука и изображения и др. Основных телевизионных стандартов в мире насчитывается 10 :
  • B,D,H,G,I,K,L,M,N,K1.
  • В России используется стандарт: Secam D/K.

Системы цветового кодирования NTSC

  • NTSC ( National Television Standards Committee) - Национальный комитет по телевизионным стандартам) - система аналогового цветного телевидения, разработанная в США (30 кадров/сек.). 18 декабря 1953 года впервые в мире было начато цветное телевизионное вещание с применением именно этой системы.
  • NTSC принята в качестве стандартной системы цветного телевидения в Канаде, Японии и ряде стран американского континента и в насмешку называется «Never the same coior!» («Один и тот же цвет не повторяется никогда!»). В этих словах и заключена основная проблема:  при передаче цветовых сигналов возникают фазовые сдвиги, приводящие к искажению цвета в изображении. Метод NTSC не позволяет компенсировать фазовые погрешности.
  • Основные рабочие характеристики системы NTSC:
  • Количество строк 525
  • Частота полукадров 60 Гц
  • Ширина полосы видеосигнала 4,2 МГц
  • Ширина полосы канала 6 МГц.

PAL

  • PAL ( phase-alternating line) - разработана инженером немецкой компании Telefunken Вальтером Брухом и представленная как стандарт телевизионного вещания в 1967 году.
  • Система PAL является стандартом во многих странах, в том числе в Германии. Эта система была создана из-за необходимости компенсировать фазовые сдвиги в видеосигнале, приводящие к значительным искажениям цвета.
  • Основные рабочие характеристики :
  • Количество строк 625
  • Частота полукадров 50 Гц
  • Ширина полосы видеосигнала 5 МГц
  • Ширина полосы канала  7 или 8 МГц.

SECАМ (Sequential Couleur avec Memoire,) - система последовательной передачи цветов с памятью

  • SECАМ разработана в СССР, идея принадлежит французкому инженеру Анри Францу.
  • С 1 октября 1967 г. в СССР начались регулярные передачи цветного телевидения в стандарте SECAM.
  • Систему приняли 25 стран, включая страны Восточной Европы (бывший социалистический лагерь, кроме Югославии), франкоговорящие страны Африки и Азии, часть Греции и Иран.
  • При методе SECAM, сигналы цветности передаются не одновременно, как в системах NTSC и PAL, а попеременно строка за строкой. Для получения полной цветовой информации в этом случае всегда должен промежуточно запоминаться некоторый сигнал. Специальная модуляционная техника позволяет сделать метод SECAM сравнительно не чувствительным относительно искажений и фазовых сдвигов.
  • Основные рабочие характеристики системы:
  • Количество строк 818
  • Частота полукадров        50 Гц
  • Ширина полосы видеосигнала 10 МГц
  • Ширина полосы канала       14 МГц.

Цифровые  системы передачи телевизионного сигнала

  • ATSC - система стандартов, разработанная Международной некоммерческой организацией Advanced Television Systems Committee (ATSC). Образована в 1982г. с целью разработки новых стандартов телевидения. Именно эта группа специалистов разработала стандарт цифрового вещания ATSC, который теперь является основным на территории США, Канады, Мексики, Аргентины, Тайваня и Южной Кореи.
  • Сюда входит HDTV стандарт высокочеткого (high-definition) цифрового телевидения. Используется метод D2-MAC, который состоит в том, что сигналы яркости и цветности передаются попеременно, и это позволяет в значительной степени избежать интерференционных помех. Еще одним преимуществом является то, что аудиосигналы передаются в цифровой форме.
  • Основные рабочие характеристики :
  • Количество видимых строк  1080
  • Количество пикселов в строке 1920
  • Частота полукадров 50 Гц
  • Ширина полосы яркостного сигнала 20 МГц
  • Ширина полосы сигнала цветности  7 МГц.
  • Формат кадра         16:9

DVB (англ. Digital Video Broadcasting)

  • DVB (англ. Digital Video Broadcasting) — семейство европейских стандартов цифрового телевидения.
  • Данный стандарт определяет физический уровень и канальный уровень в системе телевещания. Все данные передаются в транспортном потоке MPEG-2 с некоторыми дополнительными ограничениями (DVB-MPEG).
  • Существует 4 среды доставки сигнала:
  • наземное вещание (DVB-T),
  • вещание для портативных устройств (DVB-H),
  • спутниковое вещание (DVB-S),
  • кабельное вещание (DVB-C).
  • Из-за разницы в частотных каналах и способах модуляции декодеры для различных сред оказываются несовместимыми.

ISDB (Integrated Services Digital Broadcasting)

  • ISDB (Integrated Services Digital Broadcasting) - стандарт цифрового телевидения, разработанный в Японии. Он интегрирует в себя различные виды цифрового контента. Это может быть HDTV, SDTV, звук, графика, текст и т.д.
  • Японская организация по стандартизации и распределению радиочастот Association of Radio Industries and Businesses (ARIB) разработала стандарты для передачи цифрового телевидения и радио под единым названием Integrated Services Digital Broadcasting (ISDB).
  • Основных ISDB-стандартов в настоящее время четыре:
  • наземное (ISDB-T);
  • спутниковое (ISDB-S);
  • кабельное (ISDB-C);
  • мобильное (нет аббревиатуры).
  • Также как и в спецификациях ATSC и DVB, для сжатия видеопотока при ISDB-вещании используется система кодирования MPEG-2.
 

 

СЖАТИЕ ЗВУКА 

Традиционные  методы сжатия данных - без потерь (Huffman, LZW, и др.) плохо применимы для  сжатия аудио и визуальной информации

       методы сжатия с потерями:

  •   Сжатие тишины(пауз) - определяет периоды "тишины«
  • ADPCM - Adaptive Differential Pulse Code Modulation (в русскоязычной литературе применяется термин адаптивная дельта-импульсно-кодовая модуляция (АДИКМ).
  •   Apple разработал собственную систему названную ACE/MACE. Сжатие с потерями, основанное на предсказании значения следующего отсчета. Сжатие порядка 2:1.
  •   Linear Predictive Coding (LPC) - описывает сигнал с помощью "речевой модели" и передает параметры модели --> звучит как компьютерно синтезированная речь, 2.4 kbits/sec.

MPEG - Moving Pictures Expert Group.

Экспертная  группа по движущимся изображениям.

Организация была создана в 1988 году и за время  своего существования выпустила  несколько стандартов, оказавших  большое влияние на информационные технологии и современную жизнь в целом.

MPEG1 – первый официальный международный стандарт, посвященный хранению видео и аудио информации в цифровом виде.

Стандарт  состоит из трех частей:

  1. Система. Описывает системную часть формата. Определяет способы мультиплексирования аудио и видео потоков, синхронизацию и формат физического хранения данных.
  2. Видео-канал. Определяет формат и алгоритм кодирования видео-потока и способ восстановления кадров изображения.
  3. Аудио-канал. Определяет формат и алгоритм кодирования аудио-потока и способ восстановления звукового потока.

 Впоследствии, когда формат сжатия аудио,  предложенный в третьей части  стандарта получил самостоятельное  распространение, он стал называться  MP3 (Moving Pictures layer 3).

Методы  кодирования звука

  • Audio MPEG (Moving Pictures Experts Group). Применяется в компьютерных звуковых системах.
  • PASC (Precision Adaptive Sub-band Coding). Применяетя в системе DCC.
  • ATRAC (Adaptive Transform Acoustic Coding). Применяется в системе MiniDisc

Уровни AudioMPEG1 для сжатия стерео сигналов

Номер уровня Коэффициент сжатия Скорость потока данных, Кбит/с
1 1:4 384
2 1:6…1:8 256…192
3 1:10…1:12 128..112
  • Оптимальный уровень - 3 со скоростью потока 125 кбит/с и плотностью данных 1Мбит/мин
 

 MPEG-4, цели создания

 Основы  разработки стандарта MPEG-4 были заложены группой ученых из MPEG еще в 1993 году, и уже к концу 1998 года произошло  утверждение первого стандарта. Впоследствии стандарт неоднократно дорабатывался, в 1999 году получил официальный статус и затем был стандартизован со стороны ISO/IEC.Это было связано с тем, что форматы MPEG-1 и MPEG-2 не обеспечивали реальной возможности трансляции видео по сети Internet и создания интерактивного телевидения на их основе - слишком уж большим был размер файлов. Для его радикального уменьшения, а также реализации других функций, необходимых для передачи потокового видео, была начата работа над спецификациями нового формата - MPEG-4.

 Целью создания MPEG-4 была выработка стандарта кодирования, который обеспечил бы разработчиков  универсальным средством сжатия видеоданных, позволяющим обрабатывать аудио- и видеоданные как естественного (снятого с помощью видеокамеры  или записанного с помощью микрофона), так и искусственного (синтезированного или сгенерированного на компьютере) происхождения. По сути, он ориентирован не столько на сжатие видео, сколько на создание так называемого "мультимедийного контента" - слияния интерактивного телевидения, 3D-графики, текста и т. д. Это обстоятельство кардинальным образом отличает MPEG-4 как видеостандарт от его предшественников MPEG-1 и MPEG-2, в которых эффективное сжатие данных достигается лишь применительно к естественному видео и аудио.

 Принципы  работы алгоритма 

 MPEG-4 обеспечивает  необходимые средства для описания  взаимного расположения объектов (элементов) сцены в пространстве  и времени с целью их последующего  представления потенциальным зрителям  в ходе воспроизведения. Разумеется, такая трактовка предполагает разделение сцены на составляющие ее объекты, что само по себе является весьма трудоемкой задачей, к которой по сути и сводится MPEG-4-кодирование. Кроме того, при разработке стандарта MPEG-4 решались проблемы обеспечения воспроизведения объектов сцены в различных условиях пропускной способности сетей передачи данных. Был разработан формат, допускающий «универсальный доступ» к мультимедийной информации с учетом возможных ограничений полосы пропускания, возникающих в сетях при самых разных условиях. Другими словами, один и тот же видеофрагмент может быть представлен с различным качеством для различных каналов в зависимости от их пропускной способности.

Информация о работе Кодирование и сжатие аудио-информации