Кодирование и сжатие аудио-информации

Автор: Пользователь скрыл имя, 13 Декабря 2011 в 23:32, реферат

Описание работы

Первой предварительной операцией, которая производится с аналоговым звуком является фильтрация, в результате которой выделяется требуемый частотный диапазон для соответствующего канала и удаляются помехи. Эта операция производится при помощи низкочастотных, высокочастотных или полосовых фильтров. Амплитудно-частотные характеристики низкочастотного и полосового фильтров :
Семплирование и квантизация
Следующим комплексом операций является собственно оцифровка, которая состоит из дискретизации сигнала по времени, т.е. разбиении сигнала на временные отрезки с заданным шагом дискретизации и измерения амплитуды сигнала в данные моменты времени.

Работа содержит 1 файл

лекции.doc

— 1.15 Мб (Скачать)
  • Новейший формат Ogg Vorbis в режиме 256 явно недотягивает "по верхам" - урезание частот.
  • "Супер коммерческий" формат LQT передает диапазон частот по верхам немного лучше, чем LAME, но общее качество хуже. Дело в том, что в LQT нет режима чистого стерео - там, всегда Joint-Stereo (кодер сначала сжимает левый канал, а потом кодирует только разницу между левым и правым). Из-за этого и происходит размазка верхов при недостатке битрейта,
  •    LAME - чуть-чуть урезаются верхние частоты, но это терпимо; видимых провалов также не отмечено.
 

Форматы для представления  звука и музыки

Microsoft RIFF (Resource Interchange File Format) WAVE содержит оцифованный звук
SMF (Standard MIDI File) содержит «партитуру»  для MIDI-инструментов
RAW одноканальный формат «чистой оцифровки»
VOC и CMF форматы от Creative Labs
AIFF формат на Macintosh и SGI
AU формат SUN/NeXT
MOD трекерный формат
STM формат Scream Tracker
S3M формат Scream Tracker 3
XM формат Fast Tracker
 

Носители  цифрового звука

  • CD (CD-R, CD-RW)
  • ИКМ-приставка (PCM desk)
  • S-DAT (Stationary head Digital Audio Tape)
  • R-DAT (Rotary head Digital Audio Tape)
  • DASH (Digital Audio stationary Head)
  • ADAT (Alesis DAT)
  • DCC (Digital Compact Cassete)
  • MD (MiniDisc)
 

Превращение канавки в питы

 
 

Схема обработки звука  в ПК

1. С ЦАП/АЦП  на звук карте

 

2. С ЦАП  на периферийных устройствах

 

Передача  голоса по каналам  Интернет

  • Сегодня имеется 30 миллионов абонентов, регулярно пользующихся IP-phone и его аналогами, ожидается до 200 миллионов до конца текущего десятилетия, качество передачи постепенно приближается к уровню цифровой телефонии.

Существуют  два алгоритма сжатия звуковой информации, используемых для ip-телефонных переговоров:

1) GSM (global system for mobile communications), коэффициент сжатия 5,         2) DSP-группы (true speech) с коэффициентом сжатия данных 18 (работает при частотах 7.7 кбит/с).

      Добавление  аппаратных средств сжатия информации позволяет сократить необходимую  полосу до 6.72 Кбит/с. Потеря 2-5% пакетов  остается незамеченной, 20% оставляет  разговор понятным.

        Для подключения к сети ip-phone необходима мультимедийная карта, микрофон, динамики (или наушники), 8 Мбайт оперативной памяти, доступ к Интернет и соответствующее программное обеспечение.  

Cтандарты и протоколы для обеспечения передачи звука по ip-каналам

  • Качество передачи звука зависит от загруженности IP-канала.
  • В качестве транспорта используется  протокол UDP
  • К протоколам служащий для обеспечения своевременной доставки данных при работе в реальном времени относятся:
  • RTP (real time protocol),
  • RTCP (real-time control protocol), который является дополнением RTP,
  • RSVP (resource reservation protocol)
 

характеристики  аудио-кодеков, которые  можно использовать в IP-телефонии.

   Кодек      Выходная скорость кодека

   G.711                64 кбит/с

   g.722          48, 56 или 64 кбит/с

   g.728              16 кбит/с

Требования  к системам IP- телефонии

При внедрении ip-телефонии  желательно, чтобы  сетевая инфраструктура обеспечивала:

  • Время задержки в одну сторону менее 100 мсек.
  • Вероятность потери пакета менее 5%.
  • Оборудование должно соответствовать требованиям H.323v2, а механизмы безопасности - стандарту H.235.
 

Пример реализации систем в IP-телефонии

(MVD – Multiflex Voice/WAN модуль, включаемый в маршрутизатор,  например, Cisco-3662). 

 
 

Основы  и стандарты видеотехнологии.

  Основные характеристики и параметры видеосигнала

Ви́део (от лат. Video - дословно «вижу») - под этим термином понимают широкий спектр технологий записи, обработки, передачи, хранения и воспроизведения визуального и аудиовизуального материала.

  • Изобретение телевидения принадлежит русскому инженеру Зворыгину (1932г.)
  • В 1957 году был изобретен первый монитор.
  • Видеоизображение состоит из последовательности статических картинок (кадров).Количество (частота) кадров в секунду - это число неподвижных изображений, сменяющих друг друга при показе 1 секунды видеоматериала и создающих эффект движения объектов на экране.

Развёртка изображения на экране

  • Развёртка видеоматериала может быть прогрессивной или чересстрочной (интерлейс от англ. interlace или интерлейсинг).
  • При прогрессивной развёртке все горизонтальные линии (строки) изображения отображаются одновременно,
  • При чересстрочной развёртке показываются попеременно чётные и нечётные строки (называемые также полями кадра)
  • Чересстрочная развёртка была изобретена для показа изображения на кинескопах с электронно-лучевой трубкой и используется сейчас для передачи видео по «узким» каналам в Системах: PAL, SECAM и NTSC. Новые цифровые стандарты телевидения, например, HDTV предусматривают прогрессивную развёртку.
 

Разрешение  и соотношение  сторон экрана

  • По аналогии с разрешением компьютерных мониторов, любой видеосигнал также имеет разрешение ( resolution), горизонтальное и вертикальное, измеряемое в пикселях.
  • Обычное аналоговое телевизионное разрешение составляет 720×576 пикселей для стандартов PAL и SECAM, при частоте кадров 50 Герц ;
  • и 640×480 пикселей для NTSC, при частоте 60 Герц.
  •            Новый стандарт высокочеткого (high-definition) цифрового телевидения HDTV предполагает разрешения до 1920×1080 при частоте  60 Герц с прогрессивной развёрткой.
  • Разрешение в случае трёхмерного видео измеряется в вокселях - элементах изображения, представляющих точки (кубики) в трёхмерном пространстве. Например, для простого трёхмерного видео используется базовое разрешение 512×512×512.
 

Соотношение ширины и высоты кадра (англ. aspect ratio) - важнейший параметр в любом видеоматериале.

Ещё с 1910 года кинофильмы имели соотношение сторон экрана 4:3 (4 единицы в ширину к 3 единицам в высоту; иногда ещё записывается как 1,33:1 или просто 1,33). Считалось, что зрителю удобнее смотреть фильм на экране такой формы.

             Когда появилось  телевидение, то оно переняло  это соотношение и почти все  аналоговые телесистемы (и, следовательно,  телевизоры) имели соотношение сторон  экрана 4:3.

             Компьютерные мониторы  также унаследовали телевизионный  стандарт сторон. Хотя ещё в  1950-х годах это представление  о 4:3 в корне изменилось. Дело  в том, что поле зрения человека  имеет соотношение отнюдь не 4:3. Ведь у человека 2 глаза, расположенных  на одной горизонтальной линии - следовательно, поле зрения человека приближается к соотношению 2:1.

            Чтобы приблизить форму  кадра к естественному полю зрения человека (и, следовательно, усилить  восприятие фильма), был введён стандарт 16:9 (1,78), почти соответствующий так называемому «Золотому сечению».

            Цифровое телевидение  в основном тоже ориентируется на соотношение 16:9.

            К концу XX века, после ряда дополнительных исследований в этой области, стали появляться даже и  более радикальные соотношения  сторон кадра: 1,85, 2,20 и вплоть до 2,35 (почти 21:9).

Основные  характеристики цветового  сигнала

  • Яркость. При приеме цветового сигнала три раздельные передающие телевизионные трубки (или преобразователя) генерируют напряжения сигналов для красного, зеленого и синего цветов
  • напряжения преобразуются затем в один яркостный и два сигнала цветности.
  • Яркостный сигнал формируется из трех основных цветов. Он сохраняет яркость цвета и рассчитан таким образом, что может быть использован и для передачи черно-белого изображения. Расчет цветовых составляющих для яркостного сигнала основан на цветовой чувствительности человеческого глаза. Основное снижение объема информации в цветном телевидении достигается за счет передачи ограниченного числа насыщенных цветовых тонов, что оказалось возможным благодаря особому свойству цветового зрения, известному под названием трех-компонентности цветовосприятия.

Теория  цветового зрения

  • Ломоносов пришел к выводу, что цветоощущающий (колбочковый) аппарат глаза человека содержит рецепторы (нервные окончания) трех видов.
  • Причем излучения различных волн возбуждают эти рецепторы неодинаково.
  • первый вид окончаний наиболее чувствителен к длинноволновой части видимого спектра (красно-оранжевой),
  • второй  к средневолновой части спектра (зелено-желтой)
  • третий  к коротковолновой (сине-фиолетовой).
  • Естественные краски на экране получатся, если смешать основные цвета в следующем соотношении: 30% красного (R), 59% зеленого (G) и 11% синего (В).
  • При соответствующем сложении цветовых составляющих получим яркостный сигнал Y :

                  Y = 0,3R + 0,59G + 0,11B.

Кривые основных возбуждений(спектральной чувствительности рецепторов) глаза 

Согласно  теории цветового зрения М. В. Ломоносова: . все цвета могут быть получены путем сложения (смешения) трех световых потоков,  например, красного,  зеленого и синего с высокой насыщенностью, называемых основными, или первичными.

Цветность.

  • Сигналы цветности представляют собой разностные сигналы, заданные разностью яркостного сигнала и двух из трех основных цветов.
  • При формировании изображения эти три сигнала можно опять преобразовать в три основных цвета. Сигналы цветности U и V определяются по следующим формулам:

                  U = B-Y,

                   V = R-Y.

  • Разностные сигналы U и V формируют вместе с сигналом Y полный сигнал YUV, который может быть обработан большинством из существующих видеоадаптеров.

Свойства  зрения, благодаря  которым оказалось  возможным существенно  сократить объем  информации о цвете, передаваемой по каналам  связи и воспроизводимой на экране цветного телевизора:

  • Трехкомпонентность цветового зрения распространяется только на относительно крупные наблюдаемые объекты, которые при телевизионной передаче требуют полосы видеочастот от 0 до 0,5 МГц и воспроизводятся трехцветными.

 

  • Цвет объектов средних размеров, воспроизводимых видеочастотами от 0,5 до 1,5 МГц, является смесью только двух цветов: оранжевого и зелено-синего (голубого).

 

  • Мелкие детали, требующие для воспроизведения видеочастоты от 1,5 МГц и выше, различаются  наблюдателями только по яркостным градациям, то есть кажутся черно-белыми. При этом отсутствие окраски мелких деталей незначительно ухудшает субъективное восприятие цветного изображения.

Формат  полного цветного телевизионного сигнала

 

Количество цветов и цветовое разрешение

  • Количество цветов и цветовое разрешение видеосигнала описывается цветовыми моделями:

      - для  телевизионной техники применяется цветовая модель YUV,

Информация о работе Кодирование и сжатие аудио-информации