Автор: Пользователь скрыл имя, 13 Декабря 2011 в 23:32, реферат
Первой предварительной операцией, которая производится с аналоговым звуком является фильтрация, в результате которой выделяется требуемый частотный диапазон для соответствующего канала и удаляются помехи. Эта операция производится при помощи низкочастотных, высокочастотных или полосовых фильтров. Амплитудно-частотные характеристики низкочастотного и полосового фильтров :
Семплирование и квантизация
Следующим комплексом операций является собственно оцифровка, которая состоит из дискретизации сигнала по времени, т.е. разбиении сигнала на временные отрезки с заданным шагом дискретизации и измерения амплитуды сигнала в данные моменты времени.
Кодирование и сжатие аудио-информации
Цифровая запись и воспроизведение звука
Первой предварительной операцией, которая производится с аналоговым звуком является фильтрация, в результате которой выделяется требуемый частотный диапазон для соответствующего канала и удаляются помехи. Эта операция производится при помощи низкочастотных, высокочастотных или полосовых фильтров. Амплитудно-частотные характеристики низкочастотного и полосового фильтров :
Семплирование и квантизация
Оцифровка звукового
сигнала
Дискретизация аналогового сигнала во времени
Квантование
значений амплитуды
Параметры оцифровки
Семплирование звука с низкой и повышенной частотой и разрядностью
Методы сжатия аудио
1. Алгоритмы основанные на дискретизации
Самый простой метод сжатия звука: весь диапазон значений уровня громкости (в большинстве случаев это 16-битные значения) приводится к интервалу 0-15 (тогда каждый уровень громкости можно будет задать 4-мя битами). У стерео-сигнала каждый канал обрабатывается отдельно. Для повышения качества при распаковке диапазон значений громкости можно приводить обратно к 16-битному виду по нелинейному/адаптивному интерполяционному алгоритму.
2. Восстановление сигнала по спектру
Зависимость амплитуды колебания от его частоты в разложении сигнала называется спектром. Сжатие основывается на том, что спектр изменяется медленнее, чем сам сигнал – и, соответственно, лучше сжимается. Однако, этот метод обычно применяется только для сжатия речи, т.к. он выигрывает у других только при очень высоких степенях сжатия и, соответственно, при довольно больших искажениях.
3. Алгоритм MP3.
Этот алгоритм
использует особенности человеческого
слуха. Например, человек более чувствителен
к средним частотам (нежели к низким
и высоким); практически не воспринимает
тихий звук, близкий по частоте к громкому,
и т.д. Эти особенности восприятия называются
психоакустической моделью. После удаления
из спектра неслышимых частей звук кодируется
алгоритмом, похожим на описанный в п.1;
причем - чем лучше слышен звук в данной
частотной полосе, тем больше уровней
используется. Для работы со стереозвуком
существуют 2 режима: обычный, когда каналы
обрабатываются отдельно, и JoinedStereo, когда
кодируется один канал, а вместо второго
- разница между каналами, которая обычно
невелика.
MPEG - Moving Pictures Expert Group.
Экспертная группа по движущимся изображениям.
Организация была создана в 1988 году и за время своего существования выпустила несколько стандартов, оказавших большое влияние на информационные технологии и современную жизнь в целом.
MPEG1 – первый официальный международный стандарт, посвященный хранению видео и аудио информации в цифровом виде.
Стандарт состоит из трех частей:
Впоследствии,
когда формат сжатия аудио,
предложенный в третьей части
стандарта получил
Аудио параметры MPEG-1
Уровни AudioMPEG1 для сжатия стерео сигналов
Номер уровня | Коэффициент сжатия | Скорость потока данных,
Кбит/с |
1 | 1:4 | 384 |
2 | 1:6…1:8 | 256…192 |
3 | 1:10…1:12 | 128..112 |
Оптимальный
уровень - 3 со скоростью потока 125 кбит/с
и плотностью данных 1Мбит/мин
MPEG-2 – upgrade MPEG-1
Изменения а Audio:
Схема кодирования звука
Методы сжатия, основанные на психоакустике
Перцепционная модель
Психо-акустическая модель построена на основе информации, накопленной о звуковом восприятии, строении человеческого слухового аппарата и психологии восприятия музыки. Можно сказать, что MP3 построен на «обмане» человеческого уха и мозга, не сохраняя те звуковые картины, которые человек наверняка не заметит. Основными способами «обмана» являются:
Кодирование аудио-потока
В стандарте определено только кодирование потока – нет рекомендаций о форматах файлов хранения или форматах вещания MP3.
После квантования, полученные кванты данных по каждому каналу (логическому, т.к. количество каналов в потоке MP3 не обязательно соответствует количеству реальных стереофонических каналов) сжимаются по алгоритму Хаффмана (Huffman).
Алгоритм Хаффмана заключается в замене наиболее часто встречающихся последовательностей бит в потоке (паттернов) на битовые последовательности меньшей длины. Чем чаще паттерн встречается в потоке, тем короче соответствующая ему последовательность бит. Преимущества алгоритма – высокая скорость и мизерные накладные расходы на размер потока в случае совершенно равномерных данных. В среднем, для классической симфонической музыки, алгоритм дает сжатие порядка 20%.
Полученный
поток сохраняется в
Способы сжатия и хранения нескольких звуковых каналов.
Схема декодирования звука
Способы кодирования стерео сигнала в рамках MP3
Dual Channel | Каждый канал получает половину потока и кодируется отдельно как моносигнал. |
Stereo | Каждый канал кодируется отдельно, но кодер может принять решение отдать одному каналу места больше, чем другому |
Joint Stereo (MS Stereo) | Стереосигнал раскладывается на средний между каналами и разностный. При этом 2-й кодируется с меньшим битрейтом |
Joint Stereo (MS/IS Stereo) | Для нескольких частотных диапазонов оставляется только отношение мощностей сигнала в разных каналах |
Исследование АЧХ сэмплов, признанных лучшими