Принцип работы VoIP (Voice over Internet Protocol)

Автор: Роман Кулабухов, 11 Сентября 2010 в 08:16, курсовая работа

Описание работы

Телефонная связь и голосовое общение в современном мире – это один из самых быстрых способов выразить свои мысли и объяснить что-то. Возможность непрерывного диалога, в отличие от писем, ускоряет коммуникацию, да и к тому же, речевое общение – это наиболее удобный для человека способ взаимодействия с себе подобными. В этом случае не имеет значения скорость набора на клавиатуре, которая часто становится камнем преткновения при различном текстовом общении (например, в веб-чатах или программах-мессенджерах).

Содержание

Изучение принципов работы VoIP
История создания и развития VoIP

Работа содержит 1 файл

Курсач.doc

— 903.50 Кб (Скачать)

    Проверка MOS используется также для оценки того, насколько хорошо конкретный кодек работает при изменяющихся обстоятельствах, включая различные уровни фонового шума, многократное кодирование, декодирование и т.д. Потом эти данные можно использовать для сравнения других кодеков. [табл. 1]

Метод сжатия Скорость передачи (Кбит/с) Размер выборки (мс) Оценка MOS
G.711 РСМ 64 0,125 4,1
G.726 ADPCM 32 0,125 3,85
G.728 Алгоритм  сжатия при кодировании методом  линейного 

предсказания  с низкой скоростью передачи (Low Delay Code

Excited Linear Predictive —  LD-CELP)

15 0,625 3,61
G.729 Алгебраический  алгоритм сжатия при кодировании  методом 

линейного предсказания со структурой сопряжения (Conjugate Structure Algebraic Code Excited Linear Predictive — CS-ACELP)

8 10 3,92
G.729a CS-ACELP 8 10 3,7
G.723.1 MP-MLQ 6,3 30 3,9
G.723.1 ACELP 5,3 30 3,65
iLBC Freeware 15,2 20 3,9

Табл. 1 Соотношение между несколькими кодеками с низкой скоростью передачи и стандартом РСМ

1.6.3.3 Перцепционная оценка качества речи

    Проверка MOS — это субъективный метод определения  качества речи, однако он далеко не единственный. Сектор ITU-T выработал рекомендацию Р.861, которая определяет способы, с помощью которых можно объективно оценить качество речи, используя перцепционное измерение качества речи (Perceptual Speech Quality Measurement— PSQM).

    Проверка PSQM способна обнаружить множество недостатков  голосовых кодеков (вокодеров). Одним из недостатков является то, что "машина" или PSQM слышат не то, что человеческое ухо. С точки зрения обывателя это означает, что человеческое ухо можно обмануть в восприятии качества голоса, но компьютер обмануть нельзя. Кроме того, PSQM позволяет "услышать" ухудшения, вызванные компрессией и декомпрессией, но не потерей пакетов или дребезгом.

1.6.4 Эхо

    Звук  собственного голоса в трубке во время  разговора довольно-таки привычен. Однако при задержке большей, чем  примерно 25 мс, звук собственного голоса может просто сбивать говорящего с толку.

Обычно, в традиционных сетях, причиной эха является несовпадение полного электрического сопротивления  на стыке четырехпроводного сетевого коммутатора и двухпроводной  абонентской линии (рис.). В стандартной коммутируемой телефонной сети общего пользования (PSTN) эхо ликвидируется с помощью компенсаторов эха и тщательного управления рассогласованием сопротивления на общих точках отражения [рис. 2].

Рисунок 2 Эхо, вызванное несовпадением сопротивлений

В тех частях мира, где преобладает передача аналоговых голосовых данных, телефонные сети используют подавители эха, которые  удаляют эхо, компенсируя перепад  сопротивления в канале. На самом  деле, это не лучший механизм для  борьбы с эхо, к тому же он вызывает и другие проблемы. Например, канал с подавителем эха нельзя использовать в цифровой сети с комплексным обслуживанием (Integrated Services Digital Network— ISDN), поскольку подавитель эха вырезает тот диапазон частот, который использует ISDN.

В нынешних пакетных сетях можно создавать компенсаторы эха в низкоскоростных кодеках  и использовать их на каждом процессоре DSP. В реализациях некоторых изготовителей  подавление эха обеспечивается программным  обеспечением, но, следует заметить, что такая практика существенно уменьшает преимущества подавления эха.

Принцип работы компенсаторов эха становится более  ясным, если понять, откуда берется  эхо.

    Допустим, что пользователь А разговаривает с пользователем В. Разговор пользователя А с пользователем В назовем G. Когда G сталкивается с рассогласованием сопротивлений или другими факторами, вызывающими эхо, он возвращается обратно к пользователю А. Затем пользователь А несколько миллисекунд "слышит" задержку.

    Чтобы избавиться от эха в канале, устройство, по которому говорит пользователь А (маршрутизатор А), некоторое время хранит обратный образ речи пользователя А. Это называется инверсной речью (inverse speech -G). Такой компенсатор эха прослушивает звук, исходящий от пользователя В, и вычитает -G, удаляя тем самым эхо.

Компенсаторы  эха ограничены тем временем, которое  они ожидают получения отраженного  голоса (это явление известно как  хвост эхо, echo tail).

При первоначальной установке оборудования VoIP очень  важно правильно настроить подавление эха. Если его будет недостаточно, пользователи будут постоянно слышать эхо во время звонка. Если объем подавления эха будет слишком велик, компенсатор эха потратит больше времени на схождение и устранение эха.

1.6.5 Потеря пакетов

Потеря пакетов  в сетях передачи данных — явление обычное и ожидаемое. Фактически, многие протоколы данных используют потерю пакетов для получения информации о состоянии сети и могут уменьшать количество посылаемых пакетов.

    В сетях передачи данных возникновение  критического трафика требует контроля суммарных потерь пакетов.

    Для передачи голоса по сети данных важно  спроектировать сеть так, чтобы она  могла успешно передавать данные надежным и своевременным способом. Кроме того, механизм обеспечения  устойчивости голоса к периодической потере пакетов оказывается весьма полезным. В хорошо спроектированной сети потерю пакетов можно свести к минимуму.

    Реализация VoIP от Cisco Systems позволяет голосовому маршрутизатору  реагировать на периодическую потерю пакетов. Если голосовой пакет не получен за ожидаемое время (время ожидания переменно), он считается потерянным, а последний полученный пакет повторно "проигрывается [рис. 3]. Поскольку потерянный пакет содержит всего 20 мс речи, то, как правило, слушатель не обращает внимания на изменение качества.

Рис. 3 Потери пакетов при использовании алгоритма G. 729

    Используя реализацию G.729 для VoIP от Cisco, следует  пояснить, что каждая из полос на рис. означает пакет. Пакеты 1, 2 и 3 достигли получателя, но пакет 4 потерялся при передаче. Принимающая станция ожидает некоторое время (равное указанному для буфера компенсации дребезга), а затем осуществляет действия, определенные стратегией укрывательства (concealment strategy).

    Стратегия укрывательства зачастую сводится к повторению последнего полученного пакета (в данном случае пакета 3), и, таким образом, получающая сторона не слышит промежутков тишины. Поскольку потеряно всего 20 мс речи, то, скорее всего, он и не услышит различия. Но эта стратегия срабатывает только при потере одного пакета. При потере нескольких пакетов подряд стратегия укрывательства сработает всего один раз, пока не будет получен следующий пакет.

За счет стратегии  укрывательства кодек G.729 терпимо относится  к потере примерно 5% пакетов, равномерно распределенных по времени всего разговора.

1.6.6 Обнаружение голосовой активности

    В обычном (голосовом) разговоре кто-то говорит, а кто-то слушает. Современные  сети, допускающие потери, поддерживают двунаправленный канал 64 Кбит/с, независимо от того, говорит кто-то или нет. Это означает, что при обычном разговоре по меньшей мере 50% общей пропускной способности тратится впустую. Процент потраченной впустую полосы пропускания может быть, вообще-то, намного выше, если осуществляется статистическая выборка прерываний и пауз при обычном разговоре между людьми.

    В системе VoIP, если разрешено обнаружение  голосовой активности (Voice Activity Detection — VAD), "растрачиваемую впустую" полосу пропускания можно использовать для других целей. Как показано на рис., VAD определяет амплитуда речи в децибелах (Дб) и выясняет момент, когда следует прекратить разбиение речи на фреймы [рис. 4].

Рис. 4 Обнаружение голосовой активности

    Как правило, если VAD обнаруживает снижение амплитуды речи, он ожидает еще некоторый фиксированный период времени, прежде чем прекратить помещение голосовых фреймов в пакеты. Этот фиксированный период времени называется затягивание (hangover) и составляет обычно 200 мс.

    В любых технологиях есть какие-то компромиссы. У VAD есть некоторые проблемы при определении начала и конца голосовых данных, а также при выделении голоса из фонового шума. Это значит, что в шумной комнате VAD окажется неспособен распознать голос из общего шума. Это явление известно как пороговое отношение сигнал/шум (signai-to-noise threshold). В таких случаях VAD отключается в начале вызова.

    Еще одной проблемой, присущей VAD, является определение начала голосовых данных. Обычно начало предложения вырезается или удаляется. Это явление известно как отсечение начала голоса (front-end speech clipping). Слушатель, как правило, не обращает на это внимания.

 

Глава 2. Использование VoIP на практике

2.1 Тандемное кодирование

    Все современные сети работают с коммутацией  каналов на уровне передачи данных. Коммутаторы каналов организованы в иерархическую модель, где коммутаторы наиболее высокого уровня называются тандемными коммутаторами (tandem switch). Фактически тандемные коммутаторы соединяют не абонентские линии; они скорее действуют как коммутаторы каналов высокого уровня. В иерархической модели могут существовать несколько уровней тандемных коммутаторов каналов. Благодаря этому возможно сквозное подключение для любого телефона без установления прямого соединения между каждым домом на планете.

    Как правило, качество речи голосового вызова, который проходит через два коммутатора TDM и один тандемный коммутатор, не ухудшается, потому что эти канальные коммутаторы используют каналы на 64 Кбит/с.

    Если  коммутаторы TDM осуществляют компрессию голоса, а тандемный коммутатор декомпрессию и повторную компрессию, то это, безусловно, скажется на качестве речи. Сейчас в сетях PSTN компрессия и декомпрессия не распространены, однако их следует учитывать при проектировании пакетных сетей.

    Ухудшение качества речи происходит, когда для каждого телефонного вызова выполняется больше, чем один цикл компрессии-декомпрессии [рис.5].

Рис. 5 Тандемное кодирование VoIP

На [рис. 5] показаны три маршрутизатора VoIP, связанные и действующие как объединяющие линии между одной центральной РВХ и тремя удаленными РВХ. Сеть спроектирована так, чтобы вся информация о системе набора номеров хранилась в центральной РВХ. Централизация администрирования системы набора номеров характерна для многих корпоративных сетей.

Недостаток тандемного кодирования при использовании  с VoIP заключается в том, что при  соединении пользователя телефонной линии  B с пользователем С на центральной РВХ должны быть использованы два порта VoIP. Кроме того, два цикла компрессии-декомпрессии ухудшат качество речи.

Различные кодеки по-разному реагируют на тандемное  кодирование. Стандарт G.729 допускает  два цикла компрессии-декомпрессии, в то время как стандарт G.723.1 менее  устойчив к нескольким циклам сжатия.

Предположим, что  пользователь на линии В хочет позвонить пользователю на линии С. Вызов проходит через РВХ В, на маршрутизаторе VoIP В происходит компрессия и пакетирование. Пакеты передаются на центральный маршрутизатор VoIP А, где происходит декомпрессия и передача на РВХ А. Коммутатор РВХ А передает вызов обратно на маршрутизатор VoIP А, который сжимает и пакетирует данные, а затем отправляет их на удаленную линию С, где происходит их декомпрессия и отправка на РВХ С. Данный процесс известен как тандемное сжатие (tandem-compression); этого явления следует избегать во всех сетях, где существует сжатие.

Избежать тандемного сжатия просто. Достаточно упростить  конфигурацию маршрутизатора за счет качества речи.

    Рассмотрим  тот же пример с тремя РВХ, связанными с тремя маршрутизаторами VoIP: перенастройка маршрутизаторов VoIP упрощает последовательность вызовов и позволяет избежать тандемного кодирования, [рис. 6].

Информация о работе Принцип работы VoIP (Voice over Internet Protocol)