Принцип работы VoIP (Voice over Internet Protocol)

Автор: Роман Кулабухов, 11 Сентября 2010 в 08:16, курсовая работа

Описание работы

Телефонная связь и голосовое общение в современном мире – это один из самых быстрых способов выразить свои мысли и объяснить что-то. Возможность непрерывного диалога, в отличие от писем, ускоряет коммуникацию, да и к тому же, речевое общение – это наиболее удобный для человека способ взаимодействия с себе подобными. В этом случае не имеет значения скорость набора на клавиатуре, которая часто становится камнем преткновения при различном текстовом общении (например, в веб-чатах или программах-мессенджерах).

Содержание

Изучение принципов работы VoIP
История создания и развития VoIP

Работа содержит 1 файл

Курсач.doc

— 903.50 Кб (Скачать)

1.4.4 Web – телефон

Звонок с веб-сайта  или «click-to-call» (другое название –  «Surf&Call») - это относительно новая  услуга Интернет-телефонии, позволяющая  инициировать телефонный разговор с  компьютера одним кликом  по кнопке (ссылке) на web-странице. Никакого номера при этом набирать не нужно, а стоимость звонка равна стоимости потраченного трафика. Для осуществления такого разговора может потребоваться установка программы-клиента – обычно это делается автоматически с той же самой страницы. Услуга click-to-call успешно используется в электронной коммерции и позволяет клиентам Интернет-компаний оперативно связаться со службой поддержки. Как вариант, на веб-странице может быть предложено ввести свой номер телефона, на который вам позвонит оператор службы поддержки, так называемый обратный звонок – call back.

1.5 Технология

Наибольшее распространение  получил вариант построения сетей IP-телефонии, предложенный Международным  союзом электросвязи (ITU) в рекомендациях H.323, определяющих следующие элементы архитектуры:

  • шлюз (gateway)
  • диспетчер (gatekeeper)
  • монитор (administration manager)

Таким образом, сеть IP-телефонии представляет собой  соединенные посредством IP-сети шлюзы, непосредственно связывающие IP сеть с телефонной сетью и осуществляющие оцифровку, сжатие и пакетирование голоса/факса и их обратное восстановление. Управление работой и взаимодействием шлюзов выполняют контроллеры - диспетчеры. Для удобства удаленного администрирования сети IP-телефонии может быть использован необязательный ее элемент - монитор.

1.5.1 Шлюз

Шлюз или Gateway - основной и неотъемлемый элемент  архитектуры сети IP-телефонии, непосредственно  связывающий IP сеть с телефонной сетью. Он обеспечивает передачу речевого трафика, поступающего из сети с коммутацией каналов по сетям с коммутацией пакетов. Основным функциональным назначением шлюза является преобразование речевой информации или факс-сигнала, поступающих со стороны ТфОП в цифровой вид, пригодный для передачи по IP сетям и обратное преобразование для передачи в телефонную сеть. Кроме того, шлюз выполняет роль пользовательского интерфейса, отвечая на звонки вызывающего абонента и установливая соединение с вызываемым абонентом.

Шлюзы разных производителей отличаются программно-аппаратной реализацией, способом подключения, емкостью, интерфейсом и другими характеристиками, но выполняют одни и те же функции, определяемые технологией IP-телефонии.

1.5.2 Диспетчер

Диспетчер, или gatekeeper, – это самостоятельный  логический модуль, задающий алгоритм работы сети IP-телефонии, управляющий терминалами и шлюзами. Диспетчер необходим в любой сети IP-телефонии, содержащей более двух шлюзов. Функциональное назначение диспетчера – аутентификация и авторизация абонента, распределение вызовов и управление взаимодействием шлюзов, а также поддержка работы систем биллинга.

1.5.3 Монитор

Монитор - необязательный дополнительный элемент сети IP-телефонии, представляющий собой интерфейс  для удаленного конфигурирования и  поддержки через IP-сеть шлюзов и диспетчеров сети IP-телефонии. В первых шлюзах для администрирования использовались стандартные сетевые приложения, такие как pcAnywhere. Позднее для удобства работы производители оборудования IP-телефонии начали выпускать для этих целей собственные приложения.

1.6 Проблемы VoIP и методы их решения

Чтобы правильно  спроектировать сеть, необходимо хорошо разбираться в недостатках основных средств межсетевого взаимодействия и сетевых технологиях. Рассмотрим большую часть проблем VoIP и способов их решения.

  • Задержка и время ожидания.
  • Дребезг.
  • Сжатие голосовых данных.
  • Эхо.
  • Потеря пакетов.
  • Обнаружение голосовой активности.

1.6.1 Задержка и время ожидания

    Для VoIP задержка (delay), или время ожидания (latency), означает период времени, за который  голос проделывает путь от рта диктора до уха слушателя. Нынешние телефонные сети унаследовали три типа задержки: задержка на распространение (propagation delay), задержка на сериализацию (serialization delay) и задержка на обработку (handling delay). Задержка на распространение вызвана длиной пути, который должен пройти свет по оптоволоконному кабелю или электрический импульс по медным проводам. Задержка на обработку обусловлена множеством различных причин (фактическое пакетирование, сжатие и коммутация пакетов) и обуславливается устройствами, передающими фрейм по сети. Задержка на сериализацию — это период времени, в течение которого бит или байт помещается в интерфейс. Её влияние на общую задержку незначительно.

1.6.1.1 Задержка на распространение

Скорость света в вакууме составляет 300 000 км/с, а электроны перемещаются по медному или оптоволоконному кабелю со скоростью приблизительно 200 000 км/с. Для оптоволоконной сети, охватывающей полмира (80 000 км), односторонняя задержка составит примерно 70 миллисекунд. Хотя такая задержка практически неощутима человеческим ухом, вместе с задержками на обработку она может вызвать значительное ухудшение качества голоса.

1.6.1.2 Задержка на обработку

Появление задержки на обработку обуславливают устройства, которые передают фреймы по сети. Задержки на обработку могут появляться и в традиционных телефонных сетях, что стало большой проблемой для пакетных систем.

Цифровой процессор  сигналов (Digital Signal Processor — DSP) продукта Cisco IOS VoIP, создает выборки голоса каждые 10 миллисекунд, согласно стандарту G.729. В пакет помещаются каждые две голосовые выборки (обе с задержкой 10 мс).  Следовательно, задержка пакета составляет 20 мс. Стандарт G.729 предусматривает начальную предварительную задержку в 5 мс, поэтому для первого голосового фрейма общая задержка составит 25 мс. Производители могут сами решать, сколько голосовых выборок пересылать в одном пакете. Поскольку стандарт G.729 использует 10-миллисекундные выборки, каждое увеличение количества выборок во фрейме увеличивает задержку на 10 мс. На самом деле, Cisco IOS позволяет пользователям самим устанавливать количество выборок, помещаемых в каждый фрейм.

Чтобы уменьшить  нагрузку на маршрутизатор и шлюз, в Cisco основную ответственности за кадрирование и формирование пакетов возложили на процессор DSP. Например, заголовок протокола передачи данных в реальном масштабе времени (Real-Time Transport Protocol — RTP) помещается в кадр процессором DSP, а не маршрутизатором.

1.6.2 Дребезг

    Дребезг (jitter) — это неравномерность периодов времени на доставку пакетов. Дребезг относится как раз к тем проблемам, которые существуют только в пакетных сетях. В пакетной голосовой системе отправитель ожидает, что голосовые пакеты будут передаваться с одинаковыми интервалами (например, через каждые 20 мс). Эти голосовые пакеты могут задержаться в сети и не достичь принимающей станции за обычный интервал. Разница во времени между тем, когда ожидалось получение пакета и временем фактического получения, называется дребезгом. [Рис 1]

Рис. 1 Неравномерность времени поступления пакетов (дребезг)

    Время отправления и получения пакетов  А и В одинаково (D1=D2). Однако пакет  С столкнулся с задержкой в  сети, поэтому он получен несколько  позже ожидаемого момента. Вот почему буфер компенсации дребезга (jitter buffer), который сглаживает неравномерность задержки пакетов, просто необходим. Голосовые пакеты в сетях IP могут доставляться с большой разницей по времени. Рекомендуемая практика: подсчитать количество пакетов, которые прибывают с опозданием, и подсчитать соотношение таких пакетов к количеству успешно обработанных. Это соотношение можно использовать для того, чтобы целенаправленно скорректировать буфер компенсации дребезга к предопределенному допустимому соотношению с запаздывающими пакетами. Адаптация установления размеров буфера компенсации дребезга эффективно компенсирует задержку.

    Дребезг и общая задержка — это не одно и то же; в богатых на дребезг  пакетных сетях может увеличиваться  сумма общей задержки сети. Чем больше дребезга, тем большим должен быть буфер компенсации дребезга, чтобы компенсировать непредсказуемый характер пакетной сети.

1.6.3 Сжатие голосовых данных

Общепринятыми сейчас являются два основных варианта РСМ на 64 Кбит/с: µ-стандарт (используемый в Северной Америке) и а-стандарт (принятый в Европе). Оба они используют логарифмический метод сжатия, чтобы достичь 12-13-битового качества канала РСМ при восьмибитовых словах, а отличаются незначительными деталями. Метод µ-стандарта имеет небольшое преимущество перед  методом а-стандарта по низкоуровневой производительности и отношению сигнал/шум. Следует заметить, что во время междугородного звонка ответственность за необходимое преобразование функции µ вида к функции а-вида несет страна, использующая функцию вида µ.

Другой популярный метод сжатия — адаптивная дифференциальная импульсно-кодовая модуляция (Adaptive Differential Pulse Code Modulation — ADPCM). Общепринятым стандартом ADPCM является ITU-T G.726, по которому кодирование происходит с помощью 4-битовых выборок, обеспечивающих частоту передачи 32 Кбит/с. В отличие от РСМ, четырьмя битами непосредственно кодируется не амплитуда голоса, а разница амплитуды (как частота изменения амплитуды).

РСМ и ADPCM — это  примеры кодеков аналого-цифрового  преобразования, их методы сжатия эксплуатируют непосредственно избыточные характеристики аналогового сигнала. Новые методы сжатия, использующие знания фундаментальных характеристик создания голосовых данных, были разработаны 10-15 лет назад. В этих методах используются процедуры обработки сигнала, которые сжимают голосовые данные, отправляя упрощенную параметрическую информацию (относительно исходных данных). Для передачи этой информации требуется меньшая пропускная способность.

    Эти методы, как правило, объединены в исходные кодеки, включающие такие варианты, как кодирование методом линейного предсказания (Linear Predictive Coding — LPC), алгоритм сжатия при кодировании методом линейного предсказания (Code Excited Linear Prediction Compression — CELP) и мультиимпульсное многоуровневое квантование (Multipulse, Multilevel Quantization— MP-MLQ).

1.6.3.1 Стандарты кодирования голосовых данных

    Схемы кодирования CELP, MP-MLQ РСМ и ADPCM стандартизированы ITU-T в рекомендациях серии G. Вот  наиболее популярные стандарты кодирования голосовых данных для телефонов и голосовых пакетов.

  • Стандарт G.711 описывает уже известную методику кодирования голосовых данных РСМ на 64 Кбит/с. Стандарт кодирования G.711 подразумевает немедленное преобразование голосовых данных в формат, необходимый для цифровой голосовой передачи по открытой телефонной сети или РВХ.
  • Стандарт G.726 описывает технологию кодирования ADPCM со скоростями передачи 40, 32, 24 и 16 Кбит/с; при этом закодированная ADPCM может передаваться в виде голосовых пакетов по обычной телефонной сети или РВХ, если последние поддерживают ADPCM.
  • Стандарт G.728 — вариант спецификации технологии сжатия голоса CELP с низкой задержкой и скоростью передачи 16 Кбит/с.
  • Стандарт G.729 описывает технологию сжатия голоса CELP со скоростью передачи 8 Кбит/с;
  • Стандарт G.723.1 — спецификация технологии сжатия, которая может использоваться для сжатия голосовых или аудиосигналов с очень низкой скоростью передачи. Входит в семейство стандартов Н.324. Этот кодек имеет две скорости передачи — 5,3 и 6,3 Кбит/с.
  • Кодек iLBC (Internet Low Bitrate Codec — кодек для Интернета с низкой скоростью передачи) — бесплатный голосовой кодек, подходящий для надежной передачи голоса по сети IP. Кодек разработан для узкой голосовой полосы и обеспечивает передачу данных на скорости 13,33 Кбит/с при длине фрейма кодировки 30 мс и 15,20 Кбит/с при длине фрейма кодировки 20 мс.

1.6.3.2 Усредненная оценка разборчивости голоса

    Качество  голоса можно определить двумя способами — субъективно или  объективно. Люди оценивают субъективно, в то время как компьютеры, их сложнее "ввести в заблуждение" схемами сжатия, обманывающими человеческое ухо, выполняют объективную проверку.

    Кодеки  были разработаны и настроены на основе субъективных показателей качества речи. Стандартные объективные показатели качества, такие как общее гармоническое искажение (total harmonic distortion) и отношение сигнал/шум (signal-to-noise ratio), не очень хорошо соотносятся с большинством человеческих методов восприятия голоса.

    Наиболее  популярным субъективным эталоном для  проверки эффективности голосового кодека является усредненная оценка разборчивости речи (Mean Opinion Score — MOS). Тесты MOS раздаются группе слушателей. Поскольку качество голоса и звука для слушателя — понятия субъективные, при проведении теста MOS очень важно обеспечить участие как можно большего количества слушателей, а также разнообразие материала. Слушатели присваивают каждой выборке голосового материала оценку от 1 (плохо) до 5 (превосходно). Затем баллы подсчитывают и получают усредненную оценку разборчивости речи [табл. 1].

Информация о работе Принцип работы VoIP (Voice over Internet Protocol)