Устройство ввода речевой информации на английском языке

Автор: Дмитрий Хритов, 06 Ноября 2010 в 16:04, творческая работа

Описание работы

Не так давно появились средства речевого ввода, которые позволяют пользователю вместо клавиатуры, мыши и других устройств использовать речевые команды (или проговаривать текст, который должен быть занесен в память в виде текстового файла). Возможности таких устройств достаточно ограничены, хотя они постоянно совершенствуются. Проблема не в том, чтобы записать речь, подвергнуть ее дискретизации и ввести коды в компьютер (при современном уровне техники это несложно), а чтобы распознать смысл речи и представить ее, например, в текстовой форме, допускающей последующую компьютерную обработку. Например, программа “Kurzweil Voice 1.0 for Windows” обеспечивает распознавание (на английском языке) всех речевых команд для навигации в среде “Windows”, а в режиме диктовки текста способна распознать до 40 тысяч слов, произносимых в среднем для человека темпе речи (требуя, однако, не менее 16 Мбайт ОЗУ и не менее 50 Мбайт на винчестере лишь для самой себя). Многие специалисты связывают с прогрессом устройств речевого ввода будущее компьютерной техники, считая такие устройства ведущими элементами ее интеллектуализации.
Цель данной курсовой работы: анализ и назначение особенностей устройства ввода речевой информации.
В данной работе будет рассмотрена структура устройства и будет дано его описание.
Задачи курсовой работы:
- ознакомиться с теоретическими основами;
- рассмотреть принципы работы устройства

Работа содержит 1 файл

(Хритов) Устройство ввода речевой информации на английском языке.doc

— 1.22 Мб (Скачать)

РОССИЙСКИЙ  ГОСУДАРСТВЕННЫЙ СОЦИАЛЬНЫЙ УНИВЕРСИТЕТ

Филиал  государственного образовательного учреждения профессионального высшего образования  «Российский государственный социальный университет» в г. Тольятти Самарской  области

  

Кафедра: информатики  и вычислительной техники 

Специальность: Автоматизированные системы обработки  информации и управления 

Форма обучения очная  

ПОЯСНИТЕЛЬНАЯ ЗАПИСКА К КУРСОВОМУ ПРОЕКТУ 

Дисциплина: «Организация ЭВМ и систем» 

Тема: Устройство ввода речевой информации на английском языке 
 

                                                                                 Студента 2 курса группы А-08

                                                                                 Хритова Д. В,

                                                                                 Научный руководитель:

                                                                                 Заламанова Л.В.

                                                                                 Подпись руководителя______ 
 
 
 

Тольятти 2010

СОДЕРЖАНИЕ

 
 
 
 
 
 
 
 
 
 
 
 
 
 

ВВЕДЕНИЕ

      Не  так давно появились средства речевого ввода, которые позволяют пользователю вместо клавиатуры, мыши и других устройств использовать речевые команды (или проговаривать текст, который должен быть занесен в память в виде текстового файла). Возможности таких устройств достаточно ограничены, хотя они постоянно совершенствуются. Проблема не в том, чтобы записать речь, подвергнуть ее дискретизации и ввести коды в компьютер (при современном уровне техники это несложно), а чтобы распознать смысл речи и представить ее, например, в текстовой форме, допускающей последующую компьютерную обработку. Например, программа “Kurzweil Voice 1.0 for Windows” обеспечивает распознавание (на английском языке) всех речевых команд для навигации в среде “Windows”, а в режиме диктовки текста способна распознать до 40 тысяч слов, произносимых в среднем для человека темпе речи (требуя, однако, не менее 16 Мбайт ОЗУ и не менее 50 Мбайт на винчестере лишь для самой себя). Многие специалисты связывают с прогрессом устройств речевого ввода будущее компьютерной техники, считая такие устройства ведущими элементами ее интеллектуализации.

      Цель  данной курсовой работы: анализ и назначение особенностей устройства ввода речевой информации.

      В данной работе будет рассмотрена структура устройства и будет дано его описание.

    Задачи  курсовой работы:

    - ознакомиться с теоретическими основами;

    - рассмотреть принципы работы устройства 
     

  1 ИССЛЕДОВАНИЕ УСТРОЙСТВА

      Устройства  речевого ввода — это различные микрофонные акустические системы, “звуковые мыши”, например, со сложным программным обеспечением, позволяющим распознавать произносимые человеком звуки в виде букв, слов и цифр, идентифицировать их, закодировать в цифровой вид и выдать команду ПК. Устройство предназначено для ввода звуковой (речевой) информации в компьютер и состоит из следующих узлов: микрофона, входного усилителя с АРУ, полосового фильтра, АЦП, генератора синхроимпульсов, интерфейса к компьютеру. Основные технические характеристики представлены в таблице 1.                                            

                                                                                                               Таблица 1

  Параметр   Значение
  Полоса  частот входного сигнала, Гц   300 – 3400
  Амплитудный диапазон, дБ   60 – 80
  Габаритные размеры, мм3   15х30х60
  Напряжение питания, В   3,0 – 6,0
  Потребляемая  при работе мощность, мВт   10 – 50
  Потребляемый  ток в режиме ожидания, мА   менее 0,3
  Используемый порт компьютера   PRN/COM
 

     Так как информация должна вводиться  и преобразовываться для хранения в цифровой вид, то необходимо применить  АЦП и оцифровывать сигнал по методу импульсно-кодовой модуляции, суть которой заключается в следующем. Если на рисунке 1 представлен исходный сигнал:

      Рисунок 1. Исходный сигнал

      То для преобразования мы должны его разделить на временные отрезки (рисунок 2). 

     Рисунок 2. Дискретный сигнал

      Затем мы его  должны квантизовать по уровням (рисунок 3).

     Рисунок 3. Квантизованный сигнал

      Потом мы можем получить кодовые отсчеты сигнала (рисунок 4).

     Рисунок 4. Оцифрованный сигнал

     Какой выбрать квант времени- об этом нам  скажет теорема Котельникова, которая  гласит, что для точного восстановления периодического сигнала нам необходимо взять минимум два отсчета за период. Если принять верхнюю частотную границу человеческого голоса, при котором он хорошо различим за 4 кГц (в стандарте по передачи голосовой информации в телефонных линиях это число- 3,6кГц), то частота квантования по времени (дискретизации) составит 8 кГц.

     Что касается квантования по уровню-то можно ограничиться 256 уровнями для обеспечения хорошего качества (в современных цифровых АТС используются от 32 до 256 уровней ). Поэтому, можно применить восьмибитовый АЦП, работающий на частоте Квантования 8 кГц.

     Таким образом, на выходе мы получим сигнал следующей формы:

     

     Рисунок 5. Восстановленный и усиленный сигнал

     Сигнал  от микрофона усиливается микросхемой и подается на вход АЦП. Усилитель также охвачен частотно- зависимой отрицательной обратной связью, для того чтобы ограничить верхнюю частотную границу входного сигнала до 4 кГц.

     К порту микроконтроллера подключаются кнопки управления и светодиоды для  индикации режимов работы устройства.

     К разъему подключается аккумуляторная батарея для питания устройства. Конденсаторы  и служат для сглаживания пульсаций по цепи питания, которые могут возникнуть при протекании динамических процессов внутри микросхем. 

     Так как хранение информации должно производиться  при выключенном питании, то в  качестве устройства хранения нужно применить какую-нибудь энергонезависимую память. Объем этой памяти рассчитаем следующим образом: Так как каждую секунду записывается 8000 отсчетов по 8 бит, что составляет 8 кб, то в течении часа нам необходимо будет записать 3600 Х 8 кб, что составит примерно 29 Мб. Таким образом, применив память емкостью 32Мб, мы обеспечим нужное время записи. Применив же при записи алгоритмы архивации, мы сможем записать в пять раз больше информации (если принять коэффициент сжатия голосовой информации равным 5).

     Отличительной особенностью данного устройства является высокая чувствительность к акустическому  сигналу, низкая потребляемая от компьютера мощность, универсальность, аппаратная совместимость с любым компьютером, имеющим один из указанных выше портов. Наличие стандартных звуковых плат в компьютере не требуется. Разработанная программная оболочка предоставляет пользователю следующие возможности:

    -         ввод звуковой информации в непрерывном режиме;

    -         ввод данных с подавлением пауз (включается система VAD – Voice  Activity Detector);

    -         редактирование введенных данных;

    -         преобразование внутреннего формата данных в один из стандартных   звуковых форматов (например, в один из кодов формата wave);

    -         запись информации на стандартные носители;

    -         чтение записанных данных;

    -         вывод данных для измерения или прослушивания.

     Скорость  ввода данных в компьютер определяется синхрогенератором и составляет 2,4 – 64 кбит/с. Требуемый объем памяти при записи (HDD, FDD, CDROM) составляет соответственно 0,3 – 8 кбайт на 1 с данных. Использование VAD снижает требования к объему памяти до 2 раз.  Предварительное прослушивание введенной или записанной информации осуществляется через внутренний «цифровой» динамик компьютера. Разработанное устройство может быть использовано для записи и воспроизведения речи (диктофон), ввода речевых и акустических сигналов в компьютер при разработке и исследовании алгоритмов сжатия речи (например, для IP-телефонии), распознавания голосовых команд, выделения голоса в шумах, в качестве аппаратной поддержки  голосового ключа, устройства идентификации пользователя, голосового детектора, анализатора  эмоционального состояния человека, охранного устройства, обучающей системы  и т.п. Кроме того, разработанная система может быть использована для ввода в компьютер информации в указанной выше полосе частот. Устройство реализовано в виде печатной платы с установленными на ней электретным микрофоном и всеми электронными узлами на основе серийно выпускаемых комплектующих изделий. Дальнейшая микроминиатюризация устройства возможна за счет интегральной технологии. Конструкция устройства не предъявляет специальных требований к технологическому процессу и допускает реализацию в виде заказной аналого-цифровой микросхемы, например, на основе КМОП- схем, биполярных структур. При сохранении основных эксплуатационных параметров величина потребляемого в рабочем состоянии тока может составить 10 мкА и менее. При вводе в ЭВМ дискретных отсчетов речевого сигнала пользуются, как правило, стандартными преобразователями «аналог— код». Действия аналого-цифровых преобразователей основаны на электрическом преобразовании дискретизированных   аналоговых сигналов в соответствующую последовательность двоичных чисел. Это преобразование выполняется различными способами, включая линейную импульсно-кодовую модуляцию, дифференциальную импульсно-кодовую модуляцию, дельта-модуляцию, адаптивную дельта-модуляцию и другие методы, о чем можно прочесть в специальных книгах по аналого-цифровым преобразователям. 
Наиболее распространенными в настоящее время аналого-цифровыми преобразователями являются преобразователи, использующие линейную импульсно-кодовую модуляцию. Устройство производит вывод записанной информации посредством блока ЦАП и блока выходных цепей, которые производят усиление выходного сигнала до необходимого уровня. Контроль за работой блока ЦАП и блока АЦП производится модулем контроллера записи/чтения. Хранение записанной информации происходит в энергонезависимой памяти. Таким образом в устройстве можно выделить следующие блоки:

    -    входных  цепей;

    • АЦП;
    • выходных цепей;
    • ЦАП;
    • контроллер записи/чтения;
    • блок питания;
    • тактового генератора;
    • энергонезависимой памяти;

    -    блок  индикации и управления.

     Блок  входных цепей соединяется информационной связью  с блоком АЦП, который  в свою очередь соединяется информационной связью с блоком энергонезависимой  памяти и управляющими связями с тактовым генератором и блоком  контроллера записи/чтения.

     Блок  выходных цепей соединяется информационной связью  с блоком ЦАП, который  в свою очередь соединяется информационной связью с блоком энергонезависимой  памяти и управляющими связями с  тактовым генератором и блоком  контроллера записи/чтения.

     Контроллер  записи/чтения соединяется управляющей  связью с энергонезависимой памятью.

     Блок  питания соединяется со всеми  блоками.

     Блок  входных цепей обеспечивает усиление входного сигнала от микрофона и ограничение верхней частоты входного сигнала до 4 кГц.. Усиленный сигнал поступает на АЦП где преобразуется по сигналам от тактового генератора в кодовые отсчеты по уровню, представленные в двоичном коде. Кодовые отсчеты поступают в энергонезависимую память, где посредством контроллера записи/чтения происходит их запись. Контроллер записи/чтения формирует необходимые сигналы для записи и чтения из энергонезависимой памяти. В свою очередь, он получает управляющие сигналы от блока индикации и управления.

     При воспроизведении голоса происходит выборка кодовых отсчетов из энергонезависимой памяти и подача их на ЦАП, где и происходит их преобразование в аналоговый сигнал.

     Блок  выходных цепей обеспечивает усиление выходного сигнала  и ограничение  верхней частоты выходного сигнала до 4 кГц, для того чтобы избавиться от высокочастотных гармоник в выходном сигнале, появляющихся при квантовании.

     Устройство  состоит из следующих функциональных элементов MCU-контроллер на базе микропроцессора, выполняющий функции управления устройством. В состав MCU также входят АЦП и ЦАП, поэтому микроконтроллер также выполняет функции оцифровывания аналогового сигнала и преобразования цифровых кодов в аналоговый сигнал. Усилители и предназначены для усиления аналоговых сигналов и ограничения верхних граничных частот этих сигналов до 4 кГц. Микрофон MIC и динамик SPK предназначены соответственно для ввода и воспроизведения голосовой информации. Генератор опорного напряжения формирует опорное напряжение для встроенного АЦП микроконтроллера MCU. Тактовый генератор G предназначен для тактирования всех внутренних схем микроконтроллера. Энергонезависимая память RAM предназначена для хранения всей записываемой голосовой информации. Блок клавиатуры KBD предназначен для управления режимами устройства. Блок индикации LED предназначен для индикации режимов работы устройства.

Информация о работе Устройство ввода речевой информации на английском языке