Обработка речевых данных в прикладном лингвистическом аспекте

Автор: Пользователь скрыл имя, 14 Марта 2012 в 14:58, лекция

Описание работы

Методы обработки и распознавания изолированных слов в современных автоматизированных системах. Некоторые методы автоматического распознавания слитной речи.

Работа содержит 1 файл

02.docx

— 115.27 Кб (Скачать)

Семантический ярус предполагает учет данных о семантических связях слов в тексте, в том числе данных о группах слов, связанных близкими понятиями и могущих появляться вместе в определенных ситуациях, данных о лексической сочетаемости слов, а также о словах, допускающих или не допускающих взаимозаменяемость в некоторых контекстах.

Перед синтаксическим и семантическим компонентами в распознающих системах стоит проблема неоднозначности высказывания, обусловленная факторами контекстуального характера. Основная задача синтаксического анализатора заключается в том, чтобы обнаружить эти неоднозначности. На входе такого анализатора должна быть не цепочка однозначно определенных слов, а некая структура, которая может быть заполнена возможными словами. Кроме того, синтаксический анализатор должен предсказать возможную синтаксическую последовательность слов или синтаксических категорий. Тип предсказания зависит от характера используемой грамматики и объема текста.

В настоящее время в  системах распознавания и понимания речи применяют в основном две модели синтаксического анализа: сверху вниз и снизу вверх. При анализе сверху вниз строится дерево структур, начиная с корневого узла. При этом разбор осуществляется слева направо и является предсказующим. Он начинается с поиска компонента определенного типа и действует рекурсивно, пробуя все возможные способы построения составляющей. Важным преимуществом такого метода является способность предсказания набора допустимых конструкций в любой точке разбора.

При анализе снизу вверх  процесс распознавания начинается как бы с листьев дерева. Сначала рассматриваются все возможные цепочки символов размером, как правило, в одно слово, а затем – все прилегающие цепочки длиной в два, три, четыре и т.д. слов. Этот метод не относится ни к анализу слева направо, ни к анализу справа налево. Его преимущество заключается в том, что разбор ведется с изолированными фрагментами высказывания на входе.

Перспективным представляется использование при распознавании устной речи и ее понимании теории фреймов. Известно, что человек в процессе общения выбирает из своей памяти некоторый образ, называемый фреймом, и путем изменения в нем отдельных деталей приспосабливает его для понимания более широкого класса явлений или процессов. Под фреймом понимают минимальную структурированную информацию, необходимую для однозначного определения класса объектов или явлений. Иными словами, фрейм – это структура данных для представления стереотипной ситуации. С каждым фреймом ассоциируется информация различных типов. Группы семантически близких фреймов объединяются в системы. В настоящее время есть данные исследований, согласно которым фреймовые системы и ассоциативные ряды играют решающую роль в процессе понимания смысла высказывания по сравнению, например, с вероятностными и частотными характеристиками единиц языкового общения.


Информация о работе Обработка речевых данных в прикладном лингвистическом аспекте