Автор: Пользователь скрыл имя, 14 Марта 2012 в 14:58, лекция
Методы обработки и распознавания изолированных слов в современных автоматизированных системах. Некоторые методы автоматического распознавания слитной речи.
Семантический ярус предполагает учет данных о семантических связях слов в тексте, в том числе данных о группах слов, связанных близкими понятиями и могущих появляться вместе в определенных ситуациях, данных о лексической сочетаемости слов, а также о словах, допускающих или не допускающих взаимозаменяемость в некоторых контекстах.
Перед синтаксическим и семантическим компонентами в распознающих системах стоит проблема неоднозначности высказывания, обусловленная факторами контекстуального характера. Основная задача синтаксического анализатора заключается в том, чтобы обнаружить эти неоднозначности. На входе такого анализатора должна быть не цепочка однозначно определенных слов, а некая структура, которая может быть заполнена возможными словами. Кроме того, синтаксический анализатор должен предсказать возможную синтаксическую последовательность слов или синтаксических категорий. Тип предсказания зависит от характера используемой грамматики и объема текста.
В настоящее время в системах распознавания и понимания речи применяют в основном две модели синтаксического анализа: сверху вниз и снизу вверх. При анализе сверху вниз строится дерево структур, начиная с корневого узла. При этом разбор осуществляется слева направо и является предсказующим. Он начинается с поиска компонента определенного типа и действует рекурсивно, пробуя все возможные способы построения составляющей. Важным преимуществом такого метода является способность предсказания набора допустимых конструкций в любой точке разбора.
При анализе снизу вверх
процесс распознавания
Перспективным представляется использование при распознавании устной речи и ее понимании теории фреймов. Известно, что человек в процессе общения выбирает из своей памяти некоторый образ, называемый фреймом, и путем изменения в нем отдельных деталей приспосабливает его для понимания более широкого класса явлений или процессов. Под фреймом понимают минимальную структурированную информацию, необходимую для однозначного определения класса объектов или явлений. Иными словами, фрейм – это структура данных для представления стереотипной ситуации. С каждым фреймом ассоциируется информация различных типов. Группы семантически близких фреймов объединяются в системы. В настоящее время есть данные исследований, согласно которым фреймовые системы и ассоциативные ряды играют решающую роль в процессе понимания смысла высказывания по сравнению, например, с вероятностными и частотными характеристиками единиц языкового общения.
Информация о работе Обработка речевых данных в прикладном лингвистическом аспекте