Автор: Пользователь скрыл имя, 19 Января 2012 в 12:04, реферат
Для античности был характерен синкретизм мышления. Человек понимался как часть природы и общества. Человек отождествлялся мышлению, а мышление миру. Мир можно познавать через слова, поэтому речь также отождествлялась с мышлением. Мышление понималось только в словесно-логической форме. Языковое и мыслительное содержание не различались. Центральным понятием античного учения о языке был Логос – то, при помощи чего боги вступают в разговор с людьми.
1. Предыстория.
2. История компьютерной лингвистики на Западе.
2.1. АОТ с 40-х годов XX века по 1965 г.
2.2. АОТ с 1966 по 1980 годы.
2.3. АОТ в 80-е и 90-е годы.
2.4. Современные результаты компьютерной лингвистики.
3. История компьютерной лингвистики в СССР и России.
3.1. До теории «Смысл↔Текст».
3.2. Теория «Смысл↔Текст».
3.3. 70-80-е годы.
3.4. Современное коммерческие системы.
4. Послесловие.
5. Использованная литература и другие источники.
SHRDLU.
Система
SHRDLU Терри Винограда (Terry Winograd) имитировала
поведение робота, манипулировавшего
блоками на поверхности стола. Она могла
управляться инструкциями, такими как
“Pick up the red pyramid”(«Возьми красную пирамиду»)и
отвечать на вопросы типа “What does the blue
box contain?”(«Что содержит голубой блок?»).
Появление SHRDLU имело большое значение,
так как оно показало, что синтаксис, семантика
и порождение выводов о мире могут быть
скомбинированы так, чтобы создать систему,
которая понимает естественный язык. Это
была очень ограниченная система: она
могла управляться только очень небольшим
числом предложений. Более того, она могла
понимать язык, касающийся только настоящего
момента и очень небольшой части реального
мира: мира блоков. Эффект, который она
производила, мог быть достигнут только
в весьма ограниченной области и попытка
расширить систему неизбежно привела
бы к снижению эффективности.
LUNAR.
LUNAR был естественно-языковым интерфейсом к базе данных, использовавшим и Расширенную Сеть Переходов и процедурную семантику Вудса. Система унаследовало свое имя от базы данных, содержавшей информацию об образцах лунных скальных пород. Система была продемонстрирована на Научной Конференции по Луне в 1971 году. Ее эффективность казалась весьма впечатляющей: она сумела справиться с 78% запросов без ошибок, причем эта цифра возросла до 90% после исправления ошибок. Впрочем цифры эти не должны были вводить в заблуждение, ведь не случайно система не стала предметом интенсивной эксплуатации: ученый, попытавшийся бы использовать систему для своих повседневных рабочих нужд, быстро обнаружил бы, что ему нужны запросы, выходящие за пределы возможности системы.
LIFER/LADDER.
LIFER/LADDER
была одной из наиболее впечатляющих систем
АОТ. Она была сконструирована как естественно-языковой
интерфейс к базе данных кораблей ВМС
США. Она использовала семантическую грамматику,
в которой использовались метки типа «КОРАБЛЬ»
или «ХАРАКТЕРИСТИКА» вместо синтаксических
меток типа «существительное» или «глагол».
Это означало, что система, как и SHRDLU, была
тесно привязана к области для которой
была сконструирована. Тем не менее, использование
разработчиками семантической грамматики
дало ряд преимуществ в разработке дружественного
к пользователю интерфейса по сравнению
с SHRDLU. Например, в систему была включена
возможность определения новых словарей,
определения парафразов (например, чтобы
сделать возможным быстрый доступ), возможность
обработки незаконченного или неполного
ввода. Эти свойства сами по себе были
очень впечатляющими, но исследовательская
группа приступила к программе строгой
оценки и опубликовала доклад, ставший
настоящим сокровищем для тех, кто стремился
глубоко изучать АОТ. Одним из выводов
доклада было то, что люди быстро подстраивались
под машину и пытались использовать очень
неполные предложения, заменяя нормальный
естественный язык подобием неформального
языка запросов.
Было
рассмотрено небольшое
2.3.
АОТ в 80-е и
90-е годы.
Узкоспециализированные
Грамматические
формализмы.
Семантические
системы 1970-х совершенно сознательно
избегали использования синтаксической
обработки, некоторые пытались вообще
очистить от синтаксической информации
свои системы. Синтаксис всегда рассматривался
большинством лингвистов-теоретиков как
основополагающая часть человеческого
языка. Инженеры же увидели в синтаксисе
полезный способ разрешения омонимии
с относительно небольшим объемом
необходимых знаний (по крайней мере,
по сравнению с объемом знаний,
требуемым для этой цели семантической
обработкой). Теоретические лингвисты
также выступали критически против
всеобщего признания
Результатом
стали грамматики, оперирующие более
детализированными
Есть
несколько грамматик, которые
используют унификацию как
Расширенные
лексиконы.
Лексикон
(или словарь) использовался до сих
пор для хранения очень простой
информации. Использование унификационных
грамматик с их детализированными
характеристиками привело к значительному
усложению лексиконов. Сейчас он является
первичным источником информации о
свойствах слов и эта информация
используется во время разбора(использующего
унификацию) для создания конечного
дерева разбора, представляющего структуру
анализируемого предложения.
Логика
для семантики.
Раз синтаксическая
информация должна широко использоваться,
значит нужен способ передачи этой
информации в семантическую обработку
на более поздней стадии, чтобы
максимально разрешить
Порождение
текста.
Приложение,
которое должно выводить некий результат,
можно попробовать заставить
делать это на естественном языке, тем
самым делая его более удобным
для пользователя. Одно из направлений
разработки состояло в создании систем
автоматического реферирования.
Многоязычные
приложения.
Рост
многоязычных сообществ означает спрос
на переводы, особенно деловых и
технических текстов, переводить которые
профессиональным переводчикам скучно
или невыгодно. Поскольку полный
высококачественный машинный перевод
в этом периоде больше не рассматривался
как краткосрочная или даже среднесрочная
цель, это пространство было предназначено
для ограниченных систем машинного
перевода (например, канадские метеосистемы,
автоматически преобразующие
Мобильность.
Одним
из недостатков таких впечатляющих
систем, как LIFER/LADDER была трудность переноса
системы из одной проблемной области в
другую (например из области описания
кораблей ВМС США в область кадрового
учета). В этот период совершаются попытки
создания систем, применимых к разным
проблемным областям. Развитие унификационных
грамматик и логики для семантики усилили
тенденцию обобщения разных систем, что
привело к прогрессу в решении проблемы
мобильности систем.
80-е
годы. Формирование
фундамента современного
машинного перевода.
В 80-е годы в большой мере
формируется фундамент
Переход от языка А к языку
Б можно представить в виде
следующей схемы.
По мере продвижения по схеме снизу вверх, размеры структур увеличиваются.
Описанная
выше схема опирается на положении
формальной семантики, что смысл
целого определяется комбинацией смыслов
составляющих. Но пары слов в языках
А и Б могут иметь больше
одного значения (омонимия), некоторые
грамматические характеристики и функции
слов могут существовать только в
одном из этих языков. Несмотря на все
это, детальный список преобразований
может быть полезным для обработки
ситуации.
Самым серьезным итогом работ,
связанных с таким подходом
в эти годы, было введение понятия
контекстной зависимости
Значение (смысл) слова выражается
посредством сегментированных
Убить=Быть_причиной(Некто(
Одним
из главных направлений
Благодаря росту
90-е
годы. Разрешение
омонимии. Возрождение
подхода «снизу-вверх»:
эмпирицизм.
Подход к разрешение омонимии
смысла термина основывается
на выявлении слов, в контексте
которых он находится. На
Эмпирицизм, новый вариант подхода
«снизу-вверх», предлагает архитектуру,
более радикальную, чем старые
подходы, ориентированные на
Как мы можем получить