Автор: Пользователь скрыл имя, 19 Января 2012 в 12:04, реферат
Для античности был характерен синкретизм мышления. Человек понимался как часть природы и общества. Человек отождествлялся мышлению, а мышление миру. Мир можно познавать через слова, поэтому речь также отождествлялась с мышлением. Мышление понималось только в словесно-логической форме. Языковое и мыслительное содержание не различались. Центральным понятием античного учения о языке был Логос – то, при помощи чего боги вступают в разговор с людьми.
1. Предыстория.
2. История компьютерной лингвистики на Западе.
2.1. АОТ с 40-х годов XX века по 1965 г.
2.2. АОТ с 1966 по 1980 годы.
2.3. АОТ в 80-е и 90-е годы.
2.4. Современные результаты компьютерной лингвистики.
3. История компьютерной лингвистики в СССР и России.
3.1. До теории «Смысл↔Текст».
3.2. Теория «Смысл↔Текст».
3.3. 70-80-е годы.
3.4. Современное коммерческие системы.
4. Послесловие.
5. Использованная литература и другие источники.
Питерским математиком Виталием Тузовым недавно была создана модель естественного языка, использующая упрощенный вариант идей Мельчука. В модели Тузова сделана попытка свести задачу извлечения информации из текста к задаче преобразования текста на формальном семантическом языке во внутреннее представление базы знаний.
Путь идей к признанию иногда очень долог и труден. Потребовалось более тридцати лет, чтобы перейти к реальным разработкам на основе созданной Валентином Турчиным теории суперкомпиляции . Сменилась элементная база, появились совершенно новые технологии программирования, и то, что раньше многие причисляли к нереализуемым теоретическим изыскам, становится востребованным. Возможно, такой же путь ждет и теорию Мельчука. Наверное, неслучайно похожи судьбы этих ученых.
Компьютерная
лингвистика стремительно развивалась
в СССР в 1960-е годы. Однако в следующем
десятилетии работы в области
машинного перевода оказались под
жестким государственным
3.3. 70-е-80-е годы.
С середины
семидесятых годов во всем мире наблюдается
устойчивое возрастание интереса к
машинному переводу. В Москве в 1974
в институте ИНФОРМ-ЭЛЕКТРО
Системы
семейства ЭТАП работали в режиме
качественного перевода на основе полного
синтаксического анализа и в
режиме пословного перевода, в процессе
которого привлекался только морфологический
анализ. Второй вариант использовался
в тех случаях, когда возникали
проблемы с синтаксическим анализом
фразы. По архитектуре системы семейства
ЭТАП относятся к системам машинного
перевода с трансфером: анализ-преобразование
(трансфер)-синтез. Однако в идеологии
их построения имеются важные концептуальные
особенности: в качестве теоретической
основы положены постулаты модели «Смысл↔Текст»,
предполагающей независимое лингвистическое
описание от алгоритмов программы, отказ
от привязки синтаксиса и морфологии
к конкретной проблемной сфере (разумеется,
словаря это касается в меньшей
степени). В СМП ЭТАП-1 перевод
происходит через поверхностно-
Начало
работ над системой ФРАП относится
к 1975 г. В этом году во Всесоюзном центре
переводов начала работать группа исследователей
под руководством Н.Н. Леонтьевой. В
техническом задании к системе
указывалось, что СМП должна обеспечивать
перевод небольшого количества документов,
не имеющих жестких тематических
ограничений. Такая постановка задачи
существенно осложнила
Теоретическая
особенность СМП ФРАП заключается
в том, что в процессе работы системы
текст входного языка интерпретируется
не только на семантическом, но и на
информационном уровне – в терминах
категорий тезауруса той
Переводческий
комплекс АНРАП структурно состоит
из двух больших систем – АМПАР (англо-русский
перевод) и НЕРПА (немецко-русский
перевод), разрабатывавшихся с конца
50-х гг. разными научными коллективами.
Объединение этих систем связано
с общим программным
3.4. Современные коммерческие системы.
Львиную
долю российского рынка систем машинного
перевода составляют продукты компаний
PROMT и ABBYY(Lingvo).
В основу фундамента технологии перевода PROMT были заложены формализм расширенных сетей переходов (ATN – Augmented Transition Network) и использование двух «переводческих технологий» в одном продукте – технологии машинного перевода (Machine Translation) и технологии Translation Memory. Эффект от взаимного применения двух технологий позволяет обеспечить практически 100%-ное качество перевода при работе с повторяющимися текстами.
Программы,
разработанные на основе
Translation
Memory – технология, использующая базу данных,
где хранятся выполненные профессионалом
переводы в виде сегментов текста оригинал-перевод.
Эта технология базируется на сравнении
документа, который нужно перевести, с
данными, хранящимися в предварительно
созданной базе переводов. Технология
работает по принципу накопления: в процессе
перевода в базе сохраняется исходный
сегмент (предложение) и его перевод. При
обработке нового текста, поступившего
на перевод, система сравнивает каждое
его предложение с сохраненными в базе
сегментами. Если идентичный или подобный
исходному сегмент найден, то перевод
этого сегмента отображается вместе с
переводом и указанием совпадения в процентах.
Слова и фразы, которые отличаются от сохраненного
текста выделяются подсветкой. Таким образом,
переводчику остается перевести только
новые сегменты и отредактировать частично
совпадающие. Каждое изменение или новый
перевод сохраняются в базе. В результате
необходимость в повторном переводе одного
и того же предложения отпадает.
4. Послесловие.
Мы пока
не знаем, какие возможности даст
человечеству надвигающаяся новая
компьютерная революция. Однако можно
надеяться, что компьютерная лингвистика
перейдет на совершенно новую технологическую
базу, основа которой закладывается
в наше время.
5.
Использованная литература
и другие источники:
6. А.Н.Баранов, «Введение в