Машинный перевод

Автор: Пользователь скрыл имя, 17 Января 2012 в 20:39, курсовая работа

Описание работы

Целью данной работы является определение целесообразности и перспективности использования современных систем машинного перевода, доступных на сегодняшний день массовому потребителю, не владеющему в достаточной мере английским языком, а также анализ качества и эффективность выполнения машинного перевода.

Содержание

Введение …………………………………………………………………………..3
Теоретическая часть……………………………………………………………..6
1. Машинный перевод…………………………………………………………...6
1.1. Определение машинного перевода………………………………………..6
1.2. Из истории машинного перевода…………………………………………7
1.2.1 Развитие машинного перевода в СССР…………………………………..10
2. Системы машинного перевода……………………………………………..12
2.1. Основные принципы работы программ машинного перевода…………..12
2.2 Современные системы машинного перевода……………………………..12
2.3. Описание программ………………………………………………………...16
2.3.1. Promt………………………………………………………………………..16
2.3.2. Pragma………………………………………………………………………19
2.3.3. Google Translate…………………………………………………………...20
Практическая часть……………………………………………………………23
3. Перевод текстов различных функциональных стилей с помощью систем машинного перевода…………………………………………………..23
3.1 Понятие функционального стиля речи…………………………………….23
3.2. Классификация функциональных стилей речи…………………………...25
3.3. Сравнительный анализ перевода текстов публицистического и научного стиля, выполненного программами машинного перевода Promt, Pragma и Google Translate…………………………………………………………………..28
Заключение ……………………………………………………………………...37
Библиография…………………………………………………………………...39
Приложение А
Приложение Б

Работа содержит 1 файл

Курсовая работа .docx

— 133.45 Кб (Скачать)
 

О Г Л А В Л  Е Н И Е 

Введение  …………………………………………………………………………..3

Теоретическая часть……………………………………………………………..6

1. Машинный перевод…………………………………………………………...6

    1. Определение машинного перевода………………………………………..6
    2. Из истории машинного перевода…………………………………………7

1.2.1 Развитие машинного перевода в СССР…………………………………..10

2. Системы машинного  перевода……………………………………………..12

2.1. Основные принципы работы программ машинного перевода…………..12

2.2  Современные системы машинного перевода……………………………..12

2.3. Описание программ………………………………………………………...16

2.3.1. Promt………………………………………………………………………..16

2.3.2. Pragma………………………………………………………………………19

2.3.3. Google Translate…………………………………………………………...20

Практическая  часть……………………………………………………………23

3. Перевод текстов  различных функциональных  стилей с помощью  систем машинного  перевода…………………………………………………..23

3.1 Понятие функционального стиля речи…………………………………….23

3.2. Классификация функциональных стилей речи…………………………...25

3.3. Сравнительный анализ перевода текстов публицистического и научного стиля, выполненного программами машинного перевода Promt, Pragma и Google Translate…………………………………………………………………..28

Заключение ……………………………………………………………………...37

Библиография…………………………………………………………………...39

Приложение  А

Приложение  Б

 

    

    Введение

    Создание  эффективно работающих систем машинного  перевода, способных обеспечить приемлемое качество переводимого текста, то есть достаточное для его понимания  и дальнейшего практического  использования, - одна из актуальных и  перспективных областей не только в  современной лингвистике, но также  и в других прикладных науках.

    Возросший в настоящее время интерес  к данной области знания, сопровождается многочисленными спорами о целесообразности применения подобных систем, а также о качестве получаемого перевода, обусловленной недостаточной, на наш взгляд, проработкой методики анализа и критериев оценки качества машинного перевода. Эти вопросы повлияли на наш выбор темы исследования и ее актуальность.

    Целью данной работы является определение целесообразности и перспективности использования современных систем машинного перевода, доступных на сегодняшний день массовому потребителю, не владеющему в достаточной мере английским языком, а также анализ качества и эффективность выполнения машинного перевода.

    Целью исследования продиктовано решение  следующих конкретных задач в данной работе:

  1. Рассмотреть историю развития машинного перевода, современное состояние дел в данной области.
  2. Представить современную классификацию систем машинного перевода.
  3. Провести анализ качества машинного перевода текстов , относящихся к различным функциональным стилям с точки зрения грамматики и лексики.
  4. Выявить наиболее характерные ошибки в машинном переводе.
  5. Определить критерии оценки качества машинного перевода.

    Объектом  исследования является перевод, получаемый при использовании современных общедоступных систем машинного перевода, а именно Promt, Pragma, Google Translate.

    Материалами исследования послужили образцы текстов, относящиеся к различным функциональным стилям речи, а именно: публицистический и деловой.

    Работа  состоит из введения, теоретической  и практической части, заключения, библиографии и приложений.

    В теоретической части рассматриваются первые два параграфа работы:

    - определение машинного перевода;

    - история машинного перевода;

    - развитие машинного перевода в СССР;

    -системы  машинного перевода, доступные на  сегодняшний день с примерами программ.

    В практической части мы изучили определение функционального стиля, для того, чтобы далее в работе использовать два текста различного стиля для перевода при помощи программам, описанных в теоретической части работы. Далее мы выполнили анализ переводов при помощи систем машинного перевода, таких как Promt, Pragma и Google Translate, выявили наиболее грубые и частые ошибки, и предприняли попытки подобрать критерии успешности выполнения машинного перевода.

    В заключении приводятся основные выводы, сделанные при анализе результатов проведенной работы.

    Библиография содержит список использованной научной литературы, а также материалов по данной тематике, представленных в сети Интернет.

    В приложениях мы предлагаем оригиналы рассматриваемых нами текстов, а также переводы, полученные при переводе программами машинного перевода. 
 
 

 

      Теоретическая часть

    1. Машинный перевод

    1. Определение машинного перевода

   Под машинным переводом или автоматическим переводом (aнгл.: machine translation, automatic translation) понимают выполняемое компьютером действие по преобразованию текста на одном естественном языке в текст на другом естественном языке при сохранении эквивалентности содержания, а также результат такого действия [4, с. 250 - 251].

   Д.Э.Розенталь дает следующее определение машинного перевода: «Автоматический перевод текста с одного языка на другой при помощи электронных машин на основе заданной программы». Автор также утверждает, что положительные результаты достигнуты в настоящее время только при переводе текстов с чисто логическим содержанием. Попытки перевода текстов художественной литературы успехом пока не увенчались[19].

   В  Большой Советской энциклопедии различают два направления исследований по машинному переводу: 1) прикладное (промышленная реализация машинного перевода научно-технических текстов, автоматизация информационного дела и т. п.), 2) теоретическое (моделирование речевой деятельности людей как один из методов её исследования; разработка математических формализмов для лингвистических описаний; поиск алгоритмов переработки языковых объектов; исследование соотношения между человеческим мышлением и машинами и т. п.) [9].

   Известные исследователи в области компьютерной лингвистики и машинного перевода, такие как Нелюбин Л.Л., а также Марчук Ю.Н. говорят о машинном переводе как о «процессе перевода текстов (письменных, а в идеале и устных) с одного естественного языка на другой с помощью специальной компьютерной программы» [6, c.24 ].

   В данной работе мы не будем рассматривать  машинный перевод с точки зрения компьютерной лингвистики, поэтому  определив понятие машинного  перевода, перейдем к его истории.  

1.2. Из истории машинного перевода

    По  свидетельству биографов, еще выдающийся математик XIX века Чарльз Бэббидж пытался убедить британское правительство в необходимости финансировать его исследования по разработке “вычислительной машины”. В числе прочих благ он обещал, что когда-нибудь эта машина сможет автоматически переводить разговорную речь. В марте 1947 г. Уоррен Уивер (Warren Weaver), директор отделения естественных наук Рокфеллеровского фонда (Rockefeller Foundation), в переписке с Эдрю Бутом (Andrew D. Booth) и Норбертом Винером (Norbert Wiener) впервые сформулировал концепцию машинного перевода, которую несколько позже развил в своем меморандуме [7]. 

      В 1949 г. Уоррен Уивер опубликовал специальный меморандум, теоретически обосновывавший возможность реализации предложенной им идеи машинного перевода. Мысли, высказанные в этом меморандуме, вызвали очень активный интерес международных ученых и инженеров и легли в основу «концепции «interlingva», согласно которой процесс перевода делился на два этапа: 1) перевод исходного текста на промежуточный язык (в основе которого лежал упрощенный вариант английского языка), 2) оформление промежуточного перевода средствами конечного языка[13].

      В 1952 г. состоялась первая конференция  по машинному переводу в Массачусетском технологическом университете, а  в 1954 г в Нью-Йорке была представлена первая система машинного перевода — IBM Mark II, разработанная компанией IBM совместно с Джоржтаунским университетом. Была представлена очень ограниченная в своих возможностях программа, которая имела словарь в 250 единиц и 6 грамматических правил, и осуществляла перевод с русского языка на английский.

    Как указывает автор статьи «История машинного перевода», в 50-х годах 20 века целый ряд исследовательских групп в США и в Европе работали в области машинного перевода. Однако, существовали некоторые причины невысокого качества машинного перевода..в результате чего первые системы машинного перевода сводились к пословному (word-for-word) переводу текстов без какой-либо синтаксической и смысловой целостности [18].

      В 1959 г. философ Й. Бар-Хиллел (Yohoshua Bar-Hillel) выступил с утверждением, что высококачественный полностью автоматический машинный перевод (FAHQMT) не может быть достигнут в принципе. Однако Бар-Хиллел не отрицал идею машинного перевода как таковую, считая перспективным направлением разработку машинных систем, ориентированных на использование их человеком-переводчиком (своего рода "человеко-машинный симбиоз"). 

      Это выступление самым неблагоприятным  образом отразилось на развитии машинного  перевода в США. В 1966 г. специально созданная  Национальной Академией наук комиссия ALPAC (Automatic Language Processing Advisory Committee), основываясь в том числе и на выводах Бар-Хиллела, пришла к заключению, что машинный перевод нерентабелен: соотношение стоимости и качества машинного перевода было явно не в пользу последнего, а для нужд перевода технических и научных текстов было достаточно человеческих ресурсов [9].

      Следующие десять лет разработка систем машинного  перевода осуществлялась в США университетом  Brigham Young University в Прово, штат Юта (ранние коммерческие системы WEIDNER и ALPS) и финансировалась Мормонской церковью, заинтересованной в переводе Библии; в Канаде группами исследователей, в числе которых TAUM в Монреале с ее системой METEO;  в Европе — группами GENA (Гренобль) и SUSY (Саарбрюкен). 

     О возрождении машинного перевода в 70-80-е гг. свидетельствуют следующие  факты: Комиссия Европейских общин (CEC) покупает англо-французскую версию Systran, а также систему перевода с русского языка на английский (последняя развивалась после доклада ALPAC и продолжала использоваться ВВС США и НАСА); кроме того, CEC заказывает разработку франко-английской и итальянско-английской версий. В то время благодаря CEC были заложены основы проекта EUROTRA, основанного на разработках групп SUSY и GETA. Одновременно происходит быстрое расширение деятельности по созданию систем машинного перевода в Японии; в США Панамериканская организация здравоохранения (PAHO) заказывает разработку  испано-английского направления (система SPANAM); ВВС США финансируют разработку системы машинного перевода (МП) в Лингвистическом исследовательском центре при Техасском университете в Остине; группа TAUM в Канаде достигает заметных успехов в разработке своей системы METEO, которая использовалась в основном для перевода метеорологических сводок. Целый ряд проектов, начатых в 70-80-е гг. впоследствии развились в полноценные коммерческие системы. [14]

1.2.1  Развитие машинного  перевода в СССР

      Советские ученые также занимались изучением  и развитием машинного перевода. В 1954 году первый эксперимент по машинному  переводу был осуществлен в СССР И.К.Бельской (лингвистическая часть) и Д.Ю.Пановым (программная часть) в Институте точной механики и  вычислительной техники Академии наук СССР, а первый промышленно пригодный  алгоритм машинного перевода и система  машинного перевода с английского  языка на русский на универсальной  вычислительной машине были разработаны  коллективом под руководством Ю.А.Моторина. После этого работы начались во многих информационных институтах, научных  и учебных организациях страны, были открыты отделения прикладной лингвистики  и машинного перевода. Так, в СССР такие отделения были созданы  в Москве (МГУ им. М.В.Ломоносова, МГПИИЯ им. М.Тореза – ныне МГЛУ), в  Минском МГПИИЯ, в Ереване, Махачкале, Ленинградском университете, в университетах  Киева, Харькова, Новосибирска и др.

Информация о работе Машинный перевод