Машинный перевод

Автор: Пользователь скрыл имя, 17 Января 2012 в 20:39, курсовая работа

Описание работы

Целью данной работы является определение целесообразности и перспективности использования современных систем машинного перевода, доступных на сегодняшний день массовому потребителю, не владеющему в достаточной мере английским языком, а также анализ качества и эффективность выполнения машинного перевода.

Содержание

Введение …………………………………………………………………………..3
Теоретическая часть……………………………………………………………..6
1. Машинный перевод…………………………………………………………...6
1.1. Определение машинного перевода………………………………………..6
1.2. Из истории машинного перевода…………………………………………7
1.2.1 Развитие машинного перевода в СССР…………………………………..10
2. Системы машинного перевода……………………………………………..12
2.1. Основные принципы работы программ машинного перевода…………..12
2.2 Современные системы машинного перевода……………………………..12
2.3. Описание программ………………………………………………………...16
2.3.1. Promt………………………………………………………………………..16
2.3.2. Pragma………………………………………………………………………19
2.3.3. Google Translate…………………………………………………………...20
Практическая часть……………………………………………………………23
3. Перевод текстов различных функциональных стилей с помощью систем машинного перевода…………………………………………………..23
3.1 Понятие функционального стиля речи…………………………………….23
3.2. Классификация функциональных стилей речи…………………………...25
3.3. Сравнительный анализ перевода текстов публицистического и научного стиля, выполненного программами машинного перевода Promt, Pragma и Google Translate…………………………………………………………………..28
Заключение ……………………………………………………………………...37
Библиография…………………………………………………………………...39
Приложение А
Приложение Б

Работа содержит 1 файл

Курсовая работа .docx

— 133.45 Кб (Скачать)

      Следует отметить, что  современные системы  машинного перевода справляются  не со  всеми функциональными  стилями. По мнению Жукова Д.А., наиболее качественный перевод достигается при переводе текстов разговорного и официально-делового стиля [12]. В следующем параграфе будут детально рассмотрены тексты делового и публицистического стиля, перевод которых выполнен наиболее популярными современными системами машинного перевода Promt, Pragma и Google Translate. 
 

3.3. Сравнительный анализ перевода текстов публицистического и делового стиля, выполненного программами машинного перевода Promt, Pragma и Google Translate

      Материалами для нашего исследования послужили  тексты, отобранные в качестве образцов различных функциональных стилей русского языка, а именно публицистического  и делового стиля. Материалы переводились на русский язык при помощи современных  систем МП: 1) Promt, 2)Pragma и 3) Google Translate. Никакой предварительной и последующей обработки текстов не производилось. Полученный перевод сравнивался с переводом тех же текстов, выполненным человеком-переводчиком. Мы предлагаем ознакомится с полученными результатами, которые, на наш взгляд, являются достаточно субъективными, однако позволяют судить об общем уровне качества перевода, получаемого при использовании современных систем МП, доступных массовому потребителю.

      На  наш взгляд, в данной работе следует  выделить следующие критерии и принципы для осуществления анализа получившихся переводов:

    1. Функциональный (насколько хорошо программа справляется со своей функцией переводчика, передает ли основной смысл).
    2. Лексический (непереводимость слов).
    3. Сочетаемость слов (не совпадение слов по роду, пажеду, числу, склонению и т.д.).
    4. Семантический (передача многозначных слов).
    5. Передача реалий, имен собственных.
    6. Грамматический (структура предложения, порядок слов, пунктуация в сложных/ простых предложениях).
    7. Стилистический (соблюдение стиля текста).

     В качестве примера делового стиля, нами был выбран текст «Regional capacity development. Final report», который является отчетом о состояние на рынке калийных удобрений. Сложность перевода такого текста заключается в том, что он имеет достаточно узкоспециализированную тематику - горнодобывающая промышленность и калийные удобрения.

     В анализе переводов, выполненных  программами Promt, Pragma, Google Translate, необходимо отметить, что каждая из программ в достаточно большой степени справилась с функциональным принципом, а именно выполнила свою функцию как переводчика и передала смысл данного текста. Однако в нашем случае большую смысловую нагрузку несет специализированная терминология. В этом случае, у всех трех программ были допущены ошибки при переводе, к примеру, химических формул MOP (хлористый калий), SOP (сульфат калия). Варианты их перевода – ШВАБРА, ПОДЛИВКА (Pragma) и СС (Google Translate) соответственно, не говоря уже о том, что Pragma вообще не перевела ключевое смысловое слово – potash(калийные удобрения), а также производные от него слова. Это затрагивает также и лексический принцип, в соответствии с которым программа-переводчик справляется в переводом слов или нет. Таким образом, для программы Promt и Pragma остались непереведенными лишь два слова - brownfield, greenfield, Google Translate справился со всеми слова в отчете.

     Следующие принципы, которыми мы будем руководствоваться при анализе переводов, - это принцип сочетаемости слов и словосочетаний, а также грамматический принцип. Данные принципы предполагают грамматически верное как построение предложений, так и употребление правильных форм слова. С точки зрения данного принципа. Лучший перевод, по нашему мнению, был выполнен программой Promt. Несмотря на некоторую несогласованность, предложения в большинстве своем построены верно, более того, практически везде соблюдается правильный порядок слов. В переводе, выполненном программой Pragma допущены ошибки в употреблении падежа («Это увеличение приходит от трех установленные генераторы только, с тех пор, как никакие другие проекты не считаются, чтобы материализоваться перед 2013. Мозаичные разряды как всемирный второй наибольший potash производитель, с 15-процентная доля глобальной вместимости».),а также встречаются предложения, в которых практически полностью отсутствует согласование членов предложения (Agrium вместимость в Vanscoy есть близко к 2.1 Mt, увеличив 16 процента начиная с 2006.). Google Translate,по нашему мнению, справился хуже всех: простые предложения система переводит (и то, как мы убедились - не все) почти без ошибок. Сложносочиненные, да и классические примеры сложноподчиненных предложений тоже даются системе с относительной легкостью. Однако как только возникает нестандартная ситуация (например, одно придаточное предложение усложняется другим и программа не находит подходящего алгоритма грамматического анализа - она сразу забывает о синтаксисе и начинает элементарный пословный перевод, формально (посредством флексий) пытаясь связать хотя бы рядом стоящие слова. Эта попытка связать грамматически рядом стоящие слова вместе неправильным выбором значений некоторых слов еще более запутывает выходной вариант («Потенциала Agrium в Ванской близка к 2,1 млн. т, увеличившись на 16 процентов с 2006 года.»).

     Говоря  о семиотическом принципе, стоит  заметить, что все три программы  в нашем исследование используют в основном первое значение многозначных слов, как наиболее часто встречающееся. Очевидно, что системы машинного перевода не имеют средств определения правильного выбора значения слова. Частично решает данную проблему указание тематики переводимого текста в программе Promt, однако даже это не дает абсолютно правильный перевод многозначного слова.

     И последний момент, который мы выделили как важный для оценки перевода, выполненного системами МП Promt, Pragma и Google Translate,- это передача имен собственных, реалий, географических названий. Нужно сказать, что данный текст содержит большое количество географических названий, а также названий компаний. Программы - переводчики достойно справились с передачей названий стран и городов, хотя, к примеру, Promt не перевел название города Саскачеван, в то время как Pragma и Google Translate это сделали. Больше всего непереведенных географических названий мы выявили в переводе программы Pragma, тогда как Google Translate и Promt справились, на наш взгляд, в равной степени. Что касается перевода названий компаний, то можно констатировать, что все системы МП допустили при переводе ошибку и постарались перевести названия дословно:

     Promt: “В дополнение к этим краткосрочным событиям, больше чем 25 предприятиям, включая некоторые большие корпорации (Долина, ЗАБОЙНОЕ ДАВЛЕНИЕ Биллитон, и Acron) и младшие компании исследования (такие как Поташ Один, Поташ Атабаски и Западный Поташ), выполняли детализированную работу исследования, чтобы эксплуатировать депозиты поташа через Канаду. “

     Pragma: “В добавление к этому краткосрочному развитию, более чем 25 предприятий, охватывая некоторые большие корпорации (Прощание, Биллитон забойного ДАВЛЕНИЯ при закрытом устье, и Acron) и младшие компании (как например Поташ Один, Поташ атабаски и Западный Поташ) исследования, осуществляют детальную работу исследования для того, чтобы эксплуатировать potash залежи по Канаде.”

     Google Translate: “В дополнение к этим краткосрочные разработки, более 25 предприятий, включая некоторых крупных корпораций (Vale, BHP Billiton и "Акрон") и младшие компаний разведки (например, калийная Один из них, Атабаска Калий Калий и Западной), были проведение детальной разведки работы в целях использования калийных месторождений в Канаде.”

     Таким образом, можно сделать следующие  выводы относительно качества перевода текста «Расширение региональных возможностей. Итоговый отчет», выполненного программами МП Promt, Pragma и Google Translate:

  1. практически повсеместно отсутствует грамматическое согласование членов предложения, однако в большинстве случаев этот лишь незначительно затрудняет понимание смысла текста;
  2. неверно переведены некоторые термины, географические названия, имена собственные;
  3. допущены ошибки при переводе многозначных слов;
  4. не переведены некоторые слова. Данный факт указывает на недостаточную проработанность алгоритма морфологического анализа текста и словаря, используемых в данных системах МП.

     Таким образом, полученный МП текста делового стиля в значительной мере грамматически не согласован и содержит достаточно большое количество ошибок. Тем не менее, общий смысл и содержание текста переданы достаточно точно, хотя из-за недостаточного качества перевода, выполненного программой Google Translate, некоторые важные моменты могут быть упущены. На наш взгляд, лучше всего с переводом справилась программа Promt. Перевод такого рода может использоваться для первичного ознакомления с содержанием, но его использование по назначению без значительной редакторской правки представляется невозможным.

     В качестве образца публицистического функционального стиля была выбрана статья из интернет-журнала «Все о кофе. Интересные факты» [10]. Так как текст рассчитан на массовую аудиторию, он не содержит значительного количества специализированной терминологии, однако в статье содержатся исторические факты, имена собственные, географические названия, которые требуют особого внимания.

     При анализе переводов, выполненных  программами-переводчиками Promt, Pragma и Google Translate мы получили следующие результаты:

  1. Уже в первом предложении каждая из используемых нами систем

    МП  допустила ошибку в согласовании членов предложения:

    Promt: “Кофе - варивший напиток, подготовленный от жареных семян, обычно называемых кофейных бобов, завода кофе.”

    Pragma: “Кофе - вареный напиток, готовый от жареного семени, обычно называемых кофейных бобов, из кофейной установки.”

    Google Translate: “Кофе варится напиток готовится из обжаренных зерен, обычно называемые кофейные зерна, кофе завода.”

  1. Не переведенными остались слова, обозначающие сорта кофе, а также слова dunk (“Кафе в дежа вю стиле также служить чай, бутерброды, выпечка и другие легкие закуски (некоторые из которых могут быть dunked в напиток”). – Google Translate), cafes in déjà vu-style, traveler и subculture (“Эта умная стратегия маркетинга вероятнее всего приводила к созданию тех, кто ссылается на себя как "Starbucks' наркоманы," и сформировал subculture компании преданные потребители”).
  2. Следует также выделить ошибки, допущенные при переводе реалий, исторических названий и имен собственных. Несмотря на то, что они были немногочисленны, они все же имели место в переводе, выполненном программой Pragma: “ От Мусульманского мира, кофейного распространения в Италию, затем к остальной части Европы, в Индонезию, и к Americas.”, “ В результате, Эфиопская Церковь запретила свое светское потребление до царствования Император Menelik, ВТОРОЙ от Эфиопии. ”, “… когда Pieter логово фургона Broeck переместил небо и землю …”. Однако следует отметить достаточно точный перевод программы Google Translate и практически безошибочный результат Promt с точки зрения перевода имен собственных, а также географических названий.
  3. Нами также были отмечены ошибки в выборе подходящего эквивалента при переводе многозначных слов. Например, слово bush система Google Translate перевела как «Буш», понимая под переводом фамилию политика. Другие две программы МП справились с выбором верного семантического значения, на наш взгляд, лучше.
  4. Говоря о грамматической структуре предложений, то в полученых переводах встречались незначительные нарушения построения сложных предложений, и хотелось бы выделить достаточно качественный с точки зрения структуры и стилистического оформления перевод, выполненный программой Promt: “ Во время войны за независимость, однако, требование на кофе увеличилось так, что дилеры должны были копить свои недостаточные поставки и поднять цены резко; это происходило также из-за уменьшенной пригодности чая от британских торговцев.” Мы предлагаем сравнить перевод этого же предложения двумя другими программами МП:

    Pragma: “В течение Революционной Войны, однако, запрос на кофе возрос столько, что дилерам пришлось запасти их недостаточные снабжения и поднять цены драматично; это было также из-за уменьшенной пригодности чая от Британских торговцев.

    Google Translate: “В годы войны, однако, спрос на кофе увеличился настолько, что торговцы были сокровища свои скудные поставки и резко поднять цены, это было из-за снижения доступности чая из английских купцов.

    Можно проследить, что смысл, а также  лексическое и грамматическое соответствие наиболее точно передано  в переводе системы МП Promt.

      Проанализировав статью «Coffee», мы можем сказать, что общий смысл передан достаточно точно, и для читателя не составит большого труда понять содержание, несмотря на то, что восприятие информации затруднено многочисленными ошибками. Полученные переводы вполне достаточны для простого ознакомления с общей идеей, что, собственно, соответствует требованиям, предъявляемым в большинстве случаев к переводу статей и информации, получаемой из Интернета массовыми пользователями.

      Выводы  к практической части:

      В практической части нашей работы мы рассмотрели понятие функционального  стиля, его особенности и классификацию. Мы изучили этот материал для того, чтобы впоследствии на практике в  нашей работе перевести два текста различных функциональных стилей, а именно публицистического и делового, при помощи современных систем машинного перевода Promt, Pragma и Google Translate. Получив результаты, мы сравнили их с переводом, выполненным человеком и проанализировали по некоторым критериям. Таким образом, в процессе анализа качества МП текстов более-менее удовлетворительный результат был получен при переводе статьи «Coffee» программой Promt. Можно также отметить, что качественный машинный перевод научно-технических и деловых текстов может быть построен на основе использования комплексов словарей, включающих в свой состав семантические единицы различных уровней слова, словосочетания, предложения. Ведущее место должны занимать словосочетания, так как в указанных текстах наименования понятий чаще всего выражаются словосочетаниями и значительно реже отдельными словами. В процессе перевода должно соблюдаться правило предпочтения, согласно которому, прежде всего, следует вычленять и переводить семантические единицы высших уровней, а к единицам более низких уровней обращаться во вторую очередь и только в том случае, если нет иной возможности выполнить перевод.

Информация о работе Машинный перевод