Автор: Пользователь скрыл имя, 17 Января 2012 в 20:39, курсовая работа
Целью данной работы является определение целесообразности и перспективности использования современных систем машинного перевода, доступных на сегодняшний день массовому потребителю, не владеющему в достаточной мере английским языком, а также анализ качества и эффективность выполнения машинного перевода.
Введение …………………………………………………………………………..3
Теоретическая часть……………………………………………………………..6
1. Машинный перевод…………………………………………………………...6
1.1. Определение машинного перевода………………………………………..6
1.2. Из истории машинного перевода…………………………………………7
1.2.1 Развитие машинного перевода в СССР…………………………………..10
2. Системы машинного перевода……………………………………………..12
2.1. Основные принципы работы программ машинного перевода…………..12
2.2 Современные системы машинного перевода……………………………..12
2.3. Описание программ………………………………………………………...16
2.3.1. Promt………………………………………………………………………..16
2.3.2. Pragma………………………………………………………………………19
2.3.3. Google Translate…………………………………………………………...20
Практическая часть……………………………………………………………23
3. Перевод текстов различных функциональных стилей с помощью систем машинного перевода…………………………………………………..23
3.1 Понятие функционального стиля речи…………………………………….23
3.2. Классификация функциональных стилей речи…………………………...25
3.3. Сравнительный анализ перевода текстов публицистического и научного стиля, выполненного программами машинного перевода Promt, Pragma и Google Translate…………………………………………………………………..28
Заключение ……………………………………………………………………...37
Библиография…………………………………………………………………...39
Приложение А
Приложение Б
Следует
отметить, что современные системы
машинного перевода справляются
не со всеми функциональными
стилями. По мнению Жукова Д.А., наиболее
качественный перевод достигается при
переводе текстов разговорного и официально-делового
стиля [12]. В следующем параграфе будут
детально рассмотрены тексты делового
и публицистического стиля, перевод которых
выполнен наиболее популярными современными
системами машинного перевода Promt, Pragma
и Google Translate.
3.3. Сравнительный анализ перевода текстов публицистического и делового стиля, выполненного программами машинного перевода Promt, Pragma и Google Translate
Материалами для нашего исследования послужили тексты, отобранные в качестве образцов различных функциональных стилей русского языка, а именно публицистического и делового стиля. Материалы переводились на русский язык при помощи современных систем МП: 1) Promt, 2)Pragma и 3) Google Translate. Никакой предварительной и последующей обработки текстов не производилось. Полученный перевод сравнивался с переводом тех же текстов, выполненным человеком-переводчиком. Мы предлагаем ознакомится с полученными результатами, которые, на наш взгляд, являются достаточно субъективными, однако позволяют судить об общем уровне качества перевода, получаемого при использовании современных систем МП, доступных массовому потребителю.
На
наш взгляд, в данной работе следует
выделить следующие критерии и принципы
для осуществления анализа
В качестве примера делового стиля, нами был выбран текст «Regional capacity development. Final report», который является отчетом о состояние на рынке калийных удобрений. Сложность перевода такого текста заключается в том, что он имеет достаточно узкоспециализированную тематику - горнодобывающая промышленность и калийные удобрения.
В анализе переводов, выполненных программами Promt, Pragma, Google Translate, необходимо отметить, что каждая из программ в достаточно большой степени справилась с функциональным принципом, а именно выполнила свою функцию как переводчика и передала смысл данного текста. Однако в нашем случае большую смысловую нагрузку несет специализированная терминология. В этом случае, у всех трех программ были допущены ошибки при переводе, к примеру, химических формул MOP (хлористый калий), SOP (сульфат калия). Варианты их перевода – ШВАБРА, ПОДЛИВКА (Pragma) и СС (Google Translate) соответственно, не говоря уже о том, что Pragma вообще не перевела ключевое смысловое слово – potash(калийные удобрения), а также производные от него слова. Это затрагивает также и лексический принцип, в соответствии с которым программа-переводчик справляется в переводом слов или нет. Таким образом, для программы Promt и Pragma остались непереведенными лишь два слова - brownfield, greenfield, Google Translate справился со всеми слова в отчете.
Следующие принципы, которыми мы будем руководствоваться при анализе переводов, - это принцип сочетаемости слов и словосочетаний, а также грамматический принцип. Данные принципы предполагают грамматически верное как построение предложений, так и употребление правильных форм слова. С точки зрения данного принципа. Лучший перевод, по нашему мнению, был выполнен программой Promt. Несмотря на некоторую несогласованность, предложения в большинстве своем построены верно, более того, практически везде соблюдается правильный порядок слов. В переводе, выполненном программой Pragma допущены ошибки в употреблении падежа («Это увеличение приходит от трех установленные генераторы только, с тех пор, как никакие другие проекты не считаются, чтобы материализоваться перед 2013. Мозаичные разряды как всемирный второй наибольший potash производитель, с 15-процентная доля глобальной вместимости».),а также встречаются предложения, в которых практически полностью отсутствует согласование членов предложения (Agrium вместимость в Vanscoy есть близко к 2.1 Mt, увеличив 16 процента начиная с 2006.). Google Translate,по нашему мнению, справился хуже всех: простые предложения система переводит (и то, как мы убедились - не все) почти без ошибок. Сложносочиненные, да и классические примеры сложноподчиненных предложений тоже даются системе с относительной легкостью. Однако как только возникает нестандартная ситуация (например, одно придаточное предложение усложняется другим и программа не находит подходящего алгоритма грамматического анализа - она сразу забывает о синтаксисе и начинает элементарный пословный перевод, формально (посредством флексий) пытаясь связать хотя бы рядом стоящие слова. Эта попытка связать грамматически рядом стоящие слова вместе неправильным выбором значений некоторых слов еще более запутывает выходной вариант («Потенциала Agrium в Ванской близка к 2,1 млн. т, увеличившись на 16 процентов с 2006 года.»).
Говоря о семиотическом принципе, стоит заметить, что все три программы в нашем исследование используют в основном первое значение многозначных слов, как наиболее часто встречающееся. Очевидно, что системы машинного перевода не имеют средств определения правильного выбора значения слова. Частично решает данную проблему указание тематики переводимого текста в программе Promt, однако даже это не дает абсолютно правильный перевод многозначного слова.
И последний момент, который мы выделили как важный для оценки перевода, выполненного системами МП Promt, Pragma и Google Translate,- это передача имен собственных, реалий, географических названий. Нужно сказать, что данный текст содержит большое количество географических названий, а также названий компаний. Программы - переводчики достойно справились с передачей названий стран и городов, хотя, к примеру, Promt не перевел название города Саскачеван, в то время как Pragma и Google Translate это сделали. Больше всего непереведенных географических названий мы выявили в переводе программы Pragma, тогда как Google Translate и Promt справились, на наш взгляд, в равной степени. Что касается перевода названий компаний, то можно констатировать, что все системы МП допустили при переводе ошибку и постарались перевести названия дословно:
Promt: “В дополнение к этим краткосрочным событиям, больше чем 25 предприятиям, включая некоторые большие корпорации (Долина, ЗАБОЙНОЕ ДАВЛЕНИЕ Биллитон, и Acron) и младшие компании исследования (такие как Поташ Один, Поташ Атабаски и Западный Поташ), выполняли детализированную работу исследования, чтобы эксплуатировать депозиты поташа через Канаду. “
Pragma: “В добавление к этому краткосрочному развитию, более чем 25 предприятий, охватывая некоторые большие корпорации (Прощание, Биллитон забойного ДАВЛЕНИЯ при закрытом устье, и Acron) и младшие компании (как например Поташ Один, Поташ атабаски и Западный Поташ) исследования, осуществляют детальную работу исследования для того, чтобы эксплуатировать potash залежи по Канаде.”
Google Translate: “В дополнение к этим краткосрочные разработки, более 25 предприятий, включая некоторых крупных корпораций (Vale, BHP Billiton и "Акрон") и младшие компаний разведки (например, калийная Один из них, Атабаска Калий Калий и Западной), были проведение детальной разведки работы в целях использования калийных месторождений в Канаде.”
Таким образом, можно сделать следующие выводы относительно качества перевода текста «Расширение региональных возможностей. Итоговый отчет», выполненного программами МП Promt, Pragma и Google Translate:
Таким образом, полученный МП текста делового стиля в значительной мере грамматически не согласован и содержит достаточно большое количество ошибок. Тем не менее, общий смысл и содержание текста переданы достаточно точно, хотя из-за недостаточного качества перевода, выполненного программой Google Translate, некоторые важные моменты могут быть упущены. На наш взгляд, лучше всего с переводом справилась программа Promt. Перевод такого рода может использоваться для первичного ознакомления с содержанием, но его использование по назначению без значительной редакторской правки представляется невозможным.
В качестве образца публицистического функционального стиля была выбрана статья из интернет-журнала «Все о кофе. Интересные факты» [10]. Так как текст рассчитан на массовую аудиторию, он не содержит значительного количества специализированной терминологии, однако в статье содержатся исторические факты, имена собственные, географические названия, которые требуют особого внимания.
При
анализе переводов, выполненных
программами-переводчиками
МП допустила ошибку в согласовании членов предложения:
Promt: “Кофе - варивший напиток, подготовленный от жареных семян, обычно называемых кофейных бобов, завода кофе.”
Pragma: “Кофе - вареный напиток, готовый от жареного семени, обычно называемых кофейных бобов, из кофейной установки.”
Google Translate: “Кофе варится напиток готовится из обжаренных зерен, обычно называемые кофейные зерна, кофе завода.”
Pragma: “В течение Революционной Войны, однако, запрос на кофе возрос столько, что дилерам пришлось запасти их недостаточные снабжения и поднять цены драматично; это было также из-за уменьшенной пригодности чая от Британских торговцев.”
Google Translate: “В годы войны, однако, спрос на кофе увеличился настолько, что торговцы были сокровища свои скудные поставки и резко поднять цены, это было из-за снижения доступности чая из английских купцов.”
Можно проследить, что смысл, а также лексическое и грамматическое соответствие наиболее точно передано в переводе системы МП Promt.
Проанализировав статью «Coffee», мы можем сказать, что общий смысл передан достаточно точно, и для читателя не составит большого труда понять содержание, несмотря на то, что восприятие информации затруднено многочисленными ошибками. Полученные переводы вполне достаточны для простого ознакомления с общей идеей, что, собственно, соответствует требованиям, предъявляемым в большинстве случаев к переводу статей и информации, получаемой из Интернета массовыми пользователями.
Выводы к практической части:
В
практической части нашей работы
мы рассмотрели понятие