Машинный перевод

Автор: Пользователь скрыл имя, 16 Марта 2013 в 12:35, курсовая работа

Описание работы

Перевод имеет долгую историю. Своими корнями он восходит к тем далеким временам, когда праязык начал распадаться на отдельные языки и возникла необходимость в людях, знавших несколько языков и способных выступать в роли посредников при общении представителей разных языковых общин[3]. Известный переводовед А. Д. Швейцер определяет перевод, как однонаправленный и двухфазный процесс межъязыковой и межкультурной коммуникации, при котором на основе подвергнутого целенаправленному ("переводческому") анализу первичного текста создается вторичный текст ("метатекст"),

Содержание

Введение
Глава 1: Машинный перевод
1.Практическое задание.
Глава 2: История машинного перевода
Глава 3: Принципы работы систем машинного перевода
Глава 4: Классификация систем машинного перевода
4.1Задачи, которые решает система машинного перевода.
4.2.Программы машинного перевода.
Заключение
Список литературы

Работа содержит 1 файл

Машинный перевод.docx

— 46.32 Кб (Скачать)

Факультет иностранных языков

Машинный перевод

Курсовая работа

 «К защите»

___________________________

Научный руководитель

 

Содержание

  • Введение
  • Глава 1: Машинный перевод
  • 1.Практическое задание.
  • Глава 2: История машинного перевода
  • Глава 3: Принципы работы систем машинного перевода
  • Глава 4: Классификация систем машинного перевода
  • 4.1Задачи, которые решает система машинного перевода.
  • 4.2.Программы машинного перевода.
  • Заключение
  • Список литературы

 

Введение

Перевод имеет долгую историю. Своими корнями он восходит к тем далеким  временам, когда праязык начал  распадаться на отдельные языки  и возникла необходимость в людях, знавших несколько языков и способных  выступать в роли посредников  при общении представителей разных языковых общин[3]. Известный переводовед  А. Д. Швейцер определяет перевод, как  однонаправленный и двухфазный процесс  межъязыковой и межкультурной коммуникации, при котором на основе подвергнутого  целенаправленному ("переводческому") анализу первичного текста создается  вторичный текст ("метатекст"), заменяющий первичный в другой языковой и культурной среде; процесс, характеризуемый  установкой на передачу коммуникативного эффекта первичного текста, частично модифицируемый различиями между двумя  языками, между двумя культурами и двумя коммуникативными ситуациями".

Переводоведение впервые оформилось в самостоятельную дисциплину как  раздел языкознания в 1930-х годах. В настоящее время эта область  научных исследования имеет вполне установившиеся традиции. В теоретическом и языковедческом плане переводоведение тяготеет к социолингвистике, психолингвистике, сопоставительному языкознанию, грамматике текста и касается таких важных разделов науки о языке, как язык и мышление, язык и картина мира, язык и культура[3].

XXI век ставит новые задачи  в информационном пространстве  человечества. Благодаря массовой  информации роль перевода в  жизни человечества неуклонно  возрастает. Сегодня переводческие  связи охватывают почти все  сферы человеческой деятельности. Движение информационных потоков  не знает ни границ, ни времени,  ни пространства.

Круг деятельности, охватываемой понятием «перевод», очень широк. Переводятся  с одного языка на другой стихи, художественная проза, научные и научно-популярные книги из различных областей знания, дипломатические документы, деловые  бумаги, статьи политических деятелей и речи ораторов, газетные материалы, беседы лиц, разговаривающих на разных языках и вынужденных прибегать  к помощи переводчика, дублируются  кинофильмы. Вполне логично, что по мере увеличения потока информации и  распространения каналов связи  существует возрастающая потребность  в переводе этой информации с одного языка на другой. При этом, прибегать  к помощи специалиста для получения  сведений, например, на иностранном  сайте, не всегда целесообразно. Поэтому  стремление автоматизировать процесс  перевода вполне естественно, а проблемы машинного перевода являются очень  актуальными и не потеряют этой актуальности в будущем.

Перевод может осуществляться:

с одного языка на другой - неродной, родственный, близкородственный;

с литературного языка на его  диалект и наоборот, или с диалекта одного языка на другой литературный язык;

с языка древнего периода на данный язык в его современном состоянии (например, с древнерусского языка  на современный русский, со староанглийского на современный английский и т.д.).

Следует заметить, что для машинного  перевода характерен лишь пункт 1, поскольку, как известно из экономики, спрос  рождает предложение: спрос на программу-переводчика, скажем, с английского или немецкого  языка на русский намного превышает  спрос на перевод с любого из праязыков.

Целью работы является рассмотрение проблем современного машинного  перевода. Для этого необходимо сначала  проанализировать проблемы, которые  лингвистам и разработчикам уже  удалось решить на протяжении недолгой истории машинного перевода, а  затем - проблемы, с которыми им приходится сталкиваться в настоящее время.

 

Глава 1: Машинный перевод

Машинный перевод -это выполняемое на компьютере действие по преобразованию текста на одном естественном языке в эквивалентный по содержанию текст на другом языке, а также результат такого действия. Современный машинный, или автоматический перевод осуществляется с помощью человека: пред-редактора, который тем или иным образом предварительно обрабатывает подлежащий переводу текст, интер-редактора, который участвует в процессе перевода, или пост-редактора, который исправляет ошибки и недочеты в переведенном машиной тексте.

Для осуществления машинного перевода в компьютер вводится специальная  программа, реализующая алгоритм перевода, под которым понимается последовательность однозначно и строго определенных действий над текстом для нахождения переводных соответствий в данной паре языков L1 - L2 при заданном направлении перевода (с одного конкретного языка на другой). Система машинного перевода включает в себя двуязычные словари, снабженные необходимой грамматической информацией (морфологической, синтаксической и семантической) для обеспечения передачи эквивалентных, вариантных и трансформационных переводных соответствий, а также алгоритмические средства грамматического анализа, реализующие какую-либо из принятых для автоматической переработки текста формальных грамматик. Имеются также отдельные системы машинного перевода, рассчитанные на перевод в рамках трех и более языков, но они в настоящее время являются экспериментальными.

Стоит также уделить внимание и  качеству машинного перевода. Оно  зависит от тематики и стиля исходного  текста. Машинный перевод произвольных художественных текстов практически  всегда оказывается неудовлетворительного  качества. Тем не менее для технических  документов при наличии специализированных машинных словарей по определённой тематике и незначительной настройке системы  на особенности того или иного  типа текстов возможно получение  перевода вполне приемлемого качества. Результат машинного перевода в  этом случае нуждается лишь в небольшой  редакторской корректировке. Чем более  формализован стиль исходного документа, тем качественнее возможен перевод. Наилучших результатов можно  достичь при использовании машинного  перевода для текстов, написанных в  техническом (различные описания и  руководства) и официально-деловом  стиле.

язык перевод машинный

1.Практическое задание

Для подтверждения этих слов следует  привести пример переводов небольшого отрывка художественного текста. И затем сравнить перевод, сделанный  электронным переводчиком, и перевод, осуществленный человеком- переводчиком.

The shore was fledged with palm trees. These stood or leaned or reclined against the light and their green feathers were a hundred feet up in the air. The ground beneath them was a bank covered with coarse grass, torn everywhere by the upheavals of fallen trees, scattered with decaying coconuts and palm saplings. Behind this was the darkness of the forestбproper and the open space of the scar. Ralph stood, one hand against a greyбtrunk, and screwed up his eyes against the shimmering water. Out there, perhaps a mile away, the white surf flinked on a coral reef, and beyond that the open sea was dark blue. Within the irregular arc of coral the lagoon wasбstill as a mountain lake-blue of all shades and shadowy green and purple. The beach between the palm terrace and the water was a thin stick, endless apparently, for to Ralph's left the perspectives of palm and beach and water drew to a point at infinity; and always, almost visible, was the heat. ( William Golding “Lord of the Flies” ).

Ниже будет приведен перевод  этого художественного текста осуществленный Е.А. Суриц.

Берег был весь опушен пальмами. Они  стояли, клонились, никли в лучах, а зеленое оперенье висело в стофутовой выси. Под ними росла жесткая трава, вспученная вывороченными корнями, валялись гнилые кокосы и то тут, то там пробивались новорожденные  ростки. Сзади была тьма леса и светлый  проем просеки. Ральф замер, забыв  руку на сером стволе, и щурясь смотрел на сверкающую воду. Там, наверное, в расстоянии мили лохматилась у кораллового рифа белая кипень прибоя и дальше темной синью стлалось открытое море. В неровной дуге кораллов лагуна лежала тихо, как горное озеро - разнообразно синее, и тенисто-зеленое, и лиловатое. Полоска песка между пальмовой террасой и морем убегала тонкой лукой неведомо куда, и только где-то в бесконечности слева от Ральфа пальмы, вода и берег сливались в одну точку; и, почти видимая глазу, плавала вокруг жара.

А ниже приведен результат перевода этого же отрывка с помощью PROMT - переводчика.

Берег был оперен с пальмами. Они  стояли или наклонялись или откидывались против света, и их зеленые перья  были сто футов в воздухе. Основание  ниже них было банком, покрытым грубой травой, порванной всюду переворотами упавших деревьев, рассеянных с распадающимися кокосовыми орехами и молодыми деревьями  пальмы. Позади этого была темнота  надлежащего леса и открытой площади  шрама. Ральф стоял, одна рука против серого ствола, и ввернул его глаза  против мерцающей воды. Там, возможно на расстоянии в одна миля, белый прибой flinked на коралловом рифе, и кроме того открытое море было темно-синим. В пределах нерегулярной дуги коралла лагуна была все еще как гора, синяя озером из всех оттенков и темного зеленого цвета и фиолетовая. Берег между террасой пальмы и водой был тонкой палкой, бесконечной очевидно, поскольку слева от Ральфа перспективы пальмы и берега и воды тянули к пункту в бесконечности; и всегда, почти видимый, была высокая температура.

Видно, что переводы довольно сильно различаются. В первом переводе сохранена  правильные грамматические , синтаксические структуры. Во втором тексте слова , по большей части, не связаны друг с другом. Конечно же, главная мысль и идея текста понятна, это описание окружающей природы. Однако, не соблюдается огромное количество правил. Отсюда можно сделать вывод. Система машинного перевода не усовершенствована. Человеческий фактор играет огромное значение. Второй текст нуждается в обстоятельном исследовании и корректировке.

Глава 2: История машинного перевода

Для начала, следует обозначить некоторые  важные даты в истории машинного  перевода:

1947 - дата рождения машинного  перевода, как научного направления.  Уоррен Уивер, директор отделения  естественных наук Рокфеллеровского  фонда, написал письмо Норберту  Винеру, в котором рассматривал  задачу перевода текстов с  одних языков на другие, как  еще одну область применения  техники дешифрования. За этим письмом последовало множество дискуссий. 1947 - А.Бут и Д.Бриттен разработали подробный "код" для пословного машинного перевода. 1948 - Р.Риченс предложил правила разбиения словоформ на основу и окончание. 1952 - первая конференция по машинному переводу в Массачусетском технологическом институте. 1954 - представлена первая система машинного перевода - IBM Mark II - русско-английская, имела словарь в 250 единиц и 6 грамматических правил. Последовавшее за этим десятилетие было временем бурного развития машинного перевода. 1967 - специально созданная в США Комиссия Национальной Академии наук, исходя из реальной ситуации с переводами в США и показателей стоимости различных способов перевода, пришла к выводу, что машинный перевод нерентабелен. Доклад существенно затормозил развитие МП в целом. 70-е годы - новый подъем работ в области МП. С развитием вычислительной техники появились новые возможности машинной реализации лингвистических алгоритмов. 80-е годы - время работы персональных компьютеров значительно подешевело, машинный перевод наконец-то стал экономически выгодным. 90-е годы - отмечается очередной рост интереса к машинному переводу, что связано с появлением и бурным развитием Internet. Возможности перевода в режиме он-лайн позволяют преодолеть языковой барьер и осуществлять навигацию по иностранным сайтам.

А сейчас следует рассмотреть эти  факты подробнее:

Итак, впервые мысль о возможности  машинного перевода высказал Чарльз Бэббидж (1791-1871), разработавший в 1836-1848 гг. проект цифровой аналитической  машины - механического прототипа  электронных цифровых вычислительных машин, появившихся через 100 лет. Идея Ч. Бэббиджа состояла в том, что память объемом 1000 50-разрядных десятичных чисел (по 50 зубчатых колес в каждом регистре) можно использовать для  хранения словарей. Ч. Бэббидж привел эту идею в качестве обоснования для запроса у английского правительства средств, необходимых для физического воплощения аналитической машины, которую ему так и не удалось построить (см. Апокин и др. Чарльз Бэббидж. М., Наука, 1981).

Мысль использовать ЭВМ для перевода была высказана в 1946 году, сразу после  появления первых ЭВМ. Датой рождения МП как области исследований принято  считать 1947 г.: все началось с письма Уоррена Уивера, директора отделения  естественных наук Рокфеллеровского фонда, к Норберту Винеру в марте того же года, в котором задача перевода сравнивалась с задачей дешифровки текстов. Последняя в то время  уже стала выполняться на электромеханических  устройствах. За этим письмом последовало  множество дискуссий, появился меморандум о целях, и, наконец, были выделены средства на исследования. Первая публичная  демонстрация машинного перевода (так  называемый Джорджтаунский эксперимент) состоялась в 1954 году.Несмотря на примитивность той системы (словарь в 150 слов, грамматика из 6 правил, перевод нескольких простых фраз), этот эксперимент получил широкий резонанс: начались исследования в Англии, Болгарии, ГДР, Италии, Китае, Франции, ФРГ, Японии и других странах; в том же 1954 году и в СССР.

Первое поколение систем машинного  перевода базировалось на алгоритмах последовательного перевода «слово за словом», «фраза за фразой». Возможности  таких систем определялись доступными размерами словарей, прямо зависящими от объема памяти компьютера. Перевод  текста осуществлялся отдельными предложениями, смысловые связи между ними никак  не учитывались. Такие системы называют системами прямого перевода. На смену  им со временем пришли системы последующих  поколений, в которых перевод  от языка к языку осуществлялся  на уровне синтаксических структур. В  алгоритмах перевода использовался  набор операций, позволяющий путем  анализа переводимого предложения  построить его синтаксическую структуру  по правилам грамматики языка входного предложения (так же, как учат детей  языку в средней школе), а затем  преобразовать ее в синтаксическую структуру выходного предложения  и синтезировать выходное предложение, подставляя нужные слова из словаря. Такие системы называются Т-системами (от английского слова transfer - преобразование).

Информация о работе Машинный перевод