Автор: Пользователь скрыл имя, 08 Мая 2012 в 20:02, курсовая работа
Об’єктом дослідження даної курсової роботи виступають лексичні особливості перекладу текстів наукового стилю у галузі машинного перекладу з англійської мови на українську.
Метою дослідження є виконання перекладу наукового тексту та визначення головних лексичних особливостей та труднощів перекладу.
Вступ………………………………………………………………………………2
Розділ 1: Фонові знання перекладача у галузі машинного перекладу………..3
Розділ 2: Текст перекладу……………………………………………………….9
Розділ 3: Перекладацький коментар……………………………………………16
Висновки…………………………………………………………………………25
Список використаної літератури……………………………………………….26
Додаток А………………………………………………………………………..27
Додаток Б………………………………………………………………………...35
Розділ 2
Текст перекладу статті «Machine TRANSLATION»
Машинний переклад, який іноді позначається абревіатурою МП (не плутати з автоматизованим перекладом, людським перекладом з участю ЕОМ та інтерактивним перекладом), це підрозділ комп’ютерної лінгвістики який досліджує використання комп’ютерного програмного забезпечення для перекладу з однієї природної мови на іншу. На початковому рівні, МП здійснює просту заміну слів з однієї природної мови на слова з іншої, але виконання лише цієї операції не може створити гарний переклад тексту, тому що у мові-реципієнті потрібне розпізнавання цілих фраз та їх найближчих еквівалентів. Вирішення цієї проблеми за допомогою статистичного та корпусного методів є галуззю, яка швидко розвивається, так що призводить до кращих перекладів, допомагає справитися з відмінностями у лінгвістичній типології, перекладом ідіом та ізоляцією аномалій.
Сучасне програмне забезпечення для машинного перекладу часто дає можливість зробити налаштування згідно потреб конкретної галузі чи спеціальності (наприклад, прогнози погоди), покращуючи синтезовуваний текст завдяки обмеженню сфери допустимих замін. Цей метод особливо ефективний у тих галузях, де використовується формальна або шаблонна мова. Звідси випливає, що після машинного перекладу державних і юридичних документів, швидше з’являється придатний кінцевий варіант перекладу ніж після перекладу розмовної мови або менш стандартизованого тексту. Покращення якості кінцевого варіанту перекладу також може бути досягнуто шляхом втручання людини: наприклад, деякі системи можуть перекладати більш точно, якщо користувач однозначно встановлює, які слова у тексті є власними назвами. За допомогою цих методів, MП виявився корисним інструментом допомоги перекладачам і, в дуже обмеженій кількості випадків, може навіть виробляти той кінцевий варіант перекладу, який можна використовувати як є (наприклад, прогнози погоди).
Розвиток і потенціал машинного перекладу обговорювався на протязі всієї історії його існування. З 1950-х, деякі вчені ставлять під сумнів можливість досягнення повністю автоматичного машинного перекладу високої якості. Дехто з критиків стверджує, що є принципові перешкоди для автоматизації процесу перекладу. Появлення ідеї машинного перекладу може бути простежена ще з 17-ого століття. У 1629 році, Рене Декарт запропонував універсальну мову, у якій еквівалентні ідеї на різних мовах передавалися через один символ. У 1950-х, у рамках Джорджтаунського експерименту (1954) було здійснено автоматичний переклад більш ніж шістдесяти російських речень на англійську мову. Експеримент пройшов з великим успіхом і сповістив про початок ери значних інвестицій у дослідження машинного перекладу. Автори стверджували, що протягом трьох-п'яти років, машинний переклад буде вирішеною проблемою. Однак, реальний прогрес був значно повільнішим, та після звіту ALPAC (1966), який показав,,що десятирічним дослідженням не вдалось виправдати очікування, фінансування було суттєво скорочено. Починаючи з кінця 1980-х років, коли обчислювальні потужності збільшилася і стали менш дорогими, з’явився більший інтерес до статистичних моделей машинного перекладу. Ідея використання цифрових обчислювальних машин для перекладу природних мов була запропонована ще в 1946 році А.Д. Бутом і, можливо, іншими. Уоррен Вівер написав важливий меморандум «Переклад» в 1949 році. Джорджтаунський експеримент був аж ніяк не першим практичним застосуванням цієї технології, та у 1954 році був проведений показ на машині APEC у Біркбекському Коледжі (Лондонський університет) шляхом елементарного перекладу з Англійської на Французьку. Кілька доповідей на цю тему, і навіть статей в популярних журналах , були опубліковані в той час. Тоді ж аналогічний метод перекладу був вперше застосований у Біркбекському коледжі для читання та складання текстів Брайля за допомогою комп’ютера.
Що стосується перекладу, зробленого людиною, то він може бути описаний таким чином:
Розшифровка змісту тексту оригінала
Перекодування цього змісту у мову-реципієнт.
За цією, нібито простою процедурою, стоїть складний когнітивний процес. Щоб розшифрувати зміст тексту оригінала повністю, перекладач повинен витлумачити та проаналізувати усі особливості тексту, це процес, який вимагає глибокого знання граматики, семантики, синтаксису, ідіом і т. д., мови оригіналу , а також культури її носіїв. Перекладач потребує глибокого знання таких же складових мови-реципієнту щоб адекватно перекодувати зміст.
У цьому полягає проблема машинного перекладу: як запрограмувати комп'ютер, щоб він «розумів» текст так, як це робить людина, і "створював" його на мові-реципієнті так, щоб він «звучав» так, нібито був написан людиною.
Ця проблема може бути вирішена декількома способами.
Способи
Машинний переклад може використовувати метод, заснований на низці лінгвістичних правил, а це означає, що слова будуть перекладанні у лінгвістичний спосіб - найбільш підходящі (в усній формі) слова у мові-оригіналу будуть замінені словами мови реципієнта. Часто стверджується, що для успішного машинного перекладу,в першу чергу треба вирішити проблему розуміння природної мови. Як правило, способи,засновані на системі правил,роблять граматичний розбір тексту,зазвичай створюючи проміжну символічну репрезентацію, з якої утворюється текст на мові-реципієнті.
Згідно з природою цієї проміжної символічної репрезентації, підхід описується як міжмовний машинний переклад або машинний переклад, заснований на переміщенні. Ці методи вимагають застосування великих словників з морфологічною, синтаксичною і семантичною інформацією та численних наборів правил. За умови наявності достатньої кількості інформації, програми машинного перекладу працюють досить добре щоб забезпечити носію однієї мови можливість зрозуміти приблизне значення того,що було написано носієм іншої мови. Труднощі полягають у тому, щоб здобути достатньо правильної інформації для підтримки конкретного методу. Наприклад, великий багатомовний корпус даних, який потрібен для роботи статистичних методів, непотрібен для методів, основаних на граматиці. Але тоді, граматичні методи потребують щоб кваліфікований лінгвіст ретельно склав граматичну схему, яка ними використовується. Щоб робити переклад на споріднені мови, у машинному перекладі може використовуватися техніка поверхового МП.
Найбільш популярними способами перекладу є:
Машинний переклад, заснований на системі правил (МПЗСП) – це загальний термін, який позначає системи МП, що базуються на лінгвістичній інформації про мову оригіналу і мову-реципієнта, в основному вилученої зі словників та підручників граматики, які охоплюють основні семантичні, морфологічні та синтаксичні закономірності кожної мови відповідно. Маючи речення на мові оригіналу, система МПЗСП (RBMT машинний переклад, заснований на системі правил) генерує їх на мові-рецепієнті на основі морфологічного, синтаксичного та семантичного аналізу як мови оригіналу так і мови-реципієнту, до процесу перекладу.
Головна ідея машинного перекладу, заснованому на принципі переміщення полягає у створенні проміжної символьної репрезентації, яка схоплює «значення» речення на мові оригіналу, щоб згенерувати правильний переклад. Способи роботи машинного перекладу, заснованого на принципі переміщення значно різняться, але у цілому, вони діють за однаковим шаблоном - застосовують набір лінгвістичних правил, які визначаються, як співвідношення між структурами мови оригіналу та мови-реципієнту.
Міжмовний машинний переклад – це один із класичних способів МП. При застосуванні цього методу, мова оригіналу, тобто текст, який треба перекласти, трансформується у мову-посередник, абстрактну, незалежну від перекладацької мови репрезентацію. Потім, з мови-посередника генерується мова-реципієнт. У рамках заснованої на правилах парадигми машинного перекладу міжмовний машинний переклад є альтернативою до прямого способу та способу заснованому на принципі переміщення.
Переклад, заснований на застосуванні словників, використовує спосіб, якій ґрунтується на словникових статтях, що означає, що переклад слів буде здійснюватися дослівно, зазвичай без урахування смислових зв’язків між ними.
Статистичний машинний переклад (СМП) – це різновид машинного перекладу, при якому переклад створюється на основі статистичних моделей, параметри яких отримані на базі аналізу двомовних корпусів текстів. Статистичній спосіб відрізняється як від способів, заснованих на системі правил, так і від МП на основі прикладів.
Машинний переклад на основі прикладів (МПНОП) – це спосіб машинного перекладу, який часто характеризується використовуванням у процесі роботи корпусів двомовних паралельних текстів, в якості головної бази знань. По суті, це переклад за аналогією,і він може розглядатися як реалізація методу машинного навчання, основаного на прецедентах.
Гібридний машинний переклад (ГМП) – врівноважує сильні сторони методик перекладу заснованого на правилах, та статистичного перекладу. Існує кілька способів ГМП:
a) Правила, оброблені за допомогою статистики: переклад здійснюється з використанням програмного механізму, заснованому на системі правил. Статистичні данні потім використовуються з метою упорядкування синтезовуваного тексту, отриманому в результаті застосування програмного механізму, заснованому на системі правил.
b) Статистика керується правилами: вони застосовуються для попередньої обробки даних в спробі знайти кращій спосіб застосування статистичного програмного механізму. Правила також використовуються з метою подальшої обробки статистичних даних для виконання таких функцій, як нормалізація. Цей спосіб є більш потужним,гнучким та дозволяє більше контролювати процес перекладу.
Але існує декілька серйозних проблем стосовно МП, такі як неоднозначність смислу слів. Мова йде про пошук відповідного перекладу, коли слово може мати кілька значень. Вперше торкнувся цієї проблеми у 1950-ті Єгошуа Бар-Гіллель. Він зазначив, що без "Універсальної енциклопедії", машина ніколи не зможе розрізняти два різних значення слова. Сьогодні існує безліч способів, які спрямовані на подолання цієї проблеми. Вони можуть бути приблизно розділені на "поверхневі" та "глибинні".
Поверхневі способи припускають відсутність знання тексту. Вони просто застосовують статистичні методи до слів, які оточують двозначне слово. Глибинний підхід передбачає всебічне знання цього слова. До сих пір, поверхневі способи були більш вдалими.
Ідеальний глибинний підхід потребуватиме, щоб програмне забезпечення для перекладу само зробило усі необхідні дослідження цього виду неоднозначності; але для цього буде потрібен більш високий рівень ШІ (штучного інтелекту), ніж був досягнутий до цих пір. Поверхневий підхід, при якому просто вгадується смисл двозначної англійської фрази, буде досить часто мати реальний шанс вгадати неправильно. Цей процес включає «запит користувача про кожну двозначність», що автоматизує тільки 25% роботи професійного перекладача, залишаючи більш важкі 75% на доробку людині.
Системи машинного перекладу та зроблений ними переклад може бути оцінений за чисельними параметрами. Призначення перекладу, характеристики програмного забезпечення для MП, характер процесу перекладу і т.д. все це впливає на те, яким чином оцінюється системи МП та згенеровані ними тексти.
Існують різні способи оцінки якості продукції систем машинного перекладу. Найстарішим є використання людської перевірки для оцінки якості перекладу. Навіть якщо людська оцінка забирає багато часу, вона, як і раніше, є найнадійнішим способом для порівняння різних систем, таких як статистична, та заснована на правилах. Автоматизовані засоби оцінки включають BLEU, NIST і МETEOR.
Покладаючись виключно на невідредаговані тексти машинного перекладу ми не враховуємо той факт, що людське спілкування є контекстуально залежним, і що зрозуміти контекст оригіналу з розумною долею вірогідності може тільки людина. Але безсумнівно є правдою, що навіть переклади, які були зроблені виключно людьми, мають велику вірогідність помилок. Таким чином, щоб гарантувати, що переклад, зроблений машиною, буде корисним для людини і що досягнута якість, придатна до публікації, тексти, отримані у результаті МП, повинні бути переглянуті і відредаговані людиною. Покійний Клод Пірон, перекладач,який багато років працював на ООН та ВОЗ, писав, що машинний переклад, в кращому випадку, автоматизує легшу частину роботи перекладача, складніша частина, яка потребує багато часу, зазвичай включає масштабні дослідження, які мають на меті уникнення двозначності в тексті оригіналу, що потребують граматичного та лексичного вирішення у тексті-реципієнті.
Розділ 3
Перекладацький коментар
Мовне наповнення будь-якого тексту залежить передусім від його жанрово-стилістичної приналежності. Тому, першим завданням у цьому розділі є визначення саме цього аспекту. Сумарний аналіз таких чинників, як композиційна структура, тематика, лексичний склад та синтаксичні конструкції дозволяють нам охарактеризувати текст оригіналу як науково-технічний.
Функціональний стиль – це різновид літературної мови, в якій мова виступає в тій або іншій соціально значущій сфері суспільно-мовленнєвої практики людей і особливості якого зумовлені особливостями спілкування в даній сфері. [4, c. 567].
Одним з функціональних стилів є науковий, який, у свою чергу, розпадається на три підстилі: власне науковий, науково-технічний та науково-популярний. За жанром текст є науковою статтею. Наукова стаття – це науковий твір відносно невеликого розміру, який публікують у періодичних виданнях. У статті, зазвичай, піднімають більш часткові питання у порівнянні із монографією. Синтаксис цього жанрового різновиду наукового тексту орієнтується на норми книжкової мови. Лексичні домінанти визначаються вживанням переважно книжкової лексики та широким використанням термінології [7].
Отже, типовим для науково-технічних текстів на лексичному рівні є наявність: (1) термінів; (2) абревіатур; (3) класифікацій; (4) дефініцій; (5) загальнонаукової лексики. Тексти цього стилю зазвичай призначені для цільової аудиторії.
Розглядаючи лексичну складову науково-технічного стилю перш за все можна помітити використання науково-технічної термінології та спеціальної лексики.
1) Термінами називають слова або словосполучення, що позначають специфічні об'єкти і поняття, якими оперують фахівці певної науки або техніки». Терміни в мові існують у складі певної термінології. Термінологія - це сукупність термінів у даній галузі виробництва, професійної праці, знання. Будучи складовою частиною словникового складу мови, терміни виражають специфічні, часто притаманні дуже вузькій сфері професійної або наукової діяльності, поняття та найменування.[2] Функція терміна у науково-технічному тексті забезпечує чітку та точну вказівку на реальні об'єкти і явища, встановлює однозначне розуміння фахівцями переданої інформації. Звідси й випливає низка вимог, які пред'являють до цього типу слів.
В.Н.Коміссаров виділяє наступні вимоги :
1. Термін повинен бути точним, тобто мати суворо певне значення,