Автор: Пользователь скрыл имя, 08 Мая 2012 в 20:02, курсовая работа
Об’єктом дослідження даної курсової роботи виступають лексичні особливості перекладу текстів наукового стилю у галузі машинного перекладу з англійської мови на українську.
Метою дослідження є виконання перекладу наукового тексту та визначення головних лексичних особливостей та труднощів перекладу.
Вступ………………………………………………………………………………2
Розділ 1: Фонові знання перекладача у галузі машинного перекладу………..3
Розділ 2: Текст перекладу……………………………………………………….9
Розділ 3: Перекладацький коментар……………………………………………16
Висновки…………………………………………………………………………25
Список використаної літератури……………………………………………….26
Додаток А………………………………………………………………………..27
Додаток Б………………………………………………………………………...35
яке може бути схемою логічного визначення, що встановлює місце
позначеного терміном поняття в системі понять даної галузі науки і
техніки.
2. Термін повинен бути однозначним, і в цьому сенсі незалежним від контексту.
3. Кожному поняттю повинен відповідати лише один термін (для того щоб уникнути термінів-синонімів).
Наприклад:
сomputer software - Комп’ютерне програмне забезпечення
target language - мова-реципієнт
Важливо відзначити, що реально в науково-технічній літературі дуже багато термінів мають особливе, спеціальне значення в залежності від вузької області приналежності. Конкретне значення таких термінів може бути виявлено шляхом аналізу смислу контексту,наприклад:
Current machine translation software often allows for customization by domain or profession (such as weather reports).
Сучасне програмне забезпечення для машинного перекладу часто дає можливість зробити налаштування згідно потреб конкретної галузі чи спеціальності (наприклад, прогнози погоди)
У даному випадку, термін domain має декілька словникових варіантів перекладу. Він може бути перекладений як – володіння, територія, маєток, але також і як галузь, сфера, поле діяльності, знань(у технічному значенні). Аналізуючи смисл цього речення, найбільш придатним варіантом перекладач вибрав саме «галузь» тому що в реченні наявна суто технічна направленість, і виходячи з його смислу, це значення терміну є найбільш доречним.
2) Також, науково - техничному стилю притаманна велика кількість абревіатур. Абревіатура - це складноскорочене слово, похідне слово, що виникає внаслідок абревіації - процесу утворення з перших літер або з інших частин слів, що входять до складу назви чи поняття. Вживаються в усній та писемній мові. Абревіатури називають також акронімами. Акронім - це абревіатура, що складається з початкових літер або звуків слів твірного словосполучення, наприклад:
SМТ (Statistical Machine Translation) – СМП (Статистичний Машинний Переклад)
3) У даній статті зустрічаються декілька класифікацій, що є типовим для тексту,написаному у науково-технічному стилі. Класифікація - це системи розподілення об'єктів (процесів, явищ) за класами (групами, тощо) відповідно до визначених ознак [5],на приклад:
There are several approaches of the HMT:
Rules post-processed by statistics: Translations are performed using a rules based engine. Statistics are then used in an attempt to adjust/correct the output from the rules engine.
Statistics guided by rules: Rules are used to pre-process data in an attempt to better guide the statistical engine. Rules are also used to post-process the statistical output to perform functions such as normalization. This approach has a lot more power, flexibility and control when translating.
Існує кілька способів ГМП:
Правила, оброблені за допомогою статистики: переклад здійснюється з використанням програмного механізму, заснованому на системі правил. Статистичні данні потім використовуються з метою упорядкування синтезовуваного тексту, отриманому в результаті застосування програмного механізму, заснованому на системі правил.
Статистика керується правилами: вони застосовуються для попередньої обробки даних в спробі знайти кращій спосіб застосування статистичного програмного механізму. Правила також використовуються з метою подальшої обробки статистичних даних для виконання таких функцій, як нормалізація. Цей спосіб є більш потужним,гнучким та дозволяє більше контролювати процес перекладу.
4) Дефініції - невід'ємні частини наукових-технічних статей. Дефініція – це логічна операція,яка: 1) розкриває зміст (смисл) терміну,або власно назви за допомогою опису істотних і відмітних ознак предметів чи явищ, що позначаються даними ім'ям (денотата імені), 2) експлікує значення терміна. Незважаючи на те,що зазвичай наукові статті спрямовані на цільову аудиторію, точність та коректність перекладу дефініцій є запорукою вірного розуміння тексту.[5] Прикладом може слугувати речення:
Rule-based Machine Translation - is a general term that denotes machine translation systems based on linguistic information about source and target languages basically retrieved from dictionaries and grammars covering the main semantic, morphological, and syntactic regularities of each language respectively.
Машинний переклад, заснований на системі правил (МПЗСП) – це загальний термін, який позначає системи МП, що базуються на лінгвістичній інформації про мову оригіналу і мову-реципієнта, в основному вилученої зі словників та підручників граматики, які охоплюють основні семантичні, морфологічні та синтаксичні закономірності кожної мови відповідно.
5) Загальнонаукова лексика - значний пласт наукової мови. Це безпосередня частина мови, або, як кажуть учені, метамови науки, тобто мови опису наукових об'єктів і явищ. За допомогою загальнонаукових слів описуються явища і процеси в різних областях науки і техніки.[6] Ці слова закріплені за певними поняттями, але не є термінами, наприклад:
Methodology- методика; sub-field-підрозділ
За результатами проведеного лексичного аналізу нами був складений глосарій з 100 одиниць. При їх перекладі були застосовані такі способи (визначення усіх способів перекладу надано за [1]:
Словниковий / варіантний відповідник – цей спосіб перекладу передбачає вживання в якості перекладацького еквіваленту термінологічної одиниці мови оригіналу слова, яке є узуальною лексемою мови перекладу і регулярно вживається в ній для позначення того ж самого денотату. Еквівалентні одиниці поділяються на одноеквівалентні (в цьому випадку ми маємо справу при перекладі із вживанням словникового відповідника) та багатоеквівалентні (в цьому випадку ми маємо справу при перекладі із вживанням варіантного відповідника). В нашому тексті прикладами одноеквівалентних словникових відповідників будуть усі назви різновидів машинного перекладу, наприклад:
Statistical Machine Translation (СМТ) - Статистичний машинний переклад (СМП)
Hybrid Machine Translation (НМТ) - Гібридний машинний переклад (ГМП)
Прикладом многоеквівалентних варіантних відповідників може служити термін paradigm :
1) Within the rule-based machine translation paradigm, the interlingual approach is an alternative to the direct approach and the transfer approach.
У рамках заснованої на правилах парадигми машинного перекладу міжмовний машинний переклад є альтернативою до прямого способу та способу заснованому на принципі переміщення.
2) Statistical machine translation (SMT)- is a machine translation paradigm where translations are generated on the basis of statistical models whose parameters are derived from the analysis of bilingual text corpora.
Статистичний машинний переклад (СМП) – це різновид машинного перекладу, при якому переклад створюється на основі статистичних моделей, параметри яких отримані на базі аналізу двомовних корпусів текстів.
У цих реченнях ми бачимо ситуацію, коли термін paradigm може мати декілька еквівалентних відповідників, таких як парадигма, система понять або поглядів, приклад, зразок, різновид, тип. Причиною тому є те,що у данному випадку многоеквівалентность викликана неоднозначністю вихідної одиниці, коли різні еквіваленти відповідають різним інтерпретаціям, існуючим вже в рамках вихідного мови. У першому реченні,з контексту є зрозумілим,що мова йде про систему основних наукових теорій, методів,або понять за зразком яких організовується дослідницька практика вчених в конкретній галузі знань в даний період. Але у другому реченні, термін paradigm має зовсім інше контекстуальне значення – дається визначення технічному терміну,тому перекладач обрав саме відповідник «різновид».
Транскодування, тобто такий спосіб перекладу, коли звукова або графічна форма слова мови оригінала передається засобами абетки мови перекладу. В нашому перекладі зустрічаються такі різновиди транскодування:
- транскрибування, тобто передача літерами мови перекладу звукової форми слова вихідної мови, наприклад:
Rules are also used to post-process the statistical output to perform functions such as normalization.
o Правила також використовуються з метою подальшої обробки статистичних даних для виконання таких функцій, як нормалізація.
- транслітерування, тобто передача слова вихідної мови по літерах, наприклад:
Warren Weaver wrote an important memorandum "Translation" in 1949.
o Уоррен Вівер написав важливий меморандум «Переклад» в 1949 році.
The progress and potential of machine translation has been debated much through its history.
o Розвиток і потенціал машинного перекладу обговорювався на протязі всієї історії його існування.
- змішане транскодування, тобто переважне застосування транскрибування із елементами транслітерування:
The Georgetown experiment was by no means the first such application, and a demonstration was made in 1954 on the APEC machine at Birkbeck College (University of London) of a rudimentary translation of English into French.
o Джорджтаунський експеримент був аж ніяк не першим практичним застосуванням цієї технології, та у 1954 році був проведений показ на машині APEC у Біркбекському Коледжі (Лондонський університет) шляхом елементарного перекладу з Англійської на Французьку.
- адаптивне транскодування, тобто адаптація слова вихідної мови до фонетичної та/або граматичної структури мови перекладу:
To decode the meaning of the source text in its entirety, the translator must interpret and analyse all the features of the text, a process that requires in-depth knowledge of the grammar, semantics, syntax, idioms, etc.
o Щоб розшифрувати зміст тексту оригінала повністю, перекладач повинен витлумачити та проаналізувати усі особливості тексту, це процес, який вимагає глибокого знання граматики, семантики, синтаксису, ідіом і т. д
Калькування, тобто такий прийом перекладу, коли відповідником слова вихідної мови у мові перекладу вибирається перший за порядком відповідник у словнику. Калькування як прийом перекладу застосовується при перекладі похідних, складних або складнопохідних слів, коли утворений таким чином перекладний відповідник не порушує норми вживання і сполучуваності слів в українській мові:
The idea of using digital computers for translation of natural languages was proposed as early as 1946 by A. D. Booth and possibly others.
o Ідея використання цифрових обчислювальних машин для перекладу природних мов була запропонована ще в 1946 році А.Д. Бутом і, можливо, іншими.
He pointed out that without a "universal encyclopedia", a machine would never be able to distinguish between the two meanings of a word.
o Він зазначив, що без "універсальної енциклопедії", машина ніколи не зможе розрізняти два різних значення слова.
Описовий переклад, тобто прийом перекладу лексичних елементів вихідної мови, коли вони замінюються у мові перекладу словосполученнями, які адекватно передають зміст. Описовий переклад вважається найменш вдалим способом перекладу, і до нього необхідно звертатися тільки тоді, коли не можна застосувати жодний з інших прийомів. При цьому описовий переклад повинен відповідати таким вимогам: переклад повинний точно відбивати зміст поняття; опис не повинний бути надто докладним; синтаксична структура словосполучення не повинна бути складною. Звертання до описового перекладу може бути викликане невідповідністю словотворчих формантів або моделей двох мов. Наприклад:
Having input sentences (in some source language), an RBMT system generates them to output sentences (in some target language)
o Маючи речення на мові оригіналу, система МПЗСП (RBMT машинний переклад, заснований на системі правил) генерує їх у речення на мові-рецепієнті.
Переклад абревіатур. Опрацьований нами текст містив декілька абревіатур, які не мали усталених відповідників в українській мові. Тож, керуючись загально визнаними рекомендаціями[1,2], ми переклали їх на основі способу калькування:
MAHT (Machine-aided human translation) –
ЛП з ЕОМ (Людський переклад з участю ЕВМ)
APEC (All Purpose Electronic Computer) –
УЕК (Універсальний електронний комп’ютер)
ALPAC (Automatic Language Processing Advisory Committee) – КПАОМ (Комітет з питань автоматичної обробки мови)
HMT (Hybrid machine translation) –
ГМП (Гібридний машинний переклад)
SМТ (Statistical Machine Translation) –
СМП (Статистичний машинний переклад)
EBMT (Example-based Machine Translation) –
МПЗСП (Машинний переклад заснований на системі правил)
Висновки
Проведене дослідження присвячене аналізу лексичних особливостей перекладу науково-технічних текстів на матеріалі статті «Machine Translation» взятої з вільної інтернет-енциклопедії «Вікіпедія»
Дослідження носило одночасно прикладний та теоретичний характер. Прикладна частина включала переклад уривку статті розміром 10 тисяч знаків. Теоретична частина дослідження включала формулювання фонових знань перекладача, необхідних для роботи з науково-технічними текстами та проведення узагальнюючого лексичного аналізу перекладу термінів, загальнонаукової лексики.
Підготовка перекладачів на сучасному етапі вимагає їх максимальної універсалізації. Кожна за галузей має систему базових понять, відношення між якими і складає її суть. В ідеалі структура фонових знань перекладача та номенклатура термінологічних одиниць має відповідати параметрам освіченого носія кожної з двох мов, з яких він перекладає.
Кількісні підрахунки дають можливість виявити частотність застосування різних способів перекладу лексичних одиниць нашого словника. Загальна кількість одиниць словника – 100. З них за допомогою калькування (та напівкалькування) перекладено – 34; за допомогою усіх різновидів транскодування – 48; за допомогою описового перекладу – 5. Вибір варіантного відповідника складає 13 одиниць.
До головних труднощів перекладу відносимо переклад науково-технічних термінів та абревіатур. В ході виконання роботи труднощі були успішно подолані.