Основні переваги та недоліки використання машинного перекладу

Автор: Пользователь скрыл имя, 27 Февраля 2013 в 18:43, научная работа

Описание работы

Перекладом називається процес та результат створення на основі вхідного тексту однією мовою рівноцінного йому в комунікативному відношенні тексту іншою мовою. При цьому комунікативна рівнозначність, або еквівалентність, розуміється як така якість тексту перекладу, котра дозволяє йому виступати в процесі спілкування носіїв різних мов у ролі повноправної заміни вхідного тексту (оригіналу) в сфері дії мови перекладу.

Содержание

Вступ 3
1. Історичний розвиток АП 5
2. Системи автоматичного перекладу 7
2.1. Класифікація типів машинного (автоматизованого) перекладу за Ларрі Чайлдсом: 10
2.2. Узагальнена технологія роботи системи машинного перекладу 11
3. Класифікація помилок при здійсненні АП за ступенем труднощів їх виправлення 13
4. Основні проблеми машинного перекладу 14
5. Фразеологічний машинний переклад 16
5.1. Словники систем фразеологічного перекладу 19
6. Лінгвістичний аналіз тексту 23
Висновок: 24
Література: 25

Скачать полностью (337.28 Кб) Сколько стоит заказать работу?

Работа содержит 1 файл

ІНДЗ ПЗ.docx

— 341.31 Кб (Скачать)

2.1. Класифікація типів машинного (автоматизованого) перекладу за Ларрі Чайлдсом:

У 1990 р. Ларрі Чайлдс, фахівець з машинного перекладу, запропонував наступну класифікацію машинного (автоматизованого) перекладу:

FAMT (Fully-automated machine translation) - цілком автоматизований машинний переклад;

НАМТ (Human-assisted machine translation) - машинний переклад при участі людини;

МАНТ (Machine-assisted human translation) - переклад, здійснюваний людиною з використанням комп'ютера.

Зазначимо, що на зміну попередньої концепції, пов'язаної з ейфорією перших результатів - "якісний машинний переклад ", прийшла нова концепція, під назвою - "якісний чорновий машинний переклад ", який формує правильні очікування. Найбільш цікаві тези щодо правильного представлення про системи АП і їхнього правильного застосування: Не АП проти перекладачів, а АП проти відсутності перекладів (при зростаючих обсягах роботи й особливо при роботі в Інтернеті). У багатьох випадках навіть не дуже якісний переклад краще, ніж відсутність будь-якого. Там, де відсутність часу і доступність - більш важливі умови, ніж абсолютна стилістична точність, АП підтверджує свою неоціненну рентабельність.

2.2. Узагальнена технологія роботи системи машинного перекладу

Процес машинного перекладу текстів з однієї природної мови на іншу може бути в крупному плані розділений на три етапи (Мал. 5).

Текст на вхідному мові надходить в систему перекладу, на етапі семантико - синтаксичного аналізу виявляється його граматична структура, розпізнаються найменування понять і встановлюються відносини між поняттями.

На етапі трансферу проводиться перехід від найменувань понять і структури тексту на вхідному мові до найменувань понять і структурі тексту на вихідному мовою. В результаті семантико-синтаксичного синтезу на підставі отриманих еквівалентів виходить текст на вихідному мові (його граматичне оформлення), який видається в якості результату.

Мал. 5. Узагальнена технологія систем машинного перекладу

Діючі системи машинного перекладу орієнтовані на конкретні пари мов (наприклад, французький і російський або японська та англійська) і використовують, як правило, перекладні відповідності або на поверхневому рівні, або на деякому проміжному рівні між вхідним і вихідним мовою. Якість машинного перекладу залежить від обсягу словника, обсягу інформації, приписується лексичним одиницям, від ретельності складання і перевірки роботи алгоритмів аналізу та синтезу, від ефективності програмного забезпечення. Інформація може бути представлена як в декларативній (описової), так і в процедурній (що враховує потреби алгоритму) формі.

Машинний переклад слід відрізняти від використання комп'ютерів в допомогу людині-перекладачеві. В останньому випадку мається на увазі автоматичний словник, що допомагає людині швидше підбирати потрібний перекладної еквівалент. Хоч і в тому, і в іншому випадку комп'ютер працює разом з людиною (перекладачем або редактором), у зміст терміну «машинний переклад» входить уявлення про те, що головну, більшу частину роботи по переведенню і відшуканню перекладних еквівалентів, і перекладних відповідників машина бере на себе. Залишаючи людині лише контроль і виправлення помилок, у той час як комп'ютерний словник в допомогу людині - це чисто допоміжний засіб.

Класифікація помилок при здійсненні АП за ступенем труднощів їх виправлення

Результати експлуатації САП свідчать, що основні витрати пов'язані з редакторською роботою перекладачів. Головне зусилля фахівців САП спрямоване на класифікацію машинних помилок за ступенем труднощів їх виправлення.

До першої категорії помилок фахівці відносять:

неправильний вибір чи відсутність артикля;
неправильний переклад прийменника;
неправильний переклад особового займенника;
неправильний переклад багатозначного іменника.

Ці помилки легко виявляються і виправляються.

До другої категорії помилок належать такі помилки:

дослівний переклад ідіоматичного виразу;
неправильне визначення частини мови.

Виправлення помилок цього типу пов'язане з іншими виправленнями в реченні, що збільшує обсяг редакторських виправлень.

Третю категорію помилок називають «сірою зоною», яка характеризується суб'єктивністю визначення масштабу виправлень. Ці помилки виникають унаслідок того, що в тексті відсутні звичні слова і вирази, є неправильний переклад дієслівних форм, прийменників, зворотів, орфографічні помилки і неправильні закінчення.

Практика використання АП показує, що 20% речень вихідного тексту перекладається неправильно. Причинами такої низької якості САП є недоліки словника і недосконалий алгоритмічний синтез пропозицій з неправильною синтаксичною структурою. Для подолання цих недоліків потрібні серйозні зміни в лінгвістичному ПЗ шляхом збільшення лексичних одиниць словника, постійного удосконалювання лінгвістичних описів синтаксичних конструкцій та правил кодування й перекодування.

4. Основні проблеми машинного перекладу

Для створення систем, що працюють з усім природним мовою без втрати глибини аналізу, зараз не вистачає або технічних можливостей (швидкодії, пам'яті), або теоретичної бази. Однак в комерційних системах, з огляду на те, що призначаються вони для великої кількості користувачів, різних предметних областей, прийнята концепція поверхневого аналізу, до того ж і проводиться такий аналіз значно швидше.

Історично машинний переклад є першою спробою використання комп'ютерів для вирішення не обчислювальних завдань (Джорджтаунський експеримент в США в 1954 т.; роботи з машинного перекладу в СРСР, що почалися в 1954 р.). Розвиток електронної техніки, зростання обсягу пам'яті і продуктивності комп'ютерів створювали ілюзію швидкого вирішення цього завдання. Практична мета була простою: завантажити в пам'ять комп'ютера максимально можливий словник і з його допомогою з іншомовних текстів отримувати текст рідною мовою у зрозумілому людині вигляді. Однак первісна ейфорія з приводу того, що настільки трудомістку роботу можна доручити ЕОМ, змінилася розчаруванням у зв'язку з абсолютною непридатністю одержуваних текстів.

Звичайно, системи, налаштовані на певну предметну область, дають набагато більш прийнятні результати. Однак у цьому випадку системи перекладу виходять дуже вузько орієнтованими, і спроба використовувати їх навіть у суміжних предметних областях дає абсолютно непередбачувані результати.

Виникають ці проблеми через принципово різних підходів до перекладу людини і машини. Кваліфікований перекладач розуміє зміст тексту і переказує його на іншій мові словами і стилем, максимально близькими до оригіналу. Для комп'ютера цей шлях виливається в рішення двох задач:

переклад тексту в деяке внутрішнє семантичне подання;
генерація за цим поданням тексту іншою мовою.

Оскільки не тільки не вирішена сама по собі жодна з цих завдань, і навіть немає загальноприйнятої концепції семантичного представлення текстів, при автоматичному перекладі доводиться фактично робити «підрядник», замінюючи окремо слова однієї мови на слова іншого й намагаючись після цього надати отримав пропозицію деяку синтаксичну узгодженість. Сенс при цьому може бути спотворений або безповоротно загублений.

Фразеологічний машинний переклад

Концепція фразеологічного перекладу базується на розумінні того факту, що в природних мовах сенс лексичних одиниць більш високого рівня (наприклад, фразеологічних одиниць, що є найменуваннями понять або ситуацій), як правило, не зводимо до сенсу складових їх лексичних одиниць нижчого рівня (наприклад, слів ).

При вирішенні проблеми перекладу раніше робилася ставка насамперед на граматично правильний послівний переклад, а полісемія слів дозволялася в основному процедурними засобами на основі урахування їх синтаксичних і семантичних ознак. Тому системи МП перших трьох десятиліть їх розвитку можна охарактеризувати як системи семантико-синтаксичного переважно послівного перекладу. Словосполучення тут також використовувалися, але в меншому ступені.

Семантико-синтаксичний послівний машинний переклад текстів не має особливої перспективи, так як в природних мовах сенс словосполучень, як правило, не зводимо або не повністю зводимо до сенсу складових їх слів, і при перекладі він не обов'язково може бути «обчислили» на основі синтаксичних і семантичних ознак цих слів.

Принципи побудови систем фразеологічного машинного перекладу текстів були вперше сформульовані Г. Г. Бєлоногова в 1975 р. і викладені в 1983 р. у книзі Г. Г. Бєлоногова і Б. А. Кузнєцова «Мовні засоби автоматизованих інформаційних систем». У 1984 р. аналогічна ідея була висловлена японським ученим професором Нагао з університету Кіото. Він запропонував як альтернативу підхід, заснований на використанні раніше перекладених текстів, представлених одночасно на двох мовах (білінгв).

Найважливішими серед цих принципів є наступні:

основними одиницями мови і мовлення, які перш за все слід включати в машинний словник, повинні бути фразеологічні одиниці (словосполучення, фрази). Окремі слова також можуть включатися в словник, але вони повинні використовуватись тільки у тих випадках, коли не вдається здійснити переклад, спираючись тільки на фразеологічні одиниці;
поряд з фразеологічними одиницями, що складаються з безперервних послідовностей слів, в системах машинного перекладу слід використовувати і так звані мовні моделі - фразеологічні одиниці-шаблони з «порожніми місцями», які можуть заповнюватися різними словами і словосполученнями, породжуючи осмислені відрізки мовлення;
реальні тексти, незалежно від їх приналежності до тієї чи іншої тематичної області, зазвичай бувають політематичних, якщо вони мають досить великий обсяг. І відрізняються вони один від одного не стільки словниковим складом, скільки розподілами ймовірностей появи в них різних слів із загальнонаціонального словникового фонду. Тому машинний словник, призначений для перекладу текстів навіть тільки з однієї тематичної області, повинен бути політематичних, а для перекладу текстів з різних предметних областей - тим більше;
для систем фразеологічного перекладу необхідні машинні словники великого обсягу. Такі словники можуть створюватися на основі автоматизованої обробки двомовних текстів, є перекладами один одного, і в процесі функціонування систем переказу;
поряд з основним (політематичних) словником великого об'єму в системах фразеологічного машинного перекладу доцільно використовувати також набір невеликих за обсягом додаткових тематичних словників. Додаткові словники повинні містити тільки ту інформацію, яка відсутня в основному словнику (наприклад, інформацію про пріоритетні перекладних еквівалентах словосполучень і слів для різних предметних областей, якщо ці еквіваленти не збігаються із пріоритетними перекладними еквівалентами основного словника);
основним засобом вирішення полісемії (багатозначності) слів в системах фразеологічного перекладу є їх використання у складі фразеологічних словосполучень. Додатковим - апарат додаткових тематичних словників, де для кожного багатозначного слова або словосполучення вказується його пріоритетний перекладний еквівалент, специфічний для розглянутої предметної області:
велику роль в системах фразеологічного машинного перекладу текстів можуть грати процедури морфологічного і синтаксичного аналізу та синтезу російських і англійських текстів, побудовані на основі принципу аналогії. Ці процедури дозволяють відмовитися від зберігання в словниках великого обсягу граматичної інформації та породжувати її в міру необхідності автоматично, в процесі перекладу. Вони роблять систему перекладу відкритою - здатною обробляти тексти з «нової» лексикою;
поряд з перекладом текстів в автоматичному режимі в системах фразеологічного машинного перекладу доцільно передбачити інтерактивний режим роботи. У цьому режимі користувач повинен мати можливість втручатися в процес перекладу і настроювати додаткові машинні словники на тематику перекладаються текстів.

Відповідно до головною тезою концепції фразеологічного перекладу, система фразеологічного машинного перекладу повинна включати в свій склад базу знань, що містить перекладні еквіваленти для найбільш часто зустрічаються фраз, фразеологічних сполучень та окремих слів (мал.6) і програмні засоби для морфологічного і синтаксичного аналізу та синтезу текстів і для їх редагування людиною.

У процесі перекладу текстів система повинна використовувати зберігаються в її базі знань перекладні еквіваленти в наступному порядку: спочатку для чергової пропозиції вихідного тексту робиться спроба перевести його як цілісну фразеологічну одиницю; потім, в разі невдачі; входять до його складу словосполучення, і нарешті, здійснюється послівний переклад тих фрагментів тексту, які не вдалося перевести першими двома способами. Фрагменти вихідного тексту, отримані всіма трьома способами, повинні граматично узгоджуватися один з одним (за допомогою процедур морфологічного та синтаксичного синтезу).

Мал. 6. порядок переведення вихідного тексту в системах фразеологічного машинного перекладу

Словники систем фразеологічного перекладу

Словники є найбільш важливою компонентою систем фразеологічного машинного перекладу. Вони повинні бути достатньо великого обсягу, щоб добре покривати тексти, і повинні містити переважно словосполучення. Досвід створення великих російсько-англійських і англо- російських машинних словників показав, що найбільш надійним джерелом для їх складання можуть служити російські і англійські тексти, які є перекладами один одного, зокрема двомовні заголовки документів.

Складання машинних словників по двомовним текстам проводиться як вручну, так і за допомогою ЕОМ. Ручне складання словників пов'язано з великими трудовитратами. Тому була розроблена процедура автоматизованого складання словників. Ця процедура заснована на використанні того факту, що у безлічі двомовних пар речень, які є перекладами один одного і містять одне і те ж слово або словосполучення однієї з мов, максимальну частоту зустрічальності має слово або словосполучення іншої мови, що є перекладом цього слова або словосполучення.

Машинні словники системи можуть коригуватися і поповнюватися в процесі перекладу текстів в інтерактивному режимі. У цьому режимі є можливість виявляти слова і словосполучення, для яких у словнику не вказані перекладні еквіваленти або ці еквіваленти не відповідають контексту, або вказано декілька еквівалентів, але на першому місці стоїть еквівалент, не відповідний контексту. У разі відсутності перекладних еквівалентів у деяких слів вони можуть бути зазначені людиною; якщо еквіваленти не відповідають контексту, вони можуть бути замінені; якщо їх декілька, то є можливість вибрати тільки ті з них, які відповідали контексту.

Информация о работе Основні переваги та недоліки використання машинного перекладу