Автор: Пользователь скрыл имя, 27 Февраля 2013 в 18:43, научная работа
Перекладом називається процес та результат створення на основі вхідного тексту однією мовою рівноцінного йому в комунікативному відношенні тексту іншою мовою. При цьому комунікативна рівнозначність, або еквівалентність, розуміється як така якість тексту перекладу, котра дозволяє йому виступати в процесі спілкування носіїв різних мов у ролі повноправної заміни вхідного тексту (оригіналу) в сфері дії мови перекладу.
Вступ 3
1. Історичний розвиток АП 5
2. Системи автоматичного перекладу 7
2.1. Класифікація типів машинного (автоматизованого) перекладу за Ларрі Чайлдсом: 10
2.2. Узагальнена технологія роботи системи машинного перекладу 11
3. Класифікація помилок при здійсненні АП за ступенем труднощів їх виправлення 13
4. Основні проблеми машинного перекладу 14
5. Фразеологічний машинний переклад 16
5.1. Словники систем фразеологічного перекладу 19
6. Лінгвістичний аналіз тексту 23
Висновок: 24
Література: 25
У 1990 р. Ларрі Чайлдс, фахівець з машинного перекладу, запропонував наступну класифікацію машинного (автоматизованого) перекладу:
FAMT (Fully-automated machine translation) - цілком автоматизований машинний переклад;
НАМТ (Human-assisted machine translation) - машинний переклад при участі людини;
МАНТ (Machine-assisted human translation) - переклад, здійснюваний людиною з використанням комп'ютера.
Зазначимо, що на зміну попередньої концепції, пов'язаної з ейфорією перших результатів - "якісний машинний переклад ", прийшла нова концепція, під назвою - "якісний чорновий машинний переклад ", який формує правильні очікування. Найбільш цікаві тези щодо правильного представлення про системи АП і їхнього правильного застосування: Не АП проти перекладачів, а АП проти відсутності перекладів (при зростаючих обсягах роботи й особливо при роботі в Інтернеті). У багатьох випадках навіть не дуже якісний переклад краще, ніж відсутність будь-якого. Там, де відсутність часу і доступність - більш важливі умови, ніж абсолютна стилістична точність, АП підтверджує свою неоціненну рентабельність.
Процес машинного перекладу текстів з однієї природної мови на іншу може бути в крупному плані розділений на три етапи (Мал. 5).
Текст на вхідному мові надходить в систему перекладу, на етапі семантико - синтаксичного аналізу виявляється його граматична структура, розпізнаються найменування понять і встановлюються відносини між поняттями.
На етапі трансферу
проводиться перехід від
Мал. 5. Узагальнена технологія систем машинного перекладу
Діючі системи машинного перекладу орієнтовані на конкретні пари мов (наприклад, французький і російський або японська та англійська) і використовують, як правило, перекладні відповідності або на поверхневому рівні, або на деякому проміжному рівні між вхідним і вихідним мовою. Якість машинного перекладу залежить від обсягу словника, обсягу інформації, приписується лексичним одиницям, від ретельності складання і перевірки роботи алгоритмів аналізу та синтезу, від ефективності програмного забезпечення. Інформація може бути представлена як в декларативній (описової), так і в процедурній (що враховує потреби алгоритму) формі.
Машинний переклад слід відрізняти
від використання комп'ютерів в допомогу
людині-перекладачеві. В останньому
випадку мається на увазі автоматичний
словник, що допомагає людині швидше
підбирати потрібний
Результати експлуатації
САП свідчать, що основні витрати
пов'язані з редакторською
До першої категорії помилок фахівці відносять:
Ці помилки легко виявляються і виправляються.
До другої категорії помилок належать такі помилки:
Виправлення помилок цього типу пов'язане з іншими виправленнями в реченні, що збільшує обсяг редакторських виправлень.
Третю категорію помилок називають «сірою зоною», яка характеризується суб'єктивністю визначення масштабу виправлень. Ці помилки виникають унаслідок того, що в тексті відсутні звичні слова і вирази, є неправильний переклад дієслівних форм, прийменників, зворотів, орфографічні помилки і неправильні закінчення.
Практика використання АП показує, що 20% речень вихідного тексту перекладається неправильно. Причинами такої низької якості САП є недоліки словника і недосконалий алгоритмічний синтез пропозицій з неправильною синтаксичною структурою. Для подолання цих недоліків потрібні серйозні зміни в лінгвістичному ПЗ шляхом збільшення лексичних одиниць словника, постійного удосконалювання лінгвістичних описів синтаксичних конструкцій та правил кодування й перекодування.
Для створення систем, що
працюють з усім природним мовою
без втрати глибини аналізу, зараз
не вистачає або технічних можливостей
(швидкодії, пам'яті), або теоретичної
бази. Однак в комерційних системах,
з огляду на те, що призначаються
вони для великої кількості
Історично машинний переклад
є першою спробою використання комп'ютерів
для вирішення не обчислювальних
завдань (Джорджтаунський експеримент
в США в 1954 т.; роботи з машинного
перекладу в СРСР, що почалися в 1954
р.). Розвиток електронної техніки, зростання
обсягу пам'яті і продуктивності
комп'ютерів створювали ілюзію швидкого
вирішення цього завдання. Практична
мета була простою: завантажити в
пам'ять комп'ютера
Звичайно, системи, налаштовані
на певну предметну область, дають
набагато більш прийнятні результати.
Однак у цьому випадку системи
перекладу виходять дуже вузько орієнтованими,
і спроба використовувати їх навіть
у суміжних предметних областях дає
абсолютно непередбачувані
Виникають ці проблеми через принципово різних підходів до перекладу людини і машини. Кваліфікований перекладач розуміє зміст тексту і переказує його на іншій мові словами і стилем, максимально близькими до оригіналу. Для комп'ютера цей шлях виливається в рішення двох задач:
Оскільки не тільки не вирішена сама по собі жодна з цих завдань, і навіть немає загальноприйнятої концепції семантичного представлення текстів, при автоматичному перекладі доводиться фактично робити «підрядник», замінюючи окремо слова однієї мови на слова іншого й намагаючись після цього надати отримав пропозицію деяку синтаксичну узгодженість. Сенс при цьому може бути спотворений або безповоротно загублений.
Концепція фразеологічного перекладу базується на розумінні того факту, що в природних мовах сенс лексичних одиниць більш високого рівня (наприклад, фразеологічних одиниць, що є найменуваннями понять або ситуацій), як правило, не зводимо до сенсу складових їх лексичних одиниць нижчого рівня (наприклад, слів ).
При вирішенні проблеми перекладу
раніше робилася ставка насамперед на
граматично правильний послівний переклад,
а полісемія слів дозволялася
в основному процедурними засобами
на основі урахування їх синтаксичних
і семантичних ознак. Тому системи
МП перших трьох десятиліть їх розвитку
можна охарактеризувати як системи
семантико-синтаксичного
Семантико-синтаксичний послівний машинний переклад текстів не має особливої перспективи, так як в природних мовах сенс словосполучень, як правило, не зводимо або не повністю зводимо до сенсу складових їх слів, і при перекладі він не обов'язково може бути «обчислили» на основі синтаксичних і семантичних ознак цих слів.
Принципи побудови систем
фразеологічного машинного
Найважливішими серед цих принципів є наступні:
Відповідно до головною тезою
концепції фразеологічного
У процесі перекладу текстів
система повинна
Мал. 6. порядок переведення вихідного тексту в системах фразеологічного машинного перекладу
Словники є найбільш важливою
компонентою систем фразеологічного
машинного перекладу. Вони повинні
бути достатньо великого обсягу, щоб
добре покривати тексти, і повинні
містити переважно
Складання машинних словників
по двомовним текстам проводиться
як вручну, так і за допомогою
ЕОМ. Ручне складання словників
пов'язано з великими трудовитратами.
Тому була розроблена процедура автоматизованого
складання словників. Ця процедура
заснована на використанні того факту,
що у безлічі двомовних пар
речень, які є перекладами один
одного і містять одне і те ж
слово або словосполучення
Машинні словники системи можуть коригуватися і поповнюватися в процесі перекладу текстів в інтерактивному режимі. У цьому режимі є можливість виявляти слова і словосполучення, для яких у словнику не вказані перекладні еквіваленти або ці еквіваленти не відповідають контексту, або вказано декілька еквівалентів, але на першому місці стоїть еквівалент, не відповідний контексту. У разі відсутності перекладних еквівалентів у деяких слів вони можуть бути зазначені людиною; якщо еквіваленти не відповідають контексту, вони можуть бути замінені; якщо їх декілька, то є можливість вибрати тільки ті з них, які відповідали контексту.
Информация о работе Основні переваги та недоліки використання машинного перекладу