Автор: Пользователь скрыл имя, 27 Февраля 2013 в 18:43, научная работа
Перекладом називається процес та результат створення на основі вхідного тексту однією мовою рівноцінного йому в комунікативному відношенні тексту іншою мовою. При цьому комунікативна рівнозначність, або еквівалентність, розуміється як така якість тексту перекладу, котра дозволяє йому виступати в процесі спілкування носіїв різних мов у ролі повноправної заміни вхідного тексту (оригіналу) в сфері дії мови перекладу.
Вступ 3
1. Історичний розвиток АП 5
2. Системи автоматичного перекладу 7
2.1. Класифікація типів машинного (автоматизованого) перекладу за Ларрі Чайлдсом: 10
2.2. Узагальнена технологія роботи системи машинного перекладу 11
3. Класифікація помилок при здійсненні АП за ступенем труднощів їх виправлення 13
4. Основні проблеми машинного перекладу 14
5. Фразеологічний машинний переклад 16
5.1. Словники систем фразеологічного перекладу 19
6. Лінгвістичний аналіз тексту 23
Висновок: 24
Література: 25
В системі фразеологічного перекладу використовуються наступні типи словників:
Технологія використання різних типів словників в процесі перекладу наступна: після семантико-синтаксичного аналізу вхідного тексту на етапі трансферу йде звернення до двомовним словникам. Якщо підключені всі три типи словників, то порядок звернення буде наступним: найвищий пріоритет у словника користувача, проводиться пошук всіх фразеологічних одиниць перекладного тексту, для знайдених дається переклад; потім йде звернення до тематичного словника (тематика словника вибирається користувачем у системі перед початком перекладу), в ньому проводиться пошук для всіх ще неперекладених одиниць; якщо після роботи двох словників ще залишилися непереведені фрагменти, то система звертається до політематичних словником, який містить перекладні еквіваленти для самих різних понять, що належать різним тематикам.
Всі словники мають лінійну структуру:
[Поняття на вхідному мові] [перекладної еквівалент 1] /
[Перев. еквів. 2] / / [перекл. еквів. п]
Словникова стаття складається з двох частин: з вихідного найменування поняття та його переказного еквівалента. Роздільником між цими частинами служить коса риска. Записи в словнику користувача розташовуються в порядку їх введення. Початкове найменування поняття та його переклад зберігаються в словнику в тому вигляді, в якому вони були в нього спочатку введені, але в процесі його підключення до системи переказу здійснюється Послівний нормалізація вихідних найменувань понять, що дозволяє ототожнювати їх різні форми.
При цьому якщо переказ здійснюється в автоматичному режимі (без участі користувача), береться перший зліва перекладної еквівалент. Фрагмент словника користувача представлений в табл. 1.
Таблиця 1. Фрагмент словника користувача
Термін |
Еквівалент |
Balance |
Балансування |
Existence of bubbles |
Наявність бульбашок |
1 Dirty |
Бруд |
Hydraulic fluid |
Робоча рідина |
Dirty hydraulic fluid |
Брудна робоча рідина |
Power supply |
Електроживлення |
Voltage fluctuation |
Коливання напруги |
Looseness |
Ослаблення |
Selector switches |
Ручний багатопозиційний перемикач |
Proximity switches |
Безконтактний перемикач |
j Screw tip |
Головка гвинта |
Abnormal indications |
Аномальна ознака |
Piping joints |
Місце з’єднання трубопроводів |
За структурою словникових
статей словник користувача
Це пов'язано з необхідністю оперативної зміни вмісту словника і тим що його обсяг значно менше, ніж обсяг словників інших типів.
В системі фразеологічного
перекладу використовуються також
словники словотворчих еквівалентів та
словників синонімів, Гіпоніми (терміни,
що знаходяться в видових
Лінгвістичний аналіз тексту - обов'язкова стадія процесу автоматичного введення тексту під диктовку. Без цієї стадії сучасну якість розпізнавання не могло б бути досягнуте, і багато експертів пов'язують перспективи мовних систем саме з подальшим розвитком містяться в них лінгвістичних механізмів. Як наслідок, мовні технології робляться все більш залежними від мови, з яким працюють. У сфері розпізнавання злитого мовлення залежність стала абсолютною, що підтверджується, зокрема, негативним досвідом локалізації програмного пакету фірми Dragon Systems для російської мови (мається на увазі система «Горинич», не показала оголошеного якості розпізнавання). Однак і в інших областях роботи з промовою, включаючи TTS і навіть механізми редагування і стиснення, специфіка мови все більше дає себе знати. Отже розпізнавання, синтез і обробка російської мови є тією нішею, зайняти яку повинні саме російські розробники.
У цій технології використовують лінгвістичні алгоритми. Спочатку система досліджує вхідний текст: виконує морфологічний аналіз слів у пропозиції (визначає рід, число, особу й інші морфологічні характеристики), потім синтаксичний аналіз (визначає члени пропозиції: підмет, присудок, додаток, обставини) і на заключному етапі виконує синтез пропозицій у перекладеному тексті.
Перевагою такої системи є її самодостатність: адже лінгвістичній програмі не потрібний доступ до баз паралельних текстів. Крім того, система налаштовується, що серйозно підвищує якість перекладу спеціалізованих текстів.
Недоліком цієї технології можна назвати те, що для підвищення якості перекладу потрібно дуже кропітка робота – адже для цього потрібно не тільки розробляти нові алгоритми, але й поліпшувати раніше створені.
Отже, кожна із названих технологій
має як свої переваги, так і недоліки.
В перспективі можливе
Отже я можу виділити декілька аспектів у перевагах та недоліках машинного перекладу, які зможуть змінити ваш погляд на використання машинного перекладу.
Перевагами машинного перекладу є:
Недоліком машинного перекладу я можу визнати лише декілька:
Але переваг та недоліків значно більше чим я перелічив, але вибір за вами чи самому перекладати чи за допомого машинного перекладача. Також я можу вам порадити деякі способи вирішення проблем з машинним перекладачем.
Ось деякі з них:
На даному етапі я можу лиш сказати, що машинний переклад нам потрібний, але потрібно все таки його відредагувати і збільшувати бібліотеки слів для того щоб уникнути вище описаних проблем.
Информация о работе Основні переваги та недоліки використання машинного перекладу