канд. психол. наук, доцент, Южный федеральный университет, Институт управления в экономических, экологических и социальных системах, РФ, Ростовская область, г. Таганрог
ЛИНГВИСТИЧЕСКИЕ ПРОБЛЕМЫ МАШИННОГО ПЕРЕВОДА
АННОТАЦИЯ
В данной статье речь идёт о лингвистических трудностях, которые возникают при компьютерном переводе английских и русских текстов. Современный письменный машинный перевод содержит большое количество неточностей, которые возникают из-за лингвистической многозначности, трансформаций и перевода идиом и фразеологизмов. Авторы предлагают также различные пути решения лингвистических проблем машинного перевода.
ABSTRACT
This article deals with linguistic difficulties that arise during computer translation of English and Russian texts. Modern written machine translation contains a large number of inaccuracies that arise due to linguistic ambiguity, transformations and translation of idioms and phraseological units. The authors also propose various ways to solve linguistic problems of machine translation.
Ключевые слова: компьютерный перевод, английские и русские тексты, лингвистические трудности, многозначность, трансформации, перевод идиом и фразеологизмов.
Keywords: computer translation, English and Russian texts, linguistic difficulties, ambiguity, transformations, translation of idioms and phraseological units.
В последние десятилетия переводчики активно используют в своей работе компьютерные программы и электронные словари, позволяющие оптимизировать процесс перевода. С одной стороны применение компьютеров и интернета облегчает работу переводчика, но с другой стороны до сих пор не решены многие лингвистические проблемы, возникающие при машинном переводе текстов русского и английского языков.
Машинный перевод ‒ это компьютерный перевод оригинала текста на другой язык с помощью искусственного интеллекта. Обыденные языки достаточно сложно закодировать для дальнейшего их использования при автоматизированном переводе. В настоящее время переводы текстов с использованием компьютерных технологий содержат огромное количество лингвистических неточностей, из-за которых искажается общий смысл переводимого текста [2].
В данной статье мы хотели бы рассмотреть автоматизированные переводы текстов английского и русского языков. Казалось бы, тексты английского языка достаточно легко переводить на русский язык, так как в английском языке отсутствует категория рода, склонение существительных и прилагательных, простая структура предложения, но из-за лексической и грамматической многозначности возникают трудности при машинном переводе. При переводе текстов русского языка компьютерные системы делают ошибки из-за наличия большого количества падежей, склонения именных частей речи и отсутствия фиксированного порядка слов в предложении [3].
Современный письменный машинный перевод остаётся до сих пор неидеальным, так как из-за большого количества лексических и грамматических неточностей возможно понять только общий смысл текста. При автоматическом переводе текстов английского языка возникает ряд существенных лингвистических проблем. К этим проблемам следует отнести проблему многозначности лексических значений, синтаксические трансформации, из-за которых могут возникать структурные различия при переводе, а также грамматические конструкции, состоящие из идиом.
При компьютерном переводе особо сложно решать проблему лексической многозначности, которая возникает из-за полисемии. Лингвисты выделяют два вида полисемии. Лексическая полисемия возникает из-за способности каждого отдельного слова называть разные объекты и события окружающей действительности. Примерами лексической полисемии является следующие распространённые слова, имеющие отличительные значения в технической литературе: horse ‒ лошадь ‒ рама; frog ‒ лягушка ‒ крестовина; bug ‒ жук ‒ ошибка (в устройстве). Грамматическая полисемия появляется из-за того, что каждая лексема может иметь несколько грамматических вариантов. Примером грамматической полисемии является артикль the в английском языке, выполняющий как уточняющую (The cat was cute.), так и обобщающую (The pig is a domestic animal.) функцию.
Благодаря контексту раскрывается точное значение каждого многозначного слова, но в некоторых ситуациях может возникать раздробленность лексических значений, которая проявляется в том, что в разных контекстах одно и тоже слово может вести себя по-разному, например: football field ‒ футбольное поле, notes in the margins‒ заметки на полях, hat with wide brim‒ шляпа с широкими полями. Таким образом, разные значения слов могут возникать из-за лексических, грамматических и словообразовательных особенностей каждого языка.
В лингвистике проблему многозначности можно решить путём подбора синонима в виде постоянного значения лексемы (dull ‒ boring; end ‒ finish; enjoy ‒ appreciate). При компьютерном переводе разрешить проблему многозначности можно с помощью следующих задач:
1) Приписать известное значение известной словоформе.
2) Присвоить известное значение новой словоформе.
3) Выявить новый смысл для известной лексемы.
4) Определить новый смысл для новой лексемы [1].
При компьютерном переводе выделяют два основных вида механизмов разрешения многозначности:
1) Автоматические механизмы, с помощью которых компьютер без участия переводчика полностью решает все проблемы перевода.
2) Интерактивные механизмы, при использовании которых компьютер предлагает переводчику несколько вариантов решения переводческой задачи, при этом переводчик должен выбрать самостоятельно самый лучший вариант перевода [1].
К автоматическим методам разрешения многозначности относятся фильтры, которые устанавливаются на основе правил сочетаемости лексем, например: Старик (субъект) ловил неводом (инструмент) рыбу (объект). ‒ The old man (subject) was catching fish (object) with a seine (tool). Другим средством разрешения многозначности слов при переводе является обращение к словарным статьям контекстологических словарей, в которых указаны приоритетные значения слов из определённой области в зависимости от характера запроса к контексту.
При интерактивном методе переводчик взаимодействует со служебной программой, для этого он выполняет следующие операции: 1. составляет смысловые дополнения с помощью толкового словаря родного языка; 2. осуществляет перевод слов и словосочетаний с дополнениями, используя специальные словари; 3. корректирует несоответствия в исходном тексте и в переведённом варианте статьи [1].
Другой существенной лингвистической проблемой, которая имеет место при компьютерном переводе текстов русского и английского языков, являются синтаксические трансформации. Перефразы и тррансформации являются главными средствами создания новых высказываний. В настоящее время широко распространены следующие два вида трансформаций: 1) трансформации «глагол ‒ имя»; 2) трансформации «имя ‒ глагол».
Рассмотрим некоторые варианты перевода английского инфинитива на русский язык:
1) Обстоятельства цели и следствия;
We have to work well to improve our English. Мы должны работать хорошо, чтобы улучшить свой английский язык.
He was too tired to continue this work. Он слишком устал, чтобы продолжать эту работу.
2) Составное сказуемое с инфинитивом;
The gardener's duty is to collect leaves in the garden.
Обязанность садовника заключается в том, чтобы собирать листья в саду.
3) Определительные трансформации инфинитива;
The woman to go to the park is my sister.
Женщина, которая идёт в парк, моя сестра.
4) Инфинитив в функции дополнения;
I prefer to go for a walk in the park in the evening.
Я предпочитаю гулять в парке вечером.
5) Инфинитив в функции подлежащего в начале предложения.
To speak English is very pleasant.
Говорить по-английски очень приятно.
Герундий в английском языке имеет двойственную сущность, что вызывает ряд затруднений при переводе. Во-первых, герундий ‒ это форма глагола, выполняющая в предложении функцию подлежащего или дополнения, например: 1. Eating vegetables is good for our health. ‒ Употребление в пищу овощей приносит пользу нашему здоровью. 2. I like reading books. ‒ Я люблю читать книги.
По форме слова герундий совпадает с причастием настоящего времени в английском языке. Любое причастие может быть в предложении определением или обстоятельством, например: Look at the boy running in our garden. – Посмотрите на мальчика, бегающего в нашем саду. Reading a detective story, he took notes in the book. – Читая детектив, он делал заметки в книге. Но действительное причастие в английском языке в отличие от герундия не может выполнять функцию подлежащего или дополнения в предложении. Перевод форм герундия на английский язык является давно известным источником ошибок для профессионального переводчика. При компьютерном переводе различение форм причастия и герундия происходит только частично.
При переводе инфинитивных конструкций и форм герундия с английского языка на русский язык при машинном переводе следует обращаться к параллельным корпусам, которые являются двуязычными, то есть состоящими из текста оригинала и его перевода на другой язык.
Перевод идиом и фразеологизмов создает значительные трудности [5]. В качестве примера приведём некоторые английские фразеологизмы, которые были переведены с помощью компьютерной программы:
Пример 1. Rolling in money. ‒ Катающийся в деньгах; Пример 2. It rains cats and dogs. ‒ Идёт дождь из кошек и собак; Пример 3. Have a lot on the ball. ‒ Иметь много на мяче; Пример 4. Smell hell. ‒ Пахнет адом; Пример 5. To fly off the handle. ‒ Слететь с ручки.
Переведенные с помощью компьютерной программы примеры свидетельствуют о том, что машинный перевод нужно осторожно использовать при переводе фразеологизмов: в примере 1 правильный перевод звучит как «денег куры не клюют»; в примере 2 подразумевается русский фразеологизм «лить как из ведра»; в примере 3 – «быть очень способным»; в примере 4 – «хлебнуть горя»; в примере 5 ‒ «слететь с катушек».
Программа перевела дословно эти предложения, хотя в идеале должны быть подобраны эквиваленты на русском языке [4].
При создании систем машинного перевода текстов, содержащих идиоматические выражения, программистам необходимо руководствоваться определёнными принципами:
1. В компьютерный словарь следует включать не только фразеологизмы, но и речевые модели, которые будут автоматически заполняться при переводе.
3. Машинные словари должны быть политематическими и большими по объёму.
5. Машинный перевод фразеологизмов должен производиться в двух режимах работы: автоматическом и интерактивном [1].
Найти соответствия в текстах на разных языках позволяет функционально-семантический подход, который исследует отношения следующих единиц языка: фонем, морфем, лексем, словосочетаний и предложений. Функции реализуются при взаимодействии объектов языка и их контекстов. На сегодняшний день возможно использовать машинный перевод. Однако без участия профессионального переводчика при переводе текстов мы не сможем обойтись в ближайшие десятилетия. Система современного машинного перевода еще достаточно далека от совершенства.
Список литературы:
- Воронович В. В. Машинный перевод. Конспект лекций для студентов 5-го курса специальности «Современные иностранные языки». Минск. 2013. С. 22-33.
- Дубровина Е. В. Научный руководитель ‒ Городищева А. Н. Основные проблемы машинного перевода. // Актуальные проблемы авиации и космонавтики. Социально-экономические и гуманитарные науки. 2014. С. 238-240.
- Мироненко А. Б., Омельченко П. А. Проблемы машинного перевода. Секция «Актуальные научные проблемы в мире (глазами молодых исследователей)», ст. 1193-1195. URL: https://cyberleninka.ru/article/n/problemy-mashinnogo-perevoda/viewer
- Тоаме Катя Битан Проблематика машинного перевода. // Центральный научный вестник. URL: http://cscb.su/n/042301/042301012.htm?ysclid=lilojqfmr8742990587
- Эльжуркаева М. Я. Проблемы перевода фразеологических единиц. // Филологические науки в России и за рубежом: материалы II Международной научной конференции (г. Санкт-Петербург, ноябрь 2013 г.). С. 106-109. URL: https://moluch.ru/conf/phil/archive/106/4460/