Проблемы машинного перевода при переводе на узбекский язык

Problems of machine translation when translating to the Uzbek language
Тураева Г.Х.
Цитировать:
Тураева Г.Х. Проблемы машинного перевода при переводе на узбекский язык // Universum: технические науки : электрон. научн. журн. 2020. 10(79). URL: https://7universum.com/ru/tech/archive/item/10816 (дата обращения: 18.12.2024).
Прочитать статью:

 

АННОТАЦИЯ

В статье разъясняются ошибки и недочеты машинного перевода, добавление узбекского языка в Google Translate, проблемы с переводом системы на узбекский язык, роль узбекского языка в мировом сообществе, ошибки поясняются примерами. Также обсуждается качество узбекского контента на узбекском языке, отсутствие функции проверки орфографии в программах и функции редактирования текста в кириллице и латинском алфавите.

ABSTRACT

The article explains the mistakes and shortcomings of machine translation, the addition of the Uzbek language to Google Translate, the problems with translating the system into the Uzbek language, the role of the Uzbek language in the world community, the errors are explained by examples. It also discusses the quality of Uzbek content in the Uzbek language, the lack of a spell check function in programs, and the function of editing text in Cyrillic and Latin alphabets.

 

Ключевые слова: машинный перевод, Google Translate, недостатки автоматического перевода, перевод на узбекский язык, перевод на русский язык, “bat”, “ko’rshapalak”, “belkurak”, “to’qmoq”, “kichik ziyofat”, онлайн перевод, Википедия, веб-контент, веб-сайт.

Keywords: machine translation, Google Translate, disadvantages of automatic translation, Uzbek translation, Russian translation, “bat”, “ko'rshapalak”, “belkurak”, “to'qmoq”, “kichik ziyofat”, online translation , Wikipedia, web content, website.

 

Резкое увеличение объемов данных, основанных на геометрической прогрессии, привело к необходимости систем, позволяющих быстро переводить их на другие языки. В ответ начали появляться практические исследования в области машинного или автоматического перевода. Самое главное, что исследования в области машинного перевода стали базовой точкой возникновения компьютерной лингвистики.

В 1954 году Джорджтаунский университет в США протестировал первый в мире автоматический перевод. Это называется система GAT (аббревиатура от Georgetown Automatic Translation). Эти эксперименты проводились на компьютере IBM701. В основе этого эксперимента лежали алгоритмы, переводящие 50 000 слов (60 предложений) с русского на английский.

В результате развития Интернета автоматический перевод был также установлен в глобальной сети, то есть сейчас активно действует система онлайн-перевода. Искусственные нейронные сети, управляемые данными, с каждым годом улучшают качество перевода. Но даже в этом случае недостатков у автоматического перевода еще много. На сегодняшний день одной из наиболее широко используемых систем автоматического перевода является Google Translate.

Согласно Википедии, в настоящее время система поддерживает 90 языков. В декабре 2014 года в Google Translate был добавлен узбекский язык. Это было сделано с помощью узбекскоязычных волонтеров и узбекского словаря Шавката Бутаева. Это, конечно, отрадно, но в узбекском переводе машинного перевода есть ряд недостатков.

У Google Translator, как и у других автоматических переводчиков, есть свои ограничения. Эта система помогает пользователю понять общее содержание текстового контента на иностранном языке. Однако, часто он не дает точных переводов. Поэтому постоянно ведется работа над качеством перевода, будут переведены на другие языки.

Недостатки автоматического перевода:

  1. Слова переводятся непосредственно в процессе автоматического перевода. Поэтому перевод выполняется практически без соблюдения грамматических правил;
  2. Нужно редактировать автоматически переведенный текст;
  3. Современные системы автоматического перевода также переводят сочетание слов практически неправильно.

Например, переводя английскую фразу «The bat looks like a mouse with wings» на узбекский, он переводит ее как «Yarasa qanotli sichqonchaga o’xshaydi». Я не лингвист, но не думаю, что понимание сложности предложения требует глубоких знаний (рис.1):

 

Рисунок 1. Пример перевода с английского на узбекский язык

 

В переводе на русский язык словосочетание «Летучая мышь выглядит как мышь с крыльями” (рис.2.).

 

Рисунок 2. Пример перевода с английского на русский язык

 

Из вышесказанного видно, что русская версия переводов намного понятнее и чище. С другой стороны, узбекские переводы расплывчаты и понятны только семантически.

При переводе предложений следует учитывать его одноименные особенности. В противном случае перевод не будет успешным. Слово «bat» в предложении означает «ko’rshapalak», «belkurak», «to’qmoq», «kichik ziyofat», а слово «look» означает «qaramoq», «nigoh», «ko’rinish». 

Дугой пример, предложение «Have you ever wanted to make some extra money?» переводится следующим образом: «Hech qachon qo’shimcha pul ishlashni xohladingizmi?». По-русски выглядит как «Вы когда-нибудь хотели заработать немного денег?». Даже в этом предложению можно понять только в смысле значения. Но перевод был немного близок к оригиналу из-за использования синонимов.

Имея это в виду, можно сказать, что автоматический перевод выполняется успешно, особенно в пределах официального языка. Автоматический перевод разговорных и художественных текстов не решено на максимальном уровне.

Конечно, высочайшее качество перевода происходит при участии человека. Потому что переводчик подходит к переводу, учитывая тонкости, семантические, грамматические и прагматические аспекты человеческого языка.

Тем не менее, с быстрым увеличением количества веб-контента информационные системы, однако тот факт, что большая часть информации в глобальной сети находится на русском или английском языке, ограничивает способность узбекоязычного населения правильно получать необходимую информацию. Несмотря на то, что на этом языке говорят около 30 миллионов человек в мире, роль узбекского языка в мировом сообществе по-прежнему незначительна. Сложно сказать, что качество существующих узбекоязычных сайтов удовлетворительно. Предложения в опубликованных статьях, которые были взяты напрямую с иностранных сайтов и переведены напрямую, можно встретить несвязанные слова друг с другом, и в словах можно обнаружить много орфографических ошибок (рис.3):

 

Рисунок 3. Пример переведённой статьи на узбекский язык

 

Проблемы с узбекским языком можно наблюдать не только в онлайн переводах, но и в обычных программах Office.      Кириллица и латинский алфавит не имеют функций редактирования текста на узбекском языке. Для преобразования кириллического текста в латинский алфавит требуется отдельная программа-конвертер, и преобразованный текст необходимо повторно редактировать. Хорошо известно, что Microsoft Word обнаруживает орфографические ошибки в английских и русских словах.

Из вышеуказанных проблем можно сделать вывод, что одной из наиболее актуальных проблем, стоящих перед программистами, веб-программистами, экспертам компьютерной лингвистики и лингвистами, является создание качественного веб-контента на узбекском языке, разработка специальных программных приложений для обучения иностранцев узбекскому языку. Постепенное решение этих вопросов положительно скажется на росте информационной осведомленности населения.

 

Список литературы:

  1. Атаева Г.И., Тураева Г.Х. Перевод как средство взаимосвязи мировой культуры //Academy № 12 (51), 2019. С.65-67.
  2. Атаева Г.И., Ядгарова Л.Д. Оценка прикладных свойств обучающей платформы Moodle в Бухарском государственном университете // Universum: технические науки : электрон. научн. журн. 2020. № 6 (75). URL: https://7universum.com/ru/tech/archive/item/9593 (дата обращения: 03.10.2020).
  3. Буранова Г.Ё., Носирова Ш.Э. Сущность применения метода кейс-технологий в организации учебного процесса  //Academy.  №9 (60). 2020. С. 17-20.
  4. Зарипова Г.К., Сайидова Н.С., Тахиров Б.Н., Хайитов У.Х.  Пдагогическое сотрудничество преподавателя  и студентов в кредитно-модульной системе высшего образования // Наука, образование и культура. 2014. № 1 (1).  С. 22-25.
  5. Жалолов О.И. Верхняя оценка нормы функционала погрешности кубатурной формулы типа Эрмита в пространстве С.Л.Соболева //  Проблемы вычислительной и прикладной математики. Научный журнал. -№3.2017. -Ташкент. -70-78 ст.
  6.  Жалолов О.И., Хаятов Х.У. Понятие SQL и реляционной базы данных // Universum: технические науки : электрон. научн. журн. 2020. № 6 (75). URL: https://7universum.com/ru/tech/archive/item/9711 (дата обращения: 03.10.2020).
  7. Тахиров Б.Н. Понятие виртуальной реальности // Наука, образование и культура. 2014. № 1 (1).  С. 12-14.
  8. Abdurakhmonova N. O’zbek tili lotin alifbosi uchun klaviatura yoki “unicode” masalasi //Til va adabiyot ta’limi jurnali. №6. 2018.
  9. Fayzieva D.Kh. USING SOFTWARE FOR TEACHING FOREIGN LANGUAGES //Academy.  №9 (60). 2020. С. 13-16.
  10. Rahimov.A  Kompyuter lingvistikasi. Toshkent, 2011. 205в.
Информация об авторах

преподаватель, Бухарский государственный университет, Республика Узбекистан, г. Бухара

Lecturer, Bukhara State University, Republic of Uzbekistan, Bukhara

Журнал зарегистрирован Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор), регистрационный номер ЭЛ №ФС77-54434 от 17.06.2013
Учредитель журнала - ООО «МЦНО»
Главный редактор - Ахметов Сайранбек Махсутович.
Top