Леонтьев Н.А. Идентификация языка текстового сообщения с помощью газетного корпуса якутского языка // Universum: технические науки : электрон. научн. журн. 2014. № 8 (9). URL: https://7universum.com/ru/tech/archive/item/1539 (дата обращения: 05.12.2025).
Прочитать статью:
Keywords: language identification; newspaper corpus; the Yakut language; Internet forums
АННОТАЦИЯ
В данной работе описывается вопрос идентификации якутского языка в текстовом сообщении. Для идентификации языка используется газетный корпус на якутском языке. В статье описывается газетный корпус на якутском языке. Показаны вероятности определения языка для газетной статьи и для текстового сообщения из интернет-форумов.
ABSTRACT
The article deals with the question of the Yakut language identification in textese. For the language identification newspaper corpus in Yakut is used. This corpus is described in the article. Probabilities of language detection for a newspaper article and text message from Internet forums are shown.
Candidate of Technical Sciences, Associate professor, North-Eastern Federal University named after M.K. Ammosov, Yakutsk, Russia
Журнал зарегистрирован Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор), регистрационный номер ЭЛ №ФС77-54434 от 17.06.2013 Учредитель журнала - ООО «МЦНО» Главный редактор - Звездина Марина Юрьевна.
Оставаясь на сайте, вы даете согласие на обработку файлов cookie, пользовательских данных, собираемых, в том числе с использованием сервисов Яндекс.Метрика, в целях обеспечения работы сайта, проведения статистических исследований и обзоров. Если вы не хотите, чтобы ваши данные обрабатывались, измените настройки браузера или покиньте сайт.