Леонтьев Н.А. Идентификация языка текстового сообщения с помощью газетного корпуса якутского языка // Universum: технические науки : электрон. научн. журн. 2014. № 8 (9). URL: https://7universum.com/en/tech/archive/item/1539 (дата обращения: 19.06.2026).
Прочитать статью:
Keywords: language identification; newspaper corpus; the Yakut language; Internet forums
АННОТАЦИЯ
В данной работе описывается вопрос идентификации якутского языка в текстовом сообщении. Для идентификации языка используется газетный корпус на якутском языке. В статье описывается газетный корпус на якутском языке. Показаны вероятности определения языка для газетной статьи и для текстового сообщения из интернет-форумов.
ABSTRACT
The article deals with the question of the Yakut language identification in textese. For the language identification newspaper corpus in Yakut is used. This corpus is described in the article. Probabilities of language detection for a newspaper article and text message from Internet forums are shown.
Candidate of Technical Sciences, Associate professor, North-Eastern Federal University named after M.K. Ammosov, Yakutsk, Russia
ISSN 2311-5122. Article metadata is hosted on the eLIBRARY.RU platform.
Mass media registration cert.: EL No. FS77-54434 dated 17.06.2013
Journal founder: LLC «MCNO»
Editor-in-Chief - Marina Yu. Zvezdina.
By continuing to use the site, you agree to the processing of cookies and user data collected, including via Yandex.Metrica, for the purpose of site operation and statistical research. If you do not want your data to be processed, change your browser settings or leave the site.