Леонтьев Н.А. Идентификация языка текстового сообщения с помощью газетного корпуса якутского языка // Universum: технические науки : электрон. научн. журн. 2014. № 8 (9). URL: https://7universum.com/en/tech/archive/item/1539 (дата обращения: 29.05.2026).
Прочитать статью:
Keywords: language identification; newspaper corpus; the Yakut language; Internet forums
АННОТАЦИЯ
В данной работе описывается вопрос идентификации якутского языка в текстовом сообщении. Для идентификации языка используется газетный корпус на якутском языке. В статье описывается газетный корпус на якутском языке. Показаны вероятности определения языка для газетной статьи и для текстового сообщения из интернет-форумов.
ABSTRACT
The article deals with the question of the Yakut language identification in textese. For the language identification newspaper corpus in Yakut is used. This corpus is described in the article. Probabilities of language detection for a newspaper article and text message from Internet forums are shown.
By continuing to use the site, you agree to the processing of cookies and user data collected, including via Yandex.Metrica, for the purpose of site operation and statistical research. If you do not want your data to be processed, change your browser settings or leave the site.