Universum: технические науки

Номера журнала

Разработка системы определения наличия заимствований в работах студентов высших учебных заведений. Методы предварительной обработки текста


Development of a system for determining the existence of adoption in the works of the students. Methods of preparation of automatic text processing

Цитировать:
Зиберт А.О., Хрусталев В.И. Разработка системы определения наличия заимствований в работах студентов высших учебных заведений. Методы предварительной обработки текста // Universum: Технические науки : электрон. научн. журн. 2014. № 4(5). URL: http://7universum.com/ru/tech/archive/item/1258 (дата обращения: 11.12.2016).
 
Прочитать статью:

Keywords: plagiarism, the system of determining the adoption in the document, list of stop-word

 

АННОТАЦИЯ

В статье рассматривается процесс подготовки текста, применяемый в системах автоматического обработки текста в контексте системы по определению наличию заимствований. Приводится исследование методов выявления стоп-слов как одного из самых ключевых моментов подготовки текстов, и на основании эффективности данных методов выбирается один из методов для реализации в разрабатываемой системе системы определения наличия заимствований.

ABSTRACT

This article discusses the process of preparing the text to use in automatic text processing system in the context to determine the presence of adoption. The research methods to identify the stop-words as one of the important pivotal moments of preparation of texts is describes and on the basis of the effectiveness of these methods is selected one of the methods to be implemented in the developed system of determining the presence of adoption.

 


Список литературы:

1.    Зиберт А.О., Хрусталев В.И. Разработка системы определения наличия заимствований в работах студентов высших учебных заведений. Алгоритмы поиска нечетких дубликатов // Universum: Технические науки : электрон. научн. журн. 2014. № 3 (4)/ [Электронный ресурс]. — Режим доступа: URL: http://7universum.com/ru/tech/archive/item/1139 (дата обращения: 26.03.2014).
2.    Терминология / [Электронный ресурс]. — Режим доступа: https://pymorphy2.readthedocs.org/en/latest/glossary.html#id5 (дата обращения: 08.03.2014).
3.    Яцко В.А. История вычислительной техники и информатики. — Абакан: Издательство ФГБОУ ВПО «Хакасский Государственный Университет им Н.Ф. Катанова», 2013. — 88 с.
4.    Davarpanah M.R., Sanji M., Aramideh M. Farsi lexical analysis and stop word list. — Library Hi Tech., 2009. — V. 27, Iss. 3. — PP. 435—449.

Приложения:

Информация об авторах:

Зиберт Андрей Оскарович Zibert Andrey

аспирант Хакасского государственного университета, 655017, Россия, Республика Хакасия, г. Абакан, ул. Ленина 90

Postgraduate student of Khakas State University, 655017, Russia, Khakasia, Abakan, Lenin street, 90


Хрусталев Виталий Игоревич Khrustalev Vitaly

кандидат технических наук, Хакасский государственный университет, РФ, г. Абакан

candidate of Technical Science, Khakas State University, Russia, Abakan


Читателям

Информация о журнале

ISSN: 2311-5122

Св-во о регистрации СМИ: 

ЭЛ №ФС77-5443 от 17.06.2013

ПИ №ФС77-66236 от 01.07.2016

Договор с РИНЦ: 

№526-08/2013 от 29.08.2013

Индексируется в: 

Договор с РИНЦ:

google scholar

Ulrich's Periodicals Directory

elibrary

socionet

 

Base

 

ROAR

OpenAire

discovery

Поделиться

Лицензия Creative CommonsЯндекс.Метрика© Научные журналы Universum, 2013-2016
Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Непортированная.