Разработка системы определения наличия заимствований в работах студентов высших учебных заведений. Методы предварительной обработки текста

Development of a system for determining the existence of adoption in the works of the students. Methods of preparation of automatic text processing
Цитировать:
Зиберт А.О., Хрусталев В.И. Разработка системы определения наличия заимствований в работах студентов высших учебных заведений. Методы предварительной обработки текста // Universum: технические науки : электрон. научн. журн. 2014. № 4 (5). URL: https://7universum.com/ru/tech/archive/item/1258 (дата обращения: 22.12.2024).
Прочитать статью:
Keywords: plagiarism, the system of determining the adoption in the document, list of stop-word

 

АННОТАЦИЯ

В статье рассматривается процесс подготовки текста, применяемый в системах автоматического обработки текста в контексте системы по определению наличию заимствований. Приводится исследование методов выявления стоп-слов как одного из самых ключевых моментов подготовки текстов, и на основании эффективности данных методов выбирается один из методов для реализации в разрабатываемой системе системы определения наличия заимствований.

ABSTRACT

This article discusses the process of preparing the text to use in automatic text processing system in the context to determine the presence of adoption. The research methods to identify the stop-words as one of the important pivotal moments of preparation of texts is describes and on the basis of the effectiveness of these methods is selected one of the methods to be implemented in the developed system of determining the presence of adoption.

 


Список литературы:

1.    Зиберт А.О., Хрусталев В.И. Разработка системы определения наличия заимствований в работах студентов высших учебных заведений. Алгоритмы поиска нечетких дубликатов // Universum: Технические науки : электрон. научн. журн. 2014. № 3 (4)/ [Электронный ресурс]. — Режим доступа: URL: http://7universum.com/ru/tech/archive/item/1139 (дата обращения: 26.03.2014).
2.    Терминология / [Электронный ресурс]. — Режим доступа: https://pymorphy2.readthedocs.org/en/latest/glossary.html#id5 (дата обращения: 08.03.2014).
3.    Яцко В.А. История вычислительной техники и информатики. — Абакан: Издательство ФГБОУ ВПО «Хакасский Государственный Университет им Н.Ф. Катанова», 2013. — 88 с.
4.    Davarpanah M.R., Sanji M., Aramideh M. Farsi lexical analysis and stop word list. — Library Hi Tech., 2009. — V. 27, Iss. 3. — PP. 435—449.

Информация об авторах

аспирант Хакасского государственного университета, 655017, Россия, Республика Хакасия, г. Абакан, ул. Ленина 90

Postgraduate student of Khakas State University, 655017, Russia, Khakasia, Abakan, Lenin street, 90

кандидат технических наук, Хакасский государственный университет, РФ, г. Абакан

candidate of Technical Science, Khakas State University, Russia, Abakan

Журнал зарегистрирован Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор), регистрационный номер ЭЛ №ФС77-54434 от 17.06.2013
Учредитель журнала - ООО «МЦНО»
Главный редактор - Ахметов Сайранбек Махсутович.
Top