Международный
научный журнал

Номера журнала

Разработка системы определения наличия заимствований в работах студентов высших учебных заведений. Методы предварительной обработки текста


Development of a system for determining the existence of adoption in the works of the students. Methods of preparation of automatic text processing

Цитировать:
Зиберт А.О., Хрусталев В.И. Разработка системы определения наличия заимствований в работах студентов высших учебных заведений. Методы предварительной обработки текста // Universum: Технические науки : электрон. научн. журн. 2014. № 4(5). URL: http://7universum.com/ru/tech/archive/item/1258 (дата обращения: 23.06.2017).
 
Прочитать статью:

Keywords: plagiarism, the system of determining the adoption in the document, list of stop-word

 

АННОТАЦИЯ

В статье рассматривается процесс подготовки текста, применяемый в системах автоматического обработки текста в контексте системы по определению наличию заимствований. Приводится исследование методов выявления стоп-слов как одного из самых ключевых моментов подготовки текстов, и на основании эффективности данных методов выбирается один из методов для реализации в разрабатываемой системе системы определения наличия заимствований.

ABSTRACT

This article discusses the process of preparing the text to use in automatic text processing system in the context to determine the presence of adoption. The research methods to identify the stop-words as one of the important pivotal moments of preparation of texts is describes and on the basis of the effectiveness of these methods is selected one of the methods to be implemented in the developed system of determining the presence of adoption.

 


Список литературы:

1.    Зиберт А.О., Хрусталев В.И. Разработка системы определения наличия заимствований в работах студентов высших учебных заведений. Алгоритмы поиска нечетких дубликатов // Universum: Технические науки : электрон. научн. журн. 2014. № 3 (4)/ [Электронный ресурс]. — Режим доступа: URL: http://7universum.com/ru/tech/archive/item/1139 (дата обращения: 26.03.2014).
2.    Терминология / [Электронный ресурс]. — Режим доступа: https://pymorphy2.readthedocs.org/en/latest/glossary.html#id5 (дата обращения: 08.03.2014).
3.    Яцко В.А. История вычислительной техники и информатики. — Абакан: Издательство ФГБОУ ВПО «Хакасский Государственный Университет им Н.Ф. Катанова», 2013. — 88 с.
4.    Davarpanah M.R., Sanji M., Aramideh M. Farsi lexical analysis and stop word list. — Library Hi Tech., 2009. — V. 27, Iss. 3. — PP. 435—449.

Приложения:

Информация об авторах:

Зиберт Андрей Оскарович Zibert Andrey

аспирант Хакасского государственного университета, 655017, Россия, Республика Хакасия, г. Абакан, ул. Ленина 90

Postgraduate student of Khakas State University, 655017, Russia, Khakasia, Abakan, Lenin street, 90


Хрусталев Виталий Игоревич Khrustalev Vitaly

кандидат технических наук, Хакасский государственный университет, РФ, г. Абакан

candidate of Technical Science, Khakas State University, Russia, Abakan


Читателям

Информация о журнале

Выходит с 2013 года

ISSN: 2311-5122

Св-во о регистрации СМИ: 

ЭЛ №ФС77-54434 от 17.06.2013

ПИ №ФС77-66236 от 01.07.2016

Скачать информационное письмо

Размещается в: 

The agreement with the Russian SCI:

google scholar

Ulrich's Periodicals Directory

socionet

Base

 

OpenAirediscovery

Поделиться

Лицензия Creative CommonsЯндекс.Метрика© Научные журналы Universum, 2013-2017
Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Непортированная.