Разработка системы определения наличия заимствований в работах студентов высших учебных заведений. Алгоритмы поиска нечетких дубликатов

Development of a system for determining the existence of adoption in the works of the students. The search algorithms of indistinct duplicates
Цитировать:
Зиберт А.О., Хрусталев В.И. Разработка системы определения наличия заимствований в работах студентов высших учебных заведений. Алгоритмы поиска нечетких дубликатов // Universum: технические науки : электрон. научн. журн. 2014. № 3 (4). URL: https://7universum.com/ru/tech/archive/item/1139 (дата обращения: 14.10.2024).
Прочитать статью:
Keywords: plagiarism, the system of determining the adoption in the document, the search algorithms of indistinct duplicate, shingles’s method

 

АННОТАЦИЯ

В статье рассматриваются существующие проблемы плагиата в высших учебных заведениях. Производится обзор принципов работы современных интернет-сервисов проверки текстов на наличие заимствований. Ставится вопрос о необходимости разработки системы по определению заимствований в работах, выполняемых студентами. Производится тестирование алгоритмов сравнения уникальности текста, и на основании тестирования выбирается алгоритм для использования в системе определения наличия заимствований в документах.

ABSTRACT

The article considers the existing problem of plagiarism in the environment of higher school. An overview of the principles of work of modern Internet-services to check texts on the availability of adoption is considered. The question of the need to develop a system for identifying plagiarism in the work performed by the students is put. Compare algorithms of the uniqueness of the text is accomplished and one is chosen for use in the system to detect plagiarism in documents.

 


Список литературы:

1.    Дягилев В.В., Цхай А.А., Бутаков С.В. Архитектура сервиса определения плагиата, исключающая возможность нарушения авторских прав (рус.) // Вестник НГУ. Серия: Информационные технологии. — 2011. — С. 23—29.
2.    Зеленков Ю.Г., Сегалович И.В. Сравнительный анализ методов определения нечетких дубликатов для WEB-документов // Труды 9-ой Всероссийской научной конференции «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» RCDL’2007: Сб. работ участников конкурса. — Т. 1. — Переславль-Залесский: «Университет города Переславля», 2007. — С. 166—174.
3.    Медведев поручил проверять на плагиат диссертации и дипломы/ [Электронный ресурс]. — Режим доступа:     http://lenta.ru/news/2013/02/18/dissers/ (дата обращения: 20.01.2014).
4.    Степанов П.А. Системы анализа текстов естественного языка // Альманах современной науки и образования. — Тамбов: Грамота, 2013. — № 6. — С. 159—161.
5.    Broder A. On the resemblance and containment of documents // Compression and Complexity of Sequences (SEQUENCES’97). — IEEE Computer Society, 1998. P. 21—29.

Информация об авторах

аспирант Хакасского государственного университета, 655017, Россия, Республика Хакасия, г. Абакан, ул. Ленина 90

Postgraduate student of Khakas State University, 655017, Russia, Khakasia, Abakan, Lenin street, 90

кандидат технических наук, Хакасский государственный университет, РФ, г. Абакан

candidate of Technical Science, Khakas State University, Russia, Abakan

Журнал зарегистрирован Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор), регистрационный номер ЭЛ №ФС77-54434 от 17.06.2013
Учредитель журнала - ООО «МЦНО»
Главный редактор - Ахметов Сайранбек Махсутович.
Top