аспирант Хакасского государственного университета, 655017, Россия, Республика Хакасия, г. Абакан, ул. Ленина 90
Разработка системы определения наличия заимствований в работах студентов высших учебных заведений. Алгоритмы поиска нечетких дубликатов
АННОТАЦИЯ
В статье рассматриваются существующие проблемы плагиата в высших учебных заведениях. Производится обзор принципов работы современных интернет-сервисов проверки текстов на наличие заимствований. Ставится вопрос о необходимости разработки системы по определению заимствований в работах, выполняемых студентами. Производится тестирование алгоритмов сравнения уникальности текста, и на основании тестирования выбирается алгоритм для использования в системе определения наличия заимствований в документах.
ABSTRACT
The article considers the existing problem of plagiarism in the environment of higher school. An overview of the principles of work of modern Internet-services to check texts on the availability of adoption is considered. The question of the need to develop a system for identifying plagiarism in the work performed by the students is put. Compare algorithms of the uniqueness of the text is accomplished and one is chosen for use in the system to detect plagiarism in documents.
Список литературы:
1. Дягилев В.В., Цхай А.А., Бутаков С.В. Архитектура сервиса определения плагиата, исключающая возможность нарушения авторских прав (рус.) // Вестник НГУ. Серия: Информационные технологии. — 2011. — С. 23—29.
2. Зеленков Ю.Г., Сегалович И.В. Сравнительный анализ методов определения нечетких дубликатов для WEB-документов // Труды 9-ой Всероссийской научной конференции «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» RCDL’2007: Сб. работ участников конкурса. — Т. 1. — Переславль-Залесский: «Университет города Переславля», 2007. — С. 166—174.
3. Медведев поручил проверять на плагиат диссертации и дипломы/ [Электронный ресурс]. — Режим доступа: http://lenta.ru/news/2013/02/18/dissers/ (дата обращения: 20.01.2014).
4. Степанов П.А. Системы анализа текстов естественного языка // Альманах современной науки и образования. — Тамбов: Грамота, 2013. — № 6. — С. 159—161.
5. Broder A. On the resemblance and containment of documents // Compression and Complexity of Sequences (SEQUENCES’97). — IEEE Computer Society, 1998. P. 21—29.