ЮРИДИЧЕСКИЕ АСПЕКТЫ НАРУШЕНИЯ АВТОРСКИХ ПРАВ В СФЕРЕ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА: АНАЛИЗ И ПРАКТИЧЕСКИЕ РЕКОМЕНДАЦИИ

LEGAL ASPECTS OF COPYRIGHT INFRINGEMENT IN THE FIELD OF ARTIFICIAL INTELLIGENCE: ANALYSIS AND PRACTICAL RECOMMENDATIONS
Цитировать:
Имангалиева Р.С. ЮРИДИЧЕСКИЕ АСПЕКТЫ НАРУШЕНИЯ АВТОРСКИХ ПРАВ В СФЕРЕ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА: АНАЛИЗ И ПРАКТИЧЕСКИЕ РЕКОМЕНДАЦИИ // Universum: экономика и юриспруденция : электрон. научн. журн. 2025. 1(135). URL: https://7universum.com/ru/economy/archive/item/21652 (дата обращения: 10.01.2026).
Прочитать статью:
DOI - 10.32743/UniLaw.2026.135.1.21652

 

АННОТАЦИЯ

В данной статье рассматриваются правовые аспекты нарушения авторских прав с участием систем искусственного интеллекта. Проанализированы основные подходы, применяемые в США, выявлены проблемные области в регулировании. Проведен анализ, определены сильные и слабые стороны существующих моделей ответственности за действия искусственного интеллекта. На основании проведенного исследования сформулированы практические рекомендации, направленные на повышение эффективности правовой защиты авторских прав в условиях активного внедрения технологий искусственного интеллекта. Представленные выводы позволяют получить целостное представление о международных подходах к регулированию авторских прав в эпоху искусственного интеллекта и могут служить ориентиром для совершенствования соответствующих правовых механизмов.

ABSTRACT

This article examines the legal aspects of copyright infringement involving artificial intelligence systems. The main approaches applied in the United States are analyzed, highlighting current trends and regulatory challenges. An analysis identifies the strengths and weaknesses of existing liability models for artificial intelligence actions. Based on the research findings, practical recommendations are proposed to enhance the effectiveness of copyright protection in the context of widespread adoption of artificial intelligence technologies. The conclusions presented provide a comprehensive understanding of international approaches to copyright regulation in the age of artificial intelligence and can serve as a guideline for improving relevant legal frameworks.

 

Ключевые слова: авторские права, искусственный интеллект, нарушение авторских прав, юридическая ответственность, интеллектуальная собственность, библиотека данных.

Keywords: copyright, artificial intelligence, copyright infringement, legal liability, intellectual property, data library.

 

Введение

Использование систем искусственного интеллекта (ИИ) в деятельности, связанной с созданием и обработкой творческих произведений, поставило под сомнение применимость традиционных механизмов авторско-правовой защиты. Современные системы ИИ способны анализировать и воспроизводить тексты, изображения и иные объекты творчества, что приводит к возникновению правовой неопределённости в вопросах допустимости использования охраняемых произведений.

Одной из ключевых проблем является установление факта наличия нарушения авторских прав при использовании систем искусственного интеллекта, а также определение стадии их функционирования (на стадии ввода данных и вывода результатов), на которой такое нарушение может возникнуть. Модели ИИ обучаются на значительных массивах данных, включающих материалы, охраняемые авторским правом, а результаты их работы могут демонстрировать существенное сходство с оригинальными произведениями. В связи с этим в научной и правоприменительной практике ведётся дискуссия о том, следует ли квалифицировать потенциальное нарушение на стадии использования охраняемых произведений для обучения модели либо на стадии генерации контента.

Данная статья сосредоточена на анализе возможных нарушений авторских прав именно на этапе использования охраняемых произведений в процессе обучения систем ИИ. Такой подход обусловлен тем, что стадия ввода и обработки данных представляет собой фундаментальный элемент функционирования ИИ-систем и предшествует созданию любого результата их работы. Использование произведений на данном этапе носит массовый, автоматизированный и зачастую непрозрачный характер, что существенно осложняет применение традиционных авторско-правовых норм.

Соединённые Штаты Америки (США) представляют особый интерес для исследования, поскольку именно в данной юрисдикции формируется наиболее активная судебная практика по спорам, связанным с использованием охраняемых произведений в процессе обучения таких систем. Кроме того, вопросы допустимости подобного использования в США традиционно рассматриваются через призму доктрины добросовестного использования (fair use), играющей ключевую роль в оценке правомерности действий, потенциально затрагивающих исключительные права правообладателей [1].

В то же время применение традиционных авторско-правовых подходов в отношении систем ИИ вызывает значительные затруднения, обусловленные технологической сложностью таких систем и недостаточной определённостью правового регулирования. Отсутствие прямых регуляторных, строгих норм, адресованных обучению ИИ на охраняемых произведениях, приводит к тому, что ключевое значение приобретает судебная практика и аргументация, используемая судами при разрешении соответствующих споров.

В связи с этим целью данной статьи является анализ подходов американской правовой системы к квалификации возможных нарушений авторских прав на стадии использования охраняемых произведений для обучения систем ИИ, а также выявление ключевых критериев и аргументационных моделей, применяемых судами при оценке допустимости такого использования.

Материалы и методы

Для анализа вопросов нарушения авторских прав на этапе ввода данных использованы законодательные акты США, включая положения о добросовестном использовании (fair use), передовая судебная практика по делам, связанным с применением ИИ на этапе использования охраняемых произведений в процессе обучения систем ИИ, а также научные публикации и экспертные мнения. Методологической основой исследования стал правовой анализ, включающий изучение правовой базы, кейсов и научной литературы с применением методов систематизации, классификации и интерпретации судебной аргументации, что позволило выявить ключевые критерии оценки допустимости использования охраняемых произведений.

Результаты и обсуждение

Этап ввода данных является фундаментальной частью функционирования любой системы ИИ. На этом этапе осуществляется сбор и предварительная обработка данных, которые затем используются для обучения модели и формирования её способности к генерации новых результатов [2, с. 66]. Алгоритмы машинного обучения требуют значительных объёмов данных, а качество и разнообразие этих данных напрямую влияют на точность и корректность функционирования модели в новых контекстах [3, с. 20].

Обучающие наборы данных формируются из различных источников: открытые интернет-ресурсы, лицензированные базы данных, а также материалы с ограниченным доступом и размещённые на нелегальных площадках [4, с. 6]. В данном контексте встаёт вопрос о том, подпадает ли использование охраняемых авторским правом произведений в качестве обучающих данных без получения соответствующего разрешения под режим нарушения авторских прав.

Международной основой является Бернская конвенция об охране литературных и художественных произведений, закрепляющая исключительные права авторов и обязанности государств-участников принимать меры в отношении незаконного использования произведений [5]. На национальном уровне в США нарушение авторских прав определяется как несанкционированное осуществление любого из исключительных прав правообладателя, включая воспроизведение, распространение и создание производных произведений (Раздел 17 Кодекса Соединённых Штатов об авторском праве (U.S.C.)) [6]. Основной инструмент оценки допустимости использования охраняемых произведений при обучении ИИ — доктрина fair use, которая учитывает цель и характер использования, трансформацию оригинального произведения и влияние на рынок правообладателя [1].

Однако следует учитывать, что не все данные, используемые при обучении систем искусственного интеллекта, подпадают под охрану авторским правом. Факты, сырые данные и произведения в общественном достоянии не образуют нарушения [7]. Сложности возникают при использовании защищённых произведений без согласия правообладателей. Масштаб и непрозрачность процессов обучения ИИ делают практически невозможным определение вклада каждого конкретного произведения. Систематическое копирование и хранение охраняемых произведений в составе обучающих наборов данных, так называемых библиотек данных, потенциально затрагивает исключительное право на воспроизведение [8].

По мнению доктора Андреса Гвадамуса (Dr Andres Guadamuz), после завершения обучения данные трансформируются и «сжимаются» в латентном пространстве модели, вследствие чего исходные произведения в своей первоначальной форме в системе не сохраняются [9, c. 11]. По его мнению, таким образом обученная модель не содержит прямых копий произведений, а лишь обобщённые закономерности, выявленные на основе этих произведений [9, c. 11]. На взгляд автора, такое объяснение не полностью отражает фундаментальную роль исходных данных. Даже если прямые копии произведений не сохраняются, они существенно влияют на формирование модели и её результаты. Аналогично отношениям между родителями и детьми или образовательными учреждениями и студентами: родители и преподаватели предоставляют материал для интеллектуального развития, а ребёнок или студент самостоятельно обрабатывает и применяет знания. Точно так же ИИ обучается на данных — как в общественном достоянии, так и охраняемых авторским правом — и перерабатывает их, не сохраняя в исходной форме.

Ключевой вопрос здесь не в том, как данные хранятся внутри модели, а в том, что использование охраняемых произведений неизбежно. Подобно ребёнку, ИИ не может обучиться без обращения к исходным материалам. Их использование имеет принципиальное значение и формирует основу для оценки возможного нарушения авторских прав.

Основная проблема нарушения авторских прав при вводе данных заключается не только в сохранении произведений в модели, но и в неизбежном использовании охраняемых объектов для обучения, что формирует правовую основу для оценки допустимости обучения ИИ с точки зрения авторского права. Практику подтверждают ключевые судебные дела в США, где суды оценивают использование охраняемых произведений в обучении ИИ с учётом доктрины добросовестного использования (fair use) и баланса интересов правообладателей и разработчиков. В отличие от обучения человека, ИИ использует те же данные для обучения систем, что порождает специфические правовые вопросы, которые будут рассмотрены далее.

Одним из первых и наиболее значимых примеров такого судебного разбирательства является дело Kadrey v. Meta Platforms, Inc. (организация признана экстремистской и запрещенной в России). Истцы утверждали, что Meta Platforms, Inc. (организация признана экстремистской и запрещенной в России) нарушила их исключительные права в соответствии с Законом США об авторском праве, используя пиратский набор данных Books3 для обучения языковых моделей LLaMA, который содержал несанкционированные копии их произведений [4, c. 6]. В ходе процесса выяснилось, что внутренние юристы Meta Platforms, Inc. (организация признана экстремистской и запрещенной в России) участвовали и консультировали по поводу незаконной деятельности [10]. Истцы также ссылались на нарушение California Computer Data Access and Fraud Act (CDAFA) и Digital Millennium Copyright Act (DMCA), поскольку Meta Platforms, Inc. (организация признана экстремистской и запрещенной в России) скачивала и использовала пиратские данные для обучения моделей LLaMA [4, c. 2]. Meta Platforms, Inc. (организация признана экстремистской и запрещенной в России), в свою очередь, отклонила обвинения, утверждая, что использование данных для обучения модели является добросовестным использованием (fair use) [4, c. 4].

В свою очередь доктрина добросовестного использования в США предусматривает ограниченное использование охраняемых произведений без разрешения, например для критики, комментариев, новостной информации, преподавания, науки и исследований [11]. Под «обучением» в его обычном смысле понимается передача знаний людям, занятия в классе и использование учебных материалов [12]. Это, в свою очередь, не эквивалентно процессу обучения искусственного интеллекта, где объектом «обучения» является алгоритм, а не человек. Следовательно, использование данных для обучения ИИ не подпадает под вышеуказанные исключения.

Важно подчеркнуть, что во время рассмотрения дела было установлено, что Марк Цукерберг одобрил использование набора данных LibGen, несмотря на предупреждения команды по ИИ о его пиратском происхождении [13]. Этот факт также свидетельствует о том, что сами ответчики осознавали правовые последствия использования данных. Судья Винс Чхабрия 21 августа 2025 года вынес решение, что Meta Platforms, Inc. (организация признана экстремистской и запрещенной в России) не нарушила авторские права при обучении моделей на книгах 13 авторов без разрешения, сосредоточив внимание на трансформативном использовании и отсутствии доказанного ущерба для рынка [14]. Однако данное решение вызывает сомнения, так как обучение ИИ напрямую зависит от исходных материалов, многие из которых использовались без согласия авторов. Новизна результатов, создаваемых ИИ, часто сомнительна, а возможность косвенного ущерба рынку и экономическим интересам авторов сохраняется.

В последующем знаменитом деле Bartz v. Anthropic истцы ссылались на решение в Kadrey v. Meta Platforms, Inc. (организация признана экстремистской и запрещенной в России, утверждая, что Anthropic использовала их произведения без разрешения для обучения модели Claud [15]. Ключевой предмет спора — набор данных The Pile, включавший 22 поднаборов, среди которых Books3 имел особое значение [16]. Этот набор содержал 196 640 книг, многие из которых были получены с пиратского трекера Bibliotik [17]. Авторы набора открыто признавали использование пиратских материалов, подчёркивая их ценность для обучения ИИ [18]. Anthropic настаивала на том, что обучение модели носило трансформативный характер и подпадало под доктрину добросовестного использования (fair use), аргументируя это тем, что материалы использовались «за кулисами», не воспроизводились дословно, и что использование не причиняло ущерба книжному рынку [19]. Следовательно, это свидетельствует о том, что Anthropic фактически признаёт факт использования охраняемых произведений, несмотря на заявленный трансформативный характер обучения. По данному делу 23 июня 2025 года судья Уильям Олсап вынес компромиссное решение: обучение модели было признано «высокотрансформативным» и допустимым в рамках fair use, тогда как пиратские копии книг, созданные и сохранённые в библиотеке, классифицировались как незаконное присвоение [20]. Это решение подчёркивает двойственный вывод: с одной стороны, трансформативное обучение ИИ может квалифицироваться как добросовестное использование (fair use), с другой — использование пиратских материалов продолжает считаться нарушением авторских прав. Anthropic впоследствии достигла мирового соглашения с авторами 26 августа 2025 года, что демонстрирует практическую важность соблюдения прав авторов и прозрачного формирования обучающих наборов данных [21].  Дело подчёркивает необходимость баланса между инновациями в ИИ и защитой авторских прав.

Таким образом, рассмотренные кейсы показывают, что законность обучения ИИ напрямую зависит от источников данных и соблюдения авторских прав. Важно также помнить, что трансформативность использования материалов не снимает ответственности за их незаконное получение, а отсутствие доказанного прямого ущерба не исключает косвенного воздействия на рынок и доходы авторов, что подчёркивает необходимость прозрачного и законного формирования обучающих наборов данных. При этом следует подчеркнуть особую значимость первоначальных документов и произведений, защищённых авторским правом, которые формируют основу для функционирования ИИ. Независимо от того, насколько разработчики и основатели систем искусственного интеллекта стремятся обойти авторские права, труд, вложенный авторами в создание текстов и других произведений, должен оплачиваться по достоинству. Компании, использующие эти материалы для обучения своих моделей, получают значительную экономическую выгоду, и именно поэтому правовые вопросы приобретения и использования авторских произведений должны решаться легально и прозрачно. Легальное оформление прав на используемые материалы обеспечивает справедливое вознаграждение авторам и снижает риски нарушения авторских прав при обучении ИИ.

На основании вышеизложенного рекомендуется следующее:

  1. Формирование легальных библиотек данных для обучения ИИ: включать данные, полученные только на законных основаниях с согласия правообладателей; использовать материалы, находящиеся в общественном достоянии; применять фактические данные, статистику, цифровую информацию и иные объекты, не охраняемые авторским правом.

Данное уточнение демонстрирует, что использование незаконно полученных данных, включая материалы с пиратских сайтов, является нарушением авторских прав. Любые данные, не включённые в легальные библиотеки, не должны использоваться для обучения ИИ.

  1. Права и обязанности владельцев и держателей библиотек данных на этапе ввода данных: контролировать использование своих данных, произведений для обучения ИИ в рамках заявленных целей и условий; получать информацию о принципах работы ИИ при использовании их данных, что повышает прозрачность и понимание алгоритмов.
  2. Определение владельцев и держателей библиотек данных:

Необходимо законодательно установить, кто может считаться владельцем или держателем библиотеки данных: лица, получившие доступ к данным на законных основаниях; авторы самих произведений, включённых в библиотеку.

  1. Дополнительные рекомендации: предусмотреть ответственность за нарушение порядка формирования и использования библиотек данных; разработать стандарты документирования происхождения данных и правовых оснований их использования; обеспечить возможность независимого аудита библиотек данных для подтверждения их легальности; стимулировать разработку прозрачных соглашений между авторами, держателями данных и разработчиками ИИ о вознаграждении и условиях использования материалов.

Заключение

Анализ практики показывает, что законность обучения ИИ напрямую зависит от источников данных и соблюдения авторских прав. Даже если алгоритмы трансформируют информацию и создают новые результаты, это не освобождает от ответственности за использование материалов, созданных другими авторами. Создание легальных и прозрачных библиотек данных, включающих материалы с согласия правообладателей, объекты общественного достояния и данные, не охраняемые авторским правом, является необходимым условием для этичного и законного обучения ИИ. Владельцы данных должны иметь возможность контролировать их использование, а разработчики — уважать права авторов и обеспечивать справедливое вознаграждение за их труд.

В целом, внедрение таких практик обеспечивает баланс между инновационным развитием ИИ и защитой интеллектуальной собственности, способствует этически корректному использованию технологий и формирует правовую культуру в сфере искусственного интеллекта, не замедляя развитие технологий и в то же время уважая и защищая права авторов.

 

Список литературы:

  1. U.S. Copyright Office. Fair Use [Электронный ресурс] — Режим доступа. URL: https://www.copyright.gov/fair-use/    (дата обращения: 24.05.2025).
  2. Hrvoje Singh, Ashish Tripathi, Sandeep Saxena, Pushpa Choudhary, Mahesh Kumar Singh, Arjun Singh. Impact of Deep Learning on Natural Language Processing // Artificial Intelligence, Machine Learning and User Interface Design. Bentham Science Publishers, 2024, p. 66 [Электронный ресурс] — Режим доступа.  URL: https://ebookcentral.proquest.com/lib/suss/reader.action?c=RVBVQg&docID=31347860&ppg=66 (дата обращения: 01.06.2025).
  3. Goodfellow I., Bengio Y., Courville A. Deep Learning, p. 20 [Электронный ресурс]. — Режим доступа: URL:  mariyka-4griDin-monomhttps://www.deeplearningbook.org (дата обращения: 01.06.2025).
  4. Richard Kadrey et al. v. Meta Platforms, Inc., No. 3:23‑cv‑03417 (N.D. Cal. 2025), p. 6 [Электронный ресурс]. — Режим доступа: URL: https://www.courtlistener.com/docket/67569326/kadrey-v-meta-platforms-inc/  (дата обращения: 19.09.2025).
  5. Berne Convention for the Protection of Literary and Artistic Works (WIPO LEX, authentic text as amended 28 September 1979) [Электронный ресурс]. — Режим доступа: URL: https://www.wipo.int/wipolex/en/text/283698 (дата обращения: 28.06.2025).
  6. Title 17 of the United States Code (Copyright Law of the United States) (United States Copyright Office, current through 23 December 2024) [Электронный ресурс]. — Режим доступа: URL: https://www.copyright.gov/title17/title17.pdf (дата обращения: 28.06.2025).
  7. What’s Not Protected by Copyright Law [Электронный ресурс]. Copyright Alliance. — Режим доступа: URL: https://copyrightalliance.org/faqs/whats-not-protected-by-copyright-law/  (дата обращения: 28.06.2025).
  8. Авторское право ‑ личные неимущественные и имущественные права автора [Электронный ресурс]. GOV.KZ. — Режим доступа: URL: https://www.gov.kz/memleket/entities/pavlodar-zhelezinka/press/news/details/93079?lang=ru  (дата обращения: 28.06.2025). :content Reference[oaicite:0]{index=0}
  9. Guadamuz A. A Scanner Darkly: Copyright Liability and Exceptions in Artificial Intelligence Inputs and Outputs // GRUR International. 2024. Vol. 73. P. 111–125 [Электронный ресурс]. — Режим доступа: URL: https://sussex.figshare.com/articles/journal_contribution/A_scanner_darkly_copyright_liability_and_exceptions_in_artificial_intelligence_inputs_and_outputs/24805578?file=44210750 (дата обращения: 12.07.2025).
  10. Kadrey et al. v Meta Platforms, Inc, Case No 3:23-cv-03417-VC-TSH, Letter re Crime-Fraud Exception (20 December 2024) // Chat GPT Is Eating the World. — Режим доступа: URL: https://chatgptiseatingtheworld.com/wp-content/uploads/2024/12/Letter-re-Crime-Fraud-Exception-Dec-20-2024.pdf  — Дата доступа: 20.07.2025.
  11. Copyright Act 1976 (US), s 107, Fair use factors and provision for unpublished works // U.S. Copyright Office. — Режим доступа: URL: https://www.copyright.gov/title17/92chap1.html#107 — Дата доступа: 20.07.2025.
  12. Обучение // Википедия: свободная энциклопедия [Электронный ресурс]. — Режим доступа: URL: https://ru.wikipedia.org/wiki/Обучение  (дата обращения: 20.07.2025).
  13. Kadrey et al. v Meta Platforms, Inc, Case No 3:23-cv-03417-VC, Unredacted Reply of Plaintiffs (8 January 2025) // Chat GPT Is Eating the World. — Режим доступа: URL: https://chatgptiseatingtheworld.com/wp-content/uploads/2025/01/Unredacted-Reply-of-Plaintiffs-1.pdf. — Дата обращения: 20.07.2025.
  14. Wired. Meta Wins Blockbuster AI Copyright Case—but There’s a Catch, 25 June 2025. URL: https://www.wired.com/story/meta-scores-victory-ai-copyright-case/ (дата обращения: 27 июля 2025).
  15. Bartz files First Amended Complaint v Anthropic (Chat GPT Is Eating the World, 6 December 2024) [Электронный ресурс]. — Режим доступа: URL: https://chatgptiseatingtheworld.com/2024/12/06/bartz-files-first-amended-complaint-v-anthropic/ (дата обращения: 26.07.2025).
  16. Gao L., et al. The Pile: An 800GB Dataset of Diverse Text for Language Modeling (arXiv preprint 2020) arXiv:2101.00027 [Электронный ресурс]. — Режим доступа: URL: https://arxiv.org/abs/2101.00027 (дата обращения: 10.08.2025).
  17. Presser, S. Tweet by Shawn Presser (@theshawwn) // X. 4 Aug. 2025. URL: https://x.com/theshawwn/status/1320282149329784833?lang=en  (дата обращения: 10.08.2025).
  18. Gao, L., et al. The Pile // arXiv preprint. 2020. URL: https://arxiv.org/abs/2101.00027 (дата обращения: 10.08.2025).
  19. Defendant Anthropic PBC. Notice of Motion and Motion for Summary Judgment. 27 Mar. 2025. URL: https://chatgptiseatingtheworld.com/wp-content/uploads/2025/03/Anthropics-Motion-for-SJ-on-Fair-Use-in-Bartz-v.-Anthropic-Mar-27-2025.pdf (дата обращения: 10.08.2025).
  20. Bartz v. Anthropic PBC. Case No. 3:24-CV-05417-WHA. Judge Alsup order on fair use and infringement. 23 Jun. 2025. URL: https://chatgptiseatingtheworld.com/wp-content/uploads/2025/06/Judge-Alsup-order-on-fair-use-and-infringement-Jun-23-2025.pdf (дата обращения: 12.08.2025).
  21. Bartz v. Anthropic PBC. Stipulation and [Proposed] Order re Stay. 26 Aug. 2025. URL: https://chatgptiseatingtheworld.com/2025/08/26/Bartz-v-Anthropic-SETTLMENT-Aug-26-2025.pdf (дата обращения: 27.08.2025).
Информация об авторах

магистр юрид. наук, юрист, Республика Казахстан, г. Алматы

Master of Legal Sciences, Lawyer, Republic of Kazakhstan, Almaty

Журнал зарегистрирован Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор), регистрационный номер ЭЛ №ФС77-54432 от 17.06.2013
Учредитель журнала - ООО «МЦНО»
Главный редактор - Гайфуллина Марина Михайловна.
Top