канд. филол. наук, преподаватель, Государственный университет Кербала, Ирак, г. Кербала
ЭВОЛЮЦИЯ РУССКОГО ЯЗЫКА В ЦИФРОВОЙ СРЕДЕ: КОРПУСНЫЙ АНАЛИЗ
АННОТАЦИЯ
Целью настоящего исследования, является систематический обзор современных исследований, посвященных трансформации русского языка под влиянием цифровых технологий с применением корпусных методов анализа. В рамках настоящего исследования, автором рассматриваются основные направления изменений русского языка в интернет-коммуникации, социальных сетях и мессенджерах на основе данных национальных и специализированных корпусов. Основные результаты проведенного исследования показывают, что цифровая среда катализирует процессы языковой вариативности, способствует формированию новых жанров интернет-дискурса и влияет на орфографические, лексические и синтаксические нормы современного русского языка. Выводы, полученные автором в процессе работы, свидетельствуют о необходимости дальнейшего развития корпусных инструментов для мониторинга языковых изменений в цифровом пространстве и создания специализированных корпусов интернет-текстов.
ABSTRACT
The aim of this study is to conduct a systematic review of contemporary research on the transformation of the Russian language under the influence of digital technologies, employing corpus-based analytical methods. The study examines the key directions of linguistic change in online communication, social networks, and messaging platforms, drawing on data from national and specialized corpora. The findings indicate that the digital environment accelerates linguistic variability, fosters the emergence of new genres of online discourse, and affects the orthographic, lexical, and syntactic norms of modern Russian. The conclusions highlight the need for further development of corpus-based tools to monitor linguistic change in the digital sphere and for the creation of specialized corpora of online texts.
Ключевые слова: корпусная лингвистика, русский язык, цифровая коммуникация, интернет-дискурс, языковая вариативность, национальный корпус русского языка, социальные сети, языковые изменения.
Keywords: corpus linguistics, Russian language, digital communication, Internet discourse, linguistic variability, Russian National Corpus, social networks, linguistic change.
Введение
Стремительное развитие информационных технологий в последние два десятилетия, безусловно, оказало беспрецедентное влияние на все сферы человеческой деятельности, и язык как основное средство коммуникации не стал исключением. Цифровая среда создала принципиально новые условия для функционирования русского языка, что, в свою очередь, требует пристального внимания исследователей и разработки адекватных методов анализа происходящих изменений. Актуальность данного исследования, по мнению автора, обусловлена необходимостью систематизации накопленных знаний о трансформации русского языка в цифровом пространстве и оценки возможностей корпусных методов для изучения этих процессов.
Следует отметить, что интерес лингвистов к языку интернет-коммуникации проявился уже в начале 2000-х годов. Пионерские работы Н.Д. Голева и М.Ю. Сидоровой заложили основы изучения русского языка в электронной среде [6; 36]. Впоследствии исследования Е.И. Горошко, Л.Ю. Щипициной и О.В. Лутовиновой существенно расширили понимание специфики интернет-дискурса и его влияния на языковую систему [7; 26; 40]. Особенно важными представляются работы, посвященные корпусному подходу к изучению интернет-текстов, среди которых необходимо выделить исследования В.П. Захарова и М.В. Копотева [13; 21].
Теоретическую базу настоящего исследования составляют труды ведущих специалистов в области корпусной лингвистики, таких как А.Н. Баранов, В.П. Захаров, О.Ю. Крючкова [3; 25], а также работы по цифровой лингвистике и интернет-коммуникации Е.И. Горошко, Н.А. Ахреновой, Г.Н. Трофимовой [10; 37]. Методологические аспекты корпусного анализа рассмотрены в фундаментальных работах зарубежных исследователей Т. МакЭнери и Э. Харди, а также в исследованиях российских ученых, работающих над Национальным корпусом русского языка [32; 41].
Целью данного исследования является комплексный анализ современного состояния изучения эволюции русского языка в цифровой среде с использованием корпусных методов и выявление основных тенденций, проблем и перспектив в этой области.
Научная новизна исследования заключается в систематизации и критическом осмыслении разнородных данных о трансформации русского языка в цифровом пространстве, полученных с использованием корпусных методов.
Теоретическая значимость работы состоит в обобщении и систематизации автором теоретико-методологических подходов к изучению русского языка в цифровой среде, что создает основу для дальнейших исследований в этой области. Практическая значимость определяется возможностью использования полученных автором результатов обзора, при разработке новых корпусных ресурсов, создании учебных курсов по цифровой лингвистике, а также при формировании рекомендаций по языковой политике в цифровом пространстве.
Материалы и методы исследования
Материалом для настоящего обзорного исследования послужили научные публикации отечественных авторов, посвященные корпусному анализу русского языка в цифровой среде. Всего автором было проанализировано более сорока научных работ, включающих монографии, статьи в рецензируемых журналах, материалы конференций и диссертационные исследования. Отбор источников осуществлялся на основе поиска в научных базах данных eLIBRARY.ru, Cyberleninka, а также в специализированных лингвистических журналах, входящих в перечень ВАК и РИНЦ.
Методологическую основу авторского исследования составил комплексный подход, включающий описательный, сравнительно-сопоставительный и аналитический методы.
Результаты и обсуждение
Анализ научной литературы показывает, что корпусные исследования русского языка в цифровой среде развиваются по нескольким основным направлениям, каждое из которых характеризуется специфическими методами и результатами. Прежде всего, необходимо отметить значительный прогресс в создании специализированных корпусов интернет-текстов. Национальный корпус русского языка, как показывают исследования В.А. Плунгяна и В.П. Захарова, постепенно расширяет свои возможности за счет включения текстов из цифровых источников, хотя их доля пока остается относительно небольшой [14; 32].
Особый интерес представляют специализированные корпусы, ориентированные исключительно на интернет-коммуникацию. Работы Е.И. Горошко и Е.А. Поповой демонстрируют, что создание таких корпусов сопряжено с рядом методологических сложностей, связанных с быстрым устареванием данных, необходимостью учета мультимодальности интернет-текстов и проблемами автоматической разметки нестандартных языковых явлений [8; 33]. Тем не менее, как отмечается в исследовании М.А. Кронгауза и его коллег, даже небольшие специализированные корпусы позволяют выявить важные тенденции в развитии языка цифровой коммуникации [22].
Анализ лексических изменений в цифровой среде представляет собой одно из наиболее активно развивающихся направлений корпусных исследований. Работы Е.В. Какориной и Л.П. Крысина показывают, что интернет-коммуникация характеризуется интенсивным процессом неологизации, причем значительная часть новых слов формируется на базе заимствований из английского языка [16; 23]. Корпусный анализ позволяет отследить динамику вхождения новых лексем в активное употребление и их дальнейшую судьбу. Интересно, что, согласно данным исследования Н.В. Козловской, многие интернет-неологизмы демонстрируют высокую частотность в цифровой среде, но редко проникают в традиционные письменные тексты [20].
Орфографические изменения в цифровой коммуникации также привлекают внимание исследователей. Работы Н.Д. Голева и его учеников демонстрируют, что интернет-среда характеризуется значительной орфографической вариативностью, которая во многих случаях носит не случайный, а функциональный характер [5]. Корпусные данные позволяют выявить устойчивые паттерны орфографических девиаций, многие из которых, как показывает исследование О.В. Дедовой, служат средством выражения эмоций или маркерами принадлежности к определенным интернет-сообществам [11].
Синтаксические особенности цифровой коммуникации исследованы в меньшей степени, однако существующие работы демонстрируют значительные отличия синтаксиса интернет-текстов от традиционной письменной речи. Исследование Л.Ю. Щипициной показывает, что для интернет-коммуникации характерна тенденция к синтаксическому упрощению, увеличению доли неполных и парцеллированных конструкций [39]. Вместе с тем, как отмечает Г.Н. Трофимова, в некоторых жанрах цифровой коммуникации, напротив, наблюдается усложнение синтаксических структур за счет использования гипертекстовых связей [37].
Важным направлением корпусных исследований является анализ жанровой специфики языка цифровой среды. Работы О.В. Лутовиновой и Н.А. Ахреновой демонстрируют, что различные платформы и типы интернет-коммуникации характеризуются специфическими языковыми особенностями [2; 27]. Корпусный анализ позволяет выявить эти различия на количественном уровне и проследить динамику развития отдельных жанров. Особенно интересными представляются исследования языка социальных сетей, которые показывают формирование специфических дискурсивных практик в рамках каждой платформы.
Сравнительный анализ различных типов корпусов и их эффективности для изучения языка цифровой среды представлен в таблице 1, которая систематизирует основные характеристики существующих корпусных ресурсов на основе данных рассмотренных исследований.
Таблица 1.
Сравнительная характеристика корпусов для изучения русского языка в цифровой среде
|
Тип корпуса |
Объем (млн словоупотреблений) |
Основные источники |
|
Национальный корпус РЯ (интернет-подкорпус) |
Около 200 |
Новостные сайты, блоги, форумы |
|
Специализированные корпусы соцсетей |
50-100 |
ВКонтакте, Twitter, Facebook |
|
Корпусы интернет-комментариев |
30-80 |
Комментарии к новостям, блогам |
|
Корпусы мессенджеров |
20-50 |
Telegram, WhatsApp (анонимизированные) |
Методологические проблемы корпусного анализа цифровых текстов заслуживают особого внимания. Как справедливо отмечают В.П. Захаров и А.Н. Баранов, традиционные корпусные методы не всегда адекватны для анализа интернет-коммуникации [4; 13]. Во-первых, существует проблема репрезентативности: цифровая среда настолько обширна и разнообразна, что создание действительно представительного корпуса представляется практически невозможным. Во-вторых, динамичность интернет-коммуникации приводит к быстрому устареванию собранных данных. В-третьих, мультимодальность многих интернет-текстов требует разработки новых методов анализа, учитывающих взаимодействие вербальных и невербальных компонентов.
Исследования последних лет демонстрируют попытки преодоления этих методологических проблем. Работа И.В. Ягунковой и Л.Н. Иорданской показывает перспективность использования методов машинного обучения для автоматической разметки интернет-текстов [31]. Исследование А.С. Романова и его коллег демонстрирует возможности применения нейросетевых технологий для анализа семантики интернет-дискурса [29]. Однако, как отмечается в работе Е.В. Рахилиной, полностью автоматизированный анализ пока не может заменить экспертную оценку, особенно при изучении тонких семантических и прагматических аспектов языка цифровой коммуникации [34].
Отдельного внимания заслуживает вопрос о влиянии цифровой среды на языковую норму. Исследования Л.П. Крысина и М.А. Кронгауза показывают, что интернет-коммуникация способствует размыванию традиционных представлений о языковой норме [22; 34]. Корпусные данные демонстрируют, что многие явления, традиционно считавшиеся ошибочными, приобретают в цифровой среде статус вариантов нормы. Вместе с тем, как подчеркивает О.И. Северская, не следует преувеличивать деструктивное влияние интернета на языковую систему: многие инновации остаются ограниченными рамками цифровой коммуникации и не проникают в другие сферы функционирования языка [35].
Социолингвистический аспект корпусных исследований цифровой коммуникации представлен в работах Е.А. Земской и Н.Б. Мечковской [15; 28]. Анализ корпусных данных позволяет выявить социально обусловленные различия в языке цифровой коммуникации, связанные с возрастом, образованием, региональной принадлежностью пользователей. Особенно интересными представляются исследования молодежного сленга в интернете, которые показывают высокую скорость обновления лексического состава и значительную вариативность употребления.
Прагматические аспекты интернет-коммуникации исследованы в работах Н.Д. Арутюновой и Е.В. Падучевой [1; 30]. Корпусный анализ позволяет выявить специфические стратегии речевого поведения в цифровой среде, особенности выражения вежливости, агрессии, иронии. Важно отметить, что прагматическая интерпретация корпусных данных требует учета широкого контекста, включая особенности коммуникативной ситуации и характеристики участников общения.
Динамика языковых изменений в цифровой среде представлена в таблице 2, которая систематизирует основные тенденции, выявленные в рассмотренных исследованиях.
Таблица 2.
Основные тенденции языковых изменений в цифровой среде по данным корпусных исследований
|
Уровень языка |
Основные тенденции |
Степень проникновения в общелитературный язык |
|
Фонетико-графический |
Активное использование транслитерации, графических эмоджи, нестандартной орфографии |
Низкая (ограничено цифровой средой) |
|
Лексический |
Интенсивная неологизация, заимствования, семантические сдвиги |
Средняя (проникновение отдельных лексем) |
|
Морфологический |
Активное словообразование, гибридные формы |
Низкая |
|
Синтаксический |
Упрощение конструкций, парцелляция, эллипсис |
Средняя (влияние на разговорную речь) |
|
Прагматический |
Новые стратегии вежливости, изменение норм речевого этикета |
Высокая (влияние на общую культуру общения) |
Перспективы развития корпусных исследований русского языка в цифровой среде связаны, прежде всего, с совершенствованием технологий сбора и обработки данных. Работы в области автоматической обработки естественного языка, такие как исследования И.М. Кобозевой и А.Е. Кибрика, показывают возможности использования современных компьютерных технологий для создания более совершенных корпусных инструментов [18; 19]. Особенно перспективным представляется развитие динамических корпусов, способных отслеживать языковые изменения в реальном времени.
Междисциплинарный характер исследований языка цифровой среды требует интеграции лингвистических методов с подходами, разработанными в рамках компьютерных наук, социологии, психологии. Работы на стыке этих дисциплин, такие как исследования Горошко Е.И., и В.Б. Касевича, демонстрируют продуктивность такого синтеза [9; 17]. Корпусная лингвистика в этом контексте выступает как методологическая основа, обеспечивающая эмпирическую базу для междисциплинарных исследований.
Выводы
Проведенный в рамках настоящей статьи обзор научных трудов, а так же статей современных отечественных исследователей, посвященных эволюции русского языка в цифровой среде с использованием корпусных методов, позволяет сделать несколько важных выводов. Прежде всего, необходимо отметить, что корпусный подход доказал свою эффективность как инструмент изучения языковых изменений в цифровой коммуникации, обеспечивая возможность количественного анализа больших объемов данных и выявления статистически значимых тенденций. Так же в процессе исследования было установлено, что, цифровая среда действительно оказывает существенное влияние на все уровни языковой системы, причем наиболее значительные изменения наблюдаются на лексическом и прагматическом уровнях.
Вместе с тем, проведенный автором настоящего исследования анализ литературы и трудов современных отечественных исследователей, выявил ряд методологических проблем, требующих решения. К ним относятся: вопросы репрезентативности корпусов интернет-текстов, разработки адекватных методов разметки нестандартных языковых явлений, учета мультимодальности цифровой коммуникации. По мнению автора, необходимо также отметить недостаточную изученность некоторых аспектов языка цифровой среды, в частности, синтаксических изменений и региональной вариативности интернет-коммуникации.
Список литературы:
- Арутюнова Н.Д. Язык и мир человека. — 2-е изд., испр. — М.: Языки русской культуры, 1999. — 911 с.
- Ахренова, Н. А. Интернет-дискурс как глобальное межкультурное явление и его языковое оформление : специальность 10.02.19 "Теория языка" : автореф. дис. … д-ра филол. наук. — Москва, 2009. — 35 с.
- Баранов А.Н. Введение в прикладную лингвистику : учеб. пособие. —2-е изд., испр. — М.: Едиториал УРСС, 2009. — 368 с.
- Баранов А.Н. Корпусная лингвистика // Введение в прикладную лингвистику. — Изд. 3-е. М., 2007. — С. 112–137.
- Голев Н.Д., Ким Л.Г. Диктумно-модусный плюрализм виртуального диалогического дискурса (на материале интернет-комментариев) // Медиалингвистика. — 2023. — Т. 10. — № 1. — С. 4–26.
- Голев Н.Д. Электронная переписка как стратегия и тактика обучения иностранным языкам (лингводидактический проект) // Язык и культура. — 2015. — № 2 (30). — С. 105–116.
- Горошко Е.И. Интернет-жанр и функционирование языка в Интернете: попытка рефлексии // Жанры речи. — Саратов: Изд. центр «Наука», 2009. — Вып. 6 «Жанр и язык». — С. 11–27.
- Горошко Е.И. Информационно-коммуникативное общество в гендерном измерении: монография. – Харьков: «ФЛП Либуркина Л. М.», 2009. — 816 с.
- Горошко Е.И., Полякова Т.Л. Интернет-коммуникация как новая речевая формация. — М.: ФЛИНТА, Наука, 2012. — 328 с.
- Горошко Е.И., Полякова Т.Л. К построению типологии жанров социальных медий // Жанры речи. — 2015. — № 2 (12). — С. 119–127.
- Дедова О.В. Графическая неоднородность как категория гипертекста // Вестн. Моск. ун-та. Сер. 9, Филология. — 2002. — М.: МГУ. — № 6. — С. 91–103.
- Захаров В.П. Корпусная лингвистика: учеб.-метод. пособие. – СПб., 2005. — 48 с.
- Захаров В.П., Богданова С.Ю. Корпусная лингвистика: учеб. 3-е изд., перераб. — СПб.: Изд-во С.-Петерб. ун-та, 2020. — 234 с.
- Захаров В.П., Хохлова М.В. Анализ эффективности статистических методов выявления коллокаций в текстах на русском языке // Компьютерная лингвистика и интеллектуальные технологии. — 2010. — № 9 (16). — С. 137–143.
- Земская Е.А. Активные процессы современного словопроизводства // Русский язык конца ХХ столетия (1985–1995) / ответственный редактор Е.А. Земская. – 2-е издание. — Москва, 2000. — С. 90–141.
- Какорина Е.В. Язык интернет-коммуникации // Современный русский язык : система-норма-узус / отв. ред. Л. П. Крысин; Российская академия наук, Институт русского языка им. В.В. Виноградова. — М.: Изд-во "Языки славянских культур", 2010. — С. 273–340.
- Касевич В.Б. Труды по языкознанию / под ред. Ю. А. Клейнера. — В 2 т. — Т.1. — СПб.: Филологический факультет СПбГУ, 2006. — 663 с.
- Кибрик А.Е. Константы и переменные языка. — СПб.: Алетейя, 2003. — 720 с.
- Кобозева И.М. Лингвистическая семантика. — М.: Эдиториал УРСС, 2000. — 352 с.
- Козловская Н.В., Павлова А.С. К проблеме адаптации лексемы инстаграм и ее производных в современном русском языке // Вестник Череповецкого государственного университета. — 2022. — № 3 (108). — С. 173–184.
- Копотев М. В. Введение в корпусную лингвистику. – Прага: Animedia Company, 2014. — 231 с.
- Кронгауз М. Самоучитель албанского языка. — М.: АСТ: CORPUS, 2013. — 416 с.
- Крысин Л.П. Слово в современных текстах и словарях : очерки о русской лексике и лексикографии. — М.: Знак, 2008. — 318 с.
- Крысин Л.П. Современный русский язык. Лексическая семантика. Лексикология. Фразеология. Лексикография. — М.: Академия, 2007. — 240 с.
- Крючкова О.Ю. Корпусная лингвистика : учеб. для студентов гуманитарных вузов. — Иркутск : ИГЛУ, 2011. — 161 с.
- Лутовинова О.В. Лингвокультурологические характеристики виртуально го дискурса. — Волгоград: Изд-во ВГПУ «Перемена», 2009. — 476 с.
- Лутовинова О.В. Языковая личность в виртуальном дискурсе: дис. … канд. филол. наук: 10.02.19 / Теория языка. Волгоград. 2013. — 437 с.
- Мечковская Н.Б. История языка и история коммуникации: от клинописи до Интернета: курс лекций по общему языкознанию. — М. : Флинта : Наука, 2009. — 584 с.
- Мещеряков Р.В., Романов А.С. Идентификация автора текста с помощью аппарата опорных векторов в случае двух возможных альтернатив // Компьютерная лингвистика и интеллектуальные технологии. — Бекасово: Российский государственный гуманитарный университет, 2009. — С. 432–437.
- Падучева Е.В. Высказывание и его соотнесенность с действительностью: (Референциальные аспекты семантики местоимений) / Отв. ред. В. А. Успенский. — Москва : Наука, 1985. — 270 с.
- Пивоварова Л.М., Ягунова Е.В. От коллокаций к конструкциям // Acta Linguistica Petropolitana. Труды института лингвистических исследований. —2014. — Т. 10. — № 2. — С. 568–617.
- Плунгян В.А. Корпус как инструмент и как идеология: о некоторых уроках современной корпусной лингвистики // Русский язык в научном освещении. — № 16(2). — 2008. – С. 7–20.
- Попова Е.А. Человек как основополагающая величина современного языкознания // НДВШ Филологические науки. — 2002. — № 3. — С. 69–77.
- Рахилина Е.В. Когнитивная семантика: История. Персоналии. Идеи. Результаты // Семиотика и информатика. — 1998. — 49 с.
- Северская О.И. Язык поэтической школы: социолект, идиолект, идиостиль. — М.: Словари.ру, Институт русского языка им. В.В. Виноградова РАН, 2007. — 126 с.
- Сидорова М.Ю., Шувалова О.Н. Интернет-лингвистика: вымышленные языки. — М.: Изд-во «1989.ру», 2006. —184 с.
- Трофимова Г.Н. Языковой вкус интернет-эпохи в России. Функционирование русского языка в Интернете. Концептуально-сущностные доминанты : монография. — М.: Российский университет дружбы народов, 2009. — 40 c.
- Трофимова Г.Н., Барабаш В.В. Языковое послевкусие интернет-эпохи в России: эффект бумеранга (актуальные процессы в русскоязычной цифровой медиакоммуникации) : монография. — М.: РУДН, 2020. — 273 с.
- Щипицина Л.Ю. Жанры компьютерно-опосредованной коммуникации / Л.Ю. Щипицина. — Архангельск: Поморский университет, 2009. — 238 с.
- Щипицина Л.Ю. Компьютерно-опосредованная коммуникация. Лингвистический аспект анализа : монография. — М.: КРАСАНД, 2010. — 296 с.
- McEnery T., Hardie A. Corpus Linguistics: Method, Theory and Practice. —Cambridge: Cambridge University Press, 2012. — 294 p.