Animait Inc., CPO, Грузия, г. Тбилиси
ПРИМЕНЕНИЕ ГРАФОВЫХ НЕЙРОННЫХ СЕТЕЙ В АНАЛИЗЕ РЕКОМЕНДАЦИЙ В СОЦИАЛЬНЫХ СЕТЯХ
АННОТАЦИЯ
В данной статье рассмотрены теоретические основы и практические аспекты применения графовых нейронных сетей (Graph Neural Networks, GNN) для анализа рекомендаций в социальных сетях. Показано, что моделирование структуры данных в формате «пользователь–пользователь» и «пользователь–товар» на базе GNN позволяет учесть социальное влияние и общность интересов, что существенно улучшает метрики качества (точность, полнота, NDCG и др.) по сравнению с традиционными методами. Анализируются основные архитектуры GNN (Graph Convolutional Networks, Graph Attention Networks и их производные), описаны подходы к формированию графа и выбору функции потерь (MSE, BPR, CE), а также обсуждаются проблемы разреженности данных, вычислительной сложности и многослойных структур. Особое внимание уделено вопросам масштабируемости, использованию облегчённых свёрток (LightGCN), негативной выборки и перспективам внедрения гиперграфов и временных моделей. Систематическое исследование современных работ и собственные обобщения подтверждают высокую эффективность GNN для динамичных социальных рекомендаций, где важно одновременно учитывать индивидуальные и групповые предпочтения.
ABSTRACT
This article explores the theoretical foundations and practical aspects of applying Graph Neural Networks (GNNs) to the analysis of recommendations in social networks. It demonstrates that modeling data structures in the “user–user” and “user–item” formats using GNNs allows for the incorporation of social influence and shared interests, which significantly improves quality metrics (such as precision, recall, and NDCG) compared to traditional methods. The main GNN architectures (Graph Convolutional Networks, Graph Attention Networks, and their derivatives) are analyzed, along with approaches to graph construction and loss function selection (MSE, BPR, CE). The article also discusses challenges such as data sparsity, computational complexity, and multilayer architectures. Special attention is given to issues of scalability, the use of lightweight convolutions (LightGCN), negative sampling, and the potential implementation of hypergraphs and temporal models. A systematic review of recent research and original generalizations confirms the high effectiveness of GNNs in dynamic social recommendations, where it is crucial to account for both individual and group preferences.
Ключевые слова: графовые нейронные сети; социальные рекомендации; GCN; GAT; разреженные данные; функции потерь; масштабируемость; гиперграфы; мультиплексные связи.
Keywords: graph neural networks; social recommendations; GCN; GAT; sparse data; loss functions; scalability; hypergraphs; multiplex links.
Введение
В современных условиях развития социальных медиа и онлайн-платформ возрастает потребность в системах рекомендаций, которые учитывают не только индивидуальные предпочтения, но и социальные связи пользователей [13]. Речь идёт о том, что в традиционной постановке задачи рекомендации система анализирует историю взаимодействий «пользователь–товар» (user–item), однако социальные связи (user–user), отражающие дружбу, подписки или иные формы взаимодействия, нередко оказываются дополнительным источником ценной информации [3, 6]. Учёт таких связей позволяет выявить паттерны похожести (homophily) и социального влияния (social influence), что в совокупности приводит к более точным и релевантным рекомендациям [12]. В последние годы значительный интерес вызывает применение графовых нейронных сетей (Graph Neural Networks, GNN) к задачам социального рекомендательного сервиса, поскольку GNN эффективно обрабатывают структуры данных в виде графов и позволяют учитывать не только сам факт взаимодействий, но и сложную топологию отношений [10].
Основная задача в области социальных рекомендаций — повышение качества предлагаемых пользователю объектов (товаров, контента, друзей и т.д.) путём моделирования структурных связей в графе «пользователи–пользователи–товары» [13]. Традиционные методы, в первую очередь матричная факторизация (matrix factorization), дают высокий базовый уровень точности, но имеют ограничения при наличии разреженных данных или при необходимости учитывать разнородные социальные факторы [3]. Альтернативные подходы, основанные на глубоком обучении, например, автоэнкодеры или рекуррентные сети, позволяют частично улучшить результаты, но всё ещё сталкиваются с проблемами при моделировании сложных сетевых структур [7, 8]. В этом контексте GNN становятся всё более популярными благодаря способности эффективно агрегировать признаки вершин и рёбер в рамках многослойной архитектуры, учитывая, как локальные, так и глобальные взаимосвязи [1].
Настоящая работа выстроена следующим образом. Сначала даётся общий обзор концепции графовых нейронных сетей в прикладной задаче рекомендаций [12], включая основные архитектуры GCN и GAT [10]. Далее обсуждаются особенности проектирования и обучения GNN-моделей для анализа рекомендаций в социальных сетях, а также приводятся результаты сравнений с традиционными методами [5, 6]. В завершение формулируются итоги и обозначаются перспективные направления развития, связанные с масштабированием, гетерогенными гиперграфами и улучшением интерпретируемости рекомендаций [11].
Материалы и методы
Задача рекомендаций в социальных сетях (social recommender systems) тесно связана с тем, как данные пользователей и объекты (товары, контент) представлены на уровне структур «пользователь–пользователь» и «пользователь–товар» [6, 13]. В отличие от классического сценария, когда в модели включаются только факты взаимодействия пользователя с предметом рекомендации, в социальной среде дополнительно учитываются связи между самими пользователями. Такие связи могут отражать дружбу, подписку, соавторство, участие в одних и тех же группах — всё это формирует обширный граф, позволяющий глубже понять закономерности поведения, социальное влияние и общность интересов [3, 12]. Кроме того, помимо структуры самого графа, зачастую учитываются временные метки взаимодействий (например, порядковые или метки времени в секундах), контекст (геолокация, платформа доступности) и иные дополнительные атрибуты, что позволяет повысить точность предсказания интереса к объектам [1, 10]. Таким образом, социальные рекомендации трактуются как задача нахождения скрытых закономерностей в мультиграфе, чьи вершины — это пользователи и объекты, а рёбра описывают различные типы взаимодействий.
Основные архитектуры gnn для рекомендаций нередко берут за основу две наиболее распространённые парадигмы — Graph Convolutional Networks (GCN) и Graph Attention Networks (GAT).
- GCN (Graph Convolutional Networks). Изначально GCN были предложены для решения задач классификации узлов и регрессии на графах [4], но затем нашли широкое применение и в рекомендационных системах. Суть метода — в агрегировании информации о соседях вершины путём «свертки» их признаков с весами, зависящими от структуры графа [12]. При этом в классических GCN используется нормализованная матрица смежности, помогающая избежать «взрыва» значений при суммировании вклада множества соседей [1]. В контексте социального рекомендательного сервиса GCN позволяют одновременно учитывать пользовательские рейтинги и социальные связи, повышая точность путём улавливания скрытых взаимосвязей [6]. Однако при слишком большом числе слоёв может возникать проблема «сглаживания» (over-smoothing), когда все вершины в итоге приобретают слишком похожие векторные представления [13].
- GAT (Graph Attention Networks). В отличие от GCN, где веса соседей жёстко задаются нормировкой по степени вершин, механизмы внимания (attention) в GAT позволяют «выделять» наиболее значимых соседей, динамически обучая соответствующие коэффициенты [14]. Такое внимание особенно полезно в социальных сетях, где у некоторых пользователей может быть тысячная аудитория, но реально важны лишь отдельные связи [12]. Модель GAT способствует селекции наиболее релевантных дружеских отношений или отзывов, подавляя вклад шумных или слабо связанных узлов [3].
- Упоминание других вариантов. Помимо GCN и GAT, целый ряд производных или альтернативных архитектур могут находить применение в социальных рекомендациях [12]:
– LightGCN — упрощённая версия GCN, исключающая нелинейные слои и сохраняющая лишь ключевую идею агрегирования соседей для уменьшения вычислительной нагрузки [2];
– HyperGNN — подход, учитывающий гиперграфы (групповое взаимодействие в одном ребре), что актуально для сообществ и совместного потребления контента;
– GRNN (Graph Recurrent Neural Networks) — интеграция рекуррентных механизмов (LSTM или GRU) с графовым представлением, что помогает моделировать временные аспекты или сессии пользователей [12].
Ниже приведена таблица 1, кратко иллюстрирующая ключевые свойства названных архитектур в контексте социальных рекомендаций.
Таблица 1.
Сравнительные характеристики некоторых GNN-архитектур
|
Модель |
Ключевая идея |
Преимущества |
Ограничения |
|
GCN |
Свертка признаков по матрице смежности |
Хорошо формализованная агрегация соседей, умеренная сложность |
Риск over-smoothing при увеличении числа слоёв |
|
GAT |
Механизм внимания, вес соседей обучается |
Избирательность по важным соседям, гибкость |
Повышенная вычислительная цена (параметров больше, чем в GCN) |
|
LightGCN |
Упрощённые слои свертки без нелинейности |
Быстрота и хорошая масштабируемость |
Меньшая выразительная сила из-за отсутствия нелинейной трансформации |
|
HyperGNN |
Использование гиперграфов для учёта групповых взаимодействий |
Естественное моделирование коллективных отношений (например, групп пользователей) |
Требует расширенной структуры данных, сложнее в реализации |
|
GRNN |
Комбинация рекуррентных слоёв с графовыми операциями |
Учитывает временную компоненту, что важно для анализа сессий и исторической динамики |
Вероятность переобучения и возрастание вычислительной сложности |
Ключевые проблемы и вызовы при использовании GNN в социальном рекомендационном сценарии охватывают как вопросы, связанные с разреженностью данных (низким процентом реально существующих связей «пользователь–товар» или «пользователь–пользователь»), так и вычислительную сложность при масштабировании на миллионы пользователей [12]. Помимо этого, значимым фактором становится уже упомянутая проблема over-smoothing, когда при увеличении числа слоёв нейронной сети признаки соседей «сливаются» и узлы теряют индивидуальные особенности [13]. Дополнительную сложность создаёт гетерогенность отношений: один и тот же пользователь может состоять в нескольких группах, иметь разные типы связей (подписка, личные сообщения, совместное мероприятие), а объекты — принадлежать разным категориям. Такие случаи требуют надёжных механизмов агрегации (HyperGNN, Heterogeneous GNN и др.), способных учитывать многотипные ребра и атрибуты [10]. В реальных системах нередко приходится комбинировать несколько подходов, например использовать LightGCN на ранних стадиях (ради эффективности), а затем дообучать более точные модели (GAT или HyperGNN) на подвыборке ключевых узлов, что помогает достичь оптимального баланса между качеством рекомендаций и затратами ресурсов.
Результаты и обсуждение
Задача применения графовых нейронных сетей к социальным рекомендациям требует согласованного проектирования структуры данных, алгоритма обучения и механизмов оценки качества. Рассмотрим основные этапы: формирование графа, выбор функции потерь и способа регуляризации, интерпретацию результатов, а также анализ производительности и масштабирования [10, 12].
Проектирование модели начинается с формирования входного графа, где вершины соответствуют пользователям и товарам (или иным единицам контента), а рёбра представляют социальные связи и взаимодействия «пользователь–товар» [6, 13]. Социальные связи могут фиксировать дружбу, подписку, совместное участие в группах, тогда как взаимодействия пользователя с товаром — просмотр, покупка, лайк и пр. Поскольку каждый пользователь может иметь многократные типы связей, модель обычно выделяет несколько матриц смежности или создаёт единый мультиграф с помеченными рёбрами. Важно отметить, что атрибуты вершин (например, демографические данные пользователя, метаданные товара) и временные метки при необходимости добавляются в качестве дополнительных признаков при инициализации или на этапах свёртки [3].
После определения структуры графа следует алгоритм обучения, где ключевой момент — выбор и комбинирование функций потерь [12]. Наиболее распространённые варианты:
- MSE (Mean Squared Error) — подходит при наличии явных рейтингов (например, пятибалльная шкала).
- BPR (Bayesian Personalized Ranking) — широко используется в задачах ранжирования, где важно определить, какие товары пользователь предпочтёт из набора [9].
- CE (Cross-Entropy) — обычно применяют, если взаимодействие рассматривается как бинарное событие (купил/не купил, кликнул/не кликнул).
Нередко также добавляют регуляризующие слагаемые, чтобы контролировать сложность модели и избегать переобучения [6]. Рассмотрим формальные записи двух популярных функций потерь:
/Fonarev.files/image001.png)
где
— множество взаимодействий,
— множество позиций, с которыми пользователь
уже взаимодействовал,
и
— истинный и предсказанный рейтинг соответственно, а σ(⋅) обозначает сигмоиду.
Ниже приведена таблица 2, показывающая краткое сопоставление ключевых функций потерь и их типичных сценариев использования.
Таблица 2.
Сравнение основных функций потерь в GNN для рекомендаций [3, 6, 9, 12, 13]
|
Функция |
Ориентация |
Особенности |
|
MSE |
Обучение на явных рейтингах |
Удобно при наличии шкалы (1–5 и т.п.), можно легко интерпретировать ошибку |
|
BPR |
Ранжирование (Implicit Feedback) |
Сравнивает оценку понравившихся и непонравившихся товаров; эффективна при разреженных данных |
|
Cross-Entropy |
Бинарная классификация (клик / не клик) |
Удачно для сценариев, когда фиксируется сам факт взаимодействия, а не степень предпочтения |
Обучение на реальных данных включает выбор регуляризатора (например, L2-норма на векторах эмбеддингов), стратегию негативной выборки (для метода BPR или CE) и настройку гиперпараметров сети (число слоёв, размер латентного пространства и т.д.). Важно учитывать, что в GAT-моделях (Graph Attention Networks) интерпретация результатов обеспечивается анализом весов соседних узлов: чем выше коэффициент внимания αij, тем больший вклад узел j вносит в итоговое представление i. Это полезно для выявления наиболее влиятельных друзей или предметов [14].
Практические кейсы и оценка качества GNN-подходов нередко сопоставляют с классическими методами вроде матричной факторизации (MF) или вариационными автоэнкодерами. MF хорошо работает в ситуациях с относительно плотными матрицами взаимодействий и при условии, что нет сложных структур социальных связей [6]. Автоэнкодеры, в свою очередь, позволяют извлекать нелинейные зависимости, но не учитывают топологию графа [3]. GNN-методы, как показывают эксперименты [12, 13], превосходят их по метрикам вроде HR@k (Hit Rate at k), NDCG@k (Normalized Discounted Cumulative Gain at k), AUC (Area Under the Curve), особенно на графах средней или высокой плотности социальных связей. Однако если структура графа разреженная и количество явных взаимодействий мало, требуется прибегать к дополнительным источникам данных (атрибуты пользователей, контексты), а также аккуратно настраивать лосс-функции.
Немаловажно и то, как густота графа или наличие нескольких слоёв взаимодействий сказывается на точности рекомендаций. Более «полный» граф (больше рёбер) облегчает задачу GNN, так как сеть получает достаточно связей для обучения. С другой стороны, избыточные связи могут утяжелять вычисления и приводить к шуму, который требуется отсекать (LightGCN, GAT). «Многослойность» чаще относится к самим глубинам GNN: увеличение числа свёрточных слоёв даёт доступ к более дальним соседям, но при этом растёт риск oversmoothing [2].
Ниже приводится таблица 3, суммирующая ключевые отличия традиционных методов и GNN-решений для социальных рекомендаций в контексте влияния структуры графа.
Таблица 3.
Сравнение классических и GNN-подходов c учётом структуры графа [3, 6, 12, 13]
|
Метод |
Учёт графа |
Чувствительность к густоте |
|
Matrix Factorization (MF) |
Почти не учитывает структуру (только матрица рейтингов) |
При большом количестве пропусков ухудшается, нет прямого учёта соц. связей |
|
Autoencoders (AE) |
Локальный учёт паттернов, но без графовых связей |
Нужны плотные входные представления, топология не моделируется явным образом |
|
GNN (GCN, GAT, LightGCN) |
Глобальная агрегация, возможность внимания к отдельным рёбрам |
Выигрывает при средней и высокой связности, но требует careful tuning при сверхразреженных графах |
Масштабирование и дополнительные возможности становятся важны при большом числе пользователей и предметов [2]. Специально для ускорения вычислений разработаны:
- Упрощённые свёртки (LightGCN), где убирают нелинейные слои и перемножения матриц упрощаются. По данным He et al. [2], это может дать выигрыш в 2–3 раза по времени обучения при незначительном падении качества.
- Негативная выборка (Negative Sampling), позволяющая формировать батчи, в которых помимо положительных взаимодействий моделируются случайно выбранные отрицательные [9]. Это особенно актуально в методах, работающих с имплицитными отзывами (BPR, CE), где важно контрастировать «понравившиеся» и «непонравившиеся» объекты.
- Батчинг (Batching), при котором узлы и рёбра разбиваются на подграфы, обрабатываемые параллельно [12]. Данный приём повышает эффективность на этапе обучения и вывода.
В перспективе идёт активное развитие моделей, способных обрабатывать гиперграфы (HyperGNN), мультиплексные отношения (когда между двумя пользователями может быть несколько типов рёбер) и временную динамику (чтобы учитывать эволюцию предпочтений во времени). Например, в сценариях «Session-based Recommendation» социальные связи могут быстро меняться, и GRNN-подходы (Graph Recurrent Neural Networks) дают гибкость при моделировании таких изменений [12, 13]. Добавление мультиплексных слоёв позволяет учесть, что разные категории товаров или разные виды дружбы играют разную роль для рекомендаций [10]. Все эти направления делают применение GNN всё более перспективным в индустриальном формате, где требуется обрабатывать большие объёмы разнородных данных.
Заключение
Проведённый анализ подтверждает, что использование графовых нейронных сетей открывает новые возможности для построения эффективных систем рекомендаций в социальных сетях. Они позволяют моделировать сложные паттерны пользовательских предпочтений и социального влияния благодаря более детальной работе с топологией графа и дополнительными атрибутами. Наиболее распространённые архитектуры GCN и GAT демонстрируют высокую результативность, однако выбор конкретной модели и параметров зависит от уровня разреженности данных, структуры социальных связей и требуемой интерпретируемости. Наряду с этим, проблема масштабирования при увеличении числа пользователей и объектов остаётся одной из ключевых: здесь перспективными оказываются упрощённые свёртки (LightGCN) и батчинг.
В дальнейшем исследовании возможны несколько направлений развития. Во-первых, важным становится более широкое использование гиперграфов и мультиплексных отношений, позволяющих одновременно учитывать разные типы связей или групповых взаимодействий. Во-вторых, развитие временных моделей (Graph Recurrent Neural Networks) позволит лучше учитывать эволюцию пользовательских предпочтений в динамике. Наконец, растёт интерес к вопросам приватности и надёжности в среде реальных промышленных систем: гибридизация GNN с методами дифференциальной конфиденциальности и механизмами устойчивости к внешним атакам может стать следующим шагом на пути к полноценному внедрению графовых нейронных сетей в масштабируемые и доверенные рекомендательные сервисы.
Список литературы:
- Cui G., Wei Z., Su H. H. Rethinking the Expressiveness of GNNs: A Computational Model Perspective //arXiv preprint arXiv:2410.01308. – 2024. – С. 1-24.
- He X. et al. Lightgcn: Simplifying and powering graph convolution network for recommendation //Proceedings of the 43rd International ACM SIGIR conference on research and development in Information Retrieval. – 2020. – С. 639-648.
- Jamali M., Ester M. A matrix factorization technique with trust propagation for recommendation in social networks //Proceedings of the fourth ACM conference on Recommender systems. – 2010. – С. 135-142.
- Kipf T. N., Welling M. Semi-supervised classification with graph convolutional networks //arXiv preprint arXiv:1609.02907. – 2016. – С. 1-14.
- Liu Y. et al. Combinatorial optimization with automated graph neural networks //arXiv preprint arXiv:2406.02872. – 2024. – С. 1-9.
- Ma H. et al. Sorec: social recommendation using probabilistic matrix factorization //Proceedings of the 17th ACM conference on Information and knowledge management. – 2008. – С. 931-940.
- Pearce A. et al. A gentle introduction to graph neural networks. – 2021. [Онлайн ресурс] – Режим доступа: https://distill.pub/2021/gnn-intro/
- Prates M. O. R. Learning to solve NP-complete problems. – 2019. – 149 с.
- Rendle S. et al. BPR: Bayesian personalized ranking from implicit feedback //arXiv preprint arXiv:1205.2618. – 2012. – С. 452-461.
- Решетов В.О. Особенности графовых нейронных сетей и области их потенциального применения. Воронежский государственный университет. – 2024. [Онлайн ресурс] – Режим доступа: https://os-russia.com/SBORNIKI/KON-611.pdf#page=65
- Seo M., Min S. Graph neural networks and implicit neural representation for near-optimal topology prediction over irregular design domains //Engineering Applications of Artificial Intelligence. – 2023. – Т. 123. – С. 106284.
- Sharma K. et al. A survey of graph neural networks for social recommender systems //ACM Computing Surveys. – 2024. – Т. 56. – №. 10. – С. 1-34.
- Tang J., Hu X., Liu H. Social recommendation: a review //Social Network Analysis and Mining. – 2013. – Т. 3. – С. 1113-1133.
- Velickovic P. et al. Graph attention networks //stat. – 2017. – Т. 1050. – №. 20. – С. 1-12.