РАЗРАБОТКА АРХИТЕКТУРЫ ГИБРИДНОЙ РЕКОМЕНДАТЕЛЬНОЙ СИСТЕМЫ ДЛЯ ФИНАНСОВОГО АССИСТЕНТА

DEVELOPMENT OF THE ARCHITECTURE OF A HYBRID RECOMMENDER SYSTEM FOR A FINANCIAL ASSISTANT
Пилявская И.М.
Цитировать:
Пилявская И.М. РАЗРАБОТКА АРХИТЕКТУРЫ ГИБРИДНОЙ РЕКОМЕНДАТЕЛЬНОЙ СИСТЕМЫ ДЛЯ ФИНАНСОВОГО АССИСТЕНТА // Universum: технические науки : электрон. научн. журн. 2022. 5(98). URL: https://7universum.com/ru/tech/archive/item/13566 (дата обращения: 21.11.2024).
Прочитать статью:
DOI - 10.32743/UniTech.2022.98.5.13566

 

АННОТАЦИЯ

Целью данной работы является разработка архитектуры гибридной рекомендательной системы, которая позволит учесть широкий спектр данных для построения рекомендаций финансовых инструментов и стратегий для финансового ассистента. В результате данной работы удалось достичь поставленных целей. Архитектура предусматривает использование всех необходимых данных, а также решает проблему «холодного старта».

ABSTRACT

The purpose of this work is to develop the architecture of a hybrid recommender system, which will take into account a wide range of data to build recommendations for financial instruments and strategies for a financial assistant. As a result of this work, it was possible to achieve the set goals. The architecture provides for the use of all the necessary data, and also solves the problem of "cold start".

 

Ключевые слова: финансовый ассистент, финансовое планирование, управление инвестиционным портфелем, сегментация аудитории, машинное обучение.

Keywords: financial assistant, financial planning, investment portfolio management, audience segmentation, machine-learning.

 

Главной задачей финансовых ассистентов являются правильные рекомендации подходящих финансовых инструментов и стратегий. Все эти инструменты сильно зависят от финансового положения пользователя и его психологического портрета.

 Рекомендательная система в таком случае должна опираться на широкий спектр данных:

‒данные о финансовом портрете пользователя;

‒данные о финансовом инструменте;

‒данные пользовательских оценок.

Для решения поставленной задачи наиболее подходит гибридный вид рекомендательной системы, которая позволит учесть все доступные данные и избавится от ряда проблем, например, от проблемы «холодного старта». 

В ходе разработки архитектуры гибридной рекомендательной системы различные идеи были совмещены в одну систему, имеющую несколько этапов работы. На каждом этапе используются различные подходы, методы и алгоритмы, которые наиболее подходят для решения поставленной задачи.

Архитектура гибридной системы состоит из различных этапов:

1) Генерация начального списка возможных рекомендаций на основе похожести пользователей;

2) Расширение этого списка похожими финансовыми инструментами;

3) Прогнозирование рейтингов для финансовых инструментов;

4) Сортировка по рейтингу;

5) Усечение отсортированного списка.

Таким этапы обоснованы следующими причинами:

‒на начальном этапе формируется список рекомендаций, который не требует выставление рейтингов (решение проблемы «холодного старта»). По этой причине могут использовать системы типа Top N, которые сложно использовать в более обобщенных случаях. И, так как верхняя граница рекомендаций выбирается только исходя из вычислительной сложности системы, то она может быть очень высока. Благодаря этому, отпадает необходимость строго следить за числом выдаваемых рекомендаций;

‒в обычных подходах к построению рекомендательных систем для формирования и выдачи рекомендации необходимо вычислять рейтинговую оценку для каждого объекта, число которых непрерывно растет и требует все больше и больше вычислительных ресурсов. Этапы 1-3 решают эту проблему, так как там не требуются прогнозы;

‒для каждого из этапов можно использовать различные метрики оценки качества.

Для реализации рассматриваемой архитектуры необходимо определенные требования к данным.

Первый этап требует функции сравнения профилей пользователей

, , где i, j – номера пользователей.

Второй этап требует функции сравнения профилей финансовых инструментов , , где i, j – номера финансовых инструментов.

На третьем этапе требуются векторные представления профилей пользователей и финансовых инструментов. Так как неструктированные данные легко поддаются сравнению, но тяжело преобразуются в вектора, то можно их использовать на первых двух этапах, а на этом – нет.

Для учета оценок пользователей необходима матрица рейтингов  размера , где  – количество пользователей,  – количество финансовых инструментов,  – оценка, поставленная i-ым пользователем j-ому инструменту.

На этапе формирования начального списка возможных рекомендаций используются данные по финансовому портрету пользователей и данный рейтингов, чтобы создать как можно больший список возможных рекомендаций.

В результате должно быть множество финансовых инструментов I1 = i1, i2, …, in. Эти инструменты будут рекомендоваться пользователю в первую очередь.

Для обработки данных матрицы рейтингов R будет использоваться item-based коллаборативная фильтрация.

Метрика и составление векторов товаров будут использованы те же, что и в случае сравнения пользователей.

Сначала формируется список IibCF – потенциально рекомендованных финансовых инструментов, в который добавляются товары с очень высоким порогом схожести.

Item-based коллаборативная фильтрация отлично подходит для этого по ряду причин:

‒ легкость реализации;

‒ очень высокая скорость работы в режиме real-time;

‒ формируются не тривиальные рекомендации;

‒ используется разреженность данных;

‒ подход проверен во множестве исследований.

Проблема «холодного старта» будет решена на других этапах гибридной системы.

Информация о финансовом типе пользователя определяется после анкетирования и математически формализуется в вектор оценок PersonalityTypes. Подобие пользователей вычисляется в два этапа:

‒ Подобие по финансовому типу пользователей u1 и u2 вычисляется по косинусному сходству (1). 

) = ,

(1)

 

 где m – количество экспертных оценок (m = 5);

PersonalityTypesu1j j-ая оценка финансового портрета пользователя u1.

‒  Каждому выбранному параметру профиля соотносится его числовое значение индекса финансовой грамотности на основе данных таблиц 3, 4, 5, 6. Вектор значений профиля пользователя SimProfile состоит из нормализованных значений индекса финансовой грамотности. Подобие по профилю пользователя, вычисляется аналогично подобию по финансовому типу (2):

,  ,

(2)

 

где m – количество различных данных о профиле пользователя (m = 5);

u1j j-ое нормализованное значение индекса финансовой грамотности пользователя u1.

Окончательное подобие вычисляется как (3):

,  + ,

(3)

 

где  +  = 1.

Таким образом, формируется список финансовых инструментов Ifi. Для рекомендации пользователю u1 выбирается n (параметр алгоритма) таких, у кого ) максимальна.

Затем для n ближайших пользователей формируется множество финансовых инструментов Ifi, которые получили положительные оценки от этих пользователей.

Благодаря такому подходу используются следующие достоинства:

‒ легкость реализации;

‒ очень высокая скорость работы в режиме real-time;

‒ используется финансовый портрет пользователей;

‒ вместе с Item-based коллаборативной фильтрацией решается проблема «холодного старта» для пользователей;

‒ параметр n подбирается легко и не нуждается в аккуратной подборке.

Ко множеству финансовых инструментов I1 добавляются все финансовые инструменты, получившие положительную оценку от пользователя - Iuser.

В итоге, множество рекомендованных финансовых инструментов I1 формируется объединением множеств из предыдущих шагов, а именно .

Последний элемент, влияющий на список рекомендаций – данные о финансовых инструментах.

Для каждого инструмента формируется множество Simi из n (параметр алгоритма) финансовых инструментов с наибольшим значением , . Где подобие между финансовыми инструментами вычисляется двумя этапами:

‒ Подобие между финансовыми профилями (4)

,

(4)

где m – количество финансовых инструментов

‒ Подобие между текстовыми корпусами (5)

,  ,

(5)

 

где m – количество финансовых инструментов

Окончательное подобие вычисляется как (6):

,  + ,

(6)

где  +  = 1

По итогу создается множество финансовых инструментов .

Достоинства такого подхода:

‒ легкость реализации;

‒ решение проблемы «холодного старта» для финансовых инструментов;

‒ используются данные профиля финансовых инструментов

‒ параметр n подбирается легко и не нуждается в аккуратной подборке.

В соответствии с методами, описанными выше, мы получаем соседние пользовательские наборы, оценки пользователей и оценки финансовых инструментов. На входе подается множество , а на выходе должно получиться множество пар финансовый инструмент – рейтинг: .

Главным достоинством разрабатываемой технологии является то, что множество  достаточно небольшое и размер его можно регулировать.

Поэтому для прогнозирования рейтинга можно использовать достаточно вычислительно-сложные системы, которые все равно будут предлагать рекомендации быстро.

Основной сложностью при прогнозировании рейтингов является необходимость использовать все данных, полученных на предыдущих этапах, а именно: профиля пользователей, профиля финансовых продуктов и рейтинги. 

Таким образом, формула прогноза рейтинга пользователя выглядит следующим образом:

‒ Прогнозирование рейтинга пользователя рассчитывается на основе весовой функции и оценок U-ближайших пользователей (7)

 ,

(7)

‒ Прогнозирование рейтинга продукта (8)

 ,

(8)

‒ Прогнозирование рейтинга финансового инструмента m для пользователя u (9)

 )   ,

(9)

где  – коэффициент объединенных значений рейтинга.

В качестве рекомендуемого набора используются первые несколько элементов с высшими оценками в прогнозируемых рейтингах.

В результате данной работы удалось проработать архитектуру гибридной рекомендательной системы для решения задачи рекомендаций финансовых инструментов и стратегий для финансового ассистента.

 Архитектура предусматривает использование всех необходимых данных, а так же решает проблему «холодного старта».

 

Список литературы:

  1. Intelligent Virtual Assistant Market Size, Share & Trends Analysis Report By Product (Chatbot, Smart Speakers), By Technology, By Application (BFSI, Healthcare, Education), By Region, And Segment Forecasts, 2020 – 2027 Grand View Research - 4/1/2020 - 130 Pages - ID: GV16217098 URL: https://www.marketresearch.com/Grand-View-Research-v4060/Intelligent-Virtual-Assistant-Size-Share-13187162/.
  2. Markets R.A. Intelligent Virtual Assistant (IVA) Market - Growth, Trends, and Forecast (2020 - 2025) [Электронный ресурс]. – Режим доступа: https://www.researchandmarkets.com/reports/4845914/intelligent-virtualassistant-iva-market (дата обращения: 05.02.2021).
  3.  Statista – Personal Finance [Электронный ресурс]. – Режим доступа: https://www.statista.com/outlook/dmo/fintech/personal-finance/worldwide (дата обращения: 05.01.2021).
  4. Personal Finance Topics: Best Personal Finance Apps [Электронный ресурс]. – Режим доступа:  https://www.thebalance.com/best-personal-finance-apps-4170650 (дата обращения: 10.01.2021).
  5. Olivia AI [Электронный ресурс] - https://www.olivia.ai (Дата обращения: 22.01.2021).
  6. You Need a Budget Features [Электронный ресурс] - https://www.youneedabudget.com/features/ (Дата обращения: 22.01.2021).
  7. Personal Capital Wealth Management [Электронный ресурс] - https://www.personalcapital.com/wealth-management (Дата обращения: 22.01.2021).
  8. Prism by BillGo Product Description [Электронный ресурс] - https://www.prismmoney.com/ (Дата обращения: 22.01.2021).
  9. Hello Digit, Inc. [Электронный ресурс] – https://digit.co (Дата обращения: 22.01.2021).
  10. Spendee Pricing [Электронный ресурс] - https://www.spendee.com/pricing (Дата обращения: 22.01.2021).
  11. EveryDollar Product Description [Электронный ресурс] - https://www.everydollar.com (Дата обращения: 22.01.2021).
  12. Royal Bank of Canada Website [Электронный ресурс] - https://www.rbcroyalbank.com/mobile/feature/nomi/index.html (Дата обращения: 22.01.2021).
  13. Hornyák, A.  2015.:  Attitudes and Competencies Among High School Students Regarded as Potential Banking Clients.  PhD Thesis.  Sopron:  University of West-Hungary, Faculty of Economics.
  14. Rosenberg, M. J. 1960.: An analysis of affective-cognitive consistency. In: M. J. Rosenberg – C. I. Hovland – W. J. McGuire – R. P. Abelson – J. W. Brehm (ed.): Attitudee organization and change. New Haven: Yale University Press.
  15. Goldberg, H. – Lewis, R. 1978.: Money Madness. London: Springwood Books.
Информация об авторах

руководитель Аналитики, Тинькофф Банк, РФ, г. Москва

Head of Analytics, Tinkoff Bank, Russia, Moscow

Журнал зарегистрирован Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор), регистрационный номер ЭЛ №ФС77-54434 от 17.06.2013
Учредитель журнала - ООО «МЦНО»
Главный редактор - Ахметов Сайранбек Махсутович.
Top