магистрант кафедры «Информационных систем цифровой экономики», ИСЦЭ экономического факультета, Института экономики и финансов РУТ(МИИТ), РФ, г. Москва
Автоматизированные информационные системы по машинному обучению на службе кредитного скоринга
DOI: 10.32743/UniLaw.2021.79.4.4-7
АННОТАЦИЯ
В работе изучается применение методов машинного обучения в автоматизированных информационных системах (АИС) для экспресс-оценки потенциального клиента банка (заемщика) на предмет возможности выдачи ему кредита. Данное исследование проводится на примере АИС GiniMachine, в которой проводится анализ данных, предоставленных клиентом банка, и строится скоринговая модель кредитования. При этом демонстрируются главные преимущества рассматриваемой АИС с целью ее возможного внедрения в банковский сектор экономики. Результатом научной статьи служит построение скоринговой модели кредитования клиентов средствами АИС GiniMachine.
ABSTRACT
The work examines the use of machine learning methods in automated information systems (AIS) for the express assessment of a potential client of a bank (borrower) for the possibility of issuing a loan to him. This study is carried out on the example of AIS GiniMachine, which analyses the data provided by the bank's client and builds a scoring model of lending. At the same time, the main advantages of the AIS under consideration with the aim of its possible implementation in the banking sector of the economy are demonstrated. As result of the scientific article serves creation of scoring model of crediting of clients means of AIS GiniMachine.
Ключевые слова: АИС GiniMachine; матрица ошибок; скоринг; RОС-кривая; индекс Джини.
Keywords: AIS GiniMachine; confusion matrix; scoring; ROS – curve, Gini index.
Хранением истории обращения за кредитами занимается каждый банк и Бюро кредитных историй (БКИ) в целом. Информация о заемщике хранится в БКИ до 10 лет, при этом банки обращают особое внимание на действия заемщика за последние 2-5 лет [1, с. 6]. Однако, применение кредитной истории к клиентам, которые впервые обращаются за кредитом, невозможно. Для таких случаев банки содержат штат экспертов, осуществляющих оценку клиента [5, с.1]. Данные о потенциальном заемщике они получают как от самого клиента, так и из других источников (например, от работодателя или из социальных сетей). В банковских кругах этот процесс называется кредитным скорингом.
Понятие скоринга происходит от английского «scoring», что переводится как «оценивание». Скоринг – это система оценки кредитоспособности (кредитных рисков) потенциального заемщика. С момента прихода цифровых технологий делаются попытки создания информационных систем автоматического скоринга, использующих технологии машинного обучения [6, с. 1].
В настоящее время существует огромное количество автоматизированных информационных систем (АИС), использующих методы машинного обучения для построения скоринговых моделей. Одними из наиболее часто используемых автоматизированных информационных систем (АИС) для построения скоринговых моделей являются Loginom Scorecard Modeler, HES GiniMachine, Deductor Credit Scorecard Modeler и SAS Credit Scoring. Главной отличительной чертой всех вышеупомянутых АИС построения скоринговых моделей кредитования клиентов является применение методов машинного обучения и искусственных нейросетей (ИНС). Кроме всего прочего, при внедрении подобного рода АИС в кредитные организации появляются следующие ключевые преимущества:
- Увеличение числа и скорости обработки заявок на кредиты;
- Эффективная оценка и постоянный контроль уровня рисков заемщика;
- Обеспечение объективности в оценке заявок во всех отделениях кредитной организации;
- Реализация единого подхода при оценке заемщиков для различных типов кредитных продуктов банка (кредитных карт, потребительских и ипотечных кредитов) [7, с. 6].
Таким образом, исходя из всех вышесказанных преимуществ, целью исследования в рамках данной статьи становится изучение работы методов машинного обучения в автоматизированных информационных системах (АИС) для экспресс-оценки потенциальных клиентов банка (заемщиков) на предмет возможности выдачи им кредита.
В качестве примера рассмотрим применение методов машинного обучения на одной из вышеупомянутых АИС, а именно: HES GiniMachine. Однако, прежде чем приступить к рассмотрению тестового примера использования методов машинного обучения, опишем основные достоинства данной АИС.
Автоматизированная информационная система (ИС) GiniMachine – платформа оценки кредитоспособности заёмщиков, разработанная при помощи новейших алгоритмов машинного обучения международным провайдером финтех решений компанией HiEnd Systems (HES) [3, c. 2].
В отличие от других АИС по построению скоринговых моделей GiniMachine автоматически создает модели с коэффициентом Gini 0.65 и выше. Кроме всего прочего, с данной системой можно создавать, внедрять и анализировать скоринговую модель без специальных знаний в области машинного обучения и математической статистики [3, c. 8].
В рамках данной работы построим скоринговую модель, опираясь на финтех решение компании HiEnd Systems (HES) - ИС GiniMachine. Построение любой скоринговой модели кредитования клиентов банка начинается с подготовки клиентом аналитической информации по предлагаемому формату (см. рисунок 1).
Рисунок 1. Данные о ранее выданных кредитах со статусом: погашен или просрочен
На рисунке 1 представлены необходимые данные, которые предоставляет клиент в виде .xls или .csv файлов. Каждая строка данных состоит из столбцов (атрибутов, параметров) и строк (записей). В свою очередь итоговый столбец статуса займа помечается 0, если займ просрочен и 1, если он погашен [2, c. 3].
Следующим шагом для построения скоринговой модели кредитования является автоматическое деление ИС GiniMachine данных, предоставленных клиентом на обучающую и тестовую выборку в соотношении 70/30. При этом обучающая выборка содержит только те данные, которые известны на момент принятия решения по кредитной заявке. Затем на основе обучающей выборки строится модель, которая впоследствии проверяется на тестовой выборке. Основным результатом работы полученной модели является скор балл от 0 до 1, который можно интерпретировать как предсказание вероятности возврата кредита, с определенными допущениями [2, c. 6].
В силу того, что для оценки качества модели невозможно напрямую сравнить саму по себе вероятность, выраженную действительным числом, с ответом в форме «кредит возвращен» или «допущен дефолт» (за исключением случая, когда вероятность для хороших заемщиков предсказывается как 1.0, а для плохих как 0.0) воспользуемся индексом Джини, который является одним из наиболее эффективных показателей оценки прогнозных моделей. Кроме того, индекс Джини тесно связан с так называемой RОС-кривой, показывающей, как много «неуверенных» («неопределенных») предсказаний делает прогнозная модель. Так, в соответствии с нашими аналитическими данными ROC-кривая приобретает следующий вид (см. рисунок 2) [2, c. 6].
Рисунок 2.Вид ROC-кривой в соответствии с данными о ранее выданных кредитах
Как видно из рисунка 2 индекс Джини = 0,87, а по общепринятым отраслевым стандартам значение индекса Джини, превышающее 0.6 для тестового набора, позволяет оценить качество предикативной модели как «высокое» [2, c. 7].
Полученный в результате прогнозной модели скор балл в диапазоне от 0 до 1, можно использовать в качестве вероятности возврата кредита, с определенными допущениями. Эти вероятности могут быть использованы «как есть», например для подсчета средней суммы возврата, или как часть более сложной статистической модели, используемой для поддержки бизнес-решений [2, c. 9].
На практике предикативные модели в сфере кредитования используются для принятия конкретных решений по операциям кредитного характера: «одобрить» или «отказать» .
Естественным способом преобразовать значение вероятности в подобное конкретное решение является установление порогового значения: все вероятности, превышающие это пороговое значение, будут интерпретироваться как «одобрить», а все вероятности меньше порогового значения — как «отказать» [2, c. 10].
ИС GiniMachine позволяет в интерактивном режиме подбирать пороговое значение перемещением слайдера. Значения всех статистик, перечисленных выше, в том числе в процентном выражении, динамически пересчитывается в реальном времени [2, c. 10]. Так на рисунке 3 представлен пример соответствующего интерфейса, где в соответствии с приведенными аналитическими данными была построена матрица ошибок (см. рисунок 3) [4, c. 2].
Рисунок 3. Матрица ошибок в соответствии с данными о ранее выданных кредитах
Хотя выбор порогового значения существенным образом влияет на то, какие фактические решения будут приняты моделью, качество самой модели, оцениваемое такими показателями, как индекс Джини, никак не зависит от выбора порогового значения [2, c. 11].
Заключение
Таким образом, в данной статье посредством функционала ИС GiniMachine компании HiEnd Systems (HES) было изучено применение методов машинного обучения в автоматизированных информационных системах (АИС) для экспресс-оценки потенциального клиента банка (заемщика) на предмет возможности выдачи ему кредита.
Список литературы:
- Джамбиев Г. А., Шутенко А. А., Цуриков А. Н. Оценка кредитоспособности потенциальных клиентов банка с помощью искусственной нейронной сети // Актуальные исследования. 2020. №14 (17). С. 6-12. URL: https://apni.ru/article/1057-otsenka-kreditosposobnosti-potentsialnikh(дата обращения: 27.02.2021). – Текст: электронный.
- Инструкция по использованию ИС GiniMachine : файл инструкции по использованию– Москва, 2021. – 14 с. – URL: https://my-files.su/Save/usq80m/Инструкция по использованию GM.html.pdf (дата обращения: 27.02.2021). – Текст: электронный.
- Кредитный скоринг на базе искусственного интеллекта и машинного обучения в ИС GiniMachine: файл инструкции по использованию – Москва, 2021. – 14 с. – URL: https://my-files.su/Save/kyx194/GiniMachine_RU.pdf (дата обращения 27.02.2021) – Текст: электронный.
- Портал ИС GiniMachine для построения скоринговых моделей кредитования клиентов (заемщиков) – URL: https://demo.ginimachine.com/login (дата обращения 27.02.2021)
- Верескун В.Д., Цуриков А.Н. Информационно-управляющие системы в научных исследованиях и на производстве: учеб. пособие. Ростов н/Д: ФГБОУ ВО РГУПС, 2016. 76 с.
- Богданов А.Л., Дуля И.С. Применение нейронных сетей в решении задачи кредитного скоринга // Вестник Томского государственного университета. Экономика. 2018. № 44. С. 173-183.
- Особенности потребительского кредитования в банке: файл инструкции по использованию– Москва, 2021. – 21 с. – URL: https://studbooks.net/1227279/bankovskoe_delo/rekomendatsii_sovershenstvovaniyu_kreditovaniya_malogo_srednego_biznesa_bankah (дата обращения: 27.02.2021). – Текст: электронный.