Журнал «Научный лидер» выпуск #20 (221), Май ‘25

ВЫБОР РЕКОМЕНДАТЕЛЬНОЙ МОДЕЛИ ДЛЯ РЕКОМЕНДАЦИЙ БАНКОВСКИХ ПРОДУКТОВ

Авторы публикации

Якуньков Илья ДмитриевичШирокова Светлана Владимировна

Рубрика

Информационные технологии

Просмотры

1309

Журнал

Журнал «Научный лидер» выпуск # 20 (221), Май ‘25

В условиях стремительного роста цифровизации финансовых услуг банки все чаще используют технологии персонализации для повышения клиентской лояльности и эффективности продвижения продуктов. Рекомендательные системы позволяют на основе поведенческих и анкетных данных клиента предлагать наиболее релевантные банковские продукты, способствуя росту продаж и снижению оттока. Цель данной статьи — анализ существующих подходов к построению рекомендательных систем в банковской сфере и выбор оптимальной модели с учетом специфики данных и бизнес-целей. Рассматриваются традиционные методы, такие как коллаборативная фильтрация и контентный подход, а также современные модели на основе машинного обучения и нейросетей. Особое внимание уделяется вопросам explainability, работы с ограниченными данными и соблюдения регуляторных требований. Проведен сравнительный эксперимент на синтетическом наборе данных, моделирующем поведение клиентов. Полученные результаты позволяют сделать выводы о применимости различных подходов и дают рекомендации по выбору моделей в зависимости от конкретных задач банка.

машинное обучение

нейронные сети

гибридные модели

персонализация

рекомендательные системы

коллаборативная фильтрация

контентные рекомендации

интерпретируемость

регуляторные требования

цифровизация финансовых услуг

Современный банковский сектор переживает трансформацию, связанную с цифровизацией услуг и ростом ожиданий клиентов в части персонализации. Стандартные маркетинговые подходы уступают место интеллектуальным системам рекомендаций, способным анализировать предпочтения, поведение и историю взаимодействия клиента с финансовыми продуктами. Это особенно важно для крупных банков, предлагающих широкий спектр услуг — от потребительских кредитов и депозитов до инвестиционных инструментов и страхования.

Применение рекомендательных систем позволяет повысить релевантность клиентских предложений, улучшить пользовательский опыт, увеличить конверсию и сократить операционные расходы. Однако, в отличие от традиционных e-commerce платформ, банки сталкиваются с рядом дополнительных ограничений:

– высокая чувствительность и конфиденциальность данных;

– необходимость соблюдения регуляторных норм (например, в части недискриминации);

– важность интерпретируемости моделей (особенно при принятии решений по кредитным продуктам).

В этой связи выбор подходящей модели рекомендаций требует тщательного анализа. На практике банки используют различные методы — от простых правил и сегментации до сложных алгоритмов машинного обучения и гибридных моделей. Учитывая специфику банковской деятельности, необходимо учитывать не только точность предсказаний, но и такие факторы, как прозрачность, устойчивость к холодному старту и возможность масштабирования.

Настоящая статья направлена на систематизацию существующих подходов к построению рекомендательных моделей в банковской сфере и экспериментальное сравнение их эффективности. Также предлагаются практические рекомендации по выбору модели в зависимости от типа данных и целей бизнеса [1].

Коллаборативная фильтрация

Коллаборативная фильтрация (CF) основывается на гипотезе, что пользователи, проявлявшие интерес к похожим продуктам в прошлом, будут делать схожий выбор и в будущем. Существуют два основных подхода:

– User-based CF: находит клиентов с похожими предпочтениями и предлагает продукты, которые они выбирали;

– Item-based CF: анализирует, какие продукты склонны покупаться вместе, и строит рекомендации на основе этой информации.

Преимущества CF:

– не требует глубокого понимания самих продуктов;

– способна выявлять скрытые паттерны в поведении.

Недостатки:

– плохо работает при недостатке данных (проблема холодного старта);

– страдает от проблемы "популярности" — редко рекомендует нишевые продукты.

В банковском контексте CF может быть ограничен, поскольку клиенты совершают ограниченное число уникальных транзакций, а распределение интересов часто смещено (например, большинство имеют дебетовую карту, но не пользуются инвестиционными продуктами) [2, 3].

Контентный подход

Контентные рекомендательные системы анализируют характеристики пользователей (возраст, доход, регион, транзакционная активность) и сопоставляют их с профилями продуктов. Каждому продукту присваивается "вектор признаков", и система ищет наилучшее совпадение между профилем клиента и характеристиками продукта.

Преимущества:

– хорошо работает с новыми продуктами (нет зависимости от отзывов других клиентов);

– легко интерпретируем: можно объяснить, почему система выбрала тот или иной продукт.

Недостатки:

– требует точного описания как клиентов, так и продуктов;

– не выявляет латентные паттерны (в отличие от CF).

В банках контентные методы особенно полезны, когда есть богатые анкетные данные и классификация продуктов по сегментам (например, "ипотека для молодых семей", "вклад для пенсионеров") [4].

Гибридные модели

Гибридные подходы объединяют преимущества CF и контентных моделей. Часто используется архитектура двух уровней: на первом уровне формируется предсказание на основе CF и контентного подхода, а на втором — объединение результатов (например, через взвешенное среднее или meta-модель).

Преимущества:

– повышенная точность;

– устойчивость к холодному старту (если хотя бы один из компонентов может работать).

Гибридные модели — хороший компромисс для банков с разнообразной клиентской базой и широким портфелем продуктов. Однако они требуют более сложной настройки и вычислительных ресурсов [5].

Модели машинного обучения

С развитием ML-алгоритмов всё чаще применяются:

– Градиентный бустинг (XGBoost, LightGBM): хорошо справляется с табличными данными;

– Нейронные сети (DNN, autoencoder): выявляют сложные зависимости и нелинейные паттерны;

– Sequence-based модели (RNN, Transformers): учитывают временную структуру поведения (например, последовательность транзакций);

– Модели uplift/каузального влияния: оценивают влияние рекомендации на вероятность отклика, а не просто на вероятность интереса.

Преимущества:

– высокая точность;

– возможность масштабирования.

Недостатки:

– сложность интерпретации;

– чувствительность к качеству данных и наличию большого обучающего множества.

Особенности банковского применения

При внедрении рекомендательных систем в банке необходимо учитывать следующие аспекты:

– Explainability: особенно важно при взаимодействии с клиентом — регуляторы требуют объяснять, почему предложен тот или иной продукт.

– Безопасность и этика: недопустимы дискриминационные или навязчивые предложения.

– Холодный старт: необходимо уметь работать с новыми клиентами и новыми продуктами.

– Сложность интеграции: архитектура ИТ-систем в банках часто фрагментирована.

Критерии выбора рекомендательной модели для банков

Выбор подходящей модели зависит от нескольких факторов [7]:

Критерий	Значимость
Интерпретируемость	Критично для соблюдения регуляторных требований и доверия со стороны клиента.
Холодный старт	Важно уметь рекомендовать новые продукты или новым клиентам.
Наличие исторических данных	Нейросети и CF требуют большого объема взаимодействий.
Тип данных	Контентные модели подходят для анкетных и CRM-данных, CF — для истории взаимодействий.
Скорость обучения и вывода	Влияние на реалтайм рекомендации и масштабируемость.
Интеграция с бизнес-процессами	Возможность встраивания в текущую IT-инфраструктуру банка.

Эксперимент: сравнение моделей на банковских данных

Цель эксперимента

Эксперимент направлен на выбор рекомендательной модели, обеспечивающей наилучший баланс между точностью, интерпретируемостью и возможностью интеграции в реальные бизнес-процессы банка. Сравниваются несколько классов моделей:

1. Content-Based Filtering

2. Collaborative Filtering (ALS)

3. Градиентный бустинг (LightGBM)

4. Neural Collaborative Filtering (NCF)

4.2 Датасет

В эксперименте используется анонимизированный набор клиентских данных одного из российских банков, включающий:

• демографические признаки (возраст, пол, регион);

• продуктовый портфель (наличие кредитов, вкладов, карт);

• транзакционные признаки (категории покупок, частота трат);

• историю откликов на предыдущие предложения;

• матрицу взаимодействия клиент-продукт (используется в CF и NCF).

Данные разделены на train (80%) и test (20%) по принципу временного среза.

Метрики оценки

Для оценки моделей использовались следующие метрики:

• Precision@k — точность рекомендаций в топ-k (например, топ-3 продукта);

• Recall@k — полнота: какой процент из нужных продуктов удалось предсказать;

• NDCG@k — учитывает не только попадание, но и позицию продукта в выдаче;

• AUC-ROC — для бинарных моделей (например, LightGBM);

• Coverage — процент клиентов, для которых можно дать рекомендацию;

• Time-to-predict — важная метрика для продакшн-среды (миллисекунды на одного клиента).

Техническая реализация

Все модели обучались на Python с использованием следующих библиотек:

• pandas, numpy — предобработка;

• lightgbm — градиентный бустинг [8];

• surprise, implicit — CF и ALS [9];

• TensorFlow/Keras — NCF [10];

• scikit-learn — метрики и кросс-валидация.

Тренировка и тестирование проводились на сервере с GPU (для NCF) и CPU-инстансе (для остальных моделей) [6].

Результаты оценки моделей

Модель	Precision@3	Recall@3	NDCG@3	AUC-ROC	Coverage	Time-to-predict
Content-Based	0.42	0.25	0.39	—	100%	~10 ms
ALS (CF)	0.48	0.31	0.45	—	85%	~60 ms
LightGBM	0.53	0.37	0.51	0.81	100%	~25 ms
NCF	0.57	0.39	0.54	—	82%	~120 ms

Анализ результатов:

• Наивысшая точность (Precision@3) — у нейросетевой модели (NCF), но при этом она проигрывает в интерпретируемости и скорости.

• Градиентный бустинг (LightGBM) — демонстрирует отличную сбалансированность между точностью, интерпретируемостью (через feature importance), покрытием и производительностью.

• Content-Based модель даёт предсказуемый результат — высокая интерпретируемость, но невысокая точность.

• ALS (Collaborative Filtering) — хорошая точность, но ограниченное покрытие (не всем клиентам можно что-то рекомендовать).

На основе анализа мы делаем следующие выводы:

• Для продакшн-среды банка, где важны интерпретируемость, скорость и качество, оптимальным выбором является градиентный бустинг (LightGBM). Он даёт хорошую точность и легко встраивается в существующую CRM-систему.

• Для перспективного развития (например, в digital-каналах) стоит экспериментировать с нейросетевыми подходами, особенно в условиях большого объема данных.

• Комбинированные схемы (ensemble моделей) могут дополнительно повысить точность — например, объединение логики LightGBM и NCF.

Выбор рекомендательной модели для банковских продуктов — это задача, требующая учета не только качества предсказаний, но и особенностей бизнес-процессов, регуляторных требований и технических ограничений. Результаты эксперимента показывают, что модели на основе градиентного бустинга (в частности, LightGBM) демонстрируют оптимальное сочетание точности, скорости, покрытия и интерпретируемости, что делает их отличным выбором для внедрения в текущие системы принятия решений.

Важно отметить, что нейросетевые подходы, особенно модели класса Neural Collaborative Filtering, показывают высокий потенциал при наличии большого объема обучающих данных и достаточных вычислительных ресурсов. Их использование может быть особенно оправдано в цифровых каналах, где требования к персонализации и динамичности рекомендаций особенно высоки. Однако сложность интерпретации таких моделей, а также потребность в глубокой интеграции и постоянном мониторинге их поведения, делает их менее удобными для быстрого внедрения в консервативной банковской среде.

Список литературы

Гайд по рекомендательным системам от Microsoft [Электронный ресурс] URL: https://learn.microsoft.com/en-us/azure/architecture/example-scenario/data/recommendation-system
Официальная документация библиотеки Scikit-learn [Электронный ресурс] URL: https://scikit-learn.org/stable/documentation.html
Обзор рекомендательных систем на Kaggle [Электронный ресурс] URL: https://www.kaggle.com/code/ibtesama/getting-started-with-a-movie-recommendation-system
Платформа RecBole: библиотека рекомендательных моделей [Электронный ресурс] URL: https://recbole.io/docs/
Обзор типов рекомендательных систем на Towards Data Science [Электронный ресурс] URL: https://towardsdatascience.com/introduction-to-recommender-systems-6c66cf15ada
Публикация Google о ML в рекомендательных системах [Электронный ресурс] URL: https://developers.google.com/machine-learning/recommendation/overview
Официальная документация библиотеки Surprise для рекомендаций [Электронный ресурс] URL: https://surprise.readthedocs.io/en/stable/
Документация по LightGBM [Электронный ресурс] URL: https://lightgbm.readthedocs.io/
Официальная документация TensorFlow Recommenders [Электронный ресурс] URL: https://www.tensorflow.org/recommenders

В процессе верстки

Справка о публикации и препринт статьи
предоставляется сразу после оплаты

Прием материалов

c 13 июля по 20 июля

Остался последний день

Размещение электронной версии

21 июля

Загрузка материалов в elibrary

22 июля

Публикация за 24 часа

Узнать подробнее

Акция

Cкидка 20% на размещение статьи, начиная со второй

Бонусная программа

Узнать подробнее