Журнал «Научный лидер» выпуск #15 (216), Апрель ‘25

ПРИМЕНЕНИЕ UPLIFT-МОДЕЛИРОВАНИЯ И СРАВНЕНИЕ МОДЕЛЕЙ ДЛЯ ОПТИМИЗАЦИИ SMS-КАМПАНИЙ В РИТЕЙЛЕ

Авторы публикации

Талалова Наталья Сергеевна

Рубрика

Информационные технологии

Просмотры

1677

Журнал

Журнал «Научный лидер» выпуск # 15 (216), Апрель ‘25

В статье рассматривается применение uplift-моделирования для повышения эффективности SMS-кампаний в розничной торговле на примере данных X5 Retail Hero Challenge. Описан процесс предобработки данных, включая преобразование временных признаков и агрегацию транзакционных данных. Протестированы различные модели, такие как ClassTransformation, TwoModels и Uplift Random Forest, а также применён бэггинг для улучшения результатов. Оценка проводилась с использованием метрик uplift@k и weighted average uplift.

машинное обучение

розничная торговля

Uplift-моделирование

SMS-кампании

бэггинг

эффективность маркетинга

В условиях высокой конкуренции в розничной торговле компании стремятся оптимизировать маркетинговые кампании, минимизируя затраты и увеличивая их эффективность. SMS-рассылки остаются популярным каналом коммуникации с клиентами, однако массовая отправка сообщений может быть экономически неэффективной, особенно если она направлена на клиентов, которые не изменят своё поведение под воздействием рекламы.

Цель данной работы — разработать и сравнить модели uplift-моделирования для предсказания изменения вероятности покупки клиента при получении SMS-сообщения, а также определить наиболее эффективный подход для оптимизации маркетинговых кампаний.

Исследование основано на датасете из соревнования X5 Retail Hero Uplift Modeling Challenge. Датасет включает три основные таблицы:

clients.csv: информация о клиентах (возраст, пол, даты отправки и использования оффера);
purchases.csv: история покупок клиентов;
uplift_train.csv: данные о принадлежности клиента к тестовой или контрольной группе и совершении покупки.

Общий объём данных позволяет проанализировать поведение более 60 000 клиентов, что делает выборку репрезентативной для задач ритейла.

На этапе предобработки были выполнены следующие шаги:

Временные признаки (даты отправки и использования оффера) переведены в UNIX-время (секунды с 01.01.1970);
Извлечены дополнительные признаки, такие как задержка между отправкой и использованием оффера (issue_redeem_delay);
Проведена агрегация транзакционных данных: общее число покупок, количество уникальных товаров, суммы транзакций, начисленные и потраченные баллы лояльности.

После объединения признаков с целевой таблицей была сформирована итоговая выборка для uplift-моделирования. Для анализа были подготовлены две версии набора признаков:

Первая таблица признаков: базовый набор, включающий возраст, пол, временные метки и задержку между отправкой и использованием оффера.
Вторая таблица признаков: расширенный набор, дополненный агрегированными транзакционными данными (например, общее число транзакций, уникальные товары, суммы покупок и баллы лояльности).

Для построения моделей применялись следующие методы uplift-моделирования:

ClassTransformation;
TwoModels (с модификациями: TwoModels_ddr_control, TwoModels_ddr_treatment);
Uplift Random Forest;
SoloModel;
ClassTransformationRegressor.

Для улучшения качества предсказаний использовался бэггинг (Bagging_Ensemble), объединяющий несколько базовых моделей.

Оценка моделей проводилась с использованием следующих метрик:

Uplift@k_overall_val: прирост целевого действия (покупки) в верхней части списка (k=30%);
Overfit: разница между uplift@k на обучающей и валидационной выборках;
Weighted Average Uplift: средневзвешенный прирост на полной выборке.

Дополнительно применялись визуальные инструменты: кривые Uplift и Qini, позволяющие сравнить эффективность моделей с случайным таргетированием.

На первом этапе были протестированы различные модели на двух наборах признаков (базовом и расширенном). Результаты представлены в таблицах ниже.

Сравнение по метрике uplift@k_overall_val (%):

Модель	Базовый набор	Расширенный набор	Δ (%)
ClassTransformation	0.091	0.155	+70.3
TwoModels_ddr_control	0.101	0.135	+33.9
TwoModels	0.086	0.124	+43.6
Uplift_RF	0.092	0.104	+12.8
SoloModel	0.082	0.096	+16.7
TwoModels_ddr_treatment	0.042	0.084	+100.0
ClassTransformationRegressor	0.101	0.111	+9.9

Сравнение по метрике overfit (%):

Модель	Базовый набор	Расширенный набор	Δ (%)
ClassTransformation	0.400	0.413	+3.3
TwoModels_ddr_control	0.127	1.356	+967.7
TwoModels	0.751	2.560	+240.9
Uplift_RF	0.550	0.718	+30.6
SoloModel	0.236	0.122	-48.3
TwoModels_ddr_treatment	1.036	2.525	+143.7
ClassTransformationRegressor	0.224	2.523	+1026.3

Ключевые выводы:

6 из 7 моделей показали рост uplift@k_overall_val на расширенном наборе признаков (средний прирост — +39.5%).
По метрике overfit базовый набор оказался лучше (средний рост overfit на расширенном наборе — +201.8%).
SoloModel продемонстрировала улучшение по обеим метрикам: uplift@k вырос на +16.7%, а overfit снизился на -48.3%.

Для дальнейшего повышения качества была применена техника бэггинга (Bagging_Ensemble), объединяющая несколько базовых моделей. Итоговые результаты представлены ниже:

Модель	uplift@k_overall_val	uplift@k_overall_train	overfit
Bagging_Ensemble	0.160987	0.406561	1.525
ClassTransformation	0.155259	0.219429	0.413
TwoModels_ddr_control	0.135333	0.318856	1.356
TwoModels	0.124791	0.444303	2.560
SoloModel	0.096060	0.107826	0.122

Анализ результатов бэггинга:

Bagging_Ensemble достигла наивысшего значения uplift@k_overall_val (0.160987), что на +3.7% выше предыдущего лидера (ClassTransformation).
Метрика overfit составила 1.525, что выше, чем у SoloModel (0.122), но ниже, чем у TwoModels (2.560).
Средневзвешенный прирост (weighted_average_uplift) на полной выборке составил 0.0322.

Кривые Uplift и Qini демонстрируют эффективность моделей по сравнению со случайным таргетированием. На графиках видно, что Bagging_Ensemble обеспечивает наибольший прирост числа инкрементальных покупок при увеличении числа таргетированных клиентов.

Сравнительный анализ моделей uplift-моделирования показал, что использование различных подходов позволяет эффективно оптимизировать SMS-кампании в ритейле, направляя воздействия на клиентов, наиболее склонных к изменению поведения. Наилучший результат (uplift@k = 0.160987) был достигнут с помощью ансамбля Bagging_Ensemble, что подчеркивает преимущества комбинирования моделей. Однако модели, такие как SoloModel и ClassTransformation, показали лучшее поведение с точки зрения переобучения, что делает их предпочтительными в задачах, где важна стабильность.

Список литературы

Uplift modeling: как предсказать влияние на пользователя, если воздействие еще не произошло [Электронный ресурс] // Хабр. — URL: https://habr.com/ru/companies/ru_mts/articles/485980/ (дата обращения: 10.02.2025)
Uplift modeling: предсказываем вероятность покупки [Электронный ресурс] // Хабр. — URL: https://habr.com/ru/companies/ru_mts/articles/485976/ (дата обращения: 10.02.2025)
Uplift-моделирование: как мы научились предсказывать реакции пользователей на скидки [Электронный ресурс] // Хабр. — URL: https://habr.com/ru/companies/ru_mts/articles/538934/ (дата обращения: 10.02.2025)