После проведения работ по автоматизации в компаниях малого бизнеса расширяются возможности для анализа получаемых данных на каждом этапе деятельности. Одним из ключевых аспектов любого бизнеса является взаимоотношения с клиентами. Понимание потребностей клиентов, их предпочтений и поведения позволяет оптимизировать бизнес-процессы, улучшить обслуживание и повысить уровень удовлетворенности клиентов. Например, для решения проблемы удержания клиентов по полученным данным аналитики могут провести анализ клиентской базы предприятия малого бизнеса, составить портрет клиента, склонного уйти.
В качестве примера можно привести анализ клиентской базы автосервиса. После сбора информации о клиентах автосервиса сформировался датафрейм, который содержал данные по 1,2 тысяче клиентов. Была проведена предобработка данных. Данные были очищены от полных дубликатов.
Далее был проведен исследовательский анализ данных, в результате чего было выявлено, что медианный портрет клиента автосервиса – это 32-летний гражданин, который использует кредитную карту при оплате услуг. Минимальный возраст клиента 18 лет, максимальный – 75 лет. Судя по визуализации на боксплотах, выбросы были у показателя «возраст». Большинство клиентов банка в возрасте от 22 до 60 лет. Более младших и старших возрастов мало.
89% клиентов автосервиса – жители г. Москва. Гендерное распределение клиентов – 75% мужчины и 25% женщины.
Половина клиентов автосервиса пользовались его услугами более двух раз. Средний чек составил 2500 руб. Большинство клиентов автосервиса (91,5%) при оплате услуг использовали банковскую карту. Остальные платили наличными.
Далее был проведен анализ оттока клиентов, рассчитано количество клиентов в двух группах – тех, кто ушел в отток, и тех, кто остался. Большинство остались клиентами автосервиса (890 чел.), а 310 клиентов ушли.
Далее было изучено средние значения признаков в двух группах – тех, кто ушел в отток и тех, кто остался. Портрет среднего «ушедшего» клиента - возраст 42 года со средним чеком 3510 руб. и средним количеством обращений в автосервис 1,2 в текущем году. Банковской картой при оплате пользовались почти 90% «ушедших» клиентов.
Портрет среднего «оставшегося» клиента – возраст 35 лет со средним чеком 2100 руб. и средним количеством обращений в автосервис 2,3 в текущем году. Банковской картой пользовались почти 98% «оставшихся» клиентов.
При сравнении средних значений признаков оттока и оставшихся клиентов можно сделать следующие выводы: «оставшиеся» клиенты более молодые с чуть более низким средним чеком. Но они более лояльные к автосервису – среднее число посещений автосервиса выше, чем аналогичный показатель в группе «оттока».
Для того, чтобы добавить гендерную категорию в список предварительно провели категоризацию всех клиентов с помощью label encoder sklearn. Новые значения добавили в новый столбец с гендерной категорией. Условно при указании пола «мужской» присвоилась категория 1, при указании «женский» - категория 0.
Разделили датафрейм на две части – «отток» и «не попали в отток». Построили гистограммы распределения distplot по небинарным значениям признаков и с разбивкой на «Отток» и «Не попали в отток». По данным столбчатых диаграмм для бинарных значений признаков можно сделать следующие выводы:
- Пол не особо влияет на решение клиента уйти из автосервиса. Но среди «оставшихся» клиентов мужчин оказалось больше.
- Среди «оставшихся» клиентов большее количество клиентов, кто платит безналично, чем среди «ушедших».
Затем была проведена кластеризация клиентов. Выделение кластеров позволило определить «клиентские группы», объединенные определенными признаками, в том числе и склонностью к оттоку. Построили матрицу расстояний функцией linkage() на стандартизованной матрице признаков. Далее нарисовали дендограмму, на которой стало заметно цветовое разделение выборки на четыре примерно одинаковых кластера.
Обучили модель кластеризации на основе алгоритма метода k-средних (K-means) и разделили выборку на кластеры (n=4 кластеров). Добавили столбец с номерами кластеров в исходный датафрейм. Построили диаграмму распределения клиентов по кластерам. Из полученных кластеров наиболее многочисленный – 3 кластер (420 клиентов или 35% от общей численности клиентов). Остальные три кластера примерно одинаковые: 240 чел. или 20% (2 кластер), 264 чел. или 22% (0 кластер) и 276 чел. или 23% (1 кластер). Затем вывели средние значения признаков в разрезе кластеров.
Далее были построены графики распределения признаков по кластерам. Судя по графикам, во всех кластерах мужчин больше, чем женщин. Было также произведено детальное описание кластеров. По итогам проведенной кластеризации с выявлением кластеров (кластер 0 и кластер 2) с высокой долей оттока (24% и 31% соответственно) можно вывести портрет клиента, склонного к оттоку: клиент со средним возрастом примерно 40 лет, средним чеком от 2,5 тыс. руб. до 2,8 тыс. руб.
Напротив – к постоянным клиентам автосервиса можно отнести клиентов из кластера 3 (средний показатель оттока 13%), где средний возраст 35 лет, более низкий средний чек – 2,2 тыс. руб.
По итогу проведенного анализа среди рекомендаций аналитиков по удержанию клиентов автосервиса можно выделить: необходимость разработки продуманных программ лояльности (система скидок и бонусов), различные призовые акции, подарки-сувениры, поздравления клиентов с днем рождения по смс. «На удержание» клиента работают также различные дополнительные услуги. Для увеличения показателя среднего чека можно увеличить долю продаж автосервисом своих запчастей, предоставлять клиентам более широкую программу гарантий.
Список литературы
- Средний чек на услуги автосервиса в России вырос на 10% за первое полугодие 2021 года – Текст: электронный // Рамблер: [сайт]. – URL: https://auto.rambler.ru/navigator/47041014-sredniy-chek-na-uslugi-avtoservisa-v-rossii-vyros-na-10-za-pervoe-polugodie-2021-goda/ (дата обращения 04.08.2023).
- 3 способа увеличить средний чек в автосервисе // EASYМАРКЕТИНГ: [сайт]. – URL: https://easy-m.ru/3_sposoba_uvelichit_srednyi_chek?ysclid=ll0w6a0vpk36431399 (дата обращения 05.08.2023).
- Уэс Маккинни, Python и анализ данных. Второе издание // Wes McKinney, Python for Data Analysis. Second edition, 2019.