Любая организация в процессе своей деятельности стремится максимизировать прибыль. Для этого ей необходимо правильно организовать работу, ориентируясь на те вещи, которые приносят наибольшую прибыль с наименьшими затратами. Некоторое время назад считалось, что товар или предоставляемые организацией услуги приносят ей прибыль. Сейчас же все большее распространение приобретает клиентно-ориентированная стратегия, где во главу угла ставится клиент и механизмы взаимодействия с ним. Данная стратегия получила название CRM – Customer Relationship Management. На рынке существует большое разнообразие CRM систем [1, 2], однако почти все они предназначены для автоматизации работ по сбору и систематизации данных о клиентах и практически не обладают развитыми средствами анализа. Только в наиболее дорогих имеются средства OLAP. Из-за игнорирования вопросов анализа CRM данных, часто организации даже не подозревают о каких-то закономерностях в поведении клиентов, в то время как знание подобных закономерностей и их учет в своих действиях может принести значительную практическую пользу.

Ниже рассмотрен Deductor:CRM – готовое аналитическое решение для анализа информации о клиентах на базе платформы Deductor 4. Решение включает в себя хранилище данных о клиентах, готовые механизмы аналитической отчетности, а также сценарии решения более сложных задач: анализ воздействия рекламы, сегментация клиентов, установление признаков клиентов, приносящих наибольшую прибыль, определение предпочтения товаров, прогнозирования успеха сделки и объемов продаж.

Хранилище данных по клиентам

Важным этапом на пути построения аналитической системы является создание единого централизованного хранилища данных по клиентам (Customer Data Warehouse). В нем должна содержаться наиболее полная информация о клиентах, об истории взаимоотношений, открытых или завершенных сделках с клиентом.

Существует много направлений деятельностей организаций, работающих с клиентами. И для разных направлений, вероятно, требуется хранить различную информацию о потребителях. Например, если организация занимается торговлей, то наиболее интересной информацией о клиенте будет сфера его деятельности, категория клиента, географический регион его расположения, а сделки будут отражать продажи некоторого товара. Если же это банки, работающие с населением, то информацией о клиенте будут его возраст, пол, семейное положение, другие личные характеристики, социальный статус, заработок и другие, а сделки будут отражать предоставление каких-либо услуг, например, предоставление кредита. Описываемое решение – Deductor:CRM ориентирован на использование в торговых организациях.

В хранилище данных информация хранится в измерениях и процессах. Измерение – это объект анализа, который может характеризоваться свойствами, присущими только ему и имеет уникальный идентификатор. Процесс представляет собой звезду, в центре которой хранятся факты, а лучи являются измерениями. Хранилище данных будет содержать следующую информацию о клиентах: название, вид (юридическое или физическое лицо), сфера деятельности, географический регион расположения клиента, тип клиента по классификации АВС, тип клиента по классификации XYZ, потенциальный клиент или клиент.

Процесс отображает сделку с клиентом, то есть продажи клиенту некоторого товара. Фактом процесса будет сумма сделки и количество закупаемого товара. Измерения – клиент, менеджер организации, курирующий сделку, дата совершения сделки, состояние сделки (открыта, отказ, успех), причина отказа в случае неуспешной сделки, источник информации о приобретаемом товаре, товар.

Например, процесс 'Сделка' содержит следующее измерения:

  • номер клиента;
  • состояние сделки;
  • причина отказа, в случае неуспешной сделки;
  • менеджер, курирующий сделку;
  • дата сделки;
  • источник информации, способствующий сделке;
  • номер покупаемого товара;
  • номер региона;
  • сфера деятельности клиента.

    и факты:

    • количество купленного по сделке товара;
    • сумма сделки.

      Зачем требовалось хранилище данных? Во-первых для централизованного хранения данных о клиентах и сделках. Данные в ХД могут собираться из любых источников, например, из учетной CRM системы, бухгалтерской или складской программы. Во-вторых данные будут представлены в удобном для анализа виде. В-третьих, обеспечивается полнота и непротиворечивость данных с точки зрения анализа.

      Теперь, когда есть хранилище, можно приступать к анализу данных по клиентам.

      Создание аналитической отчетности

      Благодаря аналитической отчетности, данные из хранилища представляются в виде, удобном для дальнейшего анализа. Наиболее удобным инструментом для получения аналитической отчетности являются OLAP-кубы (On Line Analytical Processing – оперативная аналитическая обработка данных). OLAP дает возможность в реальном времени генерировать описательные и сравнительные сводки данных и получать ответы на различные другие аналитические запросы. OLAP-кубы представляют собой проекцию исходного куба данных на куб данных меньшей размерности. При этом значения ячеек объединяются. Такие проекции или срезы исходного куба представляются на плоскости в виде кросс-таблицы.

      На рисунке 1 представлена кросс таблица с двумя измерениями: менеджер и статус сделки. По такой таблице легко определить наиболее успешных менеджеров.

      Кросс-таблица
      Рисунок 1. Кросс-таблица.

      Более наглядное представление кросс-таблицы дает кросс-диаграмма:

      Кросс-диаграмма
      Рисунок 2. Кросс-диаграмма.

      В Deductor 4 в OLAP-кубе с помощью инструмента 'селектор' можно агрегировать факты по какому-либо измерению, оставляя только те объекты, которые соответствуют указанному условию. Например, можно объединить сумму сделок по клиентам, оставив только тех, которые в сумме приносят 50% прибыли. На рисунках 3 и 4 представлены селектор и клиенты, приносящие 50% прибыли.

      Селектор
      Рисунок 3. Селектор.

      Клиенты, приносящие 50% прибыли
      Рисунок 4. Клиенты, приносящие 50% прибыли.

      Это небольшой пример применения аналитической отчетности. На практике можно таким образом анализировать любую информацию о клиентах, имеющуюся в хранилище в произвольных разрезах. Иногда может потребоваться также некоторая предобработка данных, например, очистка данных, для чего используются механизмы анализа заложенные в Deductor 4.

      Анализ воздействия рекламы

      Для привлечения новых клиентов торговые организации активно используют рекламу в средствах массовой информации. Однако не во всех источниках реклама создает одинаковое воздействие на людей. Кроме того, стоимость рекламы может очень сильно отличаться. Поэтому важно знать, какую пользу какая реклама приносит и на какие категории клиентов воздействует.

      В данных о сделках содержится информация об источнике рекламы, который способствовал совершению сделки. С помощью OLAP-куба можно получать отчеты с объемами сделок в разрезе различных источников. Не менее интересна информация в разрезе источника и каких-либо характеристик клиента. На рисунке 5 приведен пример отчета, из которого видно, что сильное воздействие оказывают семинары, а также видно как это воздействие распределяется по регионам.

      Воздействие рекламы в регионах
      Рисунок 5. Воздействие рекламы в регионах.

      Для того, чтобы понять, какими же характеристиками обладают клиенты, совершающие сделки по тому или иному источнику рекламы, удобно воспользоваться самоорганизующимися картами Кохонена. Для их обучения необходимо использовать в качестве входных поля со всевозможными характеристиками клиентов и источник рекламы. После обучения нейросети будут построены карты по одной на каждое поле. Выделив на карте с источником, интересующую рекламу, можно будет посмотреть на других картах, какие же клиенты попали в эту область.

      Сегментация клиентов

      Наиболее активные фирмы, занимающиеся торговлей, используют как пассивную рекламу для привлечения новых клиентов, то есть, например, рекламу на телевидении, на радио, в прессе, так и рассылку с прямыми коммерческими предложениями. Для повышения эффективности подобных мероприятий необходимо учитывать интересы клиентов, объектов воздействия. То есть предлагать клиентам именно тот товар, который они предпочитают. Но нельзя учесть предпочтения каждого клиента. Необходимо выделять некоторые группы – сегменты – клиентов и уже этим группам предлагать конкретную категорию товаров.

      Выделять сегменты клиентов можно по нескольким группам признаков. Это могут быть сегменты по сфере деятельности, по географическому расположению. Для чего это нужно? После сегментирования можно узнать, какие именно сегменты являются наиболее активными, какие приносят наибольшую прибыль и где находятся наиболее лояльные клиенты, выделить характерные для них признаки. Для решения этой задачи воспользуемся мощным механизмом кластеризации – самоорганизующимися картами Кохонена.

      На рисунке 6 представлены карты Кохонена, полученные после кластеризации клиентов по характеристикам: вид (KIND), удаленность региона (DISTANCE), сфера деятельности (BRANCH), среднегодовые суммы сделок (SUMM) и частота сделок – количество сделок в неделю (DEAL_STATE). Поле BRANCH является строковым и использовалось как выходное, поэтому в процессе обучения нейросети оно не участвовало. Но после группировки по остальным полям, значения поля BRANCH также могли быть сгруппированы на карте.

      Сегментация клиентов
      Рисунок 6. Сегментация клиентов.

      Видно достаточно четкое разделение на 4 сегмента. Воспользуемся теперь деревом решений для получения правил отнесения клиентов к этим сегментам. Входными для дерева решений будут те же характеристики, а выходным – номер кластера. Результат представлен на рисунке 7.

      Правила отнесения к сегменту
      Рисунок 7. Правила отнесения к сегменту.

      Полученные сегменты можно интерпретировать следующим образом. Сегмент 0 – физические лица, расположенные ближе 600 км – клиенты, совершающие сделки на небольшую сумму и не очень часто. Сегмент 1 – клиенты, приносящие большую прибыль и часто совершающие сделки – это юридические лица в сфере связи, расположенные от 175 до 600 км. Клиенты сегмента 3 редко совершают сделки и приносят маленькие прибыли. Эти клиенты расположены дальше 600 км. Сегмент 2 обладает средними показателями.

      Поиск признаков прибыльных клиентов

      Какие же из выделенных выше сегментов являются наиболее прибыльными? Клиентов, приносящих большую прибыль удобно посмотреть с помощью OLAP-куба. На рисунке 8 показана кросс-таблица, на которой по горизонтальной оси отложены номера сегментов клиентов, полученных при помощи карт Кохонена, а по вертикальной – среднегодовые суммы сделок, приходящиеся на каждого клиента. Видно, что особое внимание нужно уделять клиентам первого сегмента.

      Продажи по сегментам
      Рисунок 8. Продажи по сегментам.

      Анализ предпочтений товаров

      Как уже говорилось выше, анализ предпочтений товаров нужен для успешного проведения маркетинговых кампаний по рекламной рассылке клиентам. Для этого выделяются сегменты клиентов, предпочитающих определенную группу товаров. При этом один и тот же клиент может попасть в разные сегменты.

      Наиболее простой и наглядный способ определения какие клиенты предпочитают ту или иную группу товара – это применение карт Кохонена. Для анализа используется информация обо всех сделках с клиентами на приобретение товара. То есть, есть таблица с клиентами, их характеристиками и наименованием группы товара, который они приобретали. Эта таблица используется при обучении карт Кохонена. На вход нейросети подаются характеристики клиента, а на выход – группа товара. Надо отметить, что выходные поля при обучении нейросети не участвуют. После группировки клиентов в некоторые области, группы товаров также должны сгруппироваться в области, если, конечно, существует зависимость между характеристиками клиентов и покупаемым товаром. Если после обучения карт Кохонена группы товаров не разбросаны по карте, а сгруппированы в области, то зависимость есть и далее можно сделать группировку по сегменту клиентов, клиентам и группе товаров. Для такой группировки удобно воспользоваться OLAP-кубом, подсчитав количество клиентов в каждом сегменте, по каждой группе товара. Результат такой группировки представлен на рисунке 9.

      Количество клиентов в каждом сегменте, по каждой группе товара
      Рисунок 9. Количество клиентов в каждом сегменте, по каждой группе товара.

      На этом рисунке по горизонтали отложены номера сегментов клиентов, а по вертикали – количество клиентов в каждом сегменте, по каждой группе товара. Например, в нулевом сегменте 90 клиентов предпочитают третью группу товара, а 65 – вторую. Причем, один и тот же клиент мог внести вклад и в ту и в другую группу.

      Видно, что в первом сегменте нет какого-то определенного предпочтения товаров, во втором сегменте явно пользуется спросом группа 1, в нулевом предпочитают группы 2 и 3, в третьем – 1 и 2. Теперь ясно, каким клиентам, какой товар предлагать.

      В торговых организациях постоянно обновляется ассортимент товаров. Если ассортимент вовремя не обновится, организация вскоре может потерять часть клиентов. С другой стороны, чрезмерное пополнение ассортимента новинками может не соответствовать текущим требованиям рынка. Алгоритм поиска компромисса может быть следующим. В каждой сегментной группе клиентов ищутся те, которые в большей степени предпочитают данную группу товара, и именно им предлагается новинка из той товарной группы, которая наиболее предпочтительна для данного сегмента. В случае успешного предложения, этот товар можно будет предложит остальным представителям данного сегмента.
      В OLAP-кубе из предыдущего примера оставим только третий сегмент и с помощью селектора оставим только первые 10 наиболее активных клиентов. Ими оказались клиенты, представленные на рисунке 10.

      Клиенты третьего сегмента, в большей степени предпочитающие товар групп 1 и 2
      Рисунок 10. Клиенты третьего сегмента, в большей степени предпочитающие товар групп 1 и 2.

      В случае появления нового товара можно сначала предложить его этим клиентам, а в случае положительных откликов распространить предложение на остальных клиентов этой группы.

      Прогнозирование успеха сделки

      Заранее спрогнозировать успех сделки важно потому, что в случае отказа клиента организация теряет не только затраченное на его привлечение и работу с ним время, но и затраченные на него средства, а также самого клиента, который, видимо, уйдет к конкуренту.

      Когда у организации накопилось достаточно много информации о завершенных сделках, успешных и неуспешных, можно использовать эту информацию, для выяснения факторов, которые в большей степени влияют на конечное состояние сделки.

      Для решения этой задачи воспользуемся деревом решений. В качестве входных полей для его обучения используем следующую информацию о сделках: KIND (вид клиента), АВС (тип по АВС классификации), MANAGER (менеджер), REGION (регион), DISTANCE (удаленность), BRANCH (сфера деятельности), E-MAIL, FAX, FONE (количество писем, факсов, телефонных разговоров перед сделкой). В качестве выходного используем поле DEAL_STATE (состояние сделки). После обучения, получаем дерево решений, которое представляет в иерархическом виде правила, следуя которым можно спрогнозировать успех сделки. На верхних уровнях дерева располагаются характеристики сделки, в наибольшей степени влияющие на ее состояние. Правила, из дерева решений можно представить в виде таблицы, представленной на рисунке 11.

      Правила прогнозирования успеха сделки
      Рисунок 11. Правила прогнозирования успеха сделки.

      Прогнозирование объемов продаж

      Торговые организации стремятся свести к минимуму время, которое товар лежит на складе, а также место, которое он там занимает. С другой стороны, необходимо чтобы на складе всегда лежал требуемый в настоящее время товар. Прогнозирование объемов продаж является важным шагом на пути принятия решения по оптимизации работы предприятия.

      Важными данными для построения прогноза объемов продаж – это статистика продаж за предыдущие периоды. Такая информация есть в нашем хранилище. Не всегда имеет смысл делать общий прогноз продаж. Дело в том, что существуют случайные клиенты, которые нарушают общую тенденцию, покупая товар в 'неподходящий' сезон или случайный товар. Поэтому перед прогнозированием нужно выделить сделки по соответствующему сегменту клиентов и определенной группе товара, например, предпочитаемого этим сегментом.

      Для примера сделаем фильтрацию всех сделок по третьему сегменту клиентов, группе товара номер 1 (предпочитаемый третьим сегментом), оставив только успешные сделки. Прогнозировать будем количество продаваемого товара. Рассматривать сделки по дням не имеет смысла, так как каждый день может очень сильно отличаться от другого по объему продаж. Но продажи в среднем по неделям или по месяцам отличаются не сильно. Сгруппируем все сделки по неделям. После такой группировки тенденция наблюдается лучше, но все еще существуют различные выбросы и шумы на кривой продаж. Для их устранения в Deductor 4 применяется инструмент «парциальная обработка». Воспользуемся им, указав удаление аномальных значений и вейвлет преобразование для сглаживания кривой продаж. Результат всех этих операций показан на рисунке 12.

      Сглаженная кривая продаж
      Рисунок 12. Сглаженная кривая продаж.

      Прогноз строится на предположении сезонности продаж и общего развития рынка. Для оценки сезонности используют автокорреляцию. Она показывает степень зависимости некоторого значения от предыдущих значений этой величины. В нашем примере максимум линии автокорреляции приходится на 43 недель, что приблизительно соответствует одному году (рисунок 13).

      Автокорреляция объемов продаж
      Рисунок 13. Автокорреляция объемов продаж.

      После оценки сезонности необходимо построить модель. В нашем примере, когда объемы продаж зависят от предыдущих продаж, можно использовать линейную регрессию. Однако, в более сложных ситуациях лучшие результаты даст использование нейронных сетей для построения более адекватных моделей. Обучать модель на данных за пол года назад не имеет смысла, так как зависимость между ними и текущими продажами очень слабая (рисунок 13). При обучении линейной регрессии будем подавать на ее вход объем продаж за две предыдущие недели текущего года, чтобы учесть общее развитие рынка, и две недели, соответствующие им год назад, чтобы учесть сезонность. Таким образом учитываются спуски и подъемы кривой продаж. Качество построенной модели можно наглядно посмотреть на диаграмме рассеяния (рисунок 14). Истинные значения располагаются вдоль прямой линии, а полученные по модели – выше или ниже ее.

      Диаграмма рассеяния
      Рисунок 14. Диаграмма рассеяния.

      После того, как построена модель можно построить прогноз, прогнав через нее историю продаж. Сделаем прогноз на 4 недели вперед. Прогноз на более длительный период будет в гораздо меньшей степени соответствовать действительности. Результат можно посмотреть на диаграмме прогноза (рисунок 15), либо в таблице (рисунок 16).

      Прогноз объемов продаж на 4 недели (диаграмма прогноза)
      Рисунок 15. Прогноз объемов продаж на 4 недели (диаграмма прогноза).

      Прогноз объемов продаж на 4 недели (таблица)
      Рисунок 16. Прогноз объемов продаж на 4 недели (таблица).

      После того как сделан прогноз по группам товаров можно получить прогноз по каждому товару группы. Делается это путем разгруппировки пропорционально вкладу каждого товара группы в общий объем за предыдущие периоды времени. Результат такой разгруппировки на рисунке 17.

      Прогноз объемов продаж на 4 недели по каждому товару
      Рисунок 17. Прогноз объемов продаж на 4 недели по каждому товару.

      Сделав таким способом прогноз по всем сегментам клиентов и всем группам товаров, можно получить общий прогноз объемов продаж. Такой прогноз учитывает сезонность продаж каждой группы товаров и активность каждого сегмента клиентов в разные периоды времени.

      Заключение

      Заменив в рассмотренных выше примерах товар на услуги можно распространить проведенный анализ на организации в сфере услуг. Но нельзя построить универсальную аналитическую систему, которая бы подходила любой клиентно-ориентированной организации. Для успешной деятельности одних организаций необходима, например, информация о личных характеристиках человека, таких как пол, вес, рост, возраст. Для других необходима информация о характеристиках организаций, таких как удаленность, число сотрудников, сфера деятельности, занимаемая площадь. Поэтому создание аналитической системы начинается уже при создании хранилища данных, специализированного для аккумулирования специфических данных о клиентах. Отличие может быть и в зависимостях между данными. Например, сезонность продаж зависит от продаваемого товара. Такая сезонность может наблюдаться при торговле одеждой, но ее может не быть при торговле продуктами питания. Для каждого конкретного случая необходимо строить свою модель. Даже, если у двух различных организаций абсолютно одинаковая деятельность, модели, построенные для одной, могут не работать для другой. Необходимо их переобучать на данных именно этой организации. Именно поэтому данное решение реализовано на платформе Deductor 4, обладающего достаточной гибкостью, удобными механизмами интеграции со сторонними системами и большим набором инструментов анализа. Это позволяет быстро
      адаптировать решение в соответствии с изменяющимися требованиями.

      Презентация по решению Deductor:CRM – deductor_crm_solution.exe

      Список литературы:

      1. www.crmonline.ru
      2. www.crm.com.ua
      www.on-crm.ru

      Онлайн CRM система:
      - единая база клиентов
      - история взаимодействий
      - учет продаж

      www.badadom.ru

      Портал - все новостройки СПб
      - база новостроек
      - поиск квартир
      - бронирование квартир

      www.on-realty.com

      Сервисы для риелторов
      - Сайт агентства недвижимости
      - База новостроек
      - Виджет каталога новостроек

      Санкт-Петербург, Полюстровский пр., д. 43А © sinercom.ru, 2017

      (812) 385-72-26

      @

      sinercom@sinercom.ru

      wolter-sc

      Карта сайта