Одно из главных требований, предъявляемых к современной аналитической платформе, состоит в максимально быстром развертывании и интеграции с информационной системой предприятия. Это направление становится одним из приоритетных в развитии аналитического пакета Deductor.

Работая в течении многих лет в области анализа данных, аналитики компании BaseGroup выявили множество закономерностей в подходах к обработке и использованию информации, присущих различным отраслям. На основании богатого практического опыта, приобретенного в результате выполнения множества комплексных проектов по автоматизации анализа данных, была создана конфигурация для быстрого развертывания Deductor в информационной системе торгового предприятия – типовое решение 'Торговля и склад'. Это решение содержит большое количество типичных сценариев анализа данных, наиболее востребованных в торговой компании. Объединяя в единую стройную систему множество подходов к анализу, решение 'Торговля и склад' позволяет развернуть и начать полноценно использовать Deductor в считанные дни. Дальнейшее совершенствование комплекса может проводиться параллельно с повседневной работой с готовой базовой аналитической системой, не прерывая работу пользователей.

Типовое решение 'Торговля и склад' включает в себя несколько важных элементов, которые присутствуют в подавляющем большинстве проектов, реализованных на базе Deductor. Оно содержит настроенное хранилище данных, развитую систему аналитической отчетности и большой набор моделей прогнозирования продаж товаров и услуг (см. рис. 1).

Структура типового решения 'Торговля и склад'

Рисунок 1. Структура типового решения 'Торговля и склад'.

Процесс развертывания системы Deductor включает всего несколько шагов (см. рис. 2). Как хорошо видно, полностью использовать возможности Deductor можно уже на второй день после начала работ.

Процесс развертывания системы Deductor:Trade'

Рисунок 2. Процесс развертывания системы Deductor:Trade.

На первом этапе нужно загрузить в хранилище данных информацию из учетной системы, установленной в компании. После загрузки хранилище будет содержать всю информацию, необходимую для управления торговым предприятием. В дальнейшем в процессе развития установленного комплекса хранилище может сколь угодно расширяться, совершенствуя построенную информационную модель предприятия. Структура хранилища показана в следующей таблице.

ТаблицаНазначениеПоля
Справочник товаровИзмерение
  • Код товара (число)
  • Наименование товара (строка)
  • Группа товара (строка)
  • Категория товара (строка)
    Справочник организацийИзмерение
    • Код организации (число)
    • Наименование (строка)
    • Регион (строка)
    • Тип организации (строка)
    • Категория организации (строка)
      Справочник складовИзмерение
      • Код склада (число)
      • Наименование (строка)
        Справочник менеджеровИзмерение
        • Код менеджера (число)
        • ФИО (строка)
        • Отдел (строка)
          ПродажиПроцесс
          • Дата продажи (дата)
          • Код организации (число)
          • Код товара (число)
          • Код менеджера (число)
          • Кол-во (число)
          • Сумма в руб. (число)
          • Сумма в у.е. (число)
          • Себестоимость (число)
            Текущие остаткиПроцесс
            • Код склада (число)
            • Код товара (число)
            • Количество (число)
            • Себестоимость (число)
              ЗакупкиПроцесс
              • Дата закупки (дата)
              • Код организации (число)
              • Код товара (число)
              • Количество (число)
              • Себестоимость (число)
                ПоступленияПроцесс
                • Дата поступления (дата)
                • Код организации (число)
                • Сумма (число)
                  ОплатаПроцесс
                  • Дата оплаты (дата)
                  • Код организации (число)
                  • Сумма (число)

                    Информация может быть представлена в любом стандартном табличном виде: текстовые файлы и файлы DBF, MS Excel, базы данных MS Access, MS SQL, Oraсle, InterBase, любой ODBC источник. Огромное разнообразие учетных систем на разных предприятиях не позволяет создать универсальный сценарий загрузки хранилища. Поэтому нужно подготовить отдельный сценарий, который учитывает особенности хранения данных в компании и осуществляет их выборку и необходимую предварительную очистку.

                    По окончании загрузки хранилища сразу можно начинать полноценное использование системы настроенных отчетов. Система аналитической отчености включает в себя все наиболее востребованные отчеты о текущей деятельности компании, основанные на использовании технологии OLAP. В отчетах широко используются разнообразные способы визуального представления данных, позволяющие взглянуть на деятельность предприятия со всех ракурсов. В качестве примера на рис. 3 приведен отчет об объемах общих продаж товаров компании. Предусмотрены отчеты по продажам, клиентам, по отдельным товарам и регионам, остаткам товаров на складах и многие другие. Каждый отчет может быть сформирован в нескольких разрезах, предоставляя для анализа только нужную информацию.

                    Аналитическая отчетность

                    Рисунок 3. Аналитическая отчетность.

                    На третьем этапе эксперту компании или аналитику предлагается из подготовленных моделей прогнозов выбрать те, которые наилучшим образом отвечают особенностям бизнеса. Центральным элементом решения 'Торговля и склад' является набор сценариев, реализующих различные модели прогнозов. Прогнозирование продаж является, вероятно, самой часто встречающейся задачей в области анализа данных. Но, несмотря на свою распространенность, универсальных способов решения она не имеет. Именно по этой причине в состав типового решения 'Торговля и склад' включено такое большое количество разных моделей прогнозирования. В зависимости от особенностей конкретного бизнеса, исходный временной ряд продаж может вести себя совершенно по-разному, и одна модель никогда не сможет охватить все многообразие возможных ситуаций. 'Торговля и склад' содержит четыре набора сценариев прогнозирования (месячный прогноз, недельный прогноз, месячный прогноз с учетом сезонности, недельный прогноз с учетом сезонности).

                    Алгоритм выбора конкретной модели представлен на рис. 4.

                    Алгоритм выбора модели прогнозирования

                    Рисунок 4. Алгоритм выбора модели прогнозирования.

                    Первое, что следует решить при выборе модели, какая периодичность требуется от прогноза (помесячный или понедельный). В соответствии с принятым решением выбираются два сценария, строящие прогноз на нужный период.

                    Теперь надо определиться с имеющимися исходными данными. Если сразу достоверно известно, что исходных данных мало, либо что продажи товара не имеют ярко выраженных сезонных колебаний, то лучше выбрать сценарий прогноза без учета сезонности. В противном случае следует воспользоваться сценарием прогноза продаж с учетом сезонности. Если поведение временного ряда продаж неизвестно, то можно воспользоваться любым из двух сценариев для предварительного исследования данных. С помощью диаграммы автокорреляции из панели отчетов одного из сценариев можно определить, следует ли учитывать сезонность при построении прогноза. Если на диаграмме есть выраженные пики, то продажи товаров подвержены сезонным колебаниям, и прогноз надо строить по сценарию, учитывающему сезонность. Если же график ведет себя плавно на всем своем протяжении, следует выбирать сценарий без сезонности.

                    Замечание: если исходные данные имеются за период менее полутора лет, то учесть сезонность невозможно в принципе, и лучше выбрать сценарий прогноза без сезонности.

                    Принцип выбора модели прогноза достаточно прост. Для модели нужно посмотреть и оценить три вещи: диаграмму рассеяния (красные точки, изображающие выход модели, должны лежать вблизи прямой), диаграмму модели (на ней можно посмотреть, насколько хорошо выход модели описывает реальное поведение данных) и диаграмму прогноза (здесь следует оценить, насколько реальны значения, предсказываемые моделью). На основании исследования этих графиков следует выбрать модели, наиболее адекватно отражающие реальное поведение временного ряда. На рис.5 слева показаны диаграммы для неудачной модели, а справа – для подходящей.

                    Сравнение моделей прогноза

                    Рисунок 5. Сравнение моделей прогноза.

                    Замечание: нейронные сети нужно переобучить на новом наборе данных, чтобы они перестроили свою внутреннюю структуру. Этот процесс практически полностью автоматизирован и не требует больших затрат усилий и времени.

                    Здесь нужно сделать несколько замечаний по поводу выбора модели.

                    • Зачастую для построения качественного прогноза достаточно модели на базе линейной регрессии. Нейронные сети в некоторых ситуациях могут давать даже худший прогноз и, в любом случае, требуют переобучения, поэтому не следует начинать с их использования. Подробности об особенностях применения линейной регрессии и нейронных сетей для построения прогнозов можно найти в руководстве аналитика Deductor или на сайте компании – www.basegroup.ru
                    • При выборе модели по степени сглаживания данных следует начинать с наименьшей степени (т.е. без сглаживания), так как в процессе сглаживания из исходного временного ряда может быть потеряна значительная часть информации, ценной для прогнозирования.
                    • Если исходных данных совсем мало или их качество очень низкое и не может быть улучшено с помощью предобработки и сглаживания, то для получения прогноза следует использовать одну из простых пользовательских моделей, включенных в сценарии прогнозирования без учета сезонности. Речь идет о модели скользящего среднего, модели авторегрессии и модели ARIMA. Они позволяют строить прогнозы на малых объемах данных и данных с большими шумами.
                    • Если некоторая группа или категория товара не вписывается в общие тенденции, то для нее следует создать отдельную модель прогнозирования.

                      В ходе работы с типовым решением 'Торговля и склад' могут появляться новые потребности в проведении специального анализа, не предусмотренного в сценариях. Это совершенно обычная ситуация, в которой проявляется одно из главных достоинств Deductor: продолжая работать с типовым решением, можно подстраивать существующие модели или создавать новые, разрабатывать новые техники анализа данных, подстраивая платформу под требования исследуемого бизнеса (см. рис.6).

                      Процесс совершенствования аналитической системы

                      Рисунок 6. Процесс совершенствования аналитической системы.

                      При этом разработка и внедрение новых компонентов в уже развернутую платформу происходит совершенно прозрачно, без необходимости ее остановки или прекращения работы с ней пользователей. Развитие системы анализа данных – это процесс адаптации под мельчайшие требования бизнеса. Строя свою информационно-аналитическую систему на базе платформы Deductor, можно превратить этот процесс в циклический. На каждом новом этапе можно полноценно пользоваться разработанными средствами и моделями, не останавливая в то же время процесс дальнейшего совершенствования.

                      Морозов Александр
                      BaseGroup Labs

                      www.on-crm.ru

                      Онлайн CRM система:
                      - единая база клиентов
                      - история взаимодействий
                      - учет продаж

                      www.kvartiran.ru

                      Портал - все новостройки СПб
                      - база новостроек
                      - поиск квартир
                      - бронирование квартир

                      www.on-realty.com

                      Сервисы для риелторов
                      - Сайт агентства недвижимости
                      - База новостроек
                      - Виджет каталога новостроек

                      jooble - работа для SEO специалистов
                      Санкт-Петербург, Полюстровский пр., д. 43А © sinercom.ru, 2024

                      (812) 385-72-26

                      @

                      sinercom@sinercom.ru

                      wolter-sc

                      Карта сайта