Big Data — модный термин. Но какие выгоды большие данные могут реально принести компании? Каковы сроки окупаемости таких проектов? Что необходимо бизнесу для внедрения аналитических технологий? Эти и другие вопросы мы адресовали эксперту, руководителю направления аналитических систем розничных компании, Евгению Нечепоренко.
— Евгений, расскажите о своем профессиональном опыте. Чем занимались в последнее время и в какой отрасли работаете сейчас?
— С 2004 года я занимаюсь бизнес-аналитикой в розничных сетях (на начальном этапе FMCG, далее — продуктовый ритейл, фарма). Первая компания – сеть «Хорошие новости» в момент моего прихода росла и с определенного момента аналитический BI-инструментарий стал одним из ключевых в работе. Аналитика открыла окно в состояние бизнеса всем экономическим и маркетинговым подразделениям компании. Мы даже написали success story с Microsoft – на продуктах этого вендора мы стоили первые аналитические решения.
Некоторые наработки были зарегистрированы как интеллектуальная собственность и в последствии внедрялись в других компаниях как «коробочные решения» в роли внешнего консультанта.
В первой половине 2015 года я работал в московской сети аптек, также возглавлял созданное с нуля направление аналитических систем, где были внедрены предыдущие наработки, а также создан фундамент для дальнейшего пути в мир Big Data. С середины августа занимаю аналогичную позицию в ювелирной сети, где сейчас формируется будущая глобальная архитектура Big Data, но о конкретных результатах пока говорить рано.
— Внедрение бизнес-аналитики в фармацевтике — это интересно. Как подобные технологии помогают сетям аптек расти и развиваться?
— В фармацевтике, как и в любом другом бизнесе, один из наиболее актуальных вопросов — товародвижение. Если говорить об аналитике в целом, прежде всего, это ассортиментный анализ. В зависимости от специфики и спроса формируются разные ассортиментные матрицы для конкретных локаций. Обычный ERP-инструментарий не предоставляет достаточно гибкой аналитики в данном вопросе. Вот, собственно, самое первое и простое применение.
— Чем конкретно Вы занимались в сети аптек?
— Мы реализовали мониторинг предложений конкурентов, с целью корректировки собственного ассортимента, первоочередного вывода новинок, т.е. оптимизировали собственное предложение по цене и сбалансированности ассортимента.
Анализ предложений конкурентов через открытые источники — классическая задача из мира Big Data. Она решается при помощи text-mining, web-scraping, python и других технологий. Для упрощения собственной реализации можно воспользоваться услугами специализирующихся на этом компаний и DMP-поставщиков. Таким образом вы можете осознанно корректировать свое предложение относительно конкурентов, быть выше или ниже по цене исходя из собственной стратегии и ценности бренда для покупателей.
Можно пойти дальше и попробовать применить таргетированные предложения: взять адресные классификаторы или гео-координаты, проанализировать ближайшие предложения или предложения в текущем районе города. За этим следуют рекомендательные системы на сайте (на основе геоданных покупателя и ближайшей к нему локации), корректировка цен off-line, индивидуальные коммуникации через другие каналы информирования. Мы не успели это реализовать, но в перспективных кейсах это остается.
— Давайте отойдем от фармацевтики и перейдем к бизнесу в целом. Как Вы считаете, отечественный рынок в полной мере осознает выгоды от внедрения аналитических технологий? Или это не пришло к нам в такой мере, как на Западе.
— Безусловно, в такой мере, как на Западе, пока еще не пришло. Для нас фактически все только начинается. 2014 год в этом отношении был очень знаменательным и требовательным – был бурный спрос на термин «Big Data». Правда, в 2015-м наступило некоторое затишье. Возможно, компании осознали, что получить конкретный выигрыш с Big Data не так-то просто. Кроме того, остро встал вопрос переложения этих технологий на конкретный бизнес-сценарий, ведущий к прибыли. Так или иначе, без понимания отраслевой специфики, сами по себе технологии Big Data и Machine Learning не дадут быстрого эффекта.
Если говорить в целом про аналитику, в последние 2 года она переживает очередной рост. Первый всплеск интереса к аналитическим технологиям наблюдался в 2004-2006 годах — тогда на рынок вышли аналитические инструменты от таких вендоров, как QlikView, Panorama, Microsoft, Cognos. Во время кризиса 2008 года большинство компаний резали косты по всем возможным направлениям, в т.ч. аналитике, лишь бы выжить. После кризиса 2008-го термин “аналитика” начал все чаще заменяться понятием “большие данные”, а также пришли новые инструменты, например, Tableau, экосистема Hadoop. Кризис заставил людей думать об аналитике, учиться извлекать из этого профит.
С популяризацией термина «Big Data» кто-то смог успешно внедрить эти технологии у себя, в первую очередь, это гиганты телекома, передовые розничные компании, а кто-то поигрался и не понял, что делать дальше. Как ответ — появились новые формы образования, некоторые вендоры запустили собственные образовательные программы на основе высших учебных заведений – ВШЭ, МГУ, появились компактные по времени курсы, например – «Специалист Big Data» в New Professions Lab. На этом курсе слушателей «прогоняют» по некоторым кейсам применения BigData и Machine Learning, дают теоретические основы, формируют общий понятийный аппарат. Нельзя сказать, что отрабатываются готовые кейсы по отраслям, тем не менее формируются навыки работы с инструментарием и вариантами применения: рекомендательные системы, анализ больших неструктурированных данных, анализ на графах и соцсетях. Дальше специалисту, который уже обладает экспертным отраслевым опытом, остается с этими технологиями экспериментировать и перекладывать на конкретные бизнес-задачи.
Безусловно, «Big Data» — термин, в котором много маркетинга: звучит заманчиво, но сложно понять, как такие технологии могут вывести бизнес на новый уровень. Тем не менее, это неизбежность, надо это просто осознать – информационных потоков вокруг все больше, они несут ценность о потребителе, конкурентах, рынке как таковом и если вы идете в omni-channel, хотите знать больше о своем покупателе, у вас разнородные источники информации, то Big Data неизбежно принесет эффект.
— Исходя из Вашего опыта, какой срок окупаемости подобных проектов?
— Если в компании ИТ-подразделение бизнес-ориентировано, вы видите подрастающих Data scientist – аналитиков, которые «миксуют» ит-инструментарий и отраслевые знания, ERP-системы покрывают ваши нужны, то срок окупаемости может составить полгода. Вы можете вырастить Data scientist’а, дать ему инструментарий, построить работающую рекомендательную систему начального уровня, которая существенно увеличит конверсии – это самый первый вариант получения эффекта.
И в этой, и в любой другой компании, если у вас есть бизнес-ориентированный аналитик на стыке информационных технологий, статистики, маркетинга, то старт будет быстрый. Если же у вас нет того, кто сможет перевести отраслевые особенности компании на язык Machine Learning, то окупаемость будет долгой и, возможно, не принесет ничего, кроме дополнительных штатных структур и инвестиционных затрат.
— Сегодня на рынке представлены инструменты для самостоятельного (а значит, непрофессионального) анализа данных. Может ли руководитель эффективно применять аналитику без найма специалиста или услуг сторонних компаний?
— Есть два варианта инструментария в классе advanced analytics. «Коробочные» коммерческие или open-source инструменты, к примеру RapidMiner, Knime, Orange, Azure ML и др. Их интерфейс прост — вы строите workflow, соединяете кубики, применяете методы анализа, не особо вникая в их математическую основу. Это может стать инструментарием бизнес-подразделений, например, аналитика- маркетолога, анализирующего выборки клиентов, динамику спроса по товарам, поводящего кагортный анализ.
Но есть и другой класс инструментов – экосистема Hadoop, языки Python, R, встроенные в них алгоритмы ML. Для работы с ними нужен специалист Data science, на стыке отрасли (предметной области), математики, изобретательности — только он сможет переложить эти технологии на какой-то бизнес-эффект и построить сложную систему.
— Мне кажется, у нашего бизнеса существует стереотип, что Data Mining может применяться только в крупных компаниях, вроде Google, Facebook. Условно говоря, могут ли большие данные служить малому бизнесу?
— Они могут служить и среднему бизнесу: если у вас — более 10 магазинов или интернет-магазин с существенным потоком покупателей, либо компания держит курс в omni-channel, т.е. средняя по размеру розничная сеть или e-commerce. В таком случае можно выявлять скрытые закономерности для оптимизации предложения, ассортимента, цен, понимания вашего потребителя: кто он? каковы его предпочтения? как часто совершает покупки? что ему предложить чтобы удержать или предвосхитить ожидания?
— Назовите отрасли, которые, на Ваш взгляд, больше всего нуждаются во внедрении технологий Data Mining и Big Data.
— Это, безусловно, весь e-commerce, средняя и большая розница, специализированный бизнес в области Big Data — DMP-системы, компании по аналогии с Социохаб, предоставляющие данные на основе парсинга социальных сетей. Также нефтянка, добывающая промышленность, энергетический сектор, металлургические комбинаты – в них можно говорить о сложном технологическом процессе, эффекте больших чисел — когда незначительные изменения технологического цикла приводят к экономии ресурсов: сырья, электроэнергии, снижают загруженность производственных линий, повышая выработку (вспоминаем производственную систему Toyota).
— Вы много бывали за границей. Что нашему бизнесу следует перенять из опыта западных компаний?
— Здесь нужно отталкиваться от специфики отрасли. Если говорить про розницу, это, прежде всего, более эффективное управление логистикой и товарными потоками, ассортиментный анализ, управление жизненным циклом (новинки, неликвиды, взаимозаменяемые товары), форматирование торговых объектов и структуры предложения. Все это — стандартизация коммерческой деятельности как таковой, без привлечения Big Data и машинного обучения. А дальше, когда первый шаг сделан, когда компания уже ожидаемо управляема (мы знаем, что будет завтра, можем осознанно влиять на завтрашний результат), тогда стоит идти в advanced-аналитику, Machine Learning, Big Data, постепенно формировать основу для еще одного шага наверх и качественного изменения вашего управления c Predictive Analytics, упреждать предстоящие события. Компания должна стать data-driven. В след за этим должна прийти новая дисциплина, о которой мало еще говорят у нас – Knowledge Management.
Могу поделиться своим опытом, как покупатель. Около полугода назад компания Metro Cash&Carry запустила индивидуальные предложения. В начале каждой недели мне приходят индивидуальные предложения и скидки на товары, которые я покупаю. В них нет разве что телевизоров и какой-то экзотики, например, осьминогов. Все остальное есть в предложении, и это приятно, т.к. ритейлер действительно хочет, чтобы я оставался лояльным клиентом, и индивидуальные коммуникации этому, безусловно, способствуют.
PS. Выражаю благодарность Петрову Александру, Зимовнову Андрею, Крот Александру, Сапунову Григорию за наставничество.
Лариса Шурига, DataReview