Сегодня DataReview беседует с Олегом Лесовым, сооснователем и CEO (Chief Executive Optimist 🙂 стартапа Softcube.
— Большие данные пока не устоявшийся термин. Как Вы его трактуете для себя?
— Я не думаю, что он когда-нибудь станет устоявшимся. Большие данные, облачные вычисления, интернет вещей — это скорее маркетинговые термины, и каждый понимает их как хочет. Например, Dell говорит: большие данные — это наши сервера. Amazon говорит: большие данные — это наше облако. Cloudera говорит: большие данные — это наш Hadoop.
Мы определяем Big Data как набор подходов, которые позволяют бизнесу зарабатывать больше и принимать решения на основе имеющихся данных.
— Какой главный эффект применения технологий Big Data в бизнесе?
— На мой взгляд, Big Data работает, когда это приносит дополнительный доход или экономит деньги компании.
В последние лет 10 у бизнеса появилась возможность собирать информацию о поведении людей (как они себя ведут, как покупают) и обрабатывать ее. На основе этих данных можно принимать более качественные решения и, соответственно, зарабатывать больше.
— Вы основали довольно успешный стартап Softсube. Почему выбрали именно это направление?
— Сейчас мы занимаемся персонализацией для электронной коммерции, это еще называется товарные рекомендации. Делаем на всех страницах сайта блоки с товарами, в которых товары сортированы таким образом, чтобы к каждому товару подбирались похожие товары, причем такие, которые пользователи купят с большей вероятностью.
Но мы пришли к такому продукту не сразу. Это был итерационный процесс. Изначально наша компания, которая в то время занималась другим, собирала данные со всех источников и строила отчеты. Но в итоге нам показалось, что этого мало: мы отдавали отчет клиенту, однако он никак им не пользовался и ничего не зарабатывал с помощью этих данных.
Все это выглядело красиво, но не приносило прибыли. Мы обратили внимание на другие ниши и решили подключить к имеющимся данным математику. Получился все тот же красивый отчет, но с сегментацией, то есть мы поделили клиентов на группы.
У нас есть один интересный кейс. Мы делали сегментацию для сети аптек и выделили группу девочек, которые каждый месяц покупают гормональные контрацептивы — идеальный клиент, можно сказать, хронические больные 🙂
Им только стоит напомнить, и они сразу идут к нам. Это классно, но заработать на этом много не получается, потому что сегментов получилось больше сотни. Работать с таким количеством сегментов вручную невозможно, а если укрупнять сегменты, теряется весь смысл анализа.
Тогда мы поняли, что одной математики мало — в наше решение должно быть заложено маркетинговое действие (желательно, автоматизированное). Мы начали эксперименты в онлайне и, таким образом, нашли метод, как автоматически применять и математику, и данные, и зарабатывать на этом деньги.
Фактически мы работаем с клиентами наших клиентов — показываем товары, которые могут быть интересны покупателям интернет-магазинов. Это выгодно интернет-магазину, так как повышает средний чек покупки, конверсию и общий оборот магазина.
А пользователь интернет-магазина получает релевантную выдачу на всех страницах сайта. Ему не нужно ничего искать на сайте, все, что ему может быть интересно, показывается для него автоматически.
— Есть ли западные компании, на опыт которых Вы опирались? Насколько мне известно, первым рекомендательную систему внедрил у себя Amazon.
— Да, Amazon по-прежнему остается лидером ранка товарных рекомендаций. Это такой базовый вариант, на который все остальные смотрят. Мы делаем то, что Amazon сделал для себя, доступным для небольших и средних интернет-магазинов.
У Amazon’а есть своя команда data scientist’ов, программистов, маркетологов, которые это все настраивают и используют. По открытым данным, 30-35% продаж на сайте генерируется через рекомендации. На них у Amazon’а строится все, начиная с главной страницы, где мы видим огромный набор рекомендаций (5,10, 15 блоков), заканчивая страничкой товара или триггерными кампаниями.
Еще одной компанией, повлиявшей на отрасль рекомендаций, стала Netflix. В некотором смысле она даже круче Amazon’а. У Netflix’а персонализирована вся выдача.
— А какие показатели продаж у Softcube в процентном соотношении?
— Пока поменьше, чем у Amazon’а. Сейчас около 10%, наша цель — от 20% до 30%. Мы работаем над ее достижением вместе с нашими клиентами.
— Расскажите о подходе Ensemble Learning, который Вы применяете в работе.
— В Machine Learning вы можете применять много разных алгоритмов, которые будут выполнять вашу задачу, в нашем случае это подбор человеку товаров, которые он захочет купить с большей вероятностью.
Подход Ensemble Learning состоит не в том, чтобы выбрать наиболее эффективный алгоритм, который работает на 3% лучше, чем другие, а в том, чтобы объединить разные существующие алгоритмы и получить максимальный результат от их совместного действия.
— Все вокруг становится персонализированным. Как Вы видите будущее рекомендательных систем?
— Когда Softcube выполнит свою миссию, каждая страница на всех интернет-магазинах в мире будет отличаться для двух разных пользователей. Потому что все люди разные, а интернет-магазины одинаковые. Это неправильно, и мы обязательно исправим это.
Лариса Шурига, DataReview