В четверг, 13 ноября, в Москве состоялась международная конференция «Большие данные и бизнес-аналитика». Организатором мероприятия выступила компания IDC – ведущий поставщик информации и консультационных услуг в России.
Форум IDC стал площадкой для обмена мнениями между представителями профессионального ИТ-сообщества и руководителями бизнес-подразделений.
В этом году программа форума была разделена на 2 сессии с перерывом на кофе-брейк. В рамках первой части конференции перед гостями выступили поставщики решений по обработке данных, в частности, представители компаний Ataccama, SAP, Yandex и Informatica.
Вторая сессия была посвящена практическому аспекту применения технологий больших данных и бизнес-аналитики.
Александр Прохоров, IDC
Первым на форуме выступил Александр Прохоров, старший аналитик рынка ИТ-услуг компании IDC, с докладом «Рынок бизнес-аналитики, тенденции и перспективы».
Основными темами выступления стали:
- таксономия и оценка рынка;
- мировые тенденции развития;
- рынок бизнес-аналитики в России.
По словам эксперта, мировой оборот рынка больших данных в 2014 году составил $16.1 миллиарда. Согласно прогнозам, в 2017 году эта цифра достигнет $32.4 млрд.
При этом, доля российского рынка больших данных в текущем году составила около $400 млн.
Александр Ильин, Ataccama
Далее с докладом выступил Александр Ильин, директор представительства Ataccama Delivery Center в России. В частности, эксперт рассказал о преимуществах использования Hadoop для обработки больших данных. По словам Ильина, для применения этого инструмента необходимо глубоко проникать внутрь технологии и знать Java.
Специалист уверен: несмотря на привлекательность использования традиционных инструментов для хранения и обработки данных, альтернативные решения могут сэкономить для компании значительные средства.
Так, в ходе выступления спикер представил новое решений компании Ataccama – платформу Big Data Platform.
Вадим Табаков, SAP
Менеджер по развитию направления Big Data & Technology компании SAP Russia Вадим Табаков рассказал о том, как большие данные меняют бизнес.
Первое, на что обратил внимание эксперт, — использование технологий big data в соревнованиях «Формула-1». По словам Табакова, обработка данных телеметрии, считывание информации со 120 датчиков болида помогает выигрывать тысячные доли секунды и победить в Гран-при.
При этом представитель SAP акцентировал внимание присутствующих на том, что, анализируя поступающие данные и статистические выборки, мы жертвуем точностью в пользу обработки огромных массивов неструктурированной информации.
В ходе выступления Табаков также упомянул о решении SAP HANA (High-Performance Analytic Appliance – высокопроизводительный аналитический комплекс).
Благодаря синтезу технологий Hadoop и HANA процесс расшифровки человеческого генома стал гораздо быстрее, — пояснил Табаков.
«Ценность Hadoop заключается в том, чтобы создать репрезентативную выборку из гигантских объемов первичных данных и затем передать эту выборку для оперативной обработки в SAP HANA», — резюмировал эксперт.
Андрей Себрант, Яндекс
Следующим спикером стал Андрей Себрант, директор по маркетингу сервисов компании Яндекс.
«Алгоритмы машинного обучения в поиске использовались изначально, за много лет до массового интереса к big data», — в частности, отметил эксперт.
Также он рассказал об использовании data science в маркетинге для определения целевой аудитории производимого компанией продукта.
В рамках выступления Себрант провел небольшой опрос присутствующих. Как выяснилось, среди гостей мероприятия почти никто не смотрит телевизор более одного часа в день. «Такая аудитория — ад для маркетологов», — пошутил Себрант. Тем не менее, по его словам, при помощи методов машинного обучения специалисты могут выяснить, кто из интернет-пользователей смотрит ТВ, и таким образом таргетировать свою рекламу.
По словам Себранта, машинное обучение по поведению интернет-пользователей включает более 200 факторов. Так, в большинстве случаев их классифицируют по запросам.
Илья Гершанов, Informatica
Вторая сессия открылась докладом Ильи Гершанова, руководителя направления Big Data компании Informatica.
Главными темами выступления «Два сценария использования технологий и продуктов компании в проектах больших данных» стали:
- типовые проекта big data;
- оптимизация корпоративного хранилища данных;
- управление озерами данных (data lakes).
Особое внимание эксперт уделил понятию «озеро данных» и его структуре.
«Озеро данных — исходная среда, где вы можете загрузить данные в том формате, в котором они получены, и обрабатывать их, сохраняя формат», — пояснил Гершанов.
Так, озеро данных состоит из:
- болота, где данные хранятся в исходном формате;
- водохранилища, где происходит трансформация и комбинация данных;
- лагуны, позволяющей управлять данными.
По словам Гершанова, с помощью этой технологии была решена задача снижения стоимости транзакций для компании Western Union.
В конце выступления эксперт презентовал новый продукт компании Informatica — Managed Data Lake.
Александр Аникин, WikiMart
Продолжил конференцию доклад «Профессия Data Scientist» Александра Аникина, бывшего руководителя аналитического отдела Wiki Mart.
«Понятие data scientist появилось тогда, когда традиционные подходы к работе с данными в бизнесе перестали справляться с постоянно растущей сложностью и многогранностью задач», — в частности, рассказал эксперт.
Среди навыков, которыми должен обладать настоящий data scientist, Аникин выделил:
-
бизнес;
-
ИТ и программирование;
-
математику и статистику.
По оценкам Аникина, российский рынок data science отстает от других стран в среднем на 5 лет.
Алексей Винниченко, Сбербанк
Завершил конференцию «Большие данные и бизнес-аналитика» доклад Алексея Винниченко, руководителя направления big data в Сбербанке.
Спикер, в частности, рассказал о совместных проектах со Школой анализа данных Яндекс.
По словам Винниченко, за последний год в песочнице Сбербанка было запущено 25 проектов в области big data.
«Получаемый эффект многократно превзошел затраты на R&D», — подчеркнул эксперт. Ключевыми факторами, по мнению Винниченко, стали небольшой бюджет и срок проекта (до 6 месяцев).
На этом международная конференция закончилась — работа форума перешла в стадию неформального общения.
Подводя итоги, можно сказать, что мероприятие внесло весомый вклад в развитие рынка big data. Каждый из гостей вынес для себя что-то новое и нашел ответы на вопросы, связанные с инвестициями в технологии больших данных и бизнес-аналитики. С нетерпением ждем следующих форумов и конференций IDC!
Автор: Лариса Шурига, DataReview
Фото и текстовые материалы: Никита Бауков