Итоги конференции «Большие данные и бизнес-аналитика»

В четверг, 13 ноября, в Москве состоялась международная конференция «Большие данные и бизнес-аналитика». Организатором мероприятия выступила компания IDC – ведущий поставщик информации и консультационных услуг в России.

Форум IDC стал площадкой для обмена мнениями между представителями профессионального ИТ-сообщества и руководителями бизнес-подразделений.

Форум IDC

В этом году программа форума была разделена на 2 сессии с перерывом на кофе-брейк. В рамках первой части конференции перед гостями выступили поставщики решений по обработке данных, в частности, представители компаний Ataccama, SAP, Yandex и Informatica.

Вторая сессия была посвящена практическому аспекту применения технологий больших данных и бизнес-аналитики.

Александр Прохоров, IDC

Первым на форуме выступил Александр Прохоров, старший аналитик рынка ИТ-услуг компании IDC, с докладом «Рынок бизнес-аналитики, тенденции и перспективы».

Александр ПрохоровОсновными темами выступления стали:

  • таксономия и оценка рынка;
  • мировые тенденции развития;
  • рынок бизнес-аналитики в России.

По словам эксперта, мировой оборот рынка больших данных в 2014 году составил $16.1 миллиарда. Согласно прогнозам, в 2017 году эта цифра достигнет $32.4 млрд.

При этом, доля российского рынка больших данных в текущем году составила около $400 млн.

Александр Ильин, Ataccama 

Далее с докладом выступил Александр Ильин, директор представительства Ataccama Delivery Center в России. В частности, эксперт рассказал о преимуществах использования Hadoop для обработки больших данных. По словам Ильина, для применения этого инструмента необходимо глубоко проникать внутрь технологии и знать Java.

Александр Ильин

Специалист уверен: несмотря на привлекательность использования традиционных инструментов для хранения и обработки данных, альтернативные решения могут сэкономить для компании значительные средства.

image (44)

Так, в ходе выступления спикер представил новое решений компании Ataccama – платформу Big Data Platform.

Вадим Табаков, SAP

Менеджер по развитию направления Big Data & Technology компании SAP Russia Вадим Табаков рассказал о том, как большие данные меняют бизнес.

Первое, на что обратил внимание эксперт, — использование технологий big data в соревнованиях «Формула-1». По словам Табакова, обработка данных телеметрии, считывание информации со 120 датчиков болида помогает выигрывать тысячные доли секунды и победить в Гран-при.

При этом представитель SAP акцентировал внимание присутствующих на том, что, анализируя поступающие данные и статистические выборки, мы жертвуем точностью в пользу обработки огромных массивов неструктурированной информации.

В ходе выступления Табаков также упомянул о решении SAP HANA (High-Performance Analytic Appliance – высокопроизводительный аналитический комплекс).

image-16

Благодаря синтезу технологий Hadoop и HANA процесс расшифровки человеческого генома стал гораздо быстрее, — пояснил Табаков.

«Ценность Hadoop заключается в том, чтобы создать репрезентативную выборку из гигантских объемов первичных данных и затем передать эту выборку для оперативной обработки в SAP HANA», — резюмировал эксперт.

Андрей Себрант, Яндекс

Следующим спикером стал Андрей Себрант, директор по маркетингу сервисов компании Яндекс.

«Алгоритмы машинного обучения в поиске использовались изначально, за много лет до массового интереса к big data», — в частности, отметил эксперт.

Также он рассказал об использовании data science в маркетинге для определения целевой аудитории производимого компанией продукта.

В рамках выступления Себрант провел небольшой опрос присутствующих. Как выяснилось, среди гостей мероприятия почти никто не смотрит телевизор более одного часа в день. «Такая аудитория — ад для маркетологов», — пошутил Себрант. Тем не менее, по его словам, при помощи методов машинного обучения специалисты могут выяснить, кто из интернет-пользователей смотрит ТВ, и таким образом таргетировать свою рекламу.

Андрей Себрант

По словам Себранта, машинное обучение по поведению интернет-пользователей включает более 200 факторов. Так, в большинстве случаев их классифицируют по запросам.

Илья Гершанов, Informatica

Вторая сессия открылась докладом Ильи Гершанова, руководителя направления Big Data компании Informatica.

Главными темами выступления «Два сценария использования технологий и продуктов компании в проектах больших данных» стали:

  • типовые проекта big data;
  • оптимизация корпоративного хранилища данных;
  • управление озерами данных (data lakes).

Особое внимание эксперт уделил понятию «озеро данных» и его структуре.

«Озеро данных — исходная среда, где вы можете загрузить данные в том формате, в котором они получены, и обрабатывать их, сохраняя формат», — пояснил Гершанов.

Озеро данных

Так, озеро данных состоит из:

  • болота, где данные хранятся в исходном формате;
  • водохранилища, где происходит трансформация и комбинация данных;
  • лагуны, позволяющей управлять данными.

По словам Гершанова, с помощью этой технологии была решена задача снижения стоимости транзакций для компании Western Union.

В конце выступления эксперт презентовал новый продукт компании Informatica — Managed Data Lake.

Александр Аникин, WikiMart

Продолжил конференцию доклад «Профессия Data Scientist» Александра Аникина, бывшего руководителя аналитического отдела Wiki Mart.

«Понятие data scientist появилось тогда, когда традиционные подходы к работе с данными в бизнесе перестали справляться с постоянно растущей сложностью и многогранностью задач», — в частности, рассказал эксперт.

Среди навыков, которыми должен обладать настоящий data scientist, Аникин выделил:

  • бизнес;

  • ИТ и программирование;

  • математику и статистику.

2

3

4

По оценкам Аникина, российский рынок data science отстает от других стран в среднем на 5 лет.

Алексей Винниченко, Сбербанк

Завершил конференцию «Большие данные и бизнес-аналитика» доклад Алексея Винниченко, руководителя направления big data в Сбербанке.

Алексей Винниченко

Спикер, в частности, рассказал о совместных проектах со Школой анализа данных Яндекс.

По словам Винниченко, за последний год в песочнице Сбербанка было запущено 25 проектов в области big data.

«Получаемый эффект многократно превзошел затраты на R&D», подчеркнул эксперт. Ключевыми факторами, по мнению Винниченко, стали небольшой бюджет и срок проекта (до 6 месяцев).

Алексей Винниченко

На этом международная конференция закончилась — работа форума перешла в стадию неформального общения.

Подводя итоги, можно сказать, что мероприятие внесло весомый вклад в развитие рынка big data. Каждый из гостей вынес для себя что-то новое и нашел ответы на вопросы, связанные с инвестициями в технологии больших данных и бизнес-аналитики. С нетерпением ждем следующих форумов и конференций IDC!

Автор: Лариса Шурига, DataReview

Фото и текстовые материалы: Никита Бауков

Добавить комментарий

Ваш e-mail не будет опубликован.

закрыть

Поделиться

Отправить на почту
закрыть

Вход

закрыть

Регистрация

+ =