Strata+Hadoop World: Итоговый фоторепортаж из Нью-Йорка

В пятницу, 17 октября, в Нью-Йорке завершила работу международная конференция Strata+Hadoop World. Наши корреспонденты внимательно следили за всеми событиями.

Подводя итоги мероприятия, следует отметить, что в этом году конференция привлекла рекордное количество посетителей — в ней приняли участие эксперты, бизнесмены, аналитики, журналисты и представители государственных структур со всего мира.

Strata+Hadoop World проходила в конференц-центре Якоба Явица.онференц-центр Якоба Явица.

День первый

В первый день, 15 октября, в рамках мероприятия состоялось несколько сессий, в том числе Data-Driven Business Day.Data-Driven Business Day

На сессии спикеры представили свои доклады — каждому из выступающих давалось ровно 20 минут.

В этому году Data-Driven Business Day был посвящен теме больших данных в бизнесе, в частности рассматривались вопросы:

  • Как технологии big data помогают в стратегическом планировании?
  • Могут ли компании использовать большие данные для повышения эффективности управленческих процессов?

  • Почему анализ данных так важен для маркетологов?

Свои доклады представили 17 спикеров. В их числе: Фарра Бостик (Farrah Bostic), основательница Solve For Interesting, Марк Домс (Mark Doms), заместитель министра торговли США по экономическим вопросам, Эд Дамбилл (Edd Dumbill), председатель Strata O’Reilly и другие.Data-Driven Business Day

Также в первый день мероприятия корреспонденты DataReview побывали на сессии Hardcore Data Science, где профессор кафедры компьютерных наук Брауновского университета Тим Краска (Tim Kraska) представил новую аналитическую платформу Tupleware с открытым исходным кодом.Tupleware

Основное отличие Tupleware от других фреймворков заключается в том, что он использует предварительную компиляцию алгоритмов и задач в высокоэффективных распределенных программах, а не интерпретирует рабочие процессы во время их выполнения.

«Наши эксперименты показывают, что Tupleware работает от 30 до 300 раз быстрее, чем Spark и до 6000 раз быстрее, чем Hadoop», — рассказал Краска.Тим Краска

День второй

Второй, как собственно и третий, день конференции ознаменовался сессией Keynotes. Ее открывали председатели программы Роджер Магулас (Roger Magoulas), руководитель научно-исследовательских работ в O’Reilly Media, Дуг Каттинг (Doug Cutting), создатель Hadoop, и Алистер Кролл (Alistair Croll), автор книг по аналитике и предприниматель.Keynotes

В рамках второго дня конференции свой доклад Data & The New Era of Interactive Storytelling представила Шармила Шахани-Муллиган — специалист с 18-летним опытом работы в софтверных компаниях.

Эксперт говорила о методе interactive storytelling (интерактивное повествование) в работе с данными.interactive storytelling

«Индустрия данных развивается — новая информация поступает из внешних и внутренних источников с поразительной скоростью. Таким образом мы переходим от статичного к интерактивному способу анализа и представления данных», — подчеркнула Шахани-Муллиган.

«Interactive storytelling – это одновременно визуальное искусство и метод интерпретации результатов аналитических исследований», — в частности, отметила эксперт.

По ее словам, привычные средства визуализации данных отходят на второй план и будущее за так называемым интерактивным повествованием.

Оно позволяет принимать бизнес-решения в два раза быстрее и подразумевает конструктивное сотрудничество всех заинтересованных сторон, считает Шахани-Муллиган.

Также свой доклад Statistics Without the Agonizing Pain представил Джон Раузер (John Rauser), бывший аналитик Amazon, а сейчас — сотрудник Pinterest, имеющий большой опыт в извлечении знаний из больших массивов данных.

В ходе выступления эксперт задался вопросом: достаточно ли хорошо современные специалисты по анализу данных знают статистику?

«У специалиста в области анализа данных должно быть два основных навыка: проектирование и статистика. Многие аналитики — отличные инженеры, но чувствуют себя полными профанами, когда дело доходит до статистического анализа», — рассказывает Раузер.

По мнению эксперта, то, что раньше можно было выразить только сложными формулами, теперь легко увидеть и смоделировав на компьютере. Понимание статистики — ключевой навык для специалиста в области анализа данных.

День третий – завершающий

Сессия Friday Keynotes порадовала участников, пожалуй, наиболее интересными докладами.

Так, Рана Эль Калиби, доктор наук, аналитик и соучредитель компании Affectiva затронула тему распознавания эмоций в данных.

«Эмоции – неотъемлемая часть жизни. Они влияют на наше здоровье, благополучие и принятие решений. Сегодня впервые за все время мы можем детально изучить эмоции потребителей в глобальном масштабе», — в частности, отметила она.эмоции в данных

Эль Калиби уверена: поиск и распознавание эмоций в данных станет неотъемлемой частью машинного обучения и отдельным направлением аналитической работы, наравне с визуализацией и интеллектуальным анализом данных (англ. data mining).

Одним из наиболее интересных выступлений пятничной сессии стал доклад Шанкара Ведантама (Shankar Vedantam), корреспондента National Public Radio, под названием The Hidden Brain.

То, что мы видим в данных, зависит от наших убеждений, — убежден эксперт.

Резюмируя свое выступление Ведантам отметил: используя инструменты аналитики и big data, важно не попасть в ловушку подтверждения своих текущих убеждений вместо поиска реальных открытий в данных.Shankar Vedantam

Также в рамках конференции Strata+Hadoop World прошла сессия Author Signing, рамках которой авторы подписывали свои книги для гостей мероприятия. author singningКорреспондент DataReview «взял автограф» у Лутца Фингера — директора по анализу данных в Linkedin.Лутц Фингер

Следующая конференция Strata+Hadoop World пройдет в Сан-Хосе, Калифорния, 18-20 февраля 2015 года. Ждем с нетерпением!

Автор: Лариса Шурига

Добавить комментарий

Ваш e-mail не будет опубликован.

закрыть

Поделиться

Отправить на почту
закрыть

Вход

закрыть

Регистрация

+ =