Илья Гершанов: Просто об озерах данных

В Москве началась вторая часть конференции «Большие данные и бизнес-аналитика», и первым выступил Илья Гершанов, руководитель направления Big Data компании Informatica, передает корреспондент DataReview.

Большие данные и бизнес-аналитикаГлавными темами доклада «Два сценария использования технологий и продуктов компании в проектах больших данных» стали:

  • типовые проекта big data;
  • оптимизация корпоративного хранилища данных;
  • управление озерами данных (data lakes).

Особое внимание эксперт уделил понятию «озеро данных» и его структуре.

«Озеро данных — исходная среда, где вы можете загрузить данные в том формате, в котором они получены, и обрабатывать их, сохраняя формат», — пояснил Гершанов.

image (31)

Так, озеро данных состоит из:

  • болота, где данные хранятся в исходном формате;
  • водохранилища, где происходит трансформация и комбинация данных;
  • лагуны, позволяющей управлять данными.

По словам Гершанова, с помощью этой технологии была решена задача снижения стоимости транзакций для компании Western Union.

В конце выступления эксперт презентовал новый продукт компании Informatica Managed Data Lake.

Никита Бауков для DataReview

Добавить комментарий

Ваш адрес email не будет опубликован.

закрыть

Поделиться

Отправить на почту
закрыть

Вход

закрыть

Регистрация

+ =