Илья Гершанов: Просто об озерах данных

1 Star2 Stars (1 votes, average: 5,00 out of 5)
Загрузка...

В Москве началась вторая часть конференции «Большие данные и бизнес-аналитика», и первым выступил Илья Гершанов, руководитель направления Big Data компании Informatica, передает корреспондент DataReview.

Большие данные и бизнес-аналитикаГлавными темами доклада «Два сценария использования технологий и продуктов компании в проектах больших данных» стали:

  • типовые проекта big data;
  • оптимизация корпоративного хранилища данных;
  • управление озерами данных (data lakes).

Особое внимание эксперт уделил понятию «озеро данных» и его структуре.

«Озеро данных — исходная среда, где вы можете загрузить данные в том формате, в котором они получены, и обрабатывать их, сохраняя формат», — пояснил Гершанов.

image (31)

Так, озеро данных состоит из:

  • болота, где данные хранятся в исходном формате;
  • водохранилища, где происходит трансформация и комбинация данных;
  • лагуны, позволяющей управлять данными.

По словам Гершанова, с помощью этой технологии была решена задача снижения стоимости транзакций для компании Western Union.

В конце выступления эксперт презентовал новый продукт компании Informatica Managed Data Lake.

Никита Бауков для DataReview

Автор публикации

не в сети 3 часа

Лариса Шурига

Комментарии: 16Публикации: 911Регистрация: 05-06-2014

Вам также может понравиться

Добавить комментарий

Ваш e-mail не будет опубликован.

закрыть

Поделиться

Отправить на почту
закрыть

Вход

закрыть

Регистрация

+ =
Авторизация
*
*

Login form protected by Login LockDown.


Регистрация
*
*
*
*
Генерация пароля