Идея и понятие «больших данных» (Big Data) существует уже некоторое время, но кажется, что многие люди до сих пор считают их чем-то окутанным тайной.
Big Data (большие данные) популярный, но довольно неловкий термин. Он на самом деле слишком сильно упрощает и обобщает тренд, создает непонимание и ложные представления. Сегодня под технологиями Big data, как правило, подразумевается способность использовать информацию новыми способами, чтобы делать полезные выводы – например, такие, которые помогут бизнесу улучшать свои товары или услуги.
При этом обыватели зачастую имеют весьма смутные представления об этих загадочных больших данных. Вот самые распространенные из заблуждений.
- Big data – это про сбор и хранение данных
Парадоксально, но нет. Это скорее про то, что вы с ними делаете.
Каждая компания имеет доступ к данным, будь то данные о денежных транзакциях, покупательском поведении, UX-аналитика, демографическая информация или данные из соцсетей. По мере того, как развиваются технологии, все больше данных становится доступно. Именно возможность преобразовывать эти данные в выводы, представляющие какой-то смысл для бизнеса — бесценна и лежит в центре определения «больших данных».
Исторически «большие данные» – это общий термин, обозначающий большие наборы данных, превышающие объемы, которые могут быть обработаны, сохранены и/или проанализированы традиционными методами и техниками. Но это словосочетание используется как попало, чтобы описать что угодно, имеющее отношение к большим (хотя часто, недостаточно большим, чтобы соответствовать определению выше) наборам данных.
Всё чаще словосочетание «big data» используют просто для того, чтобы сказать об использовании предсказательной аналитики или других продвинутых методов анализа данных. Или чтобы обобщенно описать новые инструменты, помогающие выявлять тренды и анализировать их.
- Свою Big Data каждый бизнес собирает сам
Вообще-то, нет. Уже появился рынок, на котором организации могут покупать и продавать данные, и он активно развивается. Кроме всего прочего, огромное количество потенциально полезной информации собирается и обменивается в рамках open data инициатив — государственными, исследовательскими и другими некоммерческими учреждениями. Многие представители бизнеса выяснят, что данные, в которых они нуждаются, уже где-то существуют, и таким образом, их не надо специально собирать и хранить.
- Вам нужно больше, еще больше данных
Мы все знаем, что английское слово big –означает «большой», а бигдата – это такие «очень большие наборы данных», которые можно анализировать для выявления трендов, однако, есть различие между «иметь много данных» и «иметь достаточно данных хорошего качества». Многочисленные ошибки, дубли, устаревшими или нерелевантные данные вносят искажения, поэтому ваши данные должны быть очищенными и хорошего качества, чтобы их можно было анализировать.
Если у вас качественные данные из большого спектра релевантных источников, вы получите адекватные результаты. Не надо просто собирать обширные объемы данных. Сперва поймите, что именно вы хотите узнать, чтобы сформулировать, какие именно данные необходимы для того, чтобы сделать выводы, на основе которых можно действовать.
Кстати, и определение того, что считается «данными», изменилось. А именно, большинство людей представляют данные в виде строк и колонок с числами, наподобие таблицы Excel, в то время как Big Data преимущественно касается полуструктурированных или неструктурированных данных.
- Big Data – игрушка для IT-департамента
Внедрить умное решение, способное анализировать данные компании, — как правило, действительно, часть ответственности департамента IT. Тем не менее, за то, чтобы использовать внедренные системы соответствующим образом, несут ответственность все сотрудники, вовлеченные в процесс. Это может включать умение вводить нужные данные в нужных окошках, умение обращать внимание на странные отклонения в отчетности и умение ворочать мощными инструментами BI. Это – не «магия бородатых айтишников», а рутинная работа всех сотрудников всех отделов, включая финансы, отделы продаж, обслуживания клиентов, а также (и чуть ли не в первую очередь) отдел маркетинга.
- Big Data – волшебная таблетка любого современного бизнеса
Способность обрабатывать и анализировать данные дает компаниям возможность управлять операционной деятельностью и улучшать ее – с этим никто не спорит. Однако, даже если в организации уже есть команда data scientist-ов и есть руководители, готовые прислушаться к результатам исследования, если при этом нет мотивации налаживать обычные рабочие процессы или для исследования не были сформулированы четкие цели, то те аналитические выводы, которые вы получите, могут оказаться совершенно неприменимыми в реальной жизни.
* * *
В общем, Big data – это не только про данные, но и про то, как вы используете информацию, по крохам извлекаемую из них. Это про процессы, которые вы улучшаете, про ресурсы для принятия решений и новые бизнес-возможности. Данные ради данных бессмысленны. Без ценных интерпретаций и умного использования проекты по большим данным останутся дорогой и смехотворной тратой времени.