«Данные становятся важным корпоративным активом, жизненно важным экономическим вкладом и основой новых бизнес моделей».
Что такое большие данные? Как они уже изменили наш мир? И как им еще предстоит его изменить? Ответы на эти и другие вопросы в своей книге «Большие данные. Революция, которая изменит то, как мы живем работаем и мыслим» ищут Виктор Майер-Шенбергер и Кеннет Кукьер.
От малого к большему
До недавнего времени мы имели дело с относительно небольшими объемами информации, но с развитием цифровых технологий массивы данных начали стремительно расти. Возникла необходимость в их обработке — с помощью компьютеров ученые сумели заставить данные «говорить», что произвело революцию в бизнесе, экономике, политике, здравоохранении. И это только начало, считают авторы книги.
«Объем хранящейся информации растет в четыре раза быстрее, чем мировая экономика, в то время как вычислительная мощность компьютеров увеличивается в девять раз быстрее. Неудивительно, что люди жалуются на информационную перегрузку. Всех буквально захлестнула волна изменений».
Термин «большие данные» появился в середине 2000-х годов. Для него нет строгого определения. В какой-то момент объем информации настолько вырос, что количество данных не помещалось в памяти компьютера, поэтому инженерам потребовалось модернизировать инструменты для их анализа. Так появились новые технологии обработки — например, модель MapReduce компании Google и ее аналог с открытым исходным кодом — Hadoop от Apache Software Foundation.
Количество, точность, причинность
По сути, большие данные представляют собой три шага к новому способу анализа информации, которые трансформируют наше представление об обществе и его организации. Речь идет о количестве, точности и причинности.
- В мире больших данных мы можем проанализировать огромное количество, а иногда и всю информацию, касающуюся того или иного явления. Общество больше не полагается на метод выборки, являвшийся символом «аналоговой эпохи».
- Принимая во внимание гораздо больший объем данных, мы можем снизить свои претензии к точности. То, что мы теряем из-за неточности на микроуровне, позволяет нам делать открытия на макроуровне.
- Третий шаг — отход от вековых традиций поиска причинности. В мире больших данных нам не всегда нужно знать причины, которые стоят за теми или иными явлениями. Лучше позволить данным говорит самим за себя.
Корреляции
Отход от поиска причинности привел к поиску корреляций — взаимосвязей, которые не могут сказать нам точно, почему происходит то или иное событие, зато предупреждают о том, какого оно рода.
«Если электронные медицинские записи показывают, что в определенном сочетании апельсиновый сок и аспирин способны излечить от рака, то точная причина менее важна, чем сам факт: лечение эффективно».
Корреляции полезны в области малых данных, но по-настоящему они раскрывают свой потенциал в контексте больших данных. С их помощью мы можем рассматривать явления проще, быстрее и отчетливее, чем раньше.
Корреляции помогают анализировать объекты, выявляя не принципы их работы, а полезные закономерности.
Датификация
Сегодня мы можем преобразовать в формат данных буквально все — местоположение, слова и даже эмоции. Этот процесс получил название «датификация», и он, по мнению авторов книги, приобретет повсеместный характер.
«Благодаря смартфонам и недорогой вычислительной технике датификация наиболее важных аспектов стала проще, чем когда-либо. Множество стартапов предоставляют людям возможность отслеживать свой сон путем измерения мозговых волн в течение всей ночи».
Датификация принципов работы человеческого тела открывает новые возможности перед медициной. Так, ученые из Технологического научно-исследовательского института штата Джорджия создали приложение iTrem, которое при помощи телефона контролирует тремор человеческого тела при болезни Паркинсона. Пациенты получают возможность обойтись без дорогостоящих визитов к врачу. И таких примеров очень много.
Темная сторона больших данных
Несмотря на положительные аспекты больших данных, у них есть и так называемые «темные стороны». В частности, они упраздняют некоторые правовые средства защиты неприкосновенности частной жизни, сводят на «нет» эффективность основных технических методов сохранения анонимности. Эти проблемы миру еще предстоит решить.
Также авторы книги говорят о риске, связанном с «одержимостью» данными. Люди станут руководствоваться ими в неподходящих условиях или же слишком полагаться на результаты анализов, предполагают они.
«Нужно умерить увлечение данными, чтобы не повторить ошибку Икара, который гордился своей технической возможностью летать, но неправильно воспользовался ею и упал в море».
Мнение редакции
Книга «Большие данные. Революция, которая изменит то, как мы живем работаем и мыслим» — занимательное путешествие в мир данных: от древних времен, когда люди только научились собирать информацию, до наших дней, когда данные правят миром.
Вывод — книга обязательна к прочтению!
Оценка — 9 из 10.