9 необычных закономерностей, открытых с помощью Data Science

1 Star2 Stars (2 votes, average: 5,00 out of 5)
Загрузка...

Петабайты данных, доступные в настоящее время аналитикам, формируют безграничное пространство для поиска истин.

Данные – самый многообещающий искусственный ресурс. Недаром сегодня мы наблюдаем настоящую «золотую лихорадку» в поисках полезных знаний, содержащихся в данных.

Увеличивается ли количество преступлений после спортивного события? Действительно ли на сайтах знакомств пользователи, имеющие более высокий рейтинг привлекательности, вызывают меньший интерес? Правда ли, что вегетарианцы менее склонны опаздывать на авиарейсы? Действительно ли адрес электронной почты раскрывает стремления его владельца?

Да, да, да и еще раз да!

Мы вошли в золотой век прогнозных открытий. Алгоритмы, вгрызаясь в данные, открывают для нас золотое дно красочных, бесценных, а иногда просто удивительных знаний.

Возможности прогнозной аналитики не ограничиваются проверкой гипотез посредством анализа вероятных взаимосвязей. Сфера этой дисциплины простирается намного дальше, охватывая безграничное многообразие возможных закономерностей, лежащих за пределами человеческой интуиции. Поэтому иногда взаимосвязи, обнаруженные с помощью прогнозной аналитики, могут казаться противоречащими логике.

Ниже представлены 9 интересных открытий, сделанных на основе данных таких компаний, как Walmart, Uber, Shell, Microsoft и др.

Закономерность

Организация

Возможное объяснение

Рост спроса на «Pop-Tarts» перед ураганом.

Объем продаж печенья «Pop-Tarts» с клубничной начинкой возрастает примерно в 7 раз перед ураганом.

Walmart При подготовке к удару стихии люди запасают свои любимые продукты из числа тех, которые могут долго храниться.
Больше преступлений – больше поездок Uber.

В Сан-Франциско районы, где происходит наибольшее количество преступлений, связанных с проституцией, алкоголем и кражами, характеризуются наиболее активным использованием Uber.

Uber «Мы считаем, что уровень преступности хорошо характеризует общую активность в различных районах города. Люди, путешествующие с Uber, не являются причиной большего количества преступлений. Ведь так, ребята?»
Правильное использование прописных букв свидетельствует о надежности заемщика.

Если заемщик, заполняя онлайн-форму на получение кредита, правильно применяет прописные буквы, это свидетельствует о его склонности выполнять долговые обязательства. Только строчные буквы используют менее надежные люди.   Использование только прописных букв говорит о еще меньшей надежности.

Стартап в сфере финансовых услуг. Соблюдение грамматических правил свидетельствует об общей склонности соблюдать правила.
Пользователи браузеров Chrome и Firefox являются более полезными сотрудниками.

В контексте должностей, связанных с продажами и работой с клиентами, те сотрудники, которые используют описанные выше браузеры, демонстрируют более высокую производительность труда и дольше задерживаются в одной компании.

Xerox и другие компании. «Тот факт, что вы нашли время, чтобы установить [другой браузер], говорит… о том, что вы являетесь осведомленным потребителем… о том, что вы заботитесь об эффективности своего труда и делаете активный выбор».
Не завтракающие мужчины чаще страдают ишемической болезнью сердца.

Американские мужчины в возрасте от 45 до 82 лет, пропускающие завтрак, имеют на 27% больший риск возникновения ишемической болезни сердца.

Гарвардский университет. Кроме непосредственного влияния на здоровье, если таковое имеет место, отношение к завтраку может характеризовать общий стиль жизни. Не завтракающие мужчины могут вести жизнь, более насыщенную стрессами, и «с большей вероятностью являются курильщиками, работают полный рабочий день, не состоят в браке, проявляют меньшую физическую активность и употребляют больше алкоголя».
Чем больше мотивация персонала, тем меньше несчастных случаев.

Среди работников нефтеперерабатывающей отрасли повышение мотивации на 1 процентный пункт, приводит к снижению в среднем на 4% количества несчастных случаев.

Shell Более мотивированные сотрудники более внимательны и сосредоточены.
Интеллектуалы предпочитают фигурный картофель фри (curly fries).

Если пользователь Facebook отмечает лайком страницу «Curly fries», это свидетельствует о его высоком интеллекте.

Кембриджский университет, Microsoft Research. Предположительно, первый, кто отметил лайком эту страницу, был интеллектуалом. «Это увидели его друзья, и тоже поставили лайки. А поскольку люди обычно дружат с похожими людьми, его друзья тоже, вероятно, интеллектуалы. И так далее».
Ураганы с женскими именами более смертоносны.

Согласно исследованию наиболее разрушительных ураганов, наблюдавшихся в США за последние 60 лет, среднее количество жертв урагана с женским именем составляет 42 человека, что почти в три раза превышает среднее количество жертв урагана с мужским именем, составляющее 15 человек.

Университетские исследования. Данный факт, может быть результатом «опасной формы неявного сексизма». Результаты психологических исследований «дают основания полагать, что люди воспринимают ураганы с женскими именами, как менее опасные, и, в результате, оказываются менее подготовленными к ним… Люди склонны систематически недооценивать опасность ураганов с женскими именами».
Чем выше статус, тем меньше вежливость.

Пользователи, редактирующие Википедию, которые проявляют значительную вежливость, имеют больше шансов получить статус администратора, дающий больше операционных возможностей. Однако после получения этого статуса пользователи становятся менее вежливыми.

Википедия. «Теория вежливости предсказывает отрицательную корреляцию между вежливостью и статусом человека».

А теперь необходимо сделать небольшую оговорку. Не слишком полагайтесь на содержимое столбца «Возможное объяснение», поскольку это лишь попытка объяснить наблюдаемые закономерности. Многие из этих объяснений основываются в большей степени на интуиции, чем на научных доказательствах. Причины рассмотренных нами и подобных закономерностей в общем случае неизвестны. Все представленные объяснения – это лишь догадки, не подкрепленные фактами.

Дело в том, что наличие корреляции не означает наличие причинно-следственной связи. Если мы обнаружили прогнозную взаимосвязь между событиями A и B, это еще не говорит о том, что A является причиной B, хотя бы косвенно.

Но не беспокойтесь.

Несмотря на то, что в общем случае мы не знаем причины обнаруженных взаимосвязей, в сфере прогнозной аналитики это не имеет для нас принципиального значения. Смысл многих проектов заключается в возможности прогнозировать, а понимание причин отходит на второй план. Невероятные закономерности обладают прогнозным потенциалом, даже если их невозможно объяснить.

Источник

Автор публикации

не в сети 3 дня

Лариса Шурига

Комментарии: 16Публикации: 871Регистрация: 05-06-2014

Вам также может понравиться

Добавить комментарий

Ваш e-mail не будет опубликован.

закрыть

Поделиться

Отправить на почту
закрыть

Вход

закрыть

Регистрация

+ =
Авторизация
*
*

Login form protected by Login LockDown.


Регистрация
*
*
*
*
Генерация пароля