Успей дать лучшее определение Data Science!

Дорогие читатели!

Рады сообщить, что с сегодняшнего дня на DataReview стартует открытая дискуссия на тему анализа данных. Наша команда совместно с ведущими экспертами области ищет наиболее точное определение понятию Data Science.

Несмотря на свою популярность на Западе, термин до сих пор не получил общепринятого перевода на русский язык. Так, некоторые источники предлагают вариант «наука о данных»; коллектив DataReview, в свою очередь, называет направление даталогией (один из переводов, предлагаемый Википедией).

Тем не менее, вопрос остается открытым. Вы можете дать свое определение Data Science и, возможно, предложить перевод термина на русский язык.

Дискуссия будет вестись в комментариях под данной публикацией, а также в сети Facebook. Авторов комментариев, получивших наибольшее количество лайков, ждут призы от DataReview.

Обсуждение стартует сегодня и продлится до 10 марта, после чего мы подведем итоги и назовем победителя. Его определение будет значиться в словаре DataReview и станет общепринятым стандартом для нас.

А пока Вы думаете над определением, давайте посмотрим, что на этот счет говорят мировые эксперты:

Леонид Жуков, профессор Высшей школы экономики НИИ, руководитель отдела Data Science компании Ancestry:

На русский язык термин Data Science переводят как «наука о данных». Но здесь возникает вопрос: есть ли вообще в этом всем наука? На мой взгляд,Data Science скорее подразумевает под собой набор технологий и навыков, которые помогают решать практические задачи…

Сейчас в Data Science входят методы машинного обучения (Machine Learning), интеллектуального анализа данных (Data Mining), программирование и довольно большие элементы статистики.

Также в помощь читателям материалы рубрики:

Три признака настоящей даталогии

Даталогия vs Статистика

Леонид Жуков: Научных вещей в Data Science пока нет

 

комментариев 5

  1. Irina:

    Могу не согласиться с комментарием Леонида Жукова. На мой взгляд, DS вполне заслуживает звания «наука», так как охватывает и статистические методы, и «приложения искусственного интеллекта для работы с данными», которые имеют под собой вполне научную основу. Мое определение звучит примерно так:
    Data Science — зарождающаяся наука, которая изучает все аспекты работы с данными и, в отличие от статистики, делает акцент на их практической применимости.

  2. Elizaveta Filippova:

    Когда я училась в университете, на вводном курсе об информатике и информационных технологиях нам специально говорили, что информатика — это не наука, а совокупность методов (математических, логических и т.д.) и знаний, помогающих решить определенные практические задачи. Я согласна с такой точкой зрения: наука, согласно Википедии — область человеческой деятельности, направленная на выработку и систематизацию объективных знаний о действительности. То есть во главе угла стоит сбор информации для последующей ее систематизации. В основе информатики лежит теория, веками формировавшаяся математикой и физикой, то есть она имеет под собой научный фундамент, но самостоятельной наукой не является. В случае data science, даталогии Леонид Жуков четко говорит о наборе прикладных методов и технологий, лежащих в ее основе – и я с ним согласна. Да, статистика – это наука, но все остальное – именно что методы информатики, которая в свою очередь, по моему мнению, под определение науки не подходит. Даталогия не вырабатывает своих правил и закономерностей, не имеет своих фундаментальных законов – что было бы характерно для науки; она всего лишь применяет уже имеющиеся законы и методы для решения, опять же, определенных практических задач, но уже более узких, нежели в случае информатики (например, программирования).

  3. Артем Чернодуб:

    В моем понимании, Data Science это «сборная солянка» из научных дисциплин на основе математической статистики, теории вероятности, а также сопутствующих им технологий для обработки и хранения данных, которые объединяет одна цель – синтез моделей некоторых феноменов из наблюдений о них для последующего анализа этого феномена и/или прогнозирования его поведения. Особенность этого подхода состоит в том, что практически любая научная дисциплина ставит перед собой цель построить модели процессов или феноменов, но только в Data Science задача осмысливания происходящего перекладывается с ученого-исследователя на компьютер.

  4. Стас Петренко:

    Безусловно, data science пока еще не является наукой. На текущий момент data science – это комплекс подходов и рекомендаций по применению различных дисциплин и технологий, позволяющих анализировать большие объемы данных.

    Однако в будущем DS вполне может оформиться в полноценную науку, хотя бы потому, что практическая направленность, которая изначально является ключевой особенностью DS, обещает ей серьезное внимание, спрос и инвестиции.

    Мои варианты перевода терминов:

    data science – даталогия;
    data scientist – датолог.

  5. Екатерина:

    Даталогия — прикладная наука на стыке математической статистики и информатики, направленная на изучение (разработку/адаптацию/реализацию) методов и алгоритмов для решения задач математического моделирования различных процессов на основании статистических данных.
    Основная задача даталогии – получение «новых знаний» из имеющихся данных, при котором опущен этап формирования гипотез аналитиком. Т.к. при наличии небольших объёмов информации сложностей с формированием гипотез обычно не возникает, необходимость в даталогии появляется преимущественно там, где есть Big Data. Поэтому кроме методов моделирования данных, даталогия занимается изучением алгоритмов работы с Big Data (начиная от сбора, хранения таких данных и заканчивая имплиментацией построенных моделей).
    Однако ,имхо, методы даталогии в равной степени применимы и к «small» data – т.е. я бы не связывала даталогию исключительно с анализом Big Data, тем более у этого термина чёткого определения тоже нет))

Добавить комментарий

Ваш e-mail не будет опубликован.

закрыть

Поделиться

Отправить на почту
закрыть

Вход

закрыть

Регистрация

+ =