С этого материала мы начинаем серию статей об инструментах анализа данных для неспециалистов. Для чего нужны подобные программные средства, чем и кому они полезны? На все эти вопросы мы постараемся ответить в нашей сегодняшней статье.
Бизнес-анализ vs data mining
Анализ данных долгое время был уделом узких специалистов: только настоящие профи, подкованные в вопросах математики, информатики и статистики и обладающие опытом работы с большими данными могли детально разобраться в хитросплетениях вопросов, касающихся больших данных, и эффективно применять на практике абстрактные методологии и разнообразные сложные инструменты анализа данных. По большому счету, ситуация и сейчас остается прежней, однако сегодня анализ данных интересует компании в гораздо более широком смысле этого слова.
Базовые концепции дисциплины, применимые к исследованию требований клиента и внутренних процессов компании, направленному на достижение конкурентных преимуществ и необходимых результатов, получили общее название бизнес-анализ. И это – уже скорее к вопросу о менеджменте. И к менеджерам.
Понятное дело, большинство специалистов по финансам, планированию или, например, рекламе далеко не всегда являются одновременно экспертами в data mining. Но это не значит, что в своих целях они не могут использовать инструменты анализа данных. Естественно, результат не будет отвечать требованиям интеллектуального анализа данных (в том смысле, каким его понимает даталогия), но этого и не требуется.
Нужно понимать, что целью бизнес-анализа является не построение некоего точного прогноза, а разработка модели, которая поможет принять некое решение. А на это, при условии правильно подобранного программного обеспечения, способен и условный «дилетант» анализа данных.
Инструменты для непрофессионалов: в чем фишка?
Новый инструментарий призван помочь неспециалисту разобраться с разнообразными задачами анализа данных. При этом многие из них вообще не требуют программирования, кое-какие сводят его к минимуму, а самые продвинутые – помогают объединить создание кода, визуализацию и отчеты в один рабочий поток. В большинстве своем эти программные продукты осуществляют анализ наборов данных, однако некоторые помогают еще и с интерпретацией результата.
Главным же преимуществом нового, упрощенного инструментария является его ценная внутренняя функция – способность предоставлять информацию, на основе которой неспециалист сможет оценить, является ли задача тривиальной или же для ее решения требуется участие эксперта. Естественно, компаниям невыгодно держать целый штат высококлассных специалистов по анализу данных – зато обучить потенциально вовлеченных сотрудников работе с программой – вполне реально. В идеале этим смогут заниматься профессиональные бизнес-аналитики; самые сложные же задачи всегда можно поручить одному-двум экспертам, которых сегодня может позволить себе любая уважающая себя компания.
Инструменты неспециалиста: примеры
В целом, инструменты анализа данных, созданные специально для тех, кто не является экспертом в data mining, однако нуждается в решении смежных задач, делятся на две группы:
- Инструменты визуализации и упрощенного статистического анализа. Например, это стартапы 2013 года DataHero и Statwing, которые, кроме всего прочего, предлагают пользователю построить тот вид диаграмм, который, по мнению программы, лучше всего подходит для визуализации конкретного набора данных. Statwing обладает еще и статистическим инструментарием, позволяя пользователю проводить над данными несколько вариантов стандартных статистических тестов и впоследствии выгружать подробнейшие отчеты.
- Инструменты статистического анализа и машинного обучения. Среди подобных программных продуктов можно выделить BigML, Skytree и Datameer Smart Analytics, которые облегчают бизнес-пользователям такие задачи как применение алгоритмов машинного обучения к наборам данных (причем Datameer позволяет работать с действительно большими объемами данных).
Резюме
Сегодня на рынке представлено большое разнообразие инструментов для неспециалистов, позволяющих работать с данными. Об этих инструментах мы подробно расскажем в следующих статьях. Однако хотелось бы еще раз подчеркнуть: непрофессионал, конечно, может приобрести соответствующее ПО, но при этом он должен помнить о мере ответственности — самостоятельное применение методов data science может негативно отразиться на работе компании и качестве принимаемых решений. Такие инструменты скорее подходят для получения базового опыта в работе с данными и экспериментов, которые заведомо не должны влиять на глобальные бизнес-процессы.
Автор: Елизавета Филиппова