Инструменты анализа для неспециалистов: машинное обучение с BigML

Мы продолжаем серию статей, посвященных инструментам анализа данных для неспециалистов. В прошлых материалах мы рассказали об инструментах упрощенной визуализации и статистического анализа; сегодня на очереди машинное обучение и инструмент, призванный помочь непрофессионалам разобраться с этой нелегкой задачей – BigML.

Что такое BigML?

BigML – облачный сервис машинного обучения, обладающий широкими возможностями масштабирования. Инструмент, по словам разработчиков, рассчитан на удовлетворение потребностей бизнеса, которые касаются больших данных и облачных вычислений, а также призванный сделать прогнозирование и его результат как можно более простым, понятным и пригодным для демонстрации конечным пользователям. Все это обещания – а что же на самом деле? Давайте посмотрим.

BigML

Основные моменты работы BigML:

  • Инструмент использует интерактивные деревья решений. А это означает не только удобство работы для непрофессиональных пользователей, но простое представление неких процессов, например, клиенту, который мало смыслит в машинном обучении;
  • Программа поддерживает три различных способа запуска: через веб-интерфейс (работа с облаком), командную строку (большая гибкость работы с алгоритмами) и прикладной программный интерфейс (классический способ, удобный для большинства «консерваторов»);
  • BigML поддерживает самые разнообразные форматы – от сырых данных (например, CSV), до наборов данных, моделей и ансамблей моделей. Короче говоря, при помощи инструмента можно относительно эффективно работать со всеми основными форматами входной информации для получения желаемого результата.

Достоинства BigML

BigML

Сразу оговоримся, что мы рассматриваем BigML как инструмент для непрофессионалов, который может выступать как средство обучения или помощи в принятии некоего решения, а также демонстрации конечного результата – но никак не самостоятельного инструмента для серьезного анализа данных и машинного обучения с далеко идущими результатами. С этой точки зрения можно выделить следующие достоинства BigML:

  • Результат в один клик. Действительно, многие действия (как пример – макросы) можно выполнить в один клик – и сразу же получить результат. Удобно в процессе демонстрации: для клиента или инвестора во многих случаях такая презентация будет подобна «магии»;
  • Интерактивные деревья. Специалисты по большим данным любят деревья принятия решений за то, что они позволяют просто и наглядно представить результат – однако это важно не только в целях визуализации. Не будем забывать, что деревья решений сами по себе являются мощной концепцией даталогии (англ. data science). Для обучения «премудростям» бизнес-анализа они выступают чуть ли не идеальным тренировочным вариантом;
  • Модели, способные генерировать прогнозы и оценки, и возможность самостоятельной работы с этими моделями (не во всех случаях алгоритм скрыт за интерфейсом – здесь существуют варианты). BigML предлагает довольно серьезный интерфейс моделирования, прогнозирования и анализа, причем в зависимости от пользователя, программа может либо предложить наиболее подходящий по ее мнению алгоритм, либо позволить пользователю принять это решение самостоятельно.

Недостатки BigML

В каждой бочке меда найдется пара ложек дегтя – и, к сожалению, даже такой удачный, на наш взгляд, инструмент как BigML не стал исключением. В общем-то, ложка всего одна: создается такое впечатление, что разработчики пытаются угодить всем и сразу, создав универсальный инструмент, который будет способен выполнять любую задачу, связанную с машинным обучением, вне зависимости от того, требует она профессионального «вмешательства», или нет.

Создателям нужно раз и навсегда (или, по крайней мере, пока ситуация на рынке не прояснится) решить, на кого же все-таки рассчитан их продукт. Если ставка идет на новичков/непрофессионалов, то почему бы не отдать всю работу по бизнес-анализу на облако, оставив пользователю только возможность небольшого редактирования? Если же инструмент хотят сделать действительно полезным для профессионалов, то стоит подумать о добавлении соответствующего функционала.

Резюме

Куда бы не привели нас тренды, господствующие сегодня в мире больших данных, от необходимости упрощения работы с такими концепциями, как машинное обучение, никуда не деться. BigML – программа, призванная помочь бизнес-аналитикам в их работе и демонстрации ее результатов, с удобным интерфейсом и большими возможностями. Правда, пока до конца непонятно, рассчитан ли инструмент на непрофессионалов, или «метит» в «лигу выдающихся джентльменов» data mining. Впрочем, поживем-увидим.

Добавить комментарий

Ваш e-mail не будет опубликован.

закрыть

Поделиться

Отправить на почту
закрыть

Вход

закрыть

Регистрация

+ =