Интересно о машинном обучении. Беседа с Олегом Найденовым  

Сегодня мы говорим с Олегом Найденовым, основателем Hyperlee — онлайн сервиса по аренде вычислительных ресурсов для машинного обучения и больших данных. 

— Олег, расскажите подробнее об услугах Вашей компании. 

Мы помогаем клиентам упростить работу с данными и, прежде всего, ускорить вычислительные процессы. При этом, мы активно сотрудничаем как с корпоративными заказчиками, так и с НКО, ВУЗами и обычными студентами. Наша миссия — сделать вычислительные мощности максимально доступными. А свою основную роль мы видим в том, чтобы разрушить барьеры для входа новых людей в индустрию.
Доступность предполагает не только низкую стоимость сервисов и широкий ассортимент «железа» — сам продукт должен быть понятен даже для школьников.

Поэтому мы максимально упростили интерфейс, установили все библиотеки для машинного обучения и обеспечили качественную клиентскую поддержку.

По субботам у нас в офисе традиционно проходит бесплатное мероприятие Hyperlee Arena, где собираются студенты и  энтузиасты в области машинного обучения. Вместе мы работаем над решением интересных задач, разбираем теорию и учимся друг у друга.

— Какие задачи решают Ваши клиенты с помощью машинного обучения? 

— Самые разные. Например, медучреждения могут улучшить диагностику заболеваний, анализируя определенные показатели; банки — повысить точность оценки клиентской платежеспособности, составить профиль клиента и персонализировать предложения для каждого вкладчика.

Индустрия в целом предпочитает готовые решения, и большинство наших заказчиков — не аналитики, а стартапы, комплексно решающие бизнес-задачу конкретной индустрии.

— Что должен знать и уметь специалист по машинному обучению?

Перечень «умений» в этом случае достаточно широк, и продолжает расширятся с выходом новых технологий.

Специалист по ML должен обладать фундаментальной технической подготовкой, аналитическими и коммуникационными способностями. Идеальный соискатель — тот,  кто знает прикладную математику, умеет программировать, трансформировать бизнес-задачу в задачу машинного обучения, обладает навыками предобработки и визуализации данных.

Основные языки программирования в области ML — Python, R, SQL. Однако с ростом количества данных необходимы также навыки работы cо Spark и Hadoop для распределенных вычислений, с Tableau для создания визуализаций и т.д.

— Где можно получить такие знания? 

В настоящее время все больше университетов открывают программы подготовки специалистов в области анализа данных, машинного обучения. На сегодняшний день большинство data scientist’ов — люди, имеющие степень бакалавра или магистра по математике или информатике.

Формальное образование не всегда успевает за трендами, поэтому для повышения  квалификации специалисты по машинному обучению получают дополнительные знания в школах по анализу данных, на образовательных онлайн-платформах или площадках, вроде Kaggle.

— Было бы интересно услышать реальный кейс с использованием сервисов Hyperlee…

— Недавно мы консультировали сельскохозяйственную компанию. Клиент работал над алгоритмом, который на основании аэрофотосъемки полей строил бы рекомендации по дополнительному поливу или обработке земельных участков. Кстати, сельское хозяйство сегодня — один из трендсеттеров в области применения новых технологий и, в частности, машинного обучения.

— Олег, и в завершение нашей беседы, дайте, пожалуйста, пару советов начинающим специалистам по машинному обучению.

— Терпение и еще раз терпение. Не ищите быстрых и легких решений. Приступайте к практике как можно раньше. Количество данных удваивается каждые два года, аналитиков для их качественной обработки катастрофически не хватает. Мир открыт перед вами и ждет, когда вы его измените!

Автор публикации

не в сети 22 часа

DataReview

Комментарии: 16Публикации: 944Регистрация: 05-06-2014

Вам также может понравиться

Добавить комментарий

Ваш e-mail не будет опубликован.

закрыть

Поделиться

Отправить на почту
закрыть

Вход

закрыть

Регистрация

+ =
Авторизация
*
*

Login form protected by Login LockDown.


Регистрация
*
*
*
*
Генерация пароля