Сегодня мы говорим с Олегом Найденовым, основателем Hyperlee — онлайн сервиса по аренде вычислительных ресурсов для машинного обучения и больших данных.
— Олег, расскажите подробнее об услугах Вашей компании.
Мы помогаем клиентам упростить работу с данными и, прежде всего, ускорить вычислительные процессы. При этом, мы активно сотрудничаем как с корпоративными заказчиками, так и с НКО, ВУЗами и обычными студентами. Наша миссия — сделать вычислительные мощности максимально доступными. А свою основную роль мы видим в том, чтобы разрушить барьеры для входа новых людей в индустрию.
Доступность предполагает не только низкую стоимость сервисов и широкий ассортимент «железа» — сам продукт должен быть понятен даже для школьников.
Поэтому мы максимально упростили интерфейс, установили все библиотеки для машинного обучения и обеспечили качественную клиентскую поддержку.
По субботам у нас в офисе традиционно проходит бесплатное мероприятие Hyperlee Arena, где собираются студенты и энтузиасты в области машинного обучения. Вместе мы работаем над решением интересных задач, разбираем теорию и учимся друг у друга.
— Какие задачи решают Ваши клиенты с помощью машинного обучения?
— Самые разные. Например, медучреждения могут улучшить диагностику заболеваний, анализируя определенные показатели; банки — повысить точность оценки клиентской платежеспособности, составить профиль клиента и персонализировать предложения для каждого вкладчика.
Индустрия в целом предпочитает готовые решения, и большинство наших заказчиков — не аналитики, а стартапы, комплексно решающие бизнес-задачу конкретной индустрии.
— Что должен знать и уметь специалист по машинному обучению?
Перечень «умений» в этом случае достаточно широк, и продолжает расширятся с выходом новых технологий.
Специалист по ML должен обладать фундаментальной технической подготовкой, аналитическими и коммуникационными способностями. Идеальный соискатель — тот, кто знает прикладную математику, умеет программировать, трансформировать бизнес-задачу в задачу машинного обучения, обладает навыками предобработки и визуализации данных.
Основные языки программирования в области ML — Python, R, SQL. Однако с ростом количества данных необходимы также навыки работы cо Spark и Hadoop для распределенных вычислений, с Tableau для создания визуализаций и т.д.
— Где можно получить такие знания?
В настоящее время все больше университетов открывают программы подготовки специалистов в области анализа данных, машинного обучения. На сегодняшний день большинство data scientist’ов — люди, имеющие степень бакалавра или магистра по математике или информатике.
Формальное образование не всегда успевает за трендами, поэтому для повышения квалификации специалисты по машинному обучению получают дополнительные знания в школах по анализу данных, на образовательных онлайн-платформах или площадках, вроде Kaggle.
— Было бы интересно услышать реальный кейс с использованием сервисов Hyperlee…
— Недавно мы консультировали сельскохозяйственную компанию. Клиент работал над алгоритмом, который на основании аэрофотосъемки полей строил бы рекомендации по дополнительному поливу или обработке земельных участков. Кстати, сельское хозяйство сегодня — один из трендсеттеров в области применения новых технологий и, в частности, машинного обучения.
— Олег, и в завершение нашей беседы, дайте, пожалуйста, пару советов начинающим специалистам по машинному обучению.
— Терпение и еще раз терпение. Не ищите быстрых и легких решений. Приступайте к практике как можно раньше. Количество данных удваивается каждые два года, аналитиков для их качественной обработки катастрофически не хватает. Мир открыт перед вами и ждет, когда вы его измените!