Валентин Елисеев: Облако Microsoft позволяет бизнесу быстро реализовывать свои потребности

Сегодня DataReview беседует со специалистом Microsoft Валентином Елисеевым.

— Валентин, расскажите о себе. Чем занимаетесь в Microsoft?

— Я руковожу направлением Cloud&Enterprise.  Занимаюсь продвижением серверных решений, виртуализацией, системами управления инфраструктуры, облачными вычислениями.

До этого достаточно долго работал в компаниях — партнерах Microsoft. Еще раньше — занимался разработкой программного обеспечения, был и проектным менеджером, и аналитиком, и программистом. Поэтому у меня достаточно долгая айтишная карьера.

— Насколько мне известно, Microsoft активно развивает data-направление?

— Да, сейчас все, что связано с данными — особенно данными в облаке — для Microsoft является стратегически важным. Мы активно развиваемся в двух больших областях. Первая — наземные решения на базе SQL Server (в скором времени должна выйти новая версия — SQL Server 2016). Вторая — облако Microsoft Azure с сервисами по обработке и хранению данных, предиктивной аналитике, построению отчетности и т.д.

Microsoft Azure — глобальная система, которая доступна по всему миру. Сотни тысяч клиентов хранят и обрабатывают данные, применяя достаточно серьезные и продвинутые средства анализа в облаке Azure.

— Но Microsoft не единственная крупная компания, занимающаяся этим направлением…

— Сейчас облачные технологии — это глобальный тренд, и Microsoft занимает в нем лидирующие позиции наряду с Amazon и Google. В продуктовом портфеле Microsoft есть и наземная система баз данных. В этом состоит уникальность предложения Microsoft, так как в обоих направлениях, мы признаны лидерами “магического квадранта” Gartner.  

— В последнее время особенно остро стоит вопрос о трудностях взаимодействия между бизнесом и ИТ. Существует ли такая проблема в Microsoft? Если да, какие шаги Вы предпринимаете для ее решения?

— Хороший вопрос, однако он адресован скорее не Microsoft, а корпоративным заказчикам. Что мы делаем со своей стороны, чтобы наладить диалог? Прежде всего, стараемся говорить с бизнесом на понятном ему языке. Это очень непростая задача, так как долгое время Microsoft общался только с ИТ-специалистами. Сегодня мы понимаем, как важно выйти на уровень общения с бизнесом. И я с вами абсолютно согласен: общение между бизнесом и ИТ сильно затруднено.

И то, что предлагает Microsoft, а именно — облако как альтернативу наземной инфраструктуре — является уникальным решением проблемы между бизнесом и ИТ.

Когда бизнесу требуется запустить новый сервис или получить новые отчеты, он идет к ИТ и начинает объяснять, что сделать это нужно очень быстро. Но т.к. основной задачей ИТ в корпоративном сегменте является обеспечение стабильной работы существующих сервисов, то быстро реализовать новые запросы бизнеса не получается: это целый процесс, требующий изменений в инфраструктуре и приложениях. Облако является оптимальным решением такой проблемы — оно позволяет топ-менеджерам быстро и самостоятельно реализовывать свои задачи.

— Это связано с простым интерфейсом?

— В частности и с этим. Да, Microsoft предоставляет облачную платформу для быстрой реализации бизнес-проектов. При этом, ИТ-специалисты по-прежнему нужны бизнесу для осуществления больших инфраструктурных проектов.

— Значит, Вы уже научились разговаривать на языке бизнеса…

— Для того, чтобы сложился продуктивный разговор, мы стараемся узнать потребности клиента, прийти с готовым решением к представителям их бизнеса и продемонстрировать, что именно мы предлагаем, на примере использования в нашей компании, а также подкрепив историями внедрения других клиентов в Украине и в мире. Такие “живые” примеры всегда более понятны и наглядны для бизнеса.  

— Понятно. А что, на Ваш взгляд нужно компании, чтобы начать монетизировать свои данные?

— Для этого нужны 3 вещи. Во-первых, правильная постановка задачи: в любом случае все начинается именно с этого. Я имею в виду задачу, которую можно оцифровать. Например: снизить операционные затраты на ремонтные бригады на 20%, при этом сократить время простоя оборудования на 50%.  Это понятные, измеримые величины. Во-вторых, специалисты, которые переведут эту задачу из цифр в технологические решения и, главное, определят, какие данные для этого необходимы. Сегодня их модно называть data scientist’ами — по-простому, это аналитики, которые могут перевести задачу на язык технологий.

В-третьих, техническая оснастка. Это должна быть платформа, где хранятся данные, программное обеспечение и есть необходимые мощности для вычислений.

То есть еще раз: первое — постановка задачи, второе — специалисты, третье — техническая платформа.

— Звучит, конечно, красиво, но, как правило, все обстоит немного иначе. Как думаете, если потенциальный заказчик не может поставить четкую задачу, должны ли ИТ-специалисты ему в этом помочь?

— Когда речь идет о работе с данными, мое мнение — ИТ не будет наталкивать бизнес на какое-то решение. Это не их задача. На мой взгляд, здесь очень важна роль других специалистов — аналитиков и консультантов. Они понимают, как идет бизнес, объективно оценивают  положение компании и знают, что нужно для решения тех или иных задач (например: если бы мы в каждом из наших магазинов поставили ларек с чаем, это бы увеличило поток покупателей на 10%). То есть нужны люди, которые оперируют этими понятиями и только потом обращаются к ИТ с конкретными задачами.

Сегодня мы видим, что все больше крупных компаний нанимают штат специалистов для работы с данными.

Также это могут быть компании, специализирующиеся на подобных решениях. Сейчас мы в Microsoft Украина очень большое внимание уделяем поиску стартапов и компаний, работающих в определенном сегменте рынка (например, в ритейле или в банкинге) и предлагающих конкретные узконаправленные  решения под этот тип бизнеса клиента. Это непростая задача: мы должны увидеть такие компании, понять, что они делают, вместе пойти к заказчику и показать, что именно клиент может получить, убедить в покупке.  

Поэтому, возвращаясь к началу вашего вопроса, я еще раз подчеркну: не думаю, что ИТ должны предлагать бизнесу, как решать его вопросы и какую выгоду можно извлечь из больших данных. Это задача аналитиков.

— Есть мнение, что не все данные одинаково полезны. Как понять разницу, различить, где “мусор”, а где — нет?

— Если у нас есть данные или телеметрия какого-то сервера, нам это особо ни о чем не говорит. Такая информация может быть полезной только при двух условиях. Первое — есть человек, который что-то в ней понимает. Второе — важен контекст. Приведу пример: если какой-то датчик передает информацию о температуре -3 градуса, само по себе это знание — ни о чем. Но при условии контекста, допустим,  если такой датчик установлен в холодильнике, то мы можем понять, что оборудование работает нормально; если это датчик в комнате — то там явно выключено отопление или разбиты стекла; если в машине — что на дороге, вероятно, гололед, и нужно принимать какие-то меры.  

Это как раз и выливается в необходимость использовать технологии Big Data: именно корреляция различных данных, на первый взгляд не связанных между собой, дает эффект и полезную информацию. То есть большие данные — это совмещение различных источников и анализ того, как они взаимосвязаны между собой.

— Когда бизнесу стоит собирать данные из внешних источников (например, из социальных сетей), а когда достаточно информации, имеющейся внутри компании?

— Как вам сказать? Вообще любая компания существует в окружающем мире и собирает данные извне. Это не только социальные сети, но и отзывы клиентов, звонки в call-центр, банковские выписки и т.д. Поэтому в любом случае нужно использовать информацию, полученную из внешних источников, вопрос только в том, как это делать и насколько она полезна для компании.

Использование и анализ социальных сетей — то, что называют Social Listening (т.е. «слушание отзывов через соцсети») — конечно, имеет огромное значение для глобальных компаний, которые работают по всему миру и имеют огромное количество подписчиков. В их случае малейшее слово, сказанное в Интернете может иметь огромные последствия. Такие сообщения нужно вылавливать и реагировать на них. Если говорить о компаниях небольших или работающих на локальном рынке, то значение этих данных будет другое. Предположим, розничная компания, имеющая сотни магазинов по всей стране, решила выйти на интернет-рынок. В таком случае Social Listening имеет большое значение — он влияет на маркетинг, на глобальное развитие проекта. У такой компании обязательно должны быть средства анализа Интернета, позволяющие узнать, как о них отзываются, эффективны ли их маркетинговые компании?

Возьмем другой вариант — небольшой банк или завод, который работает в основном на зарубежных поставщиков. Для них Social Listening, как таковой, имеет очень узкое и небольшое значение. У них нет необходимости в маркетинговой активности, направленной на широкий круг потребителей, и такой инструмент является нерелевантным.

— Насколько дорого и технически сложно изучать социальные сети, ведь это огромные массивы неструктурированной информации?

— Именно потому, что организовать такое хранилище и мощности для обработки данных “на земле” стоит очень внушительных денег, мы в первую очередь говорим про облако в контексте Big Data. Мы убираем стоимостной барьер вхождения в проект больших данных, поскольку мы предлагаем дешевое и безразмерное хранилище и очень гибкий биллинг использования вычислительных мощностей.

А вот аналитика и специалисты, которые знают, что и откуда взять и как это интерпретировать стоят дорого, поскольку это знания относительно того, как организовать процесс, что для этого необходимо: какие данные получать, как их разбирать и превращать во вменяемый результат. То есть при использовании облака вопрос стоит не в технике, а в квалификации консультантов-аналитиков.

— Сейчас все говорят о дефиците data scientist’ов. А как ситуация обстоит на отечественном рынке?

— Мне сказать сложно, потому что я знаю немного (до 10) компаний на украинском рынке, которые профессионально занимаются аналитикой. Конечно, проблема в состоянии нашей экономики и в том, что подобного плана специалисты зачастую находят себе применение в западных компаниях, для которых эта задача гораздо более актуальна. То есть, когда речь идет о выживании бизнеса как такового, задачи, требующие высокого интеллекта в реализации, уходят на второй план.

То, что мы видим сейчас: специалисты высочайшего класса скорее выращены и работают внутри крупных отечественных компаний (ритейл, банки, телеком), нежели в компаниях, которые специализируются на подобного плана решениях.

— Как Вы оцениваете готовность отечественного бизнеса к технологиям Big Data?

— Я знаю отечественные ритейловые компании, которые зарабатывают деньги на данных. Там работают аналитики высокого класса. Такие компании внедряют собственные бизнес-решения на основании работы этих аналитиков. Также есть прекрасные аналитические отделы в крупных банках. Я точно знаю, что наши телеком-компании держат целый штат аналитиков, которые изучают ситуацию на рынке, занимаются Social Listening  и т.д. Поэтому в нашей стране сейчас это прерогатива крупных компаний.

— А если говорить о среднем бизнесе — не о Big Data, а об аналитике в целом? Насколько она вообще присутствует на рынке?

— Аналитика присутствует практически в любой компании, вопрос в ее глубине и влиянии на бизнес. Я бы сказал так: развитие аналитического аппарата и ее влияние на жизнь компании повышается с развитием и ростом бизнеса. Что я имею в виду? Если это небольшая компания, аналитика в ней находятся на уровне сбора данных и понимания того, что уже произошло. Следующий уровень — когда на основании этих данных строятся предположения, куда компании двигаться дальше. Это уже не просто отчеты, это использование математического аппарата.

Самый простой пример — это задача типа next buy («задача следующей покупки»), когда на основании информации о покупках клиента, ему предлагается товар, который он купит с наибольшей вероятностью. Это предиктивная аналитика в самом простом виде. Сейчас она начинает все чаще применяться в компаниях, понимающих необходимость постоянно предлагать что-то новое своим клиентам.

И уже следующий шаг развития аналитики — когда компания не только делает прогноз о том, как развиваться дальше, но и какими средствами нужно оперировать, чтобы достичь этого результата. То есть, например, если идет подробный анализ работы компании за какой-то период, используются данные, допустим, из медиа, social и отзывы клиентов, делается вывод относительно того, куда нужно двигаться дальше (новый сервис, новая линейка продуктов), и предлагаются конкретные шаги для того, чтобы этого достичь. Это уже аналитика высокого уровня, и к этому компании на нашем рынке пока только подходят. Я думаю, что даже в мировой практике это высокий класс — когда машинная логика, какие-то математические выкладки делают не только предположение, но и выстраивают некий план по достижению этого результата.

На мой взгляд, большинство наших компаний сейчас находятся на первом этапе, осуществляя анализ текущей информации, строя отчеты и по ним сверяя, все ли идет хорошо. Если нет, начальник разговаривает с подчиненными и заставляет их бегать быстрее.

Более продвинутые компании, коих сейчас очень немного, строят предположения и стараются предвидеть ситуацию. Но компании, которые выстраивают бизнес-процессы вокруг математического аппарата, мне пока не известны. Я думаю, мы до этого еще не дошли.

— Поясню, чем был обусловлен этот вопрос. Не так давно, около полугода назад, мы проводили исследование: опросив около 500 человек, пытались понять, насколько наш бизнес готов к внедрению аналитики. В итоге — столкнулись с проблемой: предприниматели всё понимают, но инвестировать в аналитику не хотят. На Ваш взгляд, почему так происходит? Возможно, виной тому недостаточный уровень информированности и отсутствие популяризации?

— С одной стороны, рецепт достаточно простой, с другой — он очень сложный. Нужно доказать целесообразность аналитики с финансовой точки зрения. Если компания, специализирующаяся на аналитике и обработке данных, хочет продать свой сервис корпоративному клиенту, ее люди должны прийти и сказать: «Мы готовы повысить ваши продажи, допустим, на 5%. Это будет стоить столько-то». Только так бизнес сможет оценить предложение. Если затем поставщик услуг докажет свои слова на  примерах, даст решение задачи, то бизнес поймет, что это принесет им реальный доход. На мой взгляд, это стандартная проблема продаж консалтинговых услуг. Компании (не обязательно аналитической) нужно доказать, что она сможет принести пользу бизнесу.

— Не хватает реальных кейсов.

— Да, это во-первых. Нужно работать, собирать истории успеха. Но проблема еще в том, что зачастую люди, пытающиеся продать свои услуги, оперируют «туманом». Они приходят к бизнесу и говорят: «Наши услуги стоят столько-то, воспользуйтесь ими, и у вас все будет хорошо». Руководители бизнеса осознают, что им пытаются продать что-то, чего они не понимают.

Я, как продавец в прошлом, проходил через это много раз: когда ты пытаешься донести не вполне понятную концепцию, тебя не слушают и отправляют восвояси. Поэтому вопрос не в продвинутости решения, а в конкретности и простоте донесения информация до бизнеса. Это большая проблема для всех компаний, которые продают собственные сервисы. Мы это тоже очень хорошо чувствуем.  

— Но у Вас есть имя…

— Мне почему-то кажется, что стартапам должно быть легче.

— Почему?

— Стартапы сосредоточены на конкретной задаче и конкретном решении. Продать систему или сервис, решающие узкую задачу намного проще. Например: оптимизация раскладки купюр в банкоматах. Это вполне конкретная задача, у которой есть вполне конкретное решение. Специалисты, занимающиеся подобного плана системой, точно знают, что для банка, у которого есть, допустим, 200 банкоматов, такая оптимизация может принести такую-то выгоду. Они вычисляют, какие банкоматы принимают купюры определенного достоинства, могут обеспечить приток денег правильных номиналов и сократить простой банкоматов. Это очень просто для понимания конкретного заказчика — не руководителя банка, не финдеректора, а начальника отдела по работе с сетью банкоматов. Он точно понимает, зачем ему нужна эта система. С моей точки зрения, чем больше фокусировано решение, тем легче его продавать.

Другой пример — большая компания, которая специализируется на построении хранилищ данных. Мы приходим в ритейловую сеть и говорим, что можем построить им хранилище данных. И вот здесь встает вопрос: зачем и что, собственно, имеется в виду? Какую выгоду это принесет компании? Сколько это будет стоить?

— В данном случае выгоду сложно описать в цифрах.

— Ее можно описать, но это очень непростая задача. И поэтому среди корпоративных клиентов мало людей, которые понимают такого масштаба задачи. Для больших проектов нужны не только знающие люди на стороне компании-интегратора. Со стороны клиента тоже необходимы специалисты, которые понимают цель и  масштабность задачи. И для таких проектов компаниям действительно нужно взращивать специалистов. В текущих условиях это сложно.

— Мне как раз вспомнился недавний случай, когда на одной из конференций представитель российского Сбербанка рассказал, что они вложили около 2 млрд рублей в хранилища данных, в дорогостоящие решения от Oracle, но так и не увидели реальную выгоду от этого.

— Я вам хочу сказать, что чем больше проект, тем меньше шансов получить существенную выгоду. Это я вам говорю не только как работник Microsoft, но и как человек, видевший много разных проектов. Когда речь идет о внедрении data warehouse систем, это требует одинаково высокой подготовки и упорства не только от реализатора, но и от заказчика. Поэтому чем больше проект, тем выше требования к руководителям компании-заказчика. Это в том числе и их ответственность, чтобы такого плана решение принесло какой-то результат. Так что в этот рассказ охотно верю.

— Расскажите о достижениях Microsoft в области Big Data и машинного обучения. Какие подходы и инструменты Вы применяете? Над чем работаете сейчас?

— Направление Microsoft, связанное с данными, носит общее название Data Platform. В нее входят и наземные, и облачные решения. Наземные решения — это упомянутый мной выше SQL Server. Облачные — это целый стек сервисов облака Microsoft Azure.

Что мы предлагаем? SQL Server (кстати, тоже лидер в квадранте Gartner) получает встроенный сервер R. Недавно Microsoft купил компанию Revolution Analytics, которая, собственно говоря, и двигала этот проект. Он доступен как открытая платформа (то есть продукт, который можно скачать и использовать) или как встроенная функциональность SQL Server. Это позволит не только строить отчеты, но и сдвинуть аналитику в сторону предиктивности. Это специальный матаппарат, пакеты для работы аналитиков и data scientist’ов, которые будут не просто строить отчеты и анализировать, что уже произошло, но и делать предсказания на основании данных.  

Второй момент — в SQL Server появляется возможность работы с Big Data. То есть теперь он может работать не только с реляционными данными, но и одновременно через технологии Hadoop  с неструктурированными данными. Это очень интересная технология, которая позволяет буквально в одном запросе искать данные внутри таблиц SQL Server и при этом запускать параллельные вычисления по неструктурированной информации. И, конечно, необходимо сказать, что будет существенно улучшена in-memory технология, которая позволит выполнять операции поиска данных в десятки раз быстрее.

— Нужно ли при этом компании что-то «дотачивать» или это полностью готовое решение?

— Это платформенное решение, на основании которого строится большая аналитика, и настраивать ее должны сотрудники ИТ или компании с необходимыми компетенциями. То есть это не «коробочное решение» для задач аналитического отдела.

Что касается нашего облака, развитие там происходит очень быстро. Сейчас мы рекомендуем клиентам сначала рассматривать облако для решения своих задач, а уже потом планировать что-то на земле. Почему? Потому что в облаке возможностей по хранению и обработке информации на порядок больше. Microsoft Azure позволяет хранить файлы петабайтного размера. При этом преимущество облака заключается в том, что очень сложные и ресурсоемкие задачи, например, связанные с параллельной обработкой массивных блоков данных, решаются достаточно быстро и очень недорого.

В пример могу привести партнера из Великобритании. По его подсчетам, для обработки десятков терабайт данных ему потребовалось бы 100 серверов, работающих параллельно. В таком случае они выдали бы информацию в течение 2 дней. То есть, вы понимаете, что получить 100 серверов в наземной инфраструктуре очень дорого. В итоге компания вынесла эти данные в облако Azure, запустила 100 серверов, получила результат, и затраты на это составили менее 1000 долларов. Так что облако — это правильное решения для подобного класса задач, когда нужно быстро обработать огромный объем информации.

Весь набор сервисов захвата, обработки и анализа данных в облаке Azure носит название Cortana Analytics Suite. В него входят такие сервисы как:

  • Azure Event Hub — потоковый захват данных;
  • Azure Data Lake — хранилище информации вплоть до петабайтного размера;
  • Azure Stream Analytics — потоковая обработка данных;
  • Azure HDInsight — Hadoop технологии для параллельной обработки данных

и т.д.

В него же входит сервис Power BI, который мы рекомендуем всем для легкого построения визуальной отчетности. Сейчас это очень востребованный инструмент на рынке, и многие наши партнеры уже начали его активно предлагать клиентам.

А внимание Data scientists хочу обратить на сервис Azure Machine Learning. С его помощью строятся математические модели, через которые прогоняются данные и на результатах этих исследований можно строить рекомендации для бизнеса компаний.

— При этом, я так понимаю, что вопрос безопасности данных в облаке не стоит?

— Разговор о безопасности данных в облаке очень длинный и включает в себя множество аспектов: это и физическая безопасность наших дата-центров, и права доступа к информации, и правила шифрования. Но мы обычно используем короткий ответ: сервисы хранения и обработки данных в наших дата-центрах соответствуют огромному количеству мировых стандартов по защите и работе с данными, среди которых и стандартные ISO27001/27018 и специализированные — PCI DSS или HIPPAA.

Для корпоративных заказчиков именно этот факт является гарантией сохранности и безопасности данных при работе с облаком Microsoft.

Лариса Шурига, DataReview

Добавить комментарий

Ваш e-mail не будет опубликован.

закрыть

Поделиться

Отправить на почту
закрыть

Вход

закрыть

Регистрация

+ =