Фоторепортаж: Конференция AI Ukraine 2014 подводит итоги

В субботу, 25 октября, в Харькове состоялась международная конференция AI Ukraine 2014, посвященная практическому применению алгоритмов искусственного интеллекта. Гостями мероприятия стали более 300 человек — ведущие специалисты в области анализа данных из России и Украины, предприниматели, руководители отделов крупных компаний (в том числе, Microsoft, ABBYY) и молодые энтузиасты.

Программа состояла из трех специализированных потоков. Свои доклады представили более 18 спикеров.

Организатором мероприятия выступил один из крупнейших в Украине разработчиков программного обеспечения — Altexsoft. В рамках открытия конференции вступительное слово взял генеральный директор компании Александр Медовой.

Одним из первых выступлений стал доклад Александра Панченко, старшего исследователя в Digital Society Laboratory (Москва), «Анализ текста в социальных сетях».

В частности, эксперт рассказал о ключевых целях такого анализа:

  1. определение пола пользователя;
  2. определение языка пользователя;
  3. определение интересов пользователя.

По словам Панченко, методика определения интересов включает в себя создание текстового индекса социальной группы, списка ключевых слов из интересов, и — на их основе — классификатора, который ассоциирует интересы группы с пользователями по словарным признакам.

«В социальных сетях лайк — самая дешевая «валюта», длинный комментарий — самая «дорогая». Длинных комментариев в 18 раз меньше, чем лайков. Достоверно классифицировать интересы можно на уровне 10%», — отметил специалист.

Сергей Николаенко, старший научный сотрудник Лаборатории интернет-исследований НИУ ВШЭ, посвятил доклад коллаборативной фильтрации (collaborative filtering), матричным разложениям и расширениям рекомендательных систем.

По словам эксперта, задача рекомендательной системы машинного обучения – предсказать оценки (рейтинги, отклики) предмета, зная признаки пользователя для всех элементов базы.

«Один класс рекомендательных систем основан на рекомендациях от ближайших соседей — пользователей, которые более всего похожи на вас. Чтобы это могло масштабироваться, в действительно больших рекомендательных системах используют приближенные методы поиска ближайших соседей, основанные на LSH (locality sensitive hashing)», — в частности, рассказал Николенко.

«Другой класс основан на различных разложениях матрицы рейтингов, выставленных пользователями, в произведение прямоугольных матриц
признаков пользователей и продуктов (при этом матрица рейтингов приближается матрицей малого ранга)», — добавил он.

При этом в процессе построения вероятностной модели очень важно не допускать переобучения (overfitting) , уверен эксперт.

Что же касается матричного разложения с применением PCA (анализа главных компонентов) – по словам Николаенко, оно является одним из самых популярных методов сокращения размерности.

При наличии рейтингов эффективно также SVD (сингулярное разложение). Если же рейтингов нет, то используется NMF (неотрицательное разложение), в результате которого можно получить признаки, более доступные для интерпретации.

Говоря о коллаборативной фильтрации, самой большой ее проблемой Николаенко назвал «холодный старт» (cold start), когда в строках и столбцах матрицы недостаточно много известных значений.

Пожалуй, одним из самых интересных и нестандартных выступлений на конференции AI Ukraine стал доклад Internet of Machine Learning Кристофера Рольфа Дейнофа (Kristoffer Rolf Deinoff), оформленный в виде практического пособия по анализу данных.

Эксперт показывал аудитории и разбирал код, который написал в процессе анализа. Анализируемые им данные включали информацию о спортивной активности людей, полученную с фитнес-трекеров, а также данные о погоде. Цель анализа — построить прогнозную модель, чтобы определить, какие упражнения лучше всего выполнять на протяжении следующей недели в зависимости от прогноза погоды.

В ходе выступления спикер осветил все этапы анализа – подготовку данных и процесс обучения модели.

Лекция плавно переросла в дружественную дискуссию. Было много вопросов, на которые Кристофер любезно отвечал и пытался дать исчерпывающие ответы.

А вот наибольший ажиотаж вызвал доклад Артема Чернодуба, руководителя направления Computer Vision в ZZWolf (Киев), посвященный глубоким рекурентным нейронным сетям.

В частности, эксперт рассказал о целях их применения:

— предсказание временных серий;

— распознавание речи;

— обработка разговорного языка;

— контроль промышленных двигателей;

— распознавание рукописного текста и т.д.

По словам Чернодуба, рекурентные нейронные сети способны качественно прогнозировать на несколько шагов вперед, и с каждым будущим шагом точность прогноза будет возрастать.

«Это достигается за счет учета в прогнозе нового набора данных и обучения на них», — отметил эксперт.

Также в рамках конференции выступил Роман Захаров, представитель компании Softcube (Днепропетровск), с докладом «Ритейл с человеческим лицом».

По его словам, внутренняя оценка качества сегментации включает в себя «сплоченность» точек вокруг центра и расстояние между сегментами. Во внешнюю оценку входит обучение на известных примерах и экспертная оценка.

Заключительным стал доклад «Пути увеличения эффективности реализации алгоритмов машинного обучения» Андрея Бабия, разработчика программного обеспечения в Geosynergy (Харьков).

Спикер рассказал о проблеме нехватки ресурсов и задался вопросом: почему необходимо задумываться о скорости вычисления для ML?

По его словам, это позволяет сократить время обучения алгоритмов, достичь приемлемого времени перенастройки «на лету», учитывать больше факторов, использовать больше данных для обучения, а также сэкономить средства.

Для этого можно использовать, например, технологию массивного распараллеливания, рассказывает эксперт.

Существуют 2 подхода для параллелизации:

1) широкий (для GPU — графических процессоров)

2) узкий (для CPU).

В числе способов распараллеливания Бабий назвал KLM, PBLAS, ATLAS, OpenCL, NVIDIA CUDA.

Автор: Лариса Шурига, DataReview

Фото и текстовые материалы: Игорь Шершнев, Datareview

Добавить комментарий

Ваш адрес email не будет опубликован.

закрыть

Поделиться

Отправить на почту
закрыть

Вход

закрыть

Регистрация

+ =