Интервью: Рустам Тагиев — об экспериментальной экономике и теории игр

Сегодня мы беседуем со специалистом из Германии, доктором наук Рустамом Тагиевым.

— Рустам, насколько мне известно, Вы работали в индустрии Data Science на протяжении последних трех лет, у Вас есть докторская степень. Когда и как появился интерес к этой области?

— Еще в университете я начал интересоваться психологией, социологией и экономикой. Меня удивляло, что социологи по-прежнему проводят опросы, ведь существует большая разница между тем, что респонденты говорят и что делают в реальной жизни. Поэтому я решил заняться анализом поведения людей. В ходе написания диссертации я уже проводил эксперименты.

— А как звучала тема Вашей диссертации?

— Научная инфраструктура для исследования поведения людей.

Я думал о том, как сделать науку более эффективной, чтобы уменьшить время, потраченное на переформатирование данных. Я сам спрограммировал систему для проведения экспериментов, опробовал ее, разработал языки для описания игр.

— Что в данном случае понимается под словом “игра”?

Игра — это описание определенной стратегической ситуации, которая может случиться в реальной жизни. Суть заключается в том, чтобы зафиксировать поведение людей в ситуациях, когда дело касается денег. Эксперименты привели к некоторым интересным феноменам.

Самый простой пример, когда игроку дается 10 евро, и он должен отдать часть этих денег другому — если тот согласится, каждый остается со своей долей, если нет —  деньги возвращаются экспериментатору. Если первый даст второму слишком мало, тот может отказаться — а это не совсем рационально.

— Можете привести пример из реальной жизни?

— Конечно. Я не знаю, как в России, но в Германии есть билет, на который можно взять с собой в поезд еще пять попутчиков. Например, человек едет из Дрездена в Берлин. Перед тем, как он вставит купюры в автомат, вы можете предложить взять его с собой (что я и делал в рамках своих экспериментов) — естественно, за меньшую сумму.

— И он, конечно, согласиться?

— Не всегда. Если вы сделаете ему “человеческое” предложение, то да, а если предложите 29 евро вместо 30, он откажется. Интересно, что женщины и мужчины в подобных ситуациях ведут себя по-разному. Женщины, как правило, соглашаются на менее выгодных условиях.

Вообще данная ситуация объясняется тем, что раньше не было ни денег, ни частной собственности — все строилось исключительно на человеческих отношениях. Сейчас деньги — это правило, но, как показывают эксперименты, наш мозг на это правило пока не настроился: мы по-прежнему придаем много значения социальным отношениям.

— Подводя черту, можно сказать, что Вы пришли в Data Science вместе с теорией игр.

— Я пришел в Data Science с тем, что теория игр не работает, если не знать поведенческих особенностей людей.

— Расскажите о наиболее интересных проектах и задачах, которые Вам приходилось решать.

— В январе я анализировал данные из сетей гостеприимства. Я хотел разобраться, как работают эти системы, с точки зрения Data Science.

Сети гостеприимства — очень простая вещь: один человек спрашивает другого, можно ли погостить у него бесплатно. Так сколько же времени турист тратит на то, чтобы найти человека, готового его принять?

95% людей тратят на написание соответствующего месседжа от 3 секунд до одного часа. То есть, согласно логнормальному распределению, около 3 минут. Теперь вопрос: как вероятность положительного результата зависит от времени, потраченного на написание послания? Самое интересное, чем дольше человек писал письмо, тем больше у него шансов получить согласие принимающей стороны.

Но есть и другой момент — у тех, кто потратил на это минимум времени, вероятность услышать “да” не нулевая, ведь можно послать многим людям короткие послания или всего нескольким  —  длинные. Какая же стратегия более эффективна? Я вычислил, что отправка коротких писем большому количеству адресатов более эффективна.

Этот вывод может быть применим ко всем сферам жизни. Кстати, количество научных статей и количество постов какого-то юзера на очень несерьезном форуме имеет одинаковое распределение.

— То есть иногда проще брать количеством, нежели качеством?

— Да, если количество доступно.

— Рустам, технологии Data science в России и других постсоветских странах только начинают набирать популярность. Вы живете в Германии. Насколько велика эта индустрия там?

— Здесь data scientist’ов ищут все. Такие специалисты требуются в маркетинге, логистике, в области высоких технологий и даже в такой сфере, как металлургия. Объясню на примере компании, которая варит пиво. Например, грузовик с пивом застрял где-то на один день — получается, вкус уже не тот. Производители не могут все правильно рассчитать, потому что не обладают навыком анализа данных.

Лично меня больше всего интересует применение методов Data Science в финансовом секторе, в области страхования, в электронной коммерции и журналистике.

Но здесь есть один важный момент — мне кажется, в скором времени Data Mining утратит народную популярность. Сегодня курсируют слухи, что некоторые женщины получали рекламу детских вещей до того, как узнавали про свою беременность. Компании анализировали поведенческие данные женщин, их взаимоотношения с мужчинами и предсказывали, кто и когда из них забеременеет. Такие слухи могут в какой-то степени ирритироать народ.

— Тем не менее, компании вряд ли откажутся от этих технологий?

— Конечно, нет.

— Вы организовывали серию воркшопов по машинному обучению для экспериментальной экономики. Расскажите о них. Планируете ли проводить подобные мероприятия в 2015 году?

— Да, я организовывал воркшопы на темы, которые находятся на пересечении Data Mining, машинного обучения и экспериментальной экономики. В этом году, если получится, я тоже планирую провести подобное мероприятие.

— Какой все же ключевой тезис этих воркшопов?

— Тезис очень простой: в индустрии, как правило, работают data scientist’ы, не имеющие опыта и знаний в области социологии и психологии. Они не берут на вооружение результаты экспериментов, которые могут помочь понять зашумленные данные.

Между прочим, не только мы развиваем эту идею. Microsoft создал лабораторию MSR-NYC и пригласил экономистов, социологов и психологов, чтобы они работали вместе с data scientist’ами. Говорят, что нечто подобное есть в Facebook и Google.

— Что нового сегодня есть в области машинного обучения? Можно ли говорить о каких-то перспективных исследованиях, направлениях?

— Есть новое направление в нейронных сетях под названием “deep learning”. Некоторые люди думают, что нейронные сети полностью скопировали работу головного мозга. Это не так. Просто они имеют сложную формулу, в которой существует много параметров. Так вот глубокое обучение подразумевает использование нескольких параллельных нейронных сетей.

Также развиваются новые языки — например, Julia. Кроме того, исследователи работают над способами эффективного представления результатов анализа для обычных людей. В число таких разработок входит googleVis —  с его помощью обычный человек может  перемещаться сквозь интерактивные диаграммы, понимая, таким образом, статистику и закономерности в тех или иных данных.

Лариса Шурига, DataReview

1 комментарий

  1. Андрюха:

    Классная статья!!!!

Добавить комментарий

Ваш e-mail не будет опубликован.

закрыть

Поделиться

Отправить на почту
закрыть

Вход

закрыть

Регистрация

+ =