Google обучает машины при помощи статей Daily Mail и CNN

Команда Google DeepMind использует статьи Daily Mail и CNN, чтобы научить искусственный интеллект читать и понимать человеческий язык

Лондонская команда, во главе с доктором Карлом Морицом Херманном, собрала обширную базу данных 218000 статей Daily Mail, начиная с апреля 2007 года, и 110000 статей CNN с июня 2010 года до апреля 2015 для обоих источников.


Ученые ставили перед собой цель научить машины читать документы, написанные на естественном языке, и анализировать их, что до сих пор остается невыполнимой задачей для искусственного интеллекта. По мнению исследователей машины могут более эффективно изучать язык, благодаря особенному стилю текстов Daily Mail.

«Вскоре искусственный интеллект будет способен анализировать тексты и даже отвечать на вопросы к ним, — заявляют исследователи. Ключевое задание в том, чтобы машина не просто копировала предложения из документов в ответ на запрос».

 

На данном этапе искусственный интеллект работает на основе нейронных сетей. После «прочтения» статьи, программе предоставляют заголовки, написанные с использованием подобного стиля речи, но в каждом из них отсутствует определенное слово, — это так называемый Cloze запрос. Например, «Хай-тек бюстгальтер поможет вам победить рак молочной X». После прочтения такого заголовка машина может самостоятельно определить, что пропущенное слово – «рак».

Другой пример «Том Хэнкс дружит с менеджером Х, Скутером Брауном». Проанализировав текст программа нашла предложение, где говорилось, что Скутер Браун — менеджер Carly Rae Jepson, определив так искомое название.

Количество правильных ответов составило 60%.

Добавить комментарий

Ваш адрес email не будет опубликован.

закрыть

Поделиться

Отправить на почту
закрыть

Вход

закрыть

Регистрация

+ =