XRay: на страже персональных данных

Сегодня мы поговорим о проблеме, находящейся на стыке информационных технологий, социологии и маркетинга – безопасности персональных данных в Интернете. Как и для чего в сети используются такие, казалось бы, безобидные вещи как наши предпочтения в музыке и покупках? Как добиться прозрачности данных в Сети? На эти и другие вопросы постарались найти ответы разработчики XRay – инновационного программного продукта, открывающего перед движением за защиту персональных данных новые горизонты.

Что такое XRay?

Разговоры о персональных данных и проблемах их безопасности перенеслись из кулуаров IT-компаний в широкие массы очень быстро – люди стали все больше задумываться о том, что происходит с информацией в Интернете. Представители индустрии видят этот процесс изнутри, хотя и для них Интернет представляет собой нечто вроде черного ящика, где внутренние процессы известны лишь частично. Неудивительно, что критичным становится вопрос о прозрачности данных – и, соответственно, функций их обработки.

Решение проблемы предложила группа ученых из Колумбийского университета. Разработку назвали XRay– она призвана «просветить» черный ящик всемирной сети «рентгеновскими лучами». В эту среду, 20 августа, авторы представили саму программу и сопроводительные научно-исследовательские материалы на Симпозиуме Usenixпо безопасности в городе Сан-Диего, Калифорния. Среди всего прочего, создатели подчеркивают, что XRayпланируется выпускать в виде лицензионного ПО с открытым кодом – и это позволит программистам использовать и модифицировать алгоритмы под свои цели, правда, пока некоммерческие.

Механизм работы

 XRay, фактически, является инструментом обратного проектирования, моделирующим корреляции, которые используют в своей работе веб-службы. Первоначально, разработчики проводили эксперименты по трем направлениям:

  • определение типов рекламных объявлений, которые видят пользователи Gmail – базируясь на содержании отсылаемых ими электронных сообщений;
  • изучение рекомендаций от Amazon, основанных на списках желаний и других данных пользователей службы;
  • изучение алгоритмов, согласно которым YouTube подбирает рекомендованные к просмотру видеоролики исходя из просмотренных пользователем материалов.

Исследователи искусственно создавали аккаунты на перечисленных сайтах, чтобы затем обеспечить их «входными данными» в виде электронных писем, поисковых запросов и просмотров товаров. После этого изучались «выходные данные» — рекламные объявления и рекомендации по покупке и просмотру. Наконец, на последнем этапе осуществлялась разработка моделей корреляции между входными и выходными данными, которые затем и послужили основой для XRay. В итоге, программа «научилась» распознавать связи и предсказывать результаты фокусировки по контекстному и поведенческому признаку.

Почему это важно?

Заметим, что весь «сыр-бор» из-за персональных данных начался не только и не столько потому, что такое положение дел раздражало пользователей. Гораздо более неприятным является тот факт, что никому доподлинно не известно, как веб-сервисы используют полученные данные, и кто еще может получить к ним доступ. Разработчики приводят такой пример: при помощи XRayбыло установлено, что некое рекламное объявление коррелирует с депрессией. Неизвестно, насколько широко в пределах сети используется эта корреляция – к примеру, если вам по какой-то причине попадается то же самое рекламное объявление, и вы кликаете по нему, означает ли это, что система посчитает, что вы, возможно, склонны к депрессии? И если в случае конкретного пользователя это окажется действительно так, не приведет ли подобная цепочка запросов к нежелательным последствиям – например, в виде дискриминации при приеме на работу?

Понятно, что сбор целевой информации и фокусировка потребителей онлайн – весьма полезный инструмент маркетинга. В этом смысле персонализация может стать «двигателем» всего бизнеса. Но не стоит забывать об этической составляющей вопроса – и именно поэтому так важно изучить внутренние механизмы персонализации и защитить пользователей от проблем, связанных с неограниченным скрытым доступом третьих лиц к их персональной информации. Важно понимать риски, связанные с большими данными – и со стороны IT-компаний и независимых разработчиков это означает дальнейшее исследование вопроса и поддержка развития инструментария для контроля потоков персональных данных во Всемирной сети.

Перспективы развития

Сегодня XRay – пока лишь прототип, но уже первые результаты впечатляют многих экспертов. В течение года разработчики предполагают сделать инструмент более универсальным и надежным, при этом в качестве целевой аудитории создатели рассматривают сотрудников отделов безопасности данных, которые в скором времени станут неотъемлемой частью любой уважающей себя компании, юристов, журналистов и членов Федеральной комиссии по торговле США. На дальнейшую разработку XRay уже получено несколько грантов от уважаемых университетов, таких как Браун и Стэнфорд и таких гигантов IT-индустрии, как Google и Microsoft.

Резюме

Интернет сегодня – не только поле деятельности для компаний, позволяющее находить новые способы привлечения потребителей, но и глобальная, слабо поддающаяся всестороннему контролю система. В этих условиях встают не только вопросы безопасности данных, которые сотни миллионов пользователей ежеминутно выкладывают в сеть (порой, даже сами того не замечая), но и элементарной этики.

Решить эти важные проблемы можно лишь в одном случае – сеть должна перестать восприниматься как черный ящик, внутри которого с нашими данными происходят неизвестные и потому потенциально опасные преобразования. Инновация Колумбийского университета, программный продукт XRay дает возможность повысить уровень прозрачности внутренних механизмов работы с данными и – в перспективе – существенно минимизировать риски, связанные со свободным доступом компаний к персональной информацией пользователей сети Интернет.

Автор: Елизавета Филиппова

Добавить комментарий

Ваш e-mail не будет опубликован.

закрыть

Поделиться

Отправить на почту
закрыть

Вход

закрыть

Регистрация

+ =