Манипуляция восприятием — вот чего стоит бояться

Наука и технологии
Москва, 27.07.2020
«Эксперт» №31-34 (1172)
«Мне не очень жалко людей, которые считают, что все в интернете правда». Интервью с Артуром Хачуяном, генеральным директором Tazeros Global Systems, программистом, специалистом по обработке больших данных

Фотография Светланы Постоенко

Артур Хачуян в IT-среде признан как один из лучших в России специалистов, создавших инструменты для работы с большими данными. Его рекомендуют как отличного программиста, задающего тренды, и к тому же как человека, который достаточно свободно рассказывает о том, как сам зарабатывает на больших данных пользователей соцсетей. Мы поговорили с ним о секретах слежки за пользователями соцсетей, о торговле их данными, о том, кто и как зарабатывает на наших лайках и репостах. И о том, как при заключении договора с клиентом, происходит еще одна сделка — с совестью.

— Вы не могли бы объяснить по-простому, что такое «большие данные»?

— Это просто набор алгоритмов и подходов к анализу сверхбольших массивов данных. Например, раньше мы имели данные о десяти жителях, и они могли храниться в картотеке на карточках, а теперь у нас есть данные о миллионе, и для того, чтобы их обрабатывать, нам нужны новые подходы. Что такое, например, библиотечная картотека? Способ хранения и систематизации данных. Раньше у нас там лежало сто записей, но сейчас в одном инстаграме каждый день происходит миллиард транзакций. И все это счастье нужно где-то хранить, обеспечивать скорость хранения, скорость записи, доступ в реальном времени к этим данным.

— А что еще хранят эти данные, кроме моих лайков в инстаграме?

— Основной источник данных, находящихся сейчас в обороте, — это данные людей. Мы цифровая валюта. За последние десятилетия люди начали создавать огромное количество данных, поэтому и такой бум больших данных сейчас.

— Но все-таки что это за данные?

— Если мы говорим о системе геоаналитики, то там основным источником информации является перемещение пользователя, то есть человек, его координаты и время перемещения. Мы знаем, где он находился в каждый момент времени. Это может быть база данных мобильного оператора или московского общественного транспорта, в котором стоят джипиэсники и каждую секунду отправляют информацию о том, где находится конкретный автобус. Есть база данных соцсетей, в которой хранится информация о потребляемом человеком контенте, грубо говоря, о его интересах. Например, я наклеил на автобус набор рекламы и хочу знать, сколько человек на нее посмотрит. Для этого я собираю данные из трех баз: первая — мобильного оператора, который хранит данные о ваших перемещениях, вторая — о том, где едет транспорт в конкретный момент времени, третья — ваши интересы. Все эти данные я сваливаю в одну базу. Дальше я строю такие геополигончики и понимаю, какие люди были рядом с каким автобусом в какой момент времени. На основании этих трех источников я могу построить аналитическое решение для операторов наружной рекламы.

— А я подхожу к автобусу, вижу на нем рекламу того, о чем размышляла, купить или не купить, и думаю: «О, это знак свыше!»?

— Верно. Но все гораздо сложнее. Никакие данные в одну корзину не сливают. Это важно. Каждый из игроков этого рынка должен хранить свою информацию у себя, это его ценность. Поэтому были придуманы десятки алгоритмов, чтобы в обезличенном

Новости партнеров

«Эксперт»
№31-34 (1172) 27 июля 2020
Вами манипулируют
Содержание:
Еще одна рецессия

Мешать восстановлению экономики во второй половине 2020 года будут девальвация, низкие сборы налогов, мировой спад, плохой торговый баланс, низкий спрос со стороны населения. Трудно найти фактор, который будет способствовать росту. А в 2021 году правительство может урезать расходы и тем самым подорвать будущий рост

Международный бизнес
Реклама