Бьют в цель

Алексей Долженков
корреспондент журнала «Эксперт»
3 июля 2017, 00:00

Банки уже вовсю используют всё, что знают о нас, — для таргетированной рекламы или оценки заемщика. С помощью больших данных российские финансовые институты уже заработали первые десятки миллиардов

DPA/TASS

Финтех-сообщество с интересом наблюдает за первыми опытами банков в обработке больших данных (Big Data) — так, недавно по сети прокатился скандал, связанный с кейсом, который реализовала принадлежащая Сбербанку платформа Segmento. Речь шла о рекламе определенного продукта для McDonalds — алгоритмы Segmento «нашли» клиентов, которые за последние три месяца совершали покупки по картам Сбербанка в сетях фастфуда, дополнили их профили данными из социальных сетей и показали части этих людей таргетированную рекламу, а потом отследили эффективность рекламы опять-таки по транзакциям и содержимому чеков (история была рассказана на Яндекс-конференции и описана в блоге айтишником Credit Suisse Андреем Микитюком). Сбербанк прокомментировал это так: «Segmento не обладает прямым доступом и не обрабатывает персональные данные клиентов Сбербанка. Банк передает Segmento только зашифрованные и обезличенные вероятности, которые не содержат личной информации о человеке или группе людей. Эти вероятности позволяют Segmento уточнять собственные рекламные модели для показа рекламы пользователям интернета. Деятельность Segmento законна и не нарушает банковскую тайну наших клиентов». Однако широкие массы клиентов впервые задумались о том, не слишком ли много банки знают о них.

О проектах, связанных с большими данными, финансисты сообщают чуть ли не каждый день — например, на днях Всероссийский союз страховщиков (ВСС) сообщил о планах создания глобального офиса по управлению социальными и экономическими рисками всей страны. В этот офис будет стекаться информация от участников рынка и данные о рисках от госорганов: Федерального фонда соцстраха, МЧС, Ростехнадзора, Минздрава, Минтруда, Росстата и других. На основе этих разрозненных, или, как говорят специалисты по Big Data, «неструктурированных», данных будет построена карта рисков в масштабах всей страны. А в середине июня Альфа-банк подписал рамочное соглашение о стратегическом партнерстве с компанией Double Data — для «масштабирования процесса цифровой трансформации и внедрения передовых технологий обработки и анализа больших массивов данных», в Big Data Альфа-банк вложит полмиллиона долларов.

Наравне с блокчейном большие данные — один из самых популярных сейчас трендов в мире финансовых технологий. Количество информации, которую создает и хранит современное общество, с каждым годом возрастает. Соответственно, идея извлечь практическую пользу из всей этой информации лежит на поверхности.

Что банки знают о Big Data

Самое интересное, что сами технические специалисты по Big Data до сих пор не могут прийти к единому определению, что же это такое. Определения если и есть, то единственную функцию, которую они выполняют, — доказать, что конкретный продукт является Big Data проектом.

С точки же зрения банков и их клиентов прийти к понятному определению немного проще. Big Data — это когда банки собирают о нас большие объемы разнородной информации и на ее основе делают выводы о наших потребительских предпочтениях или о том, стоит ли выдавать нам кредит и на каких условиях. В качестве примера главный технический архитектор Альфа-банка Максим Азрильян поясняет, что Big Data позволяет собирать обратную связь от пользователей: что нравится, что не нравится и почему. Помимо анализа потребительских предпочтений и риск-менеджмента банки используют Big Data для увеличения операционной эффективности. «Для нас Big Data — это процесс получения дополнительной прибыли путем применения более эффективных стратегий, основанных на максимально полном использовании имеющихся в распоряжении организации данных», — формулирует пользу больших данных руководитель дирекции информационных технологий, член правления АО «Райффайзенбанк» Андрей Попов. Член правления, директор департамента банковских и информационных технологий ВТБ24 Сергей Русанов добавляет: «BigData начинается там, где перестают давать положительную динамику прироста необходимых результатов “традиционные” способы построения классических хранилищ данных».

Что банки знают о нас

Заместитель гендиректора EPAM Артак Оганесян поясняет, что Big Data — это в первую очередь транзакционные данные, которые постоянно генерируются банковскими системами в ходе операционной работы. Кроме того, в большие данные входит различного рода информация о клиентах — для ее накопления и обработки почти все банки используют операционные и аналитические CRM-решения, а также хранилища данных. Третья важная составляющая — информация, которая собирается из внешних или внутренних источников и применяется для построения профилей клиентов и моделей их поведения, для сегментации клиентов и оценки их платежеспособности и благонадежности. Сюда относятся как классические скоринговые сведения, так и неструктурированные данные, поступающие, например, от телеком-операторов или извлекаемые из социальных сетей. «Мы понимаем, где и на что наши пользователи тратят деньги. Дополнительно мы используем данные бюро кредитных историй и другие открытые источники данных, например социальные сети», — резюмирует Максим Азрильян. А Андрей Попов добавляет, что анализировать можно и информацию с сенсоров банкоматов.

Один из основных вопросов, который беспокоит клиентов компаний в связи с Big Data и недавним кейсом Сбербанка и Segmento, — защита личной информации. «Методики анонимизации информации, построения типовых портретов посетителей или сегментирования клиентской базы позволяют избегать передачи личных данных, — успокаивает Артак Оганесян. — Фактически это означает, что делаются снимки и слепки наиболее распространенных профилей клиентов по демографическим характеристикам, по поведенческим шаблонам и ряду других признаков. А далее банк, страховая компания, ритейлер или любой другой потребитель этих данных уже соотносит их с конкретными посетителями своего сайта, покупателями в интернет-магазине или обратившимися в отделение банка заемщиками».

«Сторонние компании не имеют и не могут иметь доступа к персональным данным клиентов банка, — утверждает Сергей Русанов из ВТБ24. — А мы используем персональные данные, имея на это согласие клиента. Особенностью работы математических моделей является возможность использования полностью анонимных данных без потери качества моделей. Во всем мире при сотрудничестве с партнерами принято создавать абсолютно обезличенный набор данных, на основании которого строятся предсказательные модели. Извлечь из этих данных какую-либо информацию для стороннего человека невозможно».

Правда, как можно сопоставить с профилями в соцсетях обезличенный набор данных, банки не объясняют.

«В основном наши проекты нацелены на наших клиентов, и не возникает никаких юридических рисков по обработке информации, которая хранится в банке. Это наш клиент, и он дал нам согласие, — говорит Максим Азрильян из Альфа-банка. — Если мы работаем в партнерстве с кем-то, то клиент акцептует оферту, что он согласен на передачу данных третьим лицам для обработки. Мы как банк находимся под пристальным присмотром разного рода регуляторов, соответственно, мы не можем себе позволить отклониться от общепринятых норм. Нас это существенно сдерживает, но есть такие правила, и мы обязаны им следовать».

Не только банки

Собственно, именно защита персональных данных заставляет банки разрабатывать свои системы обработки Big Data самостоятельно. «Основные работы по Big Data, конечно же, ведутся штатными сотрудниками банка, их около ста человек, — говорит Сергей Русанов. — В дальнейшем банк планирует развивать направления Big Data, Data Lake (“озёр” данных), Hadoop — все это части экосистемы корпоративного хранилища данных, КХД, среда для разработки моделей, проверки гипотез и проведения исследований. Для экосистемы КХД основными аналитическими инструментами стали решения SAS и Oracle, которые работают в связке с Teradata. Ежедневно через хранилище данных проходит более 40 тысяч заявок. Сейчас в КХД находится около 60 процентов всей имеющейся в ИТ-системах поддержки розничного бизнеса ВТБ информации о заемщиках, и это около 130 терабайт данных».

Альфа-банк тоже сконцентрирован на инхаус-разработках, но уже понимает, что сделать абсолютно все своими силами невозможно, отсюда сотрудничество со стартапом Double Data.

«Райффайзенбанк не покупает стартапы, а сотрудничает с ними по модели партнерства, причем не только по продуктам с использованием Big Data, а с глобальной целью улучшения клиентского опыта. Это также дает нам возможность учиться у стартапов и развивать внутреннюю компетенцию разработки, что мы активно и делаем. В случаях, когда внутренних ресурсов недостаточно для реализации инициатив из нашего проектного портфеля, мы привлекаем сторонних разработчиков, но при этом следим, чтобы по окончании проекта знания были переданы внутренней команде», — говорит г-н Попов.

Однако в области Big Data помимо поставщиков базового программного обеспечении и технических решений, есть и сторонние разработчики. Артак Оганесян рассказывает, что сегодня многие игроки интернет-пространства, в том числе Google, «Яндекс» и Mail.ru, предоставляют многообещающие платформы для анализа данных, так называемые фабрики данных. «Недавно я был в жюри конкурса по отбору финтехов для апробации инноваций в одном из ведущих российских банков. Большая часть представленных проектов была ориентирована на обработку данных о клиентах: оценка потенциальных заемщиков и поиск склонных к мошенничеству по данным из открытых государственных информационных ресурсов, анализ оттока клиентов и исследование тональности высказываний о банке в соцсетях и форумах. При этом все они использовали совершенно разные источники данных, порой даже неожиданные», — рассказывает г-н Оганесян.

 50-02.jpg

Наконец, на рынке Big Data наряду с банками и IT-компаниями активно действуют телекомы — как поставщик готовых решений в сфере больших данных выступает, например, «Мегафон». «Для корпоративных клиентов мы предлагаем аналитические услуги в финансовой сфере. Например, сервис машинного обучения позволяет финансовым институтам и компаниям, работающим с физическими лицами, включая сферу страхования и ритейла, оптимизировать управление клиентской базой на всех этапах работы с ней. В число заказчиков подобных аналитических услуг входит большое количество банков, входящих в топ-100, и широкий перечень микрофинансовых организаций», — рассказали в «Мегафоне».

Первые миллиарды

Однако не всем интересны финансы. В начале 2017 года в Yandex Data Factory (направление для решения бизнес-задач компаний, которые имеют дело с большими массивами данных) решили сосредоточиться на проектах, связанных с промышленностью, и активного развития решений вне этого направления не планируют. Решение «Яндекса» может быть связано с экономикой проектов. Большинство банков не предоставляют информацию об экономических результатах применения Big Data на практике — возможно, конечно, потому, что проекты находятся на начальных стадиях, — но все же применять Big Data в банковской сфере начали еще в 2013–2014 годах. «Банки тщательно прячут информацию об эффективности применения Big Data в маркетинговых кампаниях, — констатирует Артак Оганесян. — Но не думаю, что только лишь мода толкает на выделение существенных по нынешним временам бюджетов на внедрение методов работы с большими данными. Достаточно посмотреть на то, как ведущие банки находят свою аудиторию в интернете и тех же соцсетях. Но я считаю, что мы только в начале пути: комплексного и массового применения Big Data в наших банках пока нет».

Гендиректор oneFactor (компании — партнера «Мегафона») Роман Постников приводит более обнадеживающие расчеты. «Облачные рекомендательные сервисы на основе технологий машинного обучения уже сейчас повышают точность банковского скоринга более чем на 12–13 процентов. По оценке oneFactor, к декабрю 2016 года не менее 75 процентов всех выданных розничных кредитов в России прошли через оценку такими сервисами. Это при том, что банки в РФ технологически продвинуты и самостоятельно анализируют много разносторонних данных. Использование подобных рекомендательных сервисов создаст для банковского розничного сектора в РФ порядка 38 миллиардов рублей дополнительной чистой прибыли в 2017 году. Использование таких сервисов, по нашему опыту, повышает конверсию не менее чем на шесть-семь процентов. Но это в случае, если используется внешняя Big Data аналитика. Результаты, основанные только на собственных банковских данных, скромнее».

Сергей Русанов из ВТБ24, одного из немногих банков, которые отваживаются делиться статистикой, сообщает, что в результате внедрения системы анализа клиентского поведения по итогам 2016 года банку удалось увеличить чистую процентную маржу кредитных операций на 16% и заработать 19 млрд рублей чистого процентного дохода по МСФО (весь чистый процентный доход ВТБ24 за 2016 год по МСФО составил 165,2 млрд рублей). При этом розничный портфель (кредитование физических лиц и малого бизнеса) в рублях вырос на 12%.

В конце июня стало известно, что создатель KupiVIP, Aktivo и CarPrice Оскар Хартманн вошел в совет директоров Альфа-банка. Он будет курировать разработку стратегии продвижения банка на рынке новых банковских технологий и дистанционного обслуживания клиентов. Это живейшее подтверждение того, что банки превращаются, по сути, в маркетплейсы — площадки для продажи, которые пытаются угадать, чего хочет потребитель, и заставить его совершить покупку.