Экономика больших массивов

Как заложить фундамент доверия в экономике данных

Фото: Михаил Терещенко/ТАСС
Объем генерируемых данных в мире растет, но количество не переходит в качество автоматически. Ценность внутренних данных компаний уже почти исчерпана, а качественные массивы для обучения искусственного интеллекта в дефиците. Ключ к новому рывку — обмен данными. Мировая практика показывает, что государство может выступать в двух ролях: арбитра, то есть того, кто устанавливает правила, кому, какими данными и как обмениваться; фасилитатора — того, кто стимулирует участников рынка к обмену. Россия пока тяготеет к первой модели.
Александр Дюкарев

Главный эксперт Центра межотраслевой экспертизы «Третий Рим»

Виктория Тимофеева

Аналитик Центра межотраслевой экспертизы «Третий Рим»

Сергей Кудрявцев

Ведущий аналитик Центра межотраслевой экспертизы «Третий Рим»

Каждый день в мире генерируется порядка 400 млн терабайт данных. В 2025 году объем сгенерированных данных достиг 181 зеттабайта, а уже в текущем году может превысить 200 зеттабайт (1 зеттабайт = 1 млрд терабайт).

Объем сгенерированных данных в мире растет

Главные на сегодняшний день драйверы роста объема данных — сгенерированный искусственным интеллектом (ИИ) контент (тексты, изображения, видео, код и так далее), пользовательские данные на цифровых платформах и корпоративные данные, которые компании собирают о самих себе и своем бизнесе.

Казалось бы, для экономики данных наступает золотой век. Но это не совсем так. Потенциал применения накапливаемых массивов имеет пределы.

Для обучения ИИ требуется прежде всего качественный текст, созданный человеком. Его объем в публичном доступе оценивается примерно в 300 трлн токенов (технических единиц данных). Этот ресурс может быть исчерпан уже в 2026–2032 годах. Синтетических данных становится больше. В конце 2024 — начале 2025 годов объем текстового ИИ-контента в интернете превысил объем контента, созданного человеком. Однако такие данные пока способны лишь дополнять, но не заменять реальные обучающие корпуса.

Сведения о покупках, просмотрах, предпочтениях и других аспектах поведения пользователей, которые цифровые платформы собирают через свои интерфейсы, помогают повысить точность рекомендательных систем, настроить таргетированную рекламу и персонализировать сервис. Развлекательные площадки — видео, игры и социальные медиа — остаются основным драйвером роста интернет-трафика (97% мирового объема) и первичным каналом сбора пользовательских данных. Но потенциал монетизации этих данных имеет пределы. По мере того как платформенные бигтехи накапливают данные, каждая новая единица информации о пользователе приносит все меньший прирост в качестве продукта.

Дата-аналитика на корпоративных данных позволяет компаниям оптимизировать бизнес-процессы, улучшать управленческие практики и в конечном итоге снижать операционные издержки. В последние годы этому дополнительно способствует активное масштабирование интернета вещей. В 2026 году число активных IoT-соединений превысит отметку в 20 млрд. Однако в отношении этих данных действует та же логика убывающей полезности. Опора исключительно на собственные данные ведет к «стерилизации» выводов, предельная выгода от извлечения инсайтов сокращается, а потенциал дальнейшей экономии от каждого нового байта данных постепенно исчерпывается.

Использование только внутренних данных достигает предела

В том числе по этой причине массивы публичных и накопленных внутренних данных так непросто конвертировать в устойчивую экономию или долгосрочную выручку. В 2026 году глобальный рынок монетизации данных оценивается лишь в $4–6 млрд, но имеет потенциал двукратного роста — до $10–12 млрд к 2030 году.

Для того чтобы взять новый рубеж в развитии экономики данных, ее игрокам нужно переосмыслить свои подходы. Когда простое накопление данных уже не дает устойчивых результатов, для создания принципиально новых продуктов, бизнес-моделей и рынков компаниям нужно выстраивать партнерства — делиться данными с друг с другом. Это позволит обогатить имеющиеся массивы недостающим контекстом и выявить новые сигналы.

Зрелые компании в России и мире уже задумываются над обменом данными с другими игроками на рынке. Такие механизмы сотрудничества становятся инструментом продления экономического потенциала накопленных данных

Более того, объединение разрозненных наборов информации становится одним из ключевых вопросов для государств: это необходимый фактор инновационного развития экономики.

Другой вопрос — могут ли компании самоорганизоваться для обмена данными? Отдельным игрокам бывает тяжело договориться, чтобы достичь синергии от обмена данными. Сложности могут быть разные: технологические, регуляторные и экономические.

Ключевым драйвером в данном случае может выступить только государство. В мировой практике оно, как правило, выбирает между двумя основными ролевыми моделями: арбитра, то есть того, кто решает, кому, какими данными и как обмениваться, и устанавливает соответствующие правила, и фасилитатора — того, кто стимулирует участников рынка к обмену.

Эти роли не исключают друг друга. Регулятор подбирает ключи под конкретные проблемы: там, где крупнейшие игроки монополизируют данные, вводит обязательные требования, а там, где рынок буксует из-за жестких правил или инфраструктурного дефицита, прибегает к стимулирующим мерам.

В роли арбитра государство прибегает к обязывающим механизмам, например введению требований к переносимости данных (data portability). Первенство в законодательном закреплении этого механизма принадлежит Европейскому союзу. Digital Markets Act закрепил за европейскими пользователями право на доступ к своим данным и обязал крупные цифровые платформы обеспечивать их переносимость по запросу. Так пользователи получили активный контроль над своими данными и возможность беспрепятственно переносить цифровую историю на другую платформу. Принятый позднее Data Act распространил механизм переносимости данных на производителей IoT-устройств и поставщиков связанных с ними сервисов.

Модель переносимости данных

Бенчмарком в применении переносимости данных считается финансовый сектор, где внедрение стандартов открытых API (OpenAPI) — общедоступного набора программных инструментов, которые работают по установленным правилам, — позволило реализовать бесшовный обмен данными. Применение механизма создало уникальные возможности для роста перспективных технологических компаний. Например, благодаря внедрению открытых API в Бразилии крупнейший в стране финтех Nubank совершил феноменальный рывок, с 2018 по 2022 год увеличив клиентскую базу с 8 млн до 65 млн человек. Доступ к финансовым данным других банков позволил ему перестроить модели кредитного скоринга и предложить потребителям более конкурентные условия.

В роли фасилитатора регулятор создает правовые и технические условия для контролируемого обмена данными.

Среди правовых инструментов в мировой практике выделяется механизм доверенного посредничества. В широком смысле доверенные посредники — это аккредитованные регулятором организации, которые обеспечивают прозрачный, законный и безопасный обмен данными на рынке. Ярким примером реализации этого механизма на практике служат биржи данных в Китае. Шанхайская биржа данных (Shanghai Data Exchange) — одна из флагманских бирж в стране — фактически стала инфраструктурой для доверенного обмена данными. Биржа верифицирует участников и наборы данных, проверяет их на соответствие законодательству и гарантирует прозрачность и безопасность каждой сделки. Ключевая особенность шанхайского опыта — обусловленная географией отраслевая специализация. Основу торгов составляют данные в сфере финансов, торговли, логистики и технологий, что отражает роль Шанхая как экономического центра.

Модель доверенного посредничества

Регулятор также может стимулировать обмен данными через создание доверенной инфраструктуры открытого размещения данных. По этому пути пошли в Индии, где с 2025 года действует общенациональная платформа AIKosh. Платформа объединила наборы данных для задач обучения ИИ и демократизировала доступ к ним для стартапов, исследователей и региональных ведомств. Государство выступило в качестве крупнейшего донора данных для платформы. В дальнейшем бизнес добровольно присоединился к платформе на условиях взаимного доступа к данным и другим ресурсам для обучения ИИ. Такая модель уже показала свою эффективность: всего за год на платформе было размещено более 7,5 тыс. наборов данных.

Открытый доступ к данным может реализовываться также через отраслевые платформы данных (например, экосистема для обмена данными в автопроме Catena-X). В отличие от общенациональных ресурсов, отраслевые платформы учитывают специфические форматы и требования к передаче данных в конкретной отрасли. Стандартизация данных внутри отдельных отраслей создает фундамент для их последующей интеграции в общенациональную экосистему межотраслевого обмена.

Российская экономика данных в поисках баланса

Российские регуляторы уже отрабатывают механизмы, используемые в мировой практике. Банк России реализует переносимость данных в финансовом секторе, внедряя стандарты Открытых API. Минцифры агрегирует обезличенные персональные данные госсектора и крупного бизнеса на специальной государственной платформе (ЕИП НСУД). ДОМ.РФ при поддержке Минстроя развивает отраслевую платформу данных, позволяя игрокам строительной отрасли размещать свои данные для агрегации и использования другими участниками рынка.

Тем не менее отечественная практика идет по особенному пути. Российские регуляторы тяготеют к ролевой модели арбитра, то есть отдают предпочтение обязательным требованиям для участников рынка.

Российское законодательство, применимое к рынку данных, остается в парадигме тотальной защиты данных, препятствуя активизации обменов

Будущее экономики данных в России зависит от того, найдет ли регулятор баланс между принуждением и стимулированием, а также между защитой и свободным оборотом данных. Оптимальный баланс создаст синергию и укрепит взаимное доверие между гражданами, бизнесом и государством.

Больше новостей читайте в наших каналах в Max и Telegram

Свежие материалы
В мире,
Дональд Трамп доказал, что прошлое — самая непредсказуемая вещь
Минфин может пересмотреть расходы в меньшую сторону
Что обсудят участники ЦИПР-2026