Данные — это новый мусор

Москва, 05.08.2020
Сергей Карелов
Объемы данных не дают стратегических преимуществ

Antoine GIRET. Unsplash

Китай и США сделали ставку на искусственный интеллект (ИИ). Политики и военные обеих стран понимают, что статус сверхдержавы 21 века вряд ли достижим для государств, не являющихся мировыми лидерами в области ИИ. Обе страны уже обладают сильнейшим научно-производственным потенциалом развития ИИ технологий. А по численности специалистов в этой области Китай уверенно догоняет США. Третьим ключевым элементом успеха в развитии ИИ считается наличие больших объемов данных для машинного обучения алгоритмов.

Общепринято считать, что у Китая здесь преимущество. Во-первых, огромное население, генерирующее океаны данных через свои смартфоны: медиа и развлечения, интернет-сёрфинг, онлайн шопинг и онлайн-платежи, социальные сети и множество видов онлайн услуг, - и все это помноженное на сотни миллионов пользователей.  Во-вторых, единый командный центр – Компартия Китая, которая авторитарно решительно пресекает либеральные стоны о потере конфиденциальности данных и твердой рукой направляет бизнес в сторону собственных национальных интересов. Оба названных преимущества Китая весьма весомы. И потому мир легко поверил красивой фразе из мирового бестселлера американо-китайской техно-звезды в области ИИ Кай-Фу Ли — «В век ИИ, когда данные — это новая нефть, Китай — новая Саудовская Аравия».

В результате, утверждение, будто данные — это новая нефть, буквально за пару лет превратилось в массовом сознании в аксиому и своего рода технологическую мантру. Причем даже в странах, никак не претендующих на мировое лидерство в ИИ, где в гонку за накопление больших объемов данных с энтузиазмом включаются и государство, и бизнес.

Но реальность гораздо сложнее простых формул. А для прогресса в области ИИ, где неизвестного все еще куда больше, чем твердых знаний, это справедливо вдвойне. Ну а в деле обретения военного превосходства в ИИ-системах, где неясна сама основа – место и роль ИИ в принятии стратегических решений, - вообще пока ничего не понятно.

Проблема больших данных, необходимых для обучения алгоритмических моделей ИИ – одна из ключевых. Требования к вычислительной мощности для все более точного машинного обучения на все бОльших объемах данных удваиваются каждые 3,5 месяца. И очень скоро, как показывают расчеты Economist и OpenAI, процесс уткнется в отсутствие необходимых вычислительных мощностей. Мало того, что обучение моделей становится неподъемно дорого, но оно наносит колоссальный экологический ущерб. По расчетам MIT, из-за огромного энергопотребления экологический вред от обучения всего одной модели в течение нескольких дней соизмерим с вредом окружающей среде, наносимым пятью автомобилями за весь их срок эксплуатации. Поэтому тенденция к обучению огромных моделей на тоннах данных, похоже, ведет в тупик.

Но еще хуже то, что все большее число исследований показывает, - объемы данных имеют такое же значение для обретения военного преимущества, как объемы производимого страной мусора. Кому придет в голову делать вывод о национальном технологическом превосходстве, если страна — мировой чемпион по мусору? А ведь с данными еще хуже, ибо данные грязнее любого мусора.

Этой теме посвящен новый отчет Центра безопасности прорывных технологий (CSET) при Университете Джорджтауна “Messier than Oil: Assessing Data Advantage in Military AI”. Отчет хоть и не открывает новых истин, но действует весьма отрезвляюще.

Основные выводы отчета таковы.

  1. Объемы необработанных данных вообще ни о чем не говорят.
  2. Ценность имеют лишь очищенные, преобразованные, маркированные данные, оптимизированные для обучения конкретными алгоритмами машинного обучения.
  3. Коммерческие данные из п. 2, хотя и полезны, но мало актуальны для военного оперативного ИИ. Данные подбираются под конкретные задачи, а ценность коммерческих данных и моделей машинного обучения для военных приложений крайне мала.
  4. Синтетическая генерация данных (типа той, что делал DeepMind для триумфа AlphaZero в настольных играх), будучи сделана с умом, в тысячу крат ценнее, чем горы данных, произведенных 1.4 миллиардом китайцев, звонящих по телефонам и оплачивающих покупки онлайн.

Ключевой вывод отчета - будущее ИИ (и в том числе военного ИИ) не в больших данных.

А политикам, военным (да и бизнесменам) пора понять: «супердержавой ИИ» станет не страна с горами мусорных данных. А страна, что научится превращать их в еду, питье, энергию и стратегическое военное преимущество.

Китай и США в этом пока не сильно преуспели. И как в любой игре, никто не проиграл, пока никто не выиграл.

Новости партнеров







Офисное пространство будущего

Насколько сильно рабочее пространство офисного работника в самом скором времени будет отличаться от принятых сейчас традиционных представлений

ЮУрГУ получил первый на Урале нейрокомпьютер

Леонид Соколинский — о новейшем нейрокомпьютере на Урале, о будущем нейросетей и искусственного интеллекта

«Криогенмаш» - по-прежнему стратегический актив Газпромбанка

Новый глава совета директоров предприятия — заместитель председателя правления Газпромбанка Тигран Хачатуров. Перед менеджментом стоит задача разработать новую стратегию «Криогенмаша», который рассматривается Газпромбанком как стратегический актив.

Эксперты верят в ценные бумаги ММК

По мнению ряда финансовых аналитиков, акции ПАО «Магнитогорский металлургический комбинат» сохраняют потенциал роста и выгодны для приобретения на фоне постепенного восстановления спроса на сталь

Продается ЗАВОД МЕТАЛЛОКОНСТРУКЦИЙ В Красноярском крае

Действующее предприятие с многолетней историей Восточно-Сибирский завод металлоконструкций (г. Назарово, мкр промышленный узел, 8) выставлен на торги. Сейчас его возможно приобрести по минимальной стоимости

Мобильный отряд. Как мобильные решения повышают чек в ритейле

Несмотря на цифровую революцию последних лет до объявления в мире режима самоизоляции именно оффлайн-магазины оставались основным местом совершения покупок. С появлением же COVID-19 цифровизация магазинов стала для многих компаний единственно возможным способом остаться на плаву
Новости партнеров

Tоп

  1. «Они не помнят нас хороших, пусть не забудут нас плохих»
    Кто такой «русский хакер», чем он руководствуется, что у него на душе, есть ли вообще у него душа и действительно ли хакеры настолько всесильны, что могут влиять на политику
  2. Sukhoi SuperJet очистят от иностранного влияния
    Разработка обновленного ближнемагистрального самолета Sukhoi SuperJet New, призванного заменить существующий Sukhoi SuperJet 100, должна завершиться уже к 2023 году
  3. Спрятанные за рубежом деньги возьмут в оборот
    Власти намерены активизировать работу по возврату капитала, вывезенного преступным путем из России
Реклама