Данные — это новый мусор

Москва, 06.08.2020
Сергей Карелов, независимый эксперт, ведущий авторского научно-популярного канала «Малоизвестное интересное»
Объемы данных не дают стратегических преимуществ

Китай и США сделали ставку на искусственный интеллект (ИИ). Политики и военные обеих стран понимают, что статус сверхдержавы 21 века вряд ли достижим для государств, не являющихся мировыми лидерами в области ИИ. Обе страны уже обладают сильнейшим научно-производственным потенциалом развития ИИ технологий. А по численности специалистов в этой области Китай уверенно догоняет США. Третьим ключевым элементом успеха в развитии ИИ считается наличие больших объемов данных для машинного обучения алгоритмов.

Общепринято считать, что у Китая здесь преимущество. Во-первых, огромное население, генерирующее океаны данных через свои смартфоны: медиа и развлечения, интернет-сёрфинг, онлайн шопинг и онлайн-платежи, социальные сети и множество видов онлайн услуг, - и все это помноженное на сотни миллионов пользователей.  Во-вторых, единый командный центр – Компартия Китая, которая авторитарно решительно пресекает либеральные стоны о потере конфиденциальности данных и твердой рукой направляет бизнес в сторону собственных национальных интересов. Оба названных преимущества Китая весьма весомы. И потому мир легко поверил красивой фразе из мирового бестселлера американо-китайской техно-звезды в области ИИ Кай-Фу Ли — «В век ИИ, когда данные — это новая нефть, Китай — новая Саудовская Аравия».

В результате, утверждение, будто данные — это новая нефть, буквально за пару лет превратилось в массовом сознании в аксиому и своего рода технологическую мантру. Причем даже в странах, никак не претендующих на мировое лидерство в ИИ, где в гонку за накопление больших объемов данных с энтузиазмом включаются и государство, и бизнес.

Но реальность гораздо сложнее простых формул. А для прогресса в области ИИ, где неизвестного все еще куда больше, чем твердых знаний, это справедливо вдвойне. Ну а в деле обретения военного превосходства в ИИ-системах, где неясна сама основа – место и роль ИИ в принятии стратегических решений, - вообще пока ничего не понятно.

Проблема больших данных, необходимых для обучения алгоритмических моделей ИИ – одна из ключевых. Требования к вычислительной мощности для все более точного машинного обучения на все бОльших объемах данных удваиваются каждые 3,5 месяца. И очень скоро, как показывают расчеты Economist и OpenAI, процесс уткнется в отсутствие необходимых вычислительных мощностей. Мало того, что обучение моделей становится неподъемно дорого, но оно наносит колоссальный экологический ущерб. По расчетам MIT, из-за огромного энергопотребления экологический вред от обучения всего одной модели в течение нескольких дней соизмерим с вредом окружающей среде, наносимым пятью автомобилями за весь их срок эксплуатации. Поэтому тенденция к обучению огромных моделей на тоннах данных, похоже, ведет в тупик.

Но еще хуже то, что все большее число исследований показывает, - объемы данных имеют такое же значение для обретения военного преимущества, как объемы производимого страной мусора. Кому придет в голову делать вывод о национальном технологическом превосходстве, если страна — мировой чемпион по мусору? А ведь с данными еще хуже, ибо данные грязнее любого мусора.

Этой теме посвящен новый отчет Центра безопасности прорывных технологий (CSET) при Университете Джорджтауна “Messier than Oil: Assessing Data Advantage in Military AI”. Отчет хоть и не открывает новых истин, но действует весьма отрезвляюще.

Основные выводы отчета таковы.

  1. Объемы необработанных данных вообще ни о чем не говорят.
  2. Ценность имеют лишь очищенные, преобразованные, маркированные данные, оптимизированные для обучения конкретными алгоритмами машинного обучения.
  3. Коммерческие данные из п. 2, хотя и полезны, но мало актуальны для военного оперативного ИИ. Данные подбираются под конкретные задачи, а ценность коммерческих данных и моделей машинного обучения для военных приложений крайне мала.
  4. Синтетическая генерация данных (типа той, что делал DeepMind для триумфа AlphaZero в настольных играх), будучи сделана с умом, в тысячу крат ценнее, чем горы данных, произведенных 1.4 миллиардом китайцев, звонящих по телефонам и оплачивающих покупки онлайн.

    Ключевой вывод отчета - будущее ИИ (и в том числе военного ИИ) не в больших данных.

    А политикам, военным (да и бизнесменам) пора понять: «супердержавой ИИ» станет не страна с горами мусорных данных. А страна, что научится превращать их в еду, питье, энергию и стратегическое военное преимущество.

    Китай и США в этом пока не сильно преуспели. И как в любой игре, никто не проиграл, пока никто не выиграл.

    Новости партнеров







    Офисное пространство будущего

    Насколько сильно рабочее пространство офисного работника в самом скором времени будет отличаться от принятых сейчас традиционных представлений

    ЮУрГУ получил первый на Урале нейрокомпьютер

    Леонид Соколинский — о новейшем нейрокомпьютере на Урале, о будущем нейросетей и искусственного интеллекта

    «Криогенмаш» - по-прежнему стратегический актив Газпромбанка

    Новый глава совета директоров предприятия — заместитель председателя правления Газпромбанка Тигран Хачатуров. Перед менеджментом стоит задача разработать новую стратегию «Криогенмаша», который рассматривается Газпромбанком как стратегический актив.

    Эксперты верят в ценные бумаги ММК

    По мнению ряда финансовых аналитиков, акции ПАО «Магнитогорский металлургический комбинат» сохраняют потенциал роста и выгодны для приобретения на фоне постепенного восстановления спроса на сталь

    Продается ЗАВОД МЕТАЛЛОКОНСТРУКЦИЙ В Красноярском крае

    Действующее предприятие с многолетней историей Восточно-Сибирский завод металлоконструкций (г. Назарово, мкр промышленный узел, 8) выставлен на торги. Сейчас его возможно приобрести по минимальной стоимости

    Мобильный отряд. Как мобильные решения повышают чек в ритейле

    Несмотря на цифровую революцию последних лет до объявления в мире режима самоизоляции именно оффлайн-магазины оставались основным местом совершения покупок. С появлением же COVID-19 цифровизация магазинов стала для многих компаний единственно возможным способом остаться на плаву
    Новости партнеров

    Tоп

    1. Россия оказалась перед перспективой войны с Турцией
      День 27 сентября 2020 войдет в историю как дата начала новой Карабахской войны. Произошло то, что, увы, должно было произойти: Азербайджан решил взять реванш за поражение 26-летней давности. Для России это известие не сулит ничего хорошего. Москве было бы выгодно сохранение существовавшего статус-кво, но этого уже, очевидно, не будет
    2. Сбербанк меняет вывеску, директоров и платит рекордные дивиденды
      В пятницу прошло годовое собрания акционеров Сбербанка, накануне которого было объявлено об умопомрачительных изменениях в его судьбе.
    3. Первый атомный
    Реклама