Самое интересное за месяц с комментариями шеф-редактора. То, что нельзя пропустить!

Мир

Рассчитать волну на Васильевском

2013
Фото: Сергей Сумленный

Современные компьютерные модели позволяют рассчитывать поведение больших социальных групп и структур. Профессор Питер Слоот из Университета Амстердама создает модели, позволяющие эффективно бороться с торговлей наркотиками, распространением эпидемий, а также снижать проявления паники при стихийных бедствиях

В чем главный вызов компьютерного моделирования?

— Ключевой вопрос — можем ли мы предсказывать будущее. Можем ли создавать модели, которые предсказывают будущее с большой точностью.

И что, можете?

— Можем, конечно. Понимаете, главная разница между моделью столкновения физических объектов, например падения вашего айфона на бетонный пол, и моделью поведения людей при наводнении заключается в том, что люди сложнее. Самый простой уровень прогноза — физика макромира. Вот телефон, он падает, корпус испытывает перегрузку, разбивается экран. Химические процессы уже сложнее. Социальные процессы стоят на вершине пирамиды сложности. Плюс еще одна разница — о людях у нас данных меньше, чем о предметах. Процессы становятся сложнее, а данных все меньше.

То есть предмет исследований в первую очередь не математика, а уже гуманитарные науки, социология?

— И да, и нет. Мы пытаемся понять, что такое сложные системы, как они работают. Это, так сказать, самый общий взгляд на проблему. Мы работаем совместно с учеными в Санкт-Петербурге, из Национального исследовательского университета информационных технологий, механики и оптики (ИТМО). Мы пытаемся понять, как можно предсказать развитие катастроф, будь то наводнение, эпидемия, или другие события, основываясь на данных, которые нам доступны. Это могут быть данные, которые мы получаем из социальных сетей, например из популярного в России Livejournal. Мы просеиваем массу информации в российских блогах и ищем определенные паттерны, пытаемся их найти. Для нас хорошо то, что в Livejournal люди публикуют много открытых постингов, там можно найти массу информации.

Вы только что говорили, что информации мало, что ее не хватает.

— Это не так однозначно. За последние десять лет мы пережили невероятный взрыв количества доступных данных. И речь не только о социальных сетях. За последний год в мире было зафиксировано больше информации, чем за всю историю человечества. Разумеется, мы просеиваем и блоги — из них мы получаем интереснейшие данные о социальной топологии, например. О связях между людьми, о социальном поведении. Но помимо этого мы получаем данные от официальных органов, например из мэрии. Плюс метеорологические сводки — направление ветра, уровень воды. Это крайне важные данные, например, для Петербурга. Плюс данные о здоровье населения — их мы частично берем из блогов, а частично получаем в больницах. И вот когда мы собрали все эти данные, мы смотрим, что происходит. Например, мы видим, что в городе начинается эпидемия гриппа. Люди заболевают все чаще и чаще. И вопрос в том, с какого момента ты можешь предсказать, как ситуация будет развиваться дальше.

Можно ли предсказать будущее

Да, это понятно: если все больше людей пишут в блогах о том, что они заболели, то можно предположить, что город стоит на пороге эпидемии. Но ведь техногенные катастрофы так нельзя предсказать. В чем заключается в таком случае ваш анализ?

— Нет, конечно, это невозможно предсказать. Но в данном случае наша задача в другом. Мы собираем данные. Самые разные данные. От официальных органов, от независимых наблюдателей, из блогов. Представьте себе, что у вас есть все данные мира. Вопрос в том, можете ли вы, имея их, предсказать развитие событий. Какая будет вероятность, что в течение двух недель на Васильевском острове начнется эпидемия гриппа? Это нетривиальный вопрос, который меня волнует. Чтобы понять это, мы строим модели. И в этом смысле мы занимаемся математикой и информатикой. Мы взвешиваем параметры, размышляем об их взаимоотношениях, строим на их базе модель и запускаем ее. Мы ищем скрытые взаимосвязи, пытаемся их нащупать и посмотреть, как они работают. Это восхитительное чувство — в какой-то момент понять, что у тебя появляется возможность предсказания. Ведь речь идет не только о заболеваниях и не только о жестких системах, существующих по заданным правилам без влияния людей. Например, если в восьмичасовых утренних новостях ведущий сообщает, что наступает экономический кризис, что банки сейчас рухнут, то, скорее всего, у населения это вызовет определенную реакцию. То есть люди не только живут внутри систем, они создают их своим поведением. Это фундаментальная особенность сложных систем — они развивают себя своим поведением. Поэтому мы должны делать то же самое с нашими моделями: мы создаем модель, прокачиваем ее и видим, что в ходе ее просчета в нее надо вводить новые закономерности, возникающие по ходу взаимодействия факторов внутри модели. После этого создаем новую модель, более сложную — и так далее. В принципе эти концепции уже рассмотрены в физике, и теперь мы пытаемся приложить их к социальному поведению.

Вы могли предсказать количество участников на демонстрациях протеста в России?

— Мы работали с демонстрациями. Например, пару лет назад мы просчитывали ситуацию на демонстрации в районе Гостиного двора в Петербурге. Мы создавали модели распределения людей: как люди будут вести себя, когда они выйдут из метро, в какую сторону они пойдут, с какой плотностью распределятся. И мы рассчитывали, что произойдет, если определенное количество людей захочет срочно покинуть площадь, насколько доступны пути выхода с площади, будет ли давка, при каких условиях произойдет катастрофа, при каких — нет. Конечно, здесь вы можете использовать данные с камер наблюдения, из блогов, из уже проведенных симуляций на моделях и так далее. В итоге мы просчитали движение по всему Невскому проспекту, все точки выхода и входа, включая выходы из метро. Включая ситуацию, если в толпе прогремят взрывы.

Вы не боитесь, что из-за работы с такими тонкими темами у вас могут быть проблемы с российскими спецслужбами?

— Нет, а почему? Я делал уже больше сотни проектов, мы тесно работаем с органами власти, я работаю практически по заказу Дмитрия Медведева. Никогда не было никаких проблем.

Какие еще проекты вы сейчас делаете в Петербурге?

— Мы работаем с ИТМО, это блестящие ученые. Сейчас мы рассчитываем последствия возможного наводнения в Санкт-Петербурге. И речь далеко не только о технических аспектах возможного прорыва дамбы и так далее. Техническая часть всегда самая простая. Разумеется, мы рассчитываем и подъем воды, и прорыв воды в подземные структуры Васильевского острова, что приводит к выходу воды на поверхность в том или ином месте. Но это все легко. Сложно рассчитать, как люди поведут себя, когда вода пойдет вверх. Второй уровень сложности — что будет, если людей начать информировать о том, как развивается наводнение. Мы рассчитываем массу вещей: движение общественного транспорта, машин, потоков пешеходов. И дальше мы моделируем: если вода льется по улице, куда я побегу? А если я увижу, что три человека бегут в одну сторону, а пять — в другую? Как будет выглядеть массовое бегство с Васильевского острова? Как поведут себя люди, если они увидят, что кто-то гибнет? Это огромный массив информации, самые разные модели, крайне интересный материал. Мы начинаем думать, как управлять реакциями, чтобы сократить количество жертв. Может, информировать людей по мобильным телефонам? Или с помощью умных светофоров? Но каждое вмешательство в систему влияет на поведение людей, то есть нам надо снова модернизировать модель. И так далее. Мы, кстати, уже делали такие расчеты для нашего научного парка. Мы же находимся ниже уровня моря — если дамбу прорвет, то тут будет трехметровый уровень воды. Поэтому нам было самим интересно, куда побегут люди. И конечно, в таких исследованиях нам помогают местные власти — и Амстердама, и Петербурга.

Ловушка фальшивых связей

В таком массиве данных легко заблудиться?

— Тут надо понимать две вещи. Данные превращаются в информацию только когда вы их интерпретируете. Вопрос интерпретации небанален, и на него у нас не всегда есть ответ. Второй аспект — и это наш козырь: чем больше у вас данных, тем проще вам установить связь между данными и получить из них информацию. Например, у вас есть данные с камеры наблюдения на перекрестке, она фиксирует в том числе подъем воды — и в какой-то момент вы можете поймать закономерность, что подъем воды в такой-то точке приводит к таким-то последствиям в поведении людей. Разумеется, огромный объем данных легко интерпретировать ошибочно. Классический пример, который приводит любой преподаватель: объективно наблюдавшаяся в двадцатом веке корреляция популяции аистов в Швейцарии и количества рождений детей. Понятно, что эти два события не связаны, но они показывают, как легко можно попасться в ловушку фальшивых связей. Единственный выход из этой ловушки — создание фальсифицируемых моделей. Если мы полагаем, что между двумя параметрами есть связь, мы пытаемся подкрутить третий параметр и посмотреть, что получится, не связан ли он на самом деле с нашим первым параметром.

Во что упирается сейчас моделирование событий — в отсутствие точных моделей или в отсутствие мощных компьютеров для их просчета?

— Я бы сказал, что у нас достаточно мощные компьютеры, нам не хватает только достаточно точных моделей. Однажды я делал очень сложный расчет модели распространения ВИЧ. Каждый просчет модели длился на самом мощном нашем суперкомпьютере не менее недели. А мне надо было делать несколько сотен тысяч расчетов. В итоге я просто распределил задачу между массой компьютеров в США, и они все просчитали. Облачный компьютинг творит чудеса. Конечно, вам всегда будет казаться, что вычислительных мощностей не хватает. Но это только отговорка. На самом деле все упирается в умные модели. Потому что делать расчеты можно вечно, главное, чтобы расчет шел в рамках правильной модели. Если вам не хватает компьютера, покажите мне вашу модель.

В чем главная проблема создания модели?

— Вам нужно дистиллировать информацию из огромного объема данных. Установить взаимосвязи. Взвесить параметры. Это, если хотите, искусство. После этого вы запускаете модель — и, если с помощью модели удается что-то предсказать, это значит, что она работает. Для того чтобы модель действительно отражала реальность, нужно собрать вместе социологов, психологов, специалистов по поведению, математиков, программистов, химиков, эпидемиологов — всех. Когда я имею дело с большим проектом, у меня работает по 60–70 человек из самых разных отраслей. Если вы хотите понять механизм распространения эпидемии, вы просто обязаны смотреть на ситуацию в целом, а не только на один ее аспект. Я вообще уверен, что в мире нет интересных вопросов, которые не были бы мультидисциплинарными. И вторая обязательная задача — перевести эти знания на язык компьютерных алгоритмов. Что будет, если случится то-то. Что произойдет, если. И это работает, отлично работает. Причем на самых разных социальных структурах. Например, мы изучали развитие сетей выращивания и продажи марихуаны. Вы же знаете, у нас в Нидерландах любят курить травку. Так вот, чтобы выращивать марихуану, нужно много людей. Один организует дом, где марихуана будет расти. Другой обеспечивает электричество. Третий — рассаду, четвертый ухаживает за растениями, пятый отвечает за сбыт товара. Это очень сложная цепочка, и она обеспечивает производство и продажу наркотиков. Полиция может задаться вопросом: если мы хотим повлиять на процесс, помешать ему, то кого из этой цепочки надо выбить? На первый взгляд ответ простой: того, кто знает всех и обеспечивает связь системы, обеспечивает коммуникацию, а часто и финансирование. Мы стали проверять эту теорию. Получили данные у полиции по арестам, задержаниям. Взяли у той же полиции большой массив данных по отчетам информаторов, присовокупили данные, полученные из блогов. На основе этих данных мы сделали отличные динамические модели, которые показывали, что происходит, если арестовать, например, ответственного за электричество, или за сбыт, или еще за что-то. Так вот, мы пришли к удивительным выводам. Оказалось, если мы арестовываем человека, являющегося начальником цепочки и знающего всех в цепочке, то цепочка не разрушается, как можно было бы предположить, а наоборот, производительность группы возрастает, объем сбыта возрастает, вообще она начинает работать лучше. Никто этого не ожидал.

И почему это происходит?

— Ну в итоге все оказалось просто. Если вы выдергиваете человека, который держит на контроле всю сеть, эта система начинает пытаться выживать без него. Ведь раньше она работала, давала всем занятие и деньги. Иногда эти сети работали по пять, по десять лет. И система начинает пытаться выжить без начальника. Внезапно она понимает, что механизм ее работы был создан пять лет назад или еще раньше. Но мир с тех пор изменился. Пытаясь выжить без начальника, система использует свои оставшиеся связи и выстраивает новую конструкцию, лучше отвечающую вызовам окружающего мира. Поэтому в итоге в 90 процентах случаев она начинает работать эффективнее. И полиция подтвердила наши выводы, покопавшись в своих архивах. Раньше они не понимали, почему это происходит, а мы им объяснили.

А кого в итоге надо выдернуть из сети, чтобы обрушить ее?

— Не скажу.

«Обзоры стран» №4 (64)
Подписаться на «Эксперт» в Telegram



    Реклама



    Инстаграм как бизнес-инструмент

    Как увеличивать доходы , используя новые технологии

    Армения для малых и средних экспортеров

    С 22 по 24 октября Ассоциация малых и средних экспортеров организует масштабную бизнес-миссию экспортеров из 7 российских регионов в Армению. В программе – прямые В2В переговоры и участие в «Евразийской неделе».

    Российский IT - рынок подошел к триллиону

    И сохраняет огромный потенциал роста. Как его задействовать — решали на самом крупном в России международном IT-форуме MERLION IT Solutions Summit

    Химия - 2018

    Развитие химической промышленности снова в приоритете. Как это отражается на отрасли можно узнать на специализированной выставке с 29.10 - 1.11.18

    Эффективное управление – ключ к рынку для любого предприятия

    Повышение производительности труда может привести к кардинальному снижению себестоимости продукции и позволит российским компаниям успешно осваивать любые рынки


    Реклама