Big Data как новая нефть

Русский бизнес
Москва, 29.06.2020
«Эксперт Урал» №27 (826)
У России есть шансы стать одним из мировых центров хранения и обработки больших данных, но для этого придется решить несколько ключевых проблем

Объем информации, собираемой в России, достигнет в текущем году 980 эксабайт, составив, по оценке International Data Corporation (IDC), 2,2% от мирового объема данных.

Развивающийся рынок Big Data к 2024 году обеспечит эффект в 0,3% ВВП или 1,3 трлн рублей в денежном выражении. Это сопоставимо с 15% выручки от экспорта нефти в 2018 году. Об этом на форуме «BIG DATA 2020 онлайн: Данные в основе цифровой экономики»* рассказал исполнительный директор Ассоциации больших данных Алексей Нейман.

По его мнению, для достижения этих показателей нужно преодолеть пять барьеров.

— Первая проблема — дефицит кадров: сектору не хватает специалистов по всем направлениям, связанным с обработкой и внедрением больших данных. Сейчас многие коммерческие компании готовят кадры самостоятельно, но этого недостаточно, чтобы решить эту проблему. Вторая — инфраструктура. По количеству ЦОД и вычислительных мощностей РФ существенно уступает развитым странам. В США, например, они занимают около 65 млн кв. метров. В РФ — на порядок меньше. Нужно развивать инфраструктуру как для обработки данных, так и для передачи этих данных на высокой скорости, — констатирует Алексей Нейман. — Третья — доступность данных. У нас есть серьезные ограничения по обработке и обмену разными типами данных. Необходимы стандарты по анонимизации и деперсонализации данных, возможность свободного оборота данных, которые перестали быть персональными. Четвертая проблема — исследования и идеи. Нет необходимой экспериментальной среды и ресурсов для разработки и внедрения новых технологий работы с Big Data. Для инноваторов необходимо создать облегченный доступ к большим данным, кросс-отраслевые инкубаторы. Пятая — невозможность массово имплементировать большие данные в масштабах всей экономики.

Лидерами использования больших данных считаются банки, телеком-операторы, интернет-индустрия, ритейл и электронная коммерция. В традиционных отраслях о реализации крупных проектов Big Data говорят энергетики. Так, Росатом использует новый инструментарий управления знаниями в сфере технологий атомной энергетики на основе Big Data с использованием нейросетей и машинного обучения. Генеральный директор ПАО «МРСК Центра» (Россети) Игорь Маковский заявил, что в 2020 году «Россети Центр» и «Россети Центр и Приволжье» (дочерние предприятия компании) прежде всего нацелены продолжать цифровую трансформацию. (Подробнее о возможностях технологии в ТЭК, см. «Big Data в энергетике», с. 24.)

 

Интеллекту нужен мотиватор

Традиционные отрасли, составляющие большую долю в ВВП, пока не имеют ни внутренних, ни внешних стимулов для внедрения технологий Big Data. По мнению Алексея Неймана, стимулирующие меры позволят оцифровать эти сектора и существенно увеличить показатели производительности труда.

— Большие данные — это, возможно, новая нефть, но как ее перерабатывать, мы пока знаем плохо, — подтверждает необходимость развития рынка первый заместитель руководителя Аналитического центра при правительстве РФ Владислав Онищенко. — Если рассматривать большие данные как новый актив, сосредоточение интересов государства, бизнеса и общества, то для получения результатов необходимо обеспечить четыре составные части в реализации цифровых технологий — сформировать нормативно-правовую базу, преодолеть организационные трудности, разработать методологию, создать доступные ИT-решения и достаточные серверные мощности.

По его мнению, необходимы формальные основания использования больших данных и технологий искусственного интеллекта для обеспечения нового качественного ИT-взаимодействия: «Большая часть усилий в настоящее время направлена на придание юридической значимости данных против бумажного документооборота».

В качестве примера Владислав Онищенко привел статистику: «Статистика опирается на отчетность, а переход от бумаги к цифре здесь очень сложен, потому что требует пересмотра всей нормативно-правовой базы. Оргтрудности заключаются в регламентации, но не только — есть и вопросы однократного использования данных. Множество данных, собранных для какой-то определенной цели, можно деперсонализировать, объединить и использовать для принятия решений, но это методологически сложная задача.

А если для этого разработать алгоритм, например искусственный интеллект, возникнет вопрос безопасности и этики использования данных».

Перевод со словарем

В мае технический комитет ТК 164 «Искусственный интеллект», созданный на базе Российской венчурной компании, подготовил и вынес на общественное обсуждение первую редакцию стандарта «Информационные технологии. Большие данные. Обзор и словарь». Проект стандарта разработан Национальным центром цифровой экономики МГУ и Институтом развития информационного общества и призван обеспечить взаимопонимание между заинтересованными сторонами — органами власти, коммерческими компаниями и научно-образовательным сообществом.

— Сегодня технологии работы с большими данными достигли высокого уровня зрелости, их применение приносит ощутимые эффекты в разных отраслях экономики и областях социальной сферы. Стандартизация процессов разработки и использования технологий хранения и анализа больших данных позволяет обмениваться лучшими практиками, использовать подходы и решения, подтвердившие результативность как в России, так и во всем мире, — комментирует работу председатель совета директоров Института развития информационного общества Юрий Хохлов.

По мнению начальника аналитического управления департамента информационных технологий Москвы Дмитрия Онтоева, тема больших данных актуальна для управления столицей: «Сбор больших данных из разных источников и их последующий анализ позволяют государству не только реагировать на те или иные явления, но и действовать в проактивном режиме».

По словам Владислава Онищенко, необходима методология для целей госуправления, без нее не обеспечить корректное исполнение решений с опорой на большие данные: «Этот вопрос стоит очень остро, в том числе потому, что, несмотря на опыт Москвы, реализованных кейсов пока немного. Также часто не находится приемлемых для задач государства в масштабах страны ИT-решений».

Руководитель Центра цифрового развития Агентства стратегических инициатив Вера Адаева считает, что главное ограничение в развитии сферы применения больших данных связано с тем, что в России пока не сформировалась культура работы с большими данными и не накоплены соответствующие компетенции: «Нередко возникают проблемы диалога между властью как заказчиком и профессиональным сообществом».

АСИ год назад запустило «Конкурс цифровых решений для регионов», в котором в 2019 году приняли участие 43 региона и более 1000 data-аналитиков России. В результате в финал вышли девять регионов, внедрившие десять разработанных цифровых решений. Среди победителей — «Анализ профиля бедности», позволяющий провести оценку реального уровня и структуры бедности, определить граждан, находящихся в «группе риска», скорректировать усилия различных ведомств по помощи малоимущим; «Анализ цифрового следа туриста» — решение для более точного таргетирования рекламных кампаний в сфере туризма и организации событийных мероприятий; решение, позволяющее автоматизировать модерацию анонсов мероприятий в сфере культуры.

Наибольший вклад в сектор пока вносит применение аналитики с использованием больших данных. Так, старший менеджер по внедрению продуктов больших данных Tele2 Константин Загуменнов рассказал, как оцифровать пространство для повышения эффективности разных видов бизнеса: «Например, геопространственный анализ необходим при выборе места расположения точек продуктового ритейла. Нужно проанализировать не только трафик в конкретной локации, но и уровень доходов людей, которые живут или работают рядом, маржинальность торговых точек по соседству, наличие других центров притяжения. Все это можно рассчитать с высокой степенью точности на основе моделей с использованием Big Data. Аналитические продукты также эффективны для транспортных компаний, которым необходимо рассчитывать трафик; для застройщиков, которым нужно понимать объемы загрузки инфраструктуры и т.д.».

Тренды для умных

Алексей Нейман обозначил ключевые тренды рынка на 2020 — 2021 годы: «Первый — риск-ориентированный подход к данным. Игроки рынка при работе с особо чувствительными данными понимают существующие ограничения и оценивают риски деятельности. Второй тренд — сдвиги регуляторных барьеров. Есть инициативы по доработке нормативной базы, которая касается работы с большими данными. Ждем несколько законопроектов, которые готовы простимулировать развитие этой отрасли. Третий — больше экспериментов. Если раньше компании-лидеры в основном копировали западные идеи и разработки, то сейчас переходят в режим внедрения экспериментов. Четвертый — усиление кибербезопасности. Для экспансии на новые рынки или создания новых ниш использования данных при снижении регуляторных барьеров необходимо обезопасить пользователей. Пятый — продолжится охота за опытными специалистами. Шестой — влияние кризиса повысило спрос на аналитику. Эффективность требует больше данных для настройки работы компании».

— Значимость такого актива, как большие данные, будет нарастать по мере нарабатывания опыта использования, — итожит Владислав Онищенко. — В ближайшее время их активное применение возможно в медицине, на транспорте, в туризме, строительстве и статистике.

Big Data в энергетике Индустрии нужны большие данные, считает директор по развитию бизнеса компании КРОК в энергетике Андрей Григорьев

 директор по развитию бизнеса компании КРОК в энергетике Андрей Григорьев 024_expert_ural_27-1.jpg
директор по развитию бизнеса компании КРОК в энергетике Андрей Григорьев

Энергетики пока настроены осторожно по отношению к Big Data. Это объяснимо: отрасль довольно консервативна, функционирование по утвержденным нормам и регламентам здесь норма. Вместе с тем очевидно: чем раньше начнется накопление и использование данных, тем больше конкурентных преимуществ получат компании. Почему отрасли нужны большие данные, рассказывает директор по развитию бизнеса компании КРОК в энергетике Андрей Григорьев.

— Промышленные компании генерируют колоссальное количество информации, которую при грамотной обработке и аналитике можно использовать для развития бизнеса и повышения его эффективности. Но мир аналитики c BI-инструментами (Business intelligence) пока существуют параллельно миру промышленных технологий. Как вы оцениваете емкость рынка Big Data в целом?

— Под «большими данными» (Big Data, ВD) принято понимать данные, объем и сложность которых превосходят вычислительные возможности традиционных аналитических систем. При этом ценность больших данных напрямую связана с инструментами для их анализа. На основе ВD появляется возможность принимать более взвешенные бизнес-решения, эффективнее использовать доступные ресурсы, повышать производительность, снижать затраты на производство и даже строить предикативные модели.

Масштабы применения ВD стремительно растут: по оценкам исследователей International Data Corporation (IDC), мировой рынок технологий обработки больших данных и бизнес-аналитики будет ежегодно увеличиваться на 13,2%, так что к 2022 году его объем в денежном выражении составит 274,3 млрд долларов. В России на сегодняшний день рынок BDA (Big Data и аналитики) оценивается примерно в 150 — 450 млн долларов.

— Какие выгоды могут получить промышленные сектора? Как работает и что может Big Data в энергетике?

— Промышленность в целом и энергетический сектор в частности генерируют огромный объем информации, которая при применении традиционных методов аналитики используется не в полной мере. ВD позволяют извлекать, преобразовывать, обрабатывать и хранить данные, которые не всегда учитываются, но могут косвенно влиять на работу производства.

К примеру, когда на предприятиях обслуживание оборудования проходит согласно заранее прописанному плану («планово-предупредительная» ремонтная стратегия), некоторые детали и даже целые рабочие узлы подлежат замене без учета реального ресурса. Большие данные позволяют отслеживать состояние оборудования в режиме реального времени и прогнозировать риски. Таким образом удается увеличить срок его службы и сократить бюджет, при этом уменьшить число аварийных остановов.

Подобные технологии уже используются в российской промышленности. Так, холдинг УралХим при поддержке экспертов компании КРОК интегрирует в производство менеджмент-систему с использованием больших данных. Это решение позволит не только создавать предикативные модели контроля состояния оборудования, но и прогнозировать количество и качество продукции, тестировать бизнес-идеи. Для реализации проекта специалисты КРОК спроектировали платформу для анализа и хранения потоковых данных о показателях с технологических установок оборудования глубиной пять и более лет, которая может быть масштабирована за счет использования технологий машинного обучения и ВD.

Большие данные открывают перед энергетикой и другие возможности. Они позволяют тщательнее контролировать динамику потребления электроэнергии, точечно отслеживать дебиторскую задолженность, дают возможность качественнее управлять стоимостью контрактов и прогнозировать возникновение спроса на дополнительные услуги среди клиентов отрасли.

Применение ВD совместно с использованием технологий искусственного интеллекта помогает создавать цифровые двойники предприятий. Они позволяют проводить виртуальные испытания бизнес-гипотез и обкатку нововведений в виртуальной среде, с точным моделированием всех условий производства и без остановки деятельности «физической» версии предприятия. Мы разработали несколько цифровых двойников для ряда ТЭЦ своих заказчиков. В математических моделях имитируются все технологические процессы для каждой единицы оборудования, сводятся пароводяные и энергетические балансы. Процесс внедрения занимает около года, а в результате заказчик получает возможность оптимизации режима работы генерирующего оборудования, кроме того, оптимизируется расчет ступеней заявок на РСВ («рынок на сутки вперед») по критерию максимизации маржинальной прибыли, сокращается потребление топлива от 1 до 4%. Это позволяет окупить проект менее чем за два года.

— С какими барьерами сталкивается использование больших данных в электроэнергетическом секторе?

— Проникновение Big Data в энергетическую отрасль усложняется необходимостью преодоления ряда препятствий, связанных с существующей аналитической системой.

Традиционно аналитиками используется только наиболее очевидная информация, которая может быть полезна в контексте конкретных обстоятельств. В то же время Big Data предлагает собирать и анализировать в том числе те данные, которые пока не принимаются в расчет, но обладают большим потенциалом. Так, показатели физических характеристик, связанные с неисправностью высоковольтных линий электропередачи, могут быть использованы для ранней диагностики возникающей проблемы. А, например, индикаторы и тренды оптового рынка электроэнергии пригодятся для прогнозирования цен на рынке и улучшения финансовых результатов работы генерирующих и сбытовых компаний.

Внедрение систем анализа больших данных также подразумевает переход от централизованного управления данными к распределенному. Несмотря на кажущуюся органичность подхода, полностью реализовать его в ближайшие 10 — 15 лет вряд ли удастся, поэтому на сегодняшний день речь идет, скорее, о поиске некоего баланса между традиционной и новой системой.

Поскольку сейчас данные в отрасли в основном хранятся разрозненно, в разных информационных системах, доступ к отдельным фрагментам информации может быть ограничен. Ситуация также усугубляется вопросами кибербезопасности, которые невозможно игнорировать в разговоре о доступе к данным. Соответственно, для полноценной работы с Big Data необходимо преодолевать и эти барьеры изолированности.

Наконец, объем данных, анализируемых системами BDA, со временем вырастет настолько, что будет требовать наличия у предприятий собственных центров обработки данных. Сегодня их создание не очень распространено у российских энергетических компаний, тем не менее, удешевление средств хранения данных упрощает решение этой задачи.

Новые для довольно консервативной отрасли энергетики технологии ВD пока делают лишь первые шаги в использовании на энергообъектах. Однако по мере того, как появляется все больше успешных кейсов внедрения, интерес к технологии растет. По нашим прогнозам, в ближайшие три года большая часть энергетических предприятий начнет применять ВD намного уверенней.  

Новости партнеров

Реклама