Мы знакомы?

Экономика и финансы / ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ Стопроцентная точность распознавания лиц современными системами видеоаналитики пока, увы, невозможна. Это признают российские производители таких решений, разработки которых, кстати, считаются одними из лучших в мире
ТАСС

Рынок систем видеоаналитики развивается бурными темпами. Если несколько лет назад его показатели были почти равны нулю, то сейчас исчисляются миллиардами. Согласно данным международной консалтинговой компании MarketsandMarkets, по итогам текущего года мировой объем продаж систем видеоаналитики достигнет 2,6 млрд долларов. Рост этого рынка в ближайшие годы составит 33% в год, к 2022-му он достигнет порядка 12 млрд долларов.

Хотя за последнее время технологии видеоаналитики сделали большой рывок, они не обеспечивают абсолютно точного распознавания людей. «Ни один алгоритм сейчас не покажет стопроцентной точности», — подтвердил в интервью «Эксперту» Сергей Щербина, директор по маркетингу российской компании «Воркорд», разработки которой считаются одними из лучших в мире. В частности, технологии этой компании занимают высшие строчки в авторитетных отраслевых мировых рейтингах Megaface и NIST.

«Проблема заключается в особенностях самой задачи идентификации лиц как таковой, — объясняет Павел Сажин, генеральный директор компании “Видеоинтеллект”. — Сама по себе автоматическая идентификация лиц не является чем-то фантастическим. Все мы, условно говоря, имеем в нашем мозгу хорошо обученную систему распознавания лиц и успешно ею пользуемся. Мы легко узнаем родственников, знакомых, приятелей, в том числе мимолетом в толпе на улице, и, казалось бы, нет никаких оснований считать, что эффективности нашей собственной системы может быть недостаточно для ряда случаев. Но давайте посмотрим на это внимательнее. Мы годами запоминаем людей, их мимику, походку, повадки и прочие характерные черты. Это первое. Второе — мы за свою жизнь находимся в активном контакте в среднем с несколькими сотнями, в редких случаях с тысячами человек. Если перейти к техническим терминам, мы запоминаем в своем мозгу на порядки больше информации о каждом конкретном человеке, чем имеется на обычном фото. А объем выборки, то есть количество людей, которых нам надо узнавать, составляет от нескольких сотен до тысяч человек. Отсюда становятся видны и проблемы технических средств распознавания лиц. Эти системы, в отличие от людей, оперируют лишь одним или несколькими опорными изображениями лица, часто недостаточного разрешения, плюс к тому объем базы данных людей в таких системах может достигать миллионов человек. То есть имеющегося объема входной информации от систем видеонаблюдения просто недостаточно для безошибочного разделения большого количества человек».

Работа современных камер уступает совершенству восприятия человеческого глаза. «Когда вы видите знакомого человека, вы, как правило, можете рассмотреть его с разных ракурсов и, скорее всего, смотрите на него двумя глазами — это позволяет вам получить объемное изображение. Если вы хорошо видите человека, но общаетесь с ним редко, вы можете просто не вспомнить его лицо. Камера же висит неподвижно, видит человека под определенным углом и все-таки больше нуждается в освещении, чем ваши глаза. Зато память биометрическую систему подвести не мож