Рейтинг регулярно составляет Национальный институт стандартов и технологий США (NIST) на основе собственных тестов. Это не конкурс и тем более не сертификация — просто независимый рейтинг, который обновляется примерно раз в три месяца.
Последние результаты появились на сайте NIST в апреле, и в списке лидеров два первых места занимает российская компания VisionLabs (резидент «Сколково», специализируется на создании систем компьютерного зрения и машинного обучения). На первом месте — алгоритм, разработанный компанией в этом году, на втором — прошлогодний. Организаторы оставляют в сводной таблице текущий и предыдущий алгоритмы, чтобы компании видели прогресс. В NIST считают, что так участникам легче следить за своими успехами и работать над ошибками.
В рейтинге участвуют более 100 алгоритмов. Распознавание лиц тестируют по четырем типам изображения: Visa, Mugshot, Wild и Child Exploration. Если вас фотографирует профессионал на паспорт или, например, водительские права, изображение получается очень четкое, выполненное по стандартам. Это Visa.
Если фото делают сотрудники банка, чтобы дать клиенту доступ к счету, или кадровик — на пропуск, или полицейские, которым нужен портрет задержанного для картотеки, фото получаются менее четкими. Эта категория называется Mugshot («полицейское фото»).
Если вы фотографируете себя, свою семью и друзей на смартфон или фотоаппарат, объекты съемки могут получиться с закрытыми глазами , с повернутой или опущенной головой, что сильно затрудняет распознавание. Это категория Wild («в естественных условиях»).
В этом году специалисты NIST точкой отсчета сделали вторую категорию — Mugshot: такие условия наиболее распространены среди областей применения распознавания лиц. Вот в этой определяющей категории VisionLabs и стал лидером. По Visa у компании третье место, по Wild — пятое.
«Наши основные конкуренты — китайские и американские компании,— говорит гендиректор VisionLabs Александр Ханин.— В большей степени даже китайские. У них огромные инвестиции в исследования, которые превосходят наши в сотни раз, но мы лучше благодаря подходу».
Преимущество VisionLabs в том, что его система потребляет в десятки раз меньше компьютерных ресурсов, чем разработки конкурентов. «Для использования нашей системы заказчик должен пробрести один сервер, а системы одного из наших конкурентов — 30»,— объясняет Ханин.
Алгоритмы распознавания лиц очень чувствительны к цвету кожи и национальным особенностям. По словам Александра Ханина, алгоритмы некоторых компаний плохо распознают афроамериканцев и жителей Азии. Система VisionLabs не знает расовых или национальных различий, что особо отмечено в рейтинге NIST. «У нас наиболее политкорректный алгоритм: для него люди с любым цветом кожи равны »,— улыбается генеральный директор.
Александр Ханин по образованию робототехник. Окончил Московский государственный технический университет им. Н. Э. Баумана, там же преподавал. В 2012 году с тремя партнерами основал VisionLabs, тогда же компанию приняли в «Сколково». Распознаванием лиц она занимается с 2014 года.
«Сейчас примерно 70% наших клиентов — банки,— говорит Александр Ханин.— Только в России нашу технологию используют более 40 банков. Среди них Почта-банк, Сбербанк,
"Тинькофф". Мы работаем также на Ближнем Востоке, в Юго-Восточной Азии».
Система распознавания лиц в банках используется для доступа сотрудников к рабочим местам, обслуживания клиентов, обработки кредитных заявок.
«В банках очень легко посчитать эффект от внедрения такой системы,— объясняет Ханин.— Там она оценивается с точностью до рубля как сумма не выданных мошенникам кредитов. Только в России за прошлой год мы предотвратили случаев мошенничества больше чем на 6 млрд руб.».