26.05.2015, 00:00

В основу систем "технического зрения" должны быть положены живые нейротехнологии

нейрофизиология

Особенностью подхода к разработке систем "технического зрения" в НИИ нейрокибернетики им. А.Б. Когана ЮФУ является тесная взаимосвязь нейрофизиологических и бионических принципов для увеличения эффективности распознавания образов рукотворными "глазами" приборов и минимизации вычислительных процедур.

Человек, рассматривая предмет, фиксирует взгляд на определенных участках, которые привлекают внимание, и узнает этот предмет именно по этим признакам [рис. 01 ]. Технический сканер "рассматривает" весь предмет с одинаковым "вниманием", и в итоге строит и запоминает избыточную по информативности картинку для узнавания этого предмета.

Рис 1. Пример информативных областей для изображений лиц и дорожных знаков

Для распознавания простых предметов такое "техническое зрение" подходит, но в реальном мире применять принцип сканера для замены человеческого зрения означает создавать чересчур сложную вычислительную задачу для аналитической части сканера, имитирующего человеческий глаз. Любой поворот предмета, изменение его масштаба, условий освещения и многое другое создает слишком невыгодное соотношение сигнал — шум, что сильно затрудняет, если не делает вообще невозможным инвариантное (безошибочно однозначное) распознавание предмета.

Сравнительно недавно при решении задач компьютерного зрения стал использоваться подход, основанный на разработке вычислительных алгоритмов, имитирующих принципы работы реальных зрительных систем (нейроинспирированный подход), который в настоящее время рассматривается как наиболее перспективный.

Детальная обработка техническим устройством не всего изображения, а наиболее информативных для восприятия отдельных его фрагментов может существенно уменьшить вычислительные затраты и увеличить эффективность распознавания. Также принципиально важно найти алгоритмы, обеспечивающие сжатое и вместе с тем исчерпывающее описание фрагментов изображений при сохранении инвариантности к различным трансформациям этого изображения.

Одним из широко используемых методов инвариантного описания является представление изображения на нескольких уровнях разрешения. Примерно так, как это происходит при взгляде человека: очень четкая и детальная картинка ключевых областей рассматриваемого предмета и менее четкая, как бы размытая картина по периферии этих областей. По сути создается аналог нейробиологических механизмов выбора и восприятия перцептуально важных фрагментов при осмотре изображений [рис. 02].

Рис 2. Многоуровневые признаковое описание изображения

Перспективность такого подхода подтверждается несколькими системами "технического зрения" различного предназначения, разработанными в нашем институте и уже реально работающими [рис. 03].

Это биометрическая система санкционированного доступа, система для распознавания дорожных знаков (разработана в содружестве с коллегами из Великобритании), система оценки положения головы пациента во время томографического обследования, методика бесконтактного определения функционального состояния пилотов (последняя сейчас находится на стадии тестирования).

Мы убеждены, что в рамках исследуемого нами нейробиологического подхода может быть найдено еще много решений актуальных проблем, стоящих сегодня перед разработчиками систем "технического" зрения, в том числе при создании автономных адаптивных роботов с целесообразным поведением.

текст Валерий Кирой, доктор биологических наук, профессор
Дмитрий Шапошников, кандидат технических наук, ведущий научный сотрудник
Сергей Анищенко, PhD, НИИ нейрокибернетики им. А.Б. Когана, Южный федеральный университет

Работы выполняются в рамках базовой части внутреннего гранта Южного федерального университета (ЮФУ) No213.01–2014/001ВГ, договора между НИИ нейрокибернетики им. А.Б. Когана ЮФУ и ФГУП «ЦАГИ», финансируе- мого по ФЦП «Развитие гражданской авиационной техники России на 2002– 2010 годы и на период до 2015 года».

Новости компаний Все

Меню сайта

«Коммерсантъ» для Android

В основу систем "технического зрения" должны быть положены живые нейротехнологии

нейрофизиология

25.04.2025

DOGMA

Качественное проектирование позволяет снизить затраты на строительство многоквартирного дома

25.04.2025

ПАО «ВымпелКом»

Beeline Cloud представляет метрокластер — отказоустойчивое облако на базе двух дата-центров

25.04.2025

ООО «Серконс»

Дом с видом на будущее: как качественная экспертиза ускоряет стройку и снижает риски

25.04.2025

PIONEER

PIONEER одержал две победы на CRE Awards 2025

Лента