Особенностью подхода к разработке систем "технического зрения" в НИИ нейрокибернетики им. А.Б. Когана ЮФУ является тесная взаимосвязь нейрофизиологических и бионических принципов для увеличения эффективности распознавания образов рукотворными "глазами" приборов и минимизации вычислительных процедур.
Человек, рассматривая предмет, фиксирует взгляд на определенных участках, которые привлекают внимание, и узнает этот предмет именно по этим признакам [рис. 01 ]. Технический сканер "рассматривает" весь предмет с одинаковым "вниманием", и в итоге строит и запоминает избыточную по информативности картинку для узнавания этого предмета.
Для распознавания простых предметов такое "техническое зрение" подходит, но в реальном мире применять принцип сканера для замены человеческого зрения означает создавать чересчур сложную вычислительную задачу для аналитической части сканера, имитирующего человеческий глаз. Любой поворот предмета, изменение его масштаба, условий освещения и многое другое создает слишком невыгодное соотношение сигнал — шум, что сильно затрудняет, если не делает вообще невозможным инвариантное (безошибочно однозначное) распознавание предмета.
Сравнительно недавно при решении задач компьютерного зрения стал использоваться подход, основанный на разработке вычислительных алгоритмов, имитирующих принципы работы реальных зрительных систем (нейроинспирированный подход), который в настоящее время рассматривается как наиболее перспективный.
Детальная обработка техническим устройством не всего изображения, а наиболее информативных для восприятия отдельных его фрагментов может существенно уменьшить вычислительные затраты и увеличить эффективность распознавания. Также принципиально важно найти алгоритмы, обеспечивающие сжатое и вместе с тем исчерпывающее описание фрагментов изображений при сохранении инвариантности к различным трансформациям этого изображения.
Одним из широко используемых методов инвариантного описания является представление изображения на нескольких уровнях разрешения. Примерно так, как это происходит при взгляде человека: очень четкая и детальная картинка ключевых областей рассматриваемого предмета и менее четкая, как бы размытая картина по периферии этих областей. По сути создается аналог нейробиологических механизмов выбора и восприятия перцептуально важных фрагментов при осмотре изображений [рис. 02].
Перспективность такого подхода подтверждается несколькими системами "технического зрения" различного предназначения, разработанными в нашем институте и уже реально работающими [рис. 03].
Это биометрическая система санкционированного доступа, система для распознавания дорожных знаков (разработана в содружестве с коллегами из Великобритании), система оценки положения головы пациента во время томографического обследования, методика бесконтактного определения функционального состояния пилотов (последняя сейчас находится на стадии тестирования).
Мы убеждены, что в рамках исследуемого нами нейробиологического подхода может быть найдено еще много решений актуальных проблем, стоящих сегодня перед разработчиками систем "технического" зрения, в том числе при создании автономных адаптивных роботов с целесообразным поведением.