В погоне за безопасностью

Cognitive Pilot усовершенствовала архитектуру нейронной сети

Ведущий разработчик систем автопилотирования на основе ИИ компания Cognitive Pilot выпустила обновление систем автопилотирования для сельхозтехники и рельсового транспорта, в котором усовершенствована структура нейронной сети.

Фото: Игорь Иванко, Коммерсантъ

Фото: Игорь Иванко, Коммерсантъ

В отличие от традиционного формата совершенствования архитектуры нейронных сетей, основанного в том числе на сборе огромных массивов информации, специалисты Cognitive Pilot применили свой, инновационный подход, сделав акцент на умном и рациональном отборе данных. В своем решении компания использовала актуальные аналитические методы анализа, такие как TSNE (t-distributed Stochastic Neighbor Embedding) и OOD (Out-of-Distribution Detection). Данный подход позволяет строить сбалансированные обучающие выборки, исключая избыточность и добиваясь максимальной эффективности при минимальном количестве данных.

Использование современной многозадачной трансформерной архитектуры позволило компании достичь качественно иного результата в задачах автопилотирования сельхозтехники и рельсового транспорта. Новая архитектура сети включает в себя несколько выходов (голов), каждый из которых отвечает за решение различных задач: например, определение кромки поля, детектирование препятствий, обнаружение зон, где вождение возможно или невозможно, и т. д. Ключевым преимуществом предложенного подхода стало достижение согласованности в процедуре обучения сети, что в совокупности с правильной стратегией насыщения обучающей выборки обеспечило заметный рост качества распознавания по сравнению с обучением каждой задачи отдельно. Совместное обучение также позволило адаптировать задачи сети к новым функциональным сценариям, которые не были изначально заложены в целевую постановку (эмерджентность). Взаимодействие между выходами способствовало более глубокому, качественному извлечению признаков и устойчивому обобщению, что указывает на формирование новых системных свойств нейросети, таких как эмерджентность и синергия в процессе совместного обучения. Новая архитектура получила название CognitiveNet.

В итоге новые качества сети дали возможность комплексно анализировать окружающую среду, увеличить более чем в два раза число типов распознаваемых объектов, включая объекты дорожной инфраструктуры, транспортных средств, животных, включая собак и кошек, а также птиц.

Новый детектор объектов, применяемый в CognitiveNet, использует продвинутые методы уточнения границ для снижения ошибок локализации и более точного обнаружения. Благодаря более точной локализации объектов и улучшенному процессу классификации снизилось количество ошибок распознавания, в отдельных случаях — более чем в десять раз. Улучшенная структура сети теперь позволяет точнее определять границы распознаваемых объектов, а также минимизировать случаи, когда система ошибочно распознает элементы, которые не являются объектами (например, фон или мелкие детали).

Инновационный подход к обучению позволил также передавать знания о расположении объектов между слоями модели, улучшая предсказания без увеличения вычислительных затрат. Кроме того, это позволило существенно снизить требования к вычислительным ресурсам. Производительность системы выросла более чем на 40%.

«Усовершенствованная архитектура нейросети — это огромный шаг вперед. В CognitiveNet реализованы наши последние достижения в этой области. Они не только позволяют разработчикам экономить десятки человеко-лет при создании автопилотов и увеличивать производительность системы, главное, что они обеспечивают максимальный уровень безопасности и наивысшее качество работы техники, на которой работают наши ИИ-автопилоты. Мы очередной раз подтверждаем, что российские решения являются законодателями мод в этом важнейшем направлении мирового рынка высоких технологий»,— говорит генеральный директор Cognitive Pilot Ольга Ускова.

Еще одно важное преимущество новой архитектуры — способность самодиагностики и оценки надежности своих предсказаний, что крайне необходимо в системах автопилотирования, где критически важно понимать уровень уверенности модели в каждом решении. В случаях, когда сеть дает предсказания с низкой надежностью, система способна оперативно сигнализировать о необходимости дополнительной обработки или привлечения внешнего вмешательства.

Геннадий Савицкий, ведущий разработчик Cognitive Pilot, ответил на вопросы «Ъ-Науки»:

— Какие ключевые улучшения внесла Cognitive Pilot при разработке архитектуры нейронной сети CognitiveNet?

— В наших практических задачах высокую важность имеют форматы, предусматривающие необходимость использования ограниченных объемов данных при обучении нейронных сетей. Эти ограничения обусловлены такими причинами, например, как отсутствие широкополосного покрытия интернета для передачи стендов — видео, изображения, другой телеметрии — для дообучения нейросети. Такие ситуации типичны как для использования автономных систем в агро, так и для городских трамваев, а также беспилотных мини-тракторов, работающих в зонах аэропортов и на опасных производствах на удаленных территориях.

В этой связи специалисты Cognitive Pilot внесли целый ряд усовершенствований как в архитектуру нейронных сетей, так и изменения к подходу их обучения, что позволяет на небольших объемах данных получать результаты без потери качества работы автопилота.

— Насколько выросло качество распознавания объектов после обновления? Какие типы объектов теперь может распознавать система по сравнению с предыдущей версией?

— Если мы говорим о распознавании объектов, то будем рассматривать достигнутые показатели на примере нового детектора объектов CognitiveNet. Он использует продвинутые методы уточнения границ для снижения ошибок локализации и более точного обнаружения объектов дорожной сцены. Благодаря более точной локализации объектов и улучшенному процессу классификации снизилось количество ошибок распознавания, в отдельных случаях — более чем в десять раз.

Новые качества сети дали возможность комплексно анализировать окружающую среду, увеличить более чем в два раза число типов распознаваемых объектов, включая объекты дорожной инфраструктуры, транспортные средства, животных, в том числе собак и кошек, а также птиц. Сейчас мы сможем распознать даже воробья, сидящего в пшенице или другой культуре, в задачах автопилотирования сельхозтехники.

Можно сказать, что мы достигли уровня распознавания объектов, который превышает возможности человека. То есть если дать группе экспертов неограниченное время на анализ окружающей сцены с входного сигнала камеры, то они смогут определить существенно меньше объектов, чем наша нейросеть, но самое главное, что нейросеть это сделает за доли секунды.

— В чем заключается инновационный подход Cognitive Pilot к обучению нейронных сетей?

— Новая архитектура сети включает в себя несколько выходов (голов), каждый из которых отвечает за решение различных задач, например, определение кромки поля, детектирование препятствий, обнаружение зон, где вождение возможно или невозможно, и т. д. Ключевым преимуществом нашего подхода стало достижение согласованности в процедуре обучения сети, что в совокупности с правильной стратегией насыщения обучающей выборки обеспечило заметный рост качества распознавания по сравнению с обучением каждой задачи отдельно. Причем необходимо понимать, что все это происходит в условиях ограниченного объема данных.

Совместное обучение также позволило адаптировать задачи сети к новым функциональным сценариям, которые не были изначально заложены в целевую постановку. Взаимодействие между выходами способствовало более глубокому, качественному извлечению признаков и устойчивому обобщению входной информации, что указывает на формирование новых системных свойств нейросети, таких как эмерджентность и синергия в процессе совместного обучения.

— Какие задачи решают разные «головы» (выходы) нейронной сети?

— В используемых сегодня нами промышленных продуктах Cognitive Agro Pilot для автономного управления комбайном и трактором одна нейронная сеть позволяет решать одновременно несколько задач: определение кромки поля, детекция препятствий (людей, другой техники), распознавание зон, где вождение возможно и невозможно (аварийно), распознавание полегшей культуры, сорняков и т. д.

В условиях одного выхода сети решить эти задачи одновременно невозможно, так как они начинают друг другу противоречить. Представьте, что на пути комбайна есть препятствие — например, другой комбайн. Он закрывает границу, закрывает кромку. На этом месте получается пятно. Поскольку автопилот ориентируется по кромке, то происходит сбой. В результате качество основной задачи падает. А у нас все происходит как у человека, одновременно. Одна голова сети строит границу участка как бы без учета препятствия, как будто его нет. Другая, наоборот, детектирует препятствие. Третья определяет зоны, где вождение разрешается и где запрещено. Четвертая работает с полегшей культурой.

В задачах рельсового транспорта нами также реализована многозадачная архитектура: детектирование объектов дорожной сцены, 3D-детектирование, сегментация (выделение полосы движения) и трекинг (построение траектории движения объекта) и т. д.

А в проектах R&D мы проводим тесты уже на десятках задач.

— Почему традиционные методы сбора больших данных менее эффективны, чем подход Cognitive Pilot?

— Полностью сквозные (end-to-end) решения менее эффективны в ресурсах: они зачастую исключают использование программных алгоритмов. Подход Cognitive Pilot представляется более прозрачным и сбалансированным, поскольку позволяет избегать проблем с интерпретируемостью решений и вносить необходимые коррективы для обеспечения надежности.

— Как CognitiveNet оценивает надежность своих предсказаний? Почему способность к самодиагностике критически важна для автопилотирования?

— Способность самодиагностики и оценки надежности своих предсказаний является еще одним важным преимуществом новой архитектуры, что крайне необходимо в системах автопилотирования, где критически важно понимать уровень уверенности модели в каждом решении. В случаях, когда сеть дает предсказания с низкой надежностью, система способна оперативно сигнализировать о необходимости дополнительной обработки или привлечения внешнего вмешательства.

В наших ИИ-автопилотах для сельхозтехники механизм оценки надежности работы является одним из ключевых элементов системы управления. Специалистами Cognitive Pilot была даже специально разработала технология Cognitive Feedback, которая позволяет на протяжении всей работы автопилота определять уровень надежности работы ИИ и взаимодействовать с механизатором — информировать его об отсутствии проблем, а также потенциальных случаях ненадежной работы искусственного интеллекта, предупреждать о возникновении проблемных ситуаций, причиной которых могут быть тяжелые погодные условия (густой туман, пыль), плохое состояние поля, загрязнение датчика камеры и т. д. Тогда на этом участке комбайнер должен перейти на ручной режим управления.

— Какие перспективы открывает новая архитектура для сельхозтехники и рельсового транспорта?

— Усовершенствованная архитектура нейросети — это огромный шаг вперед. Инновации позволяют разработчикам экономить десятки человеко-лет при создании автопилотов. Инновационный подход к обучению позволил также передавать знания о расположении объектов между слоями модели, улучшая предсказания без увеличения вычислительных затрат. Это позволило существенно снизить требования к вычислительным ресурсам. Производительность системы выросла более чем на 40%.

Но главное, что новые возможности обеспечивают принципиально иной уровень качества и безопасности работы техники, на которой стоят наши ИИ-автопилоты.

Мария Грибова