Человек против алгоритма
Кто лучше видит риски на пищевом производстве
Каждый год продуктовые ритейлеры и переработчики отзывают миллионы тонн продукции из-за дефектов, которые вовремя не заметили на конвейере. Исследования показывают, что уже через полчаса монотонной работы концентрация внимания оператора снижается, из-за чего он пропускает до 20–30% дефектов.
Эксперт по пищевой безопасности и инновационным разработкам в сфере пищевого производства и общественного питания Константин Деревсков
Фото: Пресс-служба Российского биологического университета (РОСБИОТЕХ
Эксперт по пищевой безопасности и инновационным разработкам в сфере пищевого производства и общественного питания Константин Деревсков
Фото: Пресс-служба Российского биологического университета (РОСБИОТЕХ
Современные алгоритмы машинного зрения помогают нивелировать эту проблему. Они не знают усталости, не отвлекаются и не зависят от внешних факторов. Но и ИИ не всесилен: он спотыкается там, где кончается статистика, и совершенно бессилен без правильно обученного технолога. Какую модель контроля выбрать пищевым предприятиям? Об этом «Ъ-Наука» беседует c экспертом по пищевой безопасности и инновационным разработкам в сфере пищевого производства и общественного питания Константином Деревсковым.
— Константин Андреевич, с каких задач на пищевом производстве лучше снимать человека и ставить алгоритм? И каковы преимущества нейросетей в данном контексте, в чем их превосходство?
— Машинное зрение совершенно точно превосходит человека при детекции физических дефектов и инородных включений, особенно на высокоскоростных линиях. Мы уже видим, как сверточные нейросети сканируют продукцию и в реальном времени выцепляют несоответствия с точностью до 99% на обученных типах дефектов. Для сравнения, оператор в среднем дает 80%, так как чисто физически не выдерживает темпа конвейера и монотонности. В ряде исследований алгоритмы находили на 30–40% больше проблем, чем эксперты (разрыв сильно зависит от типа дефекта). И это, пожалуй, лучше всего показывает, что мы пришли в точку, где живой контроль бессилен перед потоком, несущим тысячи единиц в минуту.
— И все же без эксперта — никуда?
— Безусловно, возьмем для примера дегустацию. Да, нейросеть великолепно анализирует цвет, форму, текстуру, но вот запах и вкус (первый сигнал порчи продукта или сбоя) для нее пустой звук, изменение органолептики она выявить не в состоянии; тут однозначно нужен специалист со своим носом и языком. Или возьмите анализ первопричин. Алгоритм укажет на брак, но почему он случился, может определить только человек.
— У каких рисков самый низкий «рейтинг обучаемости» для ИИ? Что алгоритм не может предсказать в принципе?
— Труднее всего со сложной химией и биологией (здесь необходимо глубокое понимание взаимодействий, где системы ведут себя нелинейно). Классическая нейросеть обучена только на размеченных инцидентах. Однако появляются методы zero-shot detection, где алгоритм пытается делать выводы и составить прогноз, опираясь на имеющиеся у него знания о похожих субстанциях, но это пока первые разработки, о внедрении на производство говорить пока рано.
— Когда операторы начинают слепо доверять «умной» камере, возникает риск automation bias («ошибки автоматизации»). Сталкивались с таким?
— Да, это вполне реальная и опасная история. Ряд зарубежных исследований показывает, что со временем убедительные и красивые результаты алгоритма снижают потребность в его проверке, из-за чего пользователи начинают расслабляться. Тут, на мой взгляд, спасает только схема, где ИИ и живой инспектор работают в паре, и при этом финальное слово всегда остается за человеком. Кстати, в этой связи у персонала появляются новые компетенции: технологу теперь надо уметь интерпретировать выводы системы и замечать моменты, когда нейросеть начинает галлюцинировать.
— Переход от лабораторного стенда к реальному цеху — это всегда боль. С какими техническими трудностями сталкивались и как их обходили?
— Лаборатория и живое производство — совершенно разные вселенные. В цеху может быть всякое: брызги на объективе, переход с дневного света на ночную подсветку, пыль на линзах… Все это вроде бы вполне естественно, но таких, казалось бы, безобидных моментов достаточно, чтобы дорогая система вдруг начала давать сбой. Приходится физически продумывать освещение и дообучать модели прямо на реальных данных в новых условиях. Помогают гиперспектральные датчики, но они дороги (сотни тысяч—миллионы рублей) и тоже требуют чистоты оптики; полного решения проблемы нет, только комплекс мер: защитные кожухи, автоматическая калибровка, периодическая чистка.
— Если алгоритм забраковал партию, а инспектор не видит дефекта, чей вердикт окончательный?
— Пока что верить мы будем человеку, окончательное решение закреплено за ним. При всех своих преимуществах у нейросетей есть один существенный недостаток — непрозрачность. Мы не можем выяснить, какие именно признаки заставили систему отбраковать конкретный образец или параметр. То есть значительное повышение доверия к алгоритму потребует развития технологий объяснимого ИИ (XAI), которые показывают, почему система приняла то или иное решение. Полное же доверие — это вопрос не только технологии, но и регуляторики, юридических рамок и накопленной статистики безопасной эксплуатации (например, когда алгоритм научится указывать, что причиной отбраковки стало обнаружение проблемы).
— Может ли ИИ предсказывать риск, которого раньше не было? Допустим, новый тип заражения, который еще не попадал в статистику?
— Здесь, пожалуй, самый интересный момент. Классические модели завязаны на размеченной истории, они умеют распознавать только то, с чем уже сталкивались во время обучения. Например, модель обучили отличать здоровые яблоки от гнилых и пораженных паршой, у нее есть размеченные примеры этих дефектов. Но если появится новый, неизвестный тип заражения (скажем, пятнистость с необычным рисунком, которой раньше не встречали), классическая модель его распознать не сможет. Иными словами, такая модель обнаружить что-то новое не может. Но сейчас появляются zero-shot learning и генеративные нейросети, которые прогнозируют без прямых примеров. Скажем, анализ спутниковых снимков полей, погодных карт и данных о влажности может предсказывать риск афлатоксина в зерне, даже если плесень в этом конкретном месте никогда до того не фиксировалась. Не идеально, но работает и даже в чем-то превосходит привычные способы проверок, известные ранее.
— Константин Андреевич, а с экономической точки зрения внедрение ИИ на линии — это способ сократить штат контролеров или возможность перекинуть людей на более интеллектуальные задачи?
— Скажу, возможно, жестко, но в краткосрочной перспективе это вполне неплохой, оправданный способ сэкономить на персонале. Есть примеры, когда ферма сократила потребность в рабочей силе на 50% при сортировке картофеля. Но это высокоскоростная, простая задача. На сложных продуктах (мясо, молочная продукция, готовая еда) экономия персонала скромнее, а высвобожденных людей переобучают на операторов ИИ-систем. Если кто утверждает обратное — лукавит. Но! Дальше начинается реаллокация труда: освободившихся людей переводят на верификацию алгоритмов и изучение причин появления брака. Деньги экономятся, но при этом растет и интеллектуальная нагрузка на команду.
— И последнее: на перспективу в три-пять лет — какой сценарий видится вам самым реалистичным?
— Гибрид и только гибрид, на мой взгляд,— это единственный разумный вариант. Технология не заменит человека, но очень сильно изменит его работу, ИИ возьмет на себя сканирование, поднимет охват контроля до 100% и снизит утомляемость операторов. Возврата к ручной экспертизе не будет, технологии уже превосходят в скорости и объективности, но полная автоматизация упирается в проблему черного ящика и неспособность ИИ улавливать контекст, так что остается партнерство. Алгоритм подсказывает и сортирует, человек принимает финальные решения и управляет сложными ситуациями.