«Чтобы внедрять ИИ, не нужны миллиарды. Нужен порядок в компании»

Лидер ML-проектов федерального масштаба Роман Постовалов — о том, как нейросети меняют рынок

Роман Постовалов — инженер, экс-руководитель групп машинного обучения для «Россетей» и бывший CTO сервиса lip-sync, конкурировавшего с мировыми гигантами. Сегодня он применяет этот опыт в собственном проекте BioCode Protocol — системе превентивной медицины на стыке ИИ и врачебной экспертизы.

Фото: предоставлено Романом Постоваловым

Фото: предоставлено Романом Постоваловым

— Роман, вы начинали с проектов, где масштаб измерялся десятками миллионов пользователей. Расскажите о самом ярком — виртуальном помощнике для «Россетей»

— Мы сделали нейросетевую первую линию поддержки для 20 млн клиентов Московского региона. Система распознавала интенты — истинные намерения человека — в свободной речи с учетом диалектов, дефектов и шумов в трубке. Она выдерживала пики до 500 одновременных подключений в секунду.

В результате штат первой линии сократился с сотен сотрудников до десятков. Людей не уволили — их перевели на сложные экспертные задачи. А компания получила возможность масштабироваться, не нанимая каждый месяц новых операторов. Мы показали рынку: нейросеть не спит, не болеет, не ошибается в скриптах. После нас многие крупные игроки «пошли в нейросети».

— Второй проект, о котором вы говорите как о знаковом, — lip-sync-сервис. Там вы конкурировали с HeyGen, имея гораздо меньший бюджет. Каким образом?

— Мы вторыми в мире после HeyGen выпустили сервис по синхронизации губ и локализации видео. Команда из 30 человек обрабатывала до 40 тыс. часов контента в месяц на 50 языках. Технически сложная задача: арабский язык длиннее русского, китайский — короче, нужно адаптировать длину фразы без потери смысла, чтобы губы двигались естественно.

Но главный прорыв оказался не в алгоритмах, а в интерфейсе. Мы первыми сделали полноценный видеоредактор прямо в браузере — с ползунками, настройками, перегенерацией на лету. Американцы позже проанализировали наш UI/UX и практически полностью скопировали подход. Ключевой урок: маленькая сильная команда с правильным видением может задавать тренды мирового уровня.

— Вы много лет судите хакатоны. Зачем вам это как эксперту?

— Для меня это способ калибровки рынка и поиска талантов. На хакатонах я вижу «спринтеров» — команды из 2–4 человек, которые за 48 часов собирают прототип, который в корпорациях делают месяцами. Они интуитивно находят решения уровня senior-статей. Я даю им обратную связь, калибрую их уровень, а потом приглашаю на интервью. Это мой социальный вклад в отрасль — подсветить молодых, показать, что дорога открыта.

— Вы начинали в эпоху, когда нейросети были уделом корпораций с огромными бюджетами. Что изменилось для малого и среднего бизнеса сейчас?

— Доступ к ИИ и вычислительным мощностям стал дешевым благодаря облакам. Порог вхождения для талантливых команд резко снизился. Больше не нужно искать крупное финансирование на старте — можно использовать готовые наработки.

Более того, корпорации вроде Amazon, Google Cloud и фонды вроде a16z дают гранты до $0,5 млн на перспективные проекты. Вложение в «железо» больше не критично. Важны идея, горящие глаза и настрой команды. Все остальное — операционный расход.

— То есть любой бизнес сейчас может «нанять» ИИ без программистов?

— Для легких задач — да. Одностраничный сайт, простой скрипт, базовая автоматизация колл-центра — это можно «написать» в чате с нейросетью. Но это только вершина айсберга.

Ловушка в 20% сложности. Именно эта часть продукта — то, за что бизнес платит большие деньги. Эти нюансы невозможно грамотно описать в промте не-техническому специалисту. А главная проблема начинается после релиза: пошли баги, фидбек, пожелания доработок. Каждый следующий релиз усложняет систему. ChatGPT не понимает тонкостей вашего домена. В итоге продукт становится либо неподдерживаемым, либо финансово неэффективным.

— Что же делать собственнику регионального бизнеса? Какие технологии внедрять прямо сейчас, чтобы через год не догонять?

— Универсального рецепта нет. Сначала оцифруйте и приведите в порядок бизнес-процессы. ИИ масштабирует только то, что уже работает. Если в компании хаос — нейросети сделают хуже. Затем наймите или проконсультируйтесь с сильным IT-специалистом. Выберите одну-две метрики (снижение ФОТ, скорость обработки заявок и т.д.) и тестируйте решения под них. Чтобы не догонять конкурентов, смотрите шире — на смежные отрасли. Сегодня языковые модели уже предлагают полноценную функциональность ассистентов. Инструменты доступны, у собственника есть все возможности сделать компанию прибыльнее.

— Вы сами сейчас строите BioCode Protocol в медицине. Тот же подход сработал?

— Полностью. Главный урок из «Россетей» и lip-sync: нейросеть отлично справляется с рутиной, но не заменяет эксперта. В BioCode мы создали ансамбль: ИИ работает на жестких медицинских протоколах, а врач-наставник перепроверяет выводы и снимает галлюцинации.

Наша команда докторов имеет суммарный опыт более 200 лет. Мы уверены: недостижимых целей по здоровью нет — под каждый случай есть протокол. Наша задача — оцифровать эти протоколы и доставить человеку в привычном чате мессенджера. Это и есть синергия, которую мы выстроили в трех совершенно разных отраслях.