На языке нейросетей

Интервью

По ключевым направлениям искусственного интеллекта российские компании — в числе мировых лидеров. Группа ЦРТ за последние два года заняла верхние позиции в шести международных конкурсах. О том, какие решения на основе разговорного AI, машинного обучения и компьютерного зрения для крупного бизнеса и госсектора работают в национальных биометрических проектах и ведущих телеком-компаниях и банках страны, а также о новых трендах рассказывает CEO группы ЦРТ Дмитрий Дырмовский.

Фото: Александр Коряков, Коммерсантъ

Фото: Александр Коряков, Коммерсантъ

BUSINESS GUIDE: Дмитрий, зачем технологические компании участвуют в научных конкурсах?

ДМИТРИЙ ДЫРМОВСКИЙ: Прежде всего — это мощный инструмент развития компетенций. Сложную практическую задачу в режиме здоровой конкуренции решают лучшие научные команды. Участие в конкурсах позволяет не только совершенствовать экспертизу, которая впоследствии реализуется в AI-решениях, но и развивать собственный научный потенциал и глобальный технологический прогресс.

BG: Как, по вашему опыту, сегодня технологические достижения влияют на индустрии?

Д. Д.: Один из примеров — конкурс CHIME, который был посвящен работе с несегментированной — естественной — речью в ситуациях, когда говорят сразу несколько человек, перебивают друг друга и при этом в шуме. Достижения в этой области мы используем для улучшения работы виртуальных ассистентов в банках и телекоме, систем протоколирования совещаний и речевой аналитики для контроля качества в контактных центрах и офисах обслуживания. Высокое качество распознавания речи позволило реализовать в этом году первый на российском рынке проект речевой аналитики для повышения качества обслуживания в клиентских офисах одной из крупнейших энергосбытовых компании страны. Еще один пример — Трубная металлургическая компания (ТМК) внедрила технологию распознавания голоса в систему контроля качества: решение ЦРТ автоматически оцифровывает голосовые команды контролеров, называющих геометрические параметры продукции, и в этом формате передает их в единую информационную систему предприятия, оптимизируя ресурсы.

BG: Один из конкурсов был посвящен распознаванию речи на языке хинди. Зачем участвовать в столь экзотических соревнованиях?

Д. Д.: Действительно, этот язык непривычный для нас, тем более среди конкурентов были команды, для которых он родной, что умножало сложность. Именно поэтому победа во всех треках была особенно значимой: она демонстрирует не просто возможность распознавания еще одного языка, широту спектра возможностей российских разработчиков. Сейчас распознавание речи ЦРТ доступно на 14 языках: русском, английском, казахском, испанском, арабском, немецком, французском, турецком, бенгальском, филиппинском, фарси, урду, португальском, хинди. Это позволяет решать сложные задачи, в том числе — создавать билингвальных диалоговых роботов, которые могут вести диалог на разных языках. Главное — мы наращиваем свою экспертизу, которую ценят клиенты. Для создания сложных государственных сервисов и решений для крупного бизнеса выбирают разработчика с глубоким технологическим бэкграундом и опытом, а не компании, которые вышли на рынок в попытке угнаться за спросом.

BG: Какие решения ЦРТ показали рост в 2022 году?

Д. Д.: Ключевую динамику продемонстрировали направления диалоговых ассистентов, голосового протоколирования и компьютерного зрения.

Среди драйверов — тренд импортозамещения и стремление к оптимизации ресурсов и расходов при сохранении высокого качества клиентского сервиса. Так, экономический эффект внедрения проектов речевой аналитики ЦРТ в контактном центре «Сбера» для работы с корпоративными клиентами по итогам 2021 года составил 129 млн рублей.

Диалоговые ассистенты становятся привычными, с ними приятно взаимодействовать. Чат-бот «Александра», разработанный совместно с командой московского метро,— демонстрация того, как технологии помогают создавать удобные цифровые сервисы. «Александра» может рассказать о работе метро, МЦК, МЦД, о наземном транспорте, отвечает на вопросы о парковках, такси, каршеринге, организации дорожного движения. Ответила уже на 2,5 млн вопросов пассажиров и получила более 100 тыс. благодарностей пользователей. Такие эффекты, безусловно, стимулируют спрос.

BG: Появились ли за этот год новые кейсы в Санкт-Петербурге?

Д. Д.: Один из них реализован в Архивном комитете города. Комитет принял на госхранение коллекцию фонодокументов ленинградского Дома радио, которая оказалась в 1000 раз больше, чем среднегодовой объем принимаемых документов. Нейросети помогают в оцифровке. Система, разработанная в ЦРТ, преобразует речевые фонограммы в текст, оптимизирует формирование электронного каталога — улучшает качество описания фонодокументов, существенно упрощает поиск. Пользователи смогут не просто найти нужный документ по названию, но и прочитать содержание в текстовом файле.

BG: Как в этом году развивалась цифровизация здравоохранения?

Д. Д.: С точки зрения внедрения новых технологий — это одна из самых динамичных отраслей. Развивался целый ряд направлений: телемедицина, выявление патологий на снимках с помощью AI, развитие голосовых роботов службы 122.

Один из ключевых драйверов — голосовое заполнение медпротоколов для оптимизации рутинного труда врачей. С помощью голосового ввода, решения Voice2Med рентгенологи Москвы заполнили более 200 тыс. протоколов исследований, Центр диагностики и телемедицины ДЗМ зафиксировал рост качества распознавания специализированной медицинской лексики в 98%.

BG: Доступен ли сервис в Санкт-Петербурге?

Д. Д.: Центр Алмазова (ФГБУ НМИЦ им. Алмазова.— BG) применяет технологии распознавания речи при описании исследований лучевой диагностики, подтвердив экономию 20–30% времени на заполнении протоколов с помощью голоса.

В городской поликлинике № 91 голосовой ввод используют хирурги, неврологи, педиатры, урологи, терапевты. Разработка ЦРТ позволила в два раза сократить время на заполнение формы 088-У — направлений на медико-социальную экспертизу, что высоко оценили не только врачи, но и пациенты.

BG: Как развиваются решения на основе компьютерного зрения?

Д. Д.: Петербург — первый город в мире, где уже в 2014 году мы реализовали биометрический стадион. В 2018 году технологии ЦРТ стали частью АПК «Безопасный город», а с 2020-го работают на фанатском вираже «Газпром Арены». Успешный опыт перенимают по всей стране: на более чем 20 объектах спорта, 150 — транспорта, в 15 проектах АПК «Безопасный город». Развивается внедрение в системах контроля и управления доступом: совместно с партнерами мы реализовали биометрический, «по лицу», проход в несколько университетов и более 30 фитнес-центров, посетители уже высоко оценили безопасность и комфорт. В 2022 году компания Telecom Daily выделила ЦРТ в качестве ключевого игрока рынка видеоаналитики с максимальной долей.

BG: Продолжился ли экспорт?

Д. Д.: Мы наращиваем экспорт в целевые регионы — Ближний Восток и Латинскую Америку, где решения ЦРТ работают уже более 15 лет. Эти регионы остаются для нас экспортным приоритетом.

BG: Какие тренды в развитии искусственного интеллекта вы можете отметить?

Д. Д.: Первый, относительно новый тренд: спрос на сервисы протоколирования. С ростом количества совещаний, особенно в онлайне, растет сфера применения распознавания речи участников совещаний.

Второй тренд: естественные, реалистичные диалоговые ассистенты вытесняют линейных роботов прошлого поколения, они будут становиться все интеллектуальнее, развивать возможности для предвосхищения намерений по ходу разговора.

Появился тренд в компьютерном зрении: намечается переход от распознавания объектов — лиц и силуэтов — к распознаванию действий и анализа контекста.

Четвертый тренд: AI продолжит развитие для выявления паттернов мошенничества и защиты биометрии от попыток атак, которые, за счет новых генеративных моделей, становятся все креативнее. Будут создаваться новые решения, помогая им противостоять.

Замыкает топ-5 тренд голосового AI в качестве ядра привычных процессов, позволяя значительно оптимизировать привычные услуги без изменения инфраструктуры.

Новые вызовы стимулируют техновизионеров и прогрессивных разработчиков развиваться еще интенсивнее и быстрее, представляя все более совершенные технологические решения.

Екатерина Рязанова

Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...