Коммерсантъ FM

Для госуслуг проводятся тестовые роботы

«Ростелеком» обучает ИИ «Яндекса» и «Сбера»

До конца года Минцифры интегрирует в сервис госуслуг российскую LLM-модель, которая призвана упростить работу пользователей с сервисом. Проектом занимается «РТ Лабс» (структура «Ростелекома» (MOEX: RTKM)) — компания тестирует решения от «Яндекса» (MOEX: YNDX) и «Сбера» (YandexGPT и GigaChat), обучая их на жалобах граждан, сообщениях чиновников и ответах операторов колл-центров. Эксперты говорят, что такая интеграция позволит моделям обучаться и при общении с пользователями госуслуг. Однако оператору госпортала придется решить проблему безопасной обработки персональных данных пользователей.

Фото: Александр Миридонов, Коммерсантъ

Фото: Александр Миридонов, Коммерсантъ

Глава Минцифры Максут Шадаев 1 февраля сообщил, что министерство планирует внедрить на портале госуслуг «технологии ChatGPT для консультации граждан» (цитата по ТАСС). Позже в Минцифры пояснили, что речь идет не о чат-боте ChatGPT (принадлежит американской OpenAI, основан на нейросетевой модели GPT-3.5), а о российской языковой модели. Она будет интегрирована в «Робота Макса» и, по заявлению министерства, «позволит отвечать на конкретные вопросы короткими и понятными ответами, сокращая путь пользователя», а также «генерировать ответ из базы знаний госуслуг под конкретный вопрос, ориентируясь на сформулированную жизненную ситуацию».

По словам источника “Ъ”, близкого к Минцифры, «РТ Лабс» (принадлежит «Ростелекому», выступает оператором портала «Госуслуги») тестирует две российские LLM-модели (Large Language Model, большая языковая модель, обучается на массивах текстов и используется в нейросетевых сервисах) от «Яндекса» и «Сбера» — YandexGPT и GigaChat. Одна из них по итогам тестирования будет использоваться в интерфейсе госуслуг.

Собеседник “Ъ” говорит, что сейчас для наполнения базы знаний моделей специалисты «РТ Лабс» используют скрипты «Робота Макса», базу ответов операторов колл-центра «Ростелекома», обезличенные жалобы и обращения пользователей, поступающие в ведомства, а также ответы на них.

Тестирование моделей продлится до лета, а внедрить одну из них в сервис планируется до конца года.

Пока в министерстве «нет четкого понимания объемов бюджета», которые потребуются на интеграцию LLM-модели, как и финансовой модели взаимодействия заказчика решения и вендора, уточнил источник “Ъ”. В «Ростелекоме» и «Яндексе» отказались от комментариев, в «Сбере» не ответили на запрос.

Доступ к генеративным сервисам на базе LLM обычно тарифицируется, исходя из токенов (смысловых кусочков слов и предложений) в вопросе к сервису и в его ответе. «Сбер» коммерциализировал доступ к GigaChat для разработчиков сторонних сервисов в сентябре 2023 года, «Яндекс» — в декабре (см. “Ъ” от 7 декабря 2023 года). Сейчас компании предлагают разные тарифы, зависящие от объема контекста (количества токенов, которые модель может обрабатывать в одном запросе). «Яндекс» также предлагает на выбор синхронный и асинхронный режим: в последнем ответы генерируются в течение нескольких минут или часов. Источник “Ъ” в одной из IT-компаний предполагает, что «РТ Лабс» по итогам тестирования заключит с одним из двух вендоров разовый контракт, предполагающий поддержку языковой модели.

4,2–6,9 триллиона рублей в год

ожидаемый финансовый эффект от внедрения ИИ для экономики России к 2028 году, по данным компании «Яков и партнеры».

Сервисы, дающие доступ к LLM посредством API (программного интерфейса), обычно не позволяют использовать его для дообучения моделей на сторонних данных, говорит источник “Ъ” в профильной компании. Он считает, что если «РТ Лабс» и сотрудничает в этом плане с каким-либо разработчиком LLM, то между ними уже должен быть заключен договор на дообучение: «Тем более что базовая модель является результатом деятельности компании-разработчика».

После полной интеграции LLM-модель сможет теоретически дообучаться и на тех данных, которые пользователи вводят в чат-бот госуслуг, полагает директор по развитию бизнеса Just AI Светлана Захарова. При этом она подчеркивает, что при интеграции любой LLM-модели с госуслугами оператору портала придется решить проблему обработки данных. Дело в том, поясняет эксперт, что на госуслугах хранятся персональные данные пользователей, которые нельзя отправлять в облако вендора, из-за чего придется внедрять «дополнительные инструменты, способные маскировать такие данные».

Никита Королев, Юрий Литвиненко

Зарегистрируйтесь или войдите, чтобы дочитать статью

Это бесплатно и вы сможете читать все закрытые статьи «Ъ»

Новости компаний Все

Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...