Для госуслуг проводятся тестовые роботы

«Ростелеком» обучает ИИ «Яндекса» и «Сбера»

До конца года Минцифры интегрирует в сервис госуслуг российскую LLM-модель, которая призвана упростить работу пользователей с сервисом. Проектом занимается «РТ Лабс» (структура «Ростелекома» (MOEX: RTKM)) — компания тестирует решения от «Яндекса» (MOEX: YNDX) и «Сбера» (YandexGPT и GigaChat), обучая их на жалобах граждан, сообщениях чиновников и ответах операторов колл-центров. Эксперты говорят, что такая интеграция позволит моделям обучаться и при общении с пользователями госуслуг. Однако оператору госпортала придется решить проблему безопасной обработки персональных данных пользователей.

Фото: Александр Миридонов, Коммерсантъ

Фото: Александр Миридонов, Коммерсантъ

Глава Минцифры Максут Шадаев 1 февраля сообщил, что министерство планирует внедрить на портале госуслуг «технологии ChatGPT для консультации граждан» (цитата по ТАСС). Позже в Минцифры пояснили, что речь идет не о чат-боте ChatGPT (принадлежит американской OpenAI, основан на нейросетевой модели GPT-3.5), а о российской языковой модели. Она будет интегрирована в «Робота Макса» и, по заявлению министерства, «позволит отвечать на конкретные вопросы короткими и понятными ответами, сокращая путь пользователя», а также «генерировать ответ из базы знаний госуслуг под конкретный вопрос, ориентируясь на сформулированную жизненную ситуацию».

По словам источника “Ъ”, близкого к Минцифры, «РТ Лабс» (принадлежит «Ростелекому», выступает оператором портала «Госуслуги») тестирует две российские LLM-модели (Large Language Model, большая языковая модель, обучается на массивах текстов и используется в нейросетевых сервисах) от «Яндекса» и «Сбера» — YandexGPT и GigaChat. Одна из них по итогам тестирования будет использоваться в интерфейсе госуслуг.

Собеседник “Ъ” говорит, что сейчас для наполнения базы знаний моделей специалисты «РТ Лабс» используют скрипты «Робота Макса», базу ответов операторов колл-центра «Ростелекома», обезличенные жалобы и обращения пользователей, поступающие в ведомства, а также ответы на них.

Тестирование моделей продлится до лета, а внедрить одну из них в сервис планируется до конца года.

Пока в министерстве «нет четкого понимания объемов бюджета», которые потребуются на интеграцию LLM-модели, как и финансовой модели взаимодействия заказчика решения и вендора, уточнил источник “Ъ”. В «Ростелекоме» и «Яндексе» отказались от комментариев, в «Сбере» не ответили на запрос.

Доступ к генеративным сервисам на базе LLM обычно тарифицируется, исходя из токенов (смысловых кусочков слов и предложений) в вопросе к сервису и в его ответе. «Сбер» коммерциализировал доступ к GigaChat для разработчиков сторонних сервисов в сентябре 2023 года, «Яндекс» — в декабре (см. “Ъ” от 7 декабря 2023 года). Сейчас компании предлагают разные тарифы, зависящие от объема контекста (количества токенов, которые модель может обрабатывать в одном запросе). «Яндекс» также предлагает на выбор синхронный и асинхронный режим: в последнем ответы генерируются в течение нескольких минут или часов. Источник “Ъ” в одной из IT-компаний предполагает, что «РТ Лабс» по итогам тестирования заключит с одним из двух вендоров разовый контракт, предполагающий поддержку языковой модели.

4,2–6,9 триллиона рублей в год

ожидаемый финансовый эффект от внедрения ИИ для экономики России к 2028 году, по данным компании «Яков и партнеры».

Сервисы, дающие доступ к LLM посредством API (программного интерфейса), обычно не позволяют использовать его для дообучения моделей на сторонних данных, говорит источник “Ъ” в профильной компании. Он считает, что если «РТ Лабс» и сотрудничает в этом плане с каким-либо разработчиком LLM, то между ними уже должен быть заключен договор на дообучение: «Тем более что базовая модель является результатом деятельности компании-разработчика».

После полной интеграции LLM-модель сможет теоретически дообучаться и на тех данных, которые пользователи вводят в чат-бот госуслуг, полагает директор по развитию бизнеса Just AI Светлана Захарова. При этом она подчеркивает, что при интеграции любой LLM-модели с госуслугами оператору портала придется решить проблему обработки данных. Дело в том, поясняет эксперт, что на госуслугах хранятся персональные данные пользователей, которые нельзя отправлять в облако вендора, из-за чего придется внедрять «дополнительные инструменты, способные маскировать такие данные».

Никита Королев, Юрий Литвиненко

Зарегистрируйтесь или войдите, чтобы дочитать статью

Это бесплатно и вы сможете читать все закрытые статьи «Ъ»

Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...