Коммерсантъ FM

Beeline Cloud представил Token Factory — платформу для корпоративного AI-инференса

Beeline Cloud запустил Token Factory — собственный сервис для инференса больших языковых моделей (LLM). Платформа позволяет корпоративным клиентам интегрировать передовые нейросети в свои бизнес-процессы, используя привычный OpenAI-совместимый API и защищенную инфраструктуру российского облака.

Сервис развернут на базе собственной GPU-инфраструктуры Beeline Cloud. Это гарантирует клиентам высокую скорость работы и предсказуемую задержку (latency), а также полное соответствие российским требованиям по локализации данных и информационной безопасности. На текущем этапе Token Factory работает в режиме закрытого пилотного проекта с участием ряда крупных корпоративных заказчиков.

Первым пользователям уже доступна GLM 5.1 — одна из самых производительных открытых моделей нового поколения. В ближайшее время каталог будет расширен за счет интеграции Kimi K2.6 и DeepSeek V4, предназначенных для решения сложных аналитических задач, а также линейки более легких моделей для рутинных операций, таких как классификация, извлечение данных, поддержка при написании кода и работе с документацией. Такой широкий состав каталога позволит компаниям гибко балансировать качество ответов, скорость генерации и стоимость каждого токена в зависимости от конкретного бизнес-сценария.

«Token Factory — это элемент технологического суверенитета, без которого дальнейшее развитие корпоративного AI в России невозможно. Бизнесу нужен предсказуемый доступ к передовым LLM в защищенном контуре, без зависимости от санкционно уязвимых внешних провайдеров и без компромиссов по latency, приватности данных и стоимости токена. Запуская сервис, мы фактически открываем для рынка целый класс задач — от автоматизации внутренних процессов до построения собственных AI-агентов и продуктов на их базе», — отметил директор по ИИ Beeline Cloud Михаил Степнов.

«Мы видим устойчивый спрос на инференс-as-a-service* со стороны корпоративных заказчиков — банков, ритейла, промышленности, телекома. Token Factory отвечает на этот запрос прозрачной токенной экономикой, корпоративным SLA и нативной интеграцией с остальной инфраструктурой Beeline Cloud. Участники пилота получают не только доступ к моделям, но и сопровождение наших инженеров на этапах внедрения и продуктивизации», — прокомментировал директор по продажам и маркетингу Beeline Cloud Анатолий Бибиков.

Подробнее на сайте beeline.ru.

*инференс-as-a-service — инференс как сервис.

18+

ПАО «ВымпелКом»
г. Москва, ОГРН 1027700166636

Реклама