Цена запроса
Экономия бизнеса на ИИ оборачивается затратами на инфраструктуру
Открытые большие языковые модели в среднем в 40 раз дешевле проприетарных при незначительном отставании в характеристиках, считают аналитики Nodul. Выбор же между языковыми моделями определяется не только ценой за единицу обработки информации, но и полной стоимостью владения: внедрение open-source-решений требует инвестиций в инфраструктуру и дефицитные кадры. Крупный бизнес чаще «дообучает» открытые модели, тогда как малые компании предпочитают готовые сервисы с оплатой по факту использования.
Фото: Евгений Павленко, Коммерсантъ
Фото: Евгений Павленко, Коммерсантъ
Большие языковые модели (Large Language Model, LLM), работающие на базе open-source (открытого кода, свободные), в среднем в 40 раз дешевле закрытых и коммерческих, при этом они незначительно уступают последним в характеристиках, отмечают аналитики компании Nodul. Стоимость использования моделей с открытой лицензией рассчитывается исходя из аренды серверов и диапазона скорости генерации текста (токенов в секунду — это скорость обработки информации, где токен — это часть слова или знак препинания). Закрытые модели, напротив, принадлежат крупным IT-компаниям и доступны только в виде готовых сервисов через API или веб-интерфейсы. Пользователи не могут изменять их, а оплата зависит от количества и скорости генерируемых токенов. Для входящих и исходящих токенов цены отличаются.
Например, при минимально необходимой конфигурации сервера и его максимальной загрузке стоимость 1 млн токенов в открытых моделях варьируется от 23 (GPT OSS) до 77 руб. (Qwen). При увеличении скорости генерации текста стоимость снижается до 17 и 51 руб. соответственно. У закрытых зарубежных моделей стоимость миллиона входящих токенов находится в диапазоне от 140 руб. у GPT-5.2 до 400 руб. у Claude Opus 4.5. Среди российских решений 1 млн токенов в закрытых моделях GigaChat 2 max и Yandex GPT pro 5 стоит 650 и 1200 руб. соответственно, приводят данные аналитики Nodul. Однако руководитель платформы Yandex AI Studio (Yandex B2B Tech) Артур Самигуллин отмечает, что «эта оценка проводилась на неактуальном поколении модели». При аналогичных расчетах с текущей версией Alice AI LLM стоимость 1 млн входящих токенов составит около 660 руб. При этом, по итогам 2025 года потребление токенов через API в платформе Yandex AI Studio выросло примерно в семь раз.
Максут Шадаев, глава Минцифры, апрель 2025 года, «Российская газета»:
«У нас есть датасеты, на которых мы можем учить и тренировать наши модели. Стоит задача от отдельных пилотов перейти к массовому внедрению такого рода решений».
Для объективного сравнения стоимости использования LLM нужно смотреть на Total Cost of Ownership (TCO — полная стоимость владения), объясняют в пресс-службе Just AI. Для запуска мощного open-source-решения нужны дефицитные и дорогие видеокарты или аренда облачных GPU (графический процессор). Также значительные затраты придутся на ML-инженеров, достаточно дефицитных специалистов. В целом выбор между проприетарной и открытой моделью является стратегическим, поэтому всегда учитывает, кроме стоимости использования, такие критерии, как регуляторные требования в отрасли, круг решаемых задач, контроль над данными, необходимость доработки под специфику бизнеса и последующего масштабирования.
При этом Артур Самигуллин отмечает, что, даже если выбирать open-source-модели, их выгоднее использовать в облачной инфраструктуре, нежели разворачивать самостоятельно. «В противном случае компании придется купить или арендовать вычислительные мощности, обеспечить быструю и стабильную работу модели и ее безопасность. Фактически все это уже входит в стоимость моделей в облаке по API»,— добавил он.
«Большие универсальные модели часто "всё знают", но прикладные задачи решают нестабильно и обходятся дорого из-за высоких требований к инфраструктуре»,— отмечает пресс-служба MWS AI (входит в структуры МТС).
Поэтому крупный бизнес часто выбирает открытые модели не только из-за стоимости, а потому, что их можно «дообучить» на собственных данных под специализированные задачи, когда точности универсальных проприетарных моделей не хватает.
Закрытые модели больше подходят малому бизнесу, считает исполнительный директор Aura System Вячеслав Васильков, так как это быстрее и дешевле, чем разворачивать инфраструктуру, где вам нужен отдельный ML-инженер и сервер с GPU, чтобы заниматься «дообучением» модели. Стартовать проще с закрытыми моделями, но если бизнес растет, то безопаснее развернуть open-source-модель и «донастроить» ее до необходимого компании уровня.