ИИ не справляется с нагрузкой
Почему снижаются лимиты на генерацию контента со стороны пользователей
«Видеокарты плавятся»,— об этом заявил руководитель модели Sora в OpenAI Билл Пиблз. Компания ужесточила условия для генерации видео: теперь бесплатно доступно не более шести запросов в сутки. Другие разработчики в сфере искусственного интеллекта также сократили лимиты для пользователей из-за перегрузки серверов. Так, в Google урезали бесплатный доступ к новой версии Gemini, известной как Nano Banana Pro. При этом корпорация не приводит конкретных цифр и предупреждает, что число доступных генераций может часто и без уведомлений меняться.
Фото: Игорь Елисеев, Коммерсантъ
Фото: Игорь Елисеев, Коммерсантъ
В итоге из-за нехватки мощностей у разработчиков повсеместно будут расти тарифы, считает главный редактор портала Itzine.ru, автор подкаста ForGeeks Сергей Кузнецов: «Несмотря на то, что в целом количество пользователей растет, количество платных подписчиков увеличивается не так быстро, как хотелось бы OpenAI, Google и всем прочим. Так что это попытка стимулировать людей к переходу на платные тарифы. Дело в том, что рынок довольно лимитирован, и, к сожалению, компании не могут начать выпускать больше видеокарт, строить больше дата-центров и делать это моментально. Если в Google понимают, что им нужно через год иметь в два раза больше серверов, то они не могут это физически осуществить, нужно начать сейчас где-то это закупать. Соответственно, как только они начинают приобретать для них большие объемы видеокарт, начинается кризис в этом сегменте, потому что цены тут же начинают расти. Мы видим, что в США существует, например, кризис с оперативной памятью в том числе, и это все накапливается, как снежный ком.
Тут вопрос, как долго они еще смогут предоставлять бесплатные опции.
В целом сейчас уже есть тенденция, что в чат GPT-5.1 доступно ограниченное количество запросов. И если OpenAI понимает, что много людей прямо сейчас начинают запрашивать доступ, то они бесплатным пользователям его ограничивают, а обладатели платной подписки, соответственно, имеют приоритет. За $20 с человека невозможно приобретать серверы. Мне кажется, у них экономика не очень сходится. То есть, с одной стороны, они бы хотели очень сильно повысить тарифы долларов до $100, но, с другой, компании очень много денег тратят на то, чтобы привлечь людей. Конечно, видеогенерация отнимает гораздо больше ресурсов. При этом создание текста, когда у вас миллионы пользователей, тоже требует работы серверов, и вы не можете только владельцам платной подписки предоставлять возможность пользоваться программой, а остальным пользователям говорить: "Извините, подождите несколько дней"».
В случае с моделью Sora при необходимости пользователи могут докупить количество доступных генераций. А OpenAI на этом фоне продолжает говорить о планах расширить возможности монетизации своих продуктов. Лимиты могут объясняться не только чрезмерной нагрузкой на оборудование, отметил гендиректор компании «А-Я эксперт» Роман Душкин: «Эти модели становятся все более доступными всем по всему миру, а модели потребляют токены, а каждой токен фактически — это электроэнергия и потребление вычислительных ресурсов. Но оценить, какие там объемы задействованы, хватает их или нет, затруднительно. Если компания-производитель, провайдер моделей вводят какие-то ограничения, то это может свидетельствовать как о наличии недостатков, так и о том, что есть какие-то другие вопросы. Может быть, они и не носят проблемного характера, но компании говорят, что у них просто не хватает ресурсов для того, чтобы эти вопросы скрыть.
Если же говорить именно про то, будут ли успевать дата-центры за ростом числа пользователей и развитием ИИ, то можно перефразировать это в более понятных метафорах, например, биологической. Будет ли хватать высших нервных центров человека для выполнения тех ресурсоемких вычислений, которые сейчас производятся? Сразу становится немножко смешно, потому что ответ на него абсолютно понятный. Так и здесь: объем ЦОД и количество вычислительных мощностей в нем предопределяет то, сколько модель может вычислить. Такого не может быть, что какому-то мифическому ИИ требуется больше вычислительных ресурсов, а в мире не хватает ЦОД».
Ранее генеральный директор Microsoft Сатья Наделла заявил, что главной проблемой развития искусственного интеллекта стала нехватка электричества для питания серверов.