В Google завершили «немую эпоху»
На что способен первый ИИ-генератор видео со звуком
Google представила новую нейросеть для создания видео со звуком. Модель Veo 3 способна сразу генерировать динамическое изображение с аудиодорожкой: реалистичными диалогами и фоновым шумом. До сих пор ни один инструмент не мог делать этого одновременно. В компании назвали разработку выходом из «немой эпохи» генерации роликов. Саму модель аналитики сравнивают с инструментом Sora от OpenAI. Она считается лидером в создании видео, хотя озвучивать контент этот сервис не умеет.
Фото: Google
Фото: Google
Можно ли считать новый продукт Google прорывом? Сооснователь AI Academy Александр Горный в этом сомневается: «Корпорация, безусловно, сделал шаг и для себя, и для развития искусственного интеллекта в целом, но это именно шаг, не глобальный рывок. Все же уже было, просто стало чуть лучше, чуть более связано между собой, но нет драматической разницы между сегодня и вчера. Но, во-первых, это красиво. Во-вторых, поддерживает имидж Google как лидера в технологиях вообще. Тут даже больше речь о пиаре, чем о реальном технологическом успехе. Все же для инвесторов огромным глобальным изменением являются текстовые нейросети. В такие стартапы вкладывают десятки миллиардов долларов, OpenAI стоит космических денег. Когда Google что-то объявляет про тексты, то идет реакция на фондовом рынке, потому что есть влияние на основной бизнес компании, как считают инвесторы.
История про медиа, картинки, видео или музыку в глазах игроков рынка стоит гораздо меньше. Это гораздо более специфическое направление, которое даже в самых радужных мечтах не будет сопоставимо с Google по выручке, обороту и влиянию на мир. Вся наша работа, по сути, строится вокруг текстов. И когда нейросеть создает их, то может быть использована журналистами, юристами, финансистами и так далее. А с картинками работают художники, ну и кинематографисты снимают кино. Но в сравнении со всеми "белыми воротничками" их в несколько раз меньше. Соответственно, в несколько порядков меньше будущая монетизация».
Google также показала отдельный инструмент для создания фильмов под названием Flow. Пользователь может загрузить готовую сцену в виде картинки или сгенерировать ее по описанию. Эти же объекты появятся в следующих кадрах. В интерфейсе есть управление камерой и редактор сцен. Главный редактор портала ITZine.ru Сергей Кузнецов считает, что через два-три года ролики, созданные такими сервисами, станут привычным делом: «Это еще одна возможность создавать контент быстро и просто, распространять его в дальнейшем и зарабатывать на этом деньги. Это интересно и видеографам, кроме того, это очень быстрая генерация каких-то вещей для тендеров, например.
Представьте, что вам нужно понять, как будет выглядеть ролик. Вы можете его быстро сгенерировать и потом его снимать. Уверяю вас, через пару-тройку лет созданные нейросетью видео будут практически во всех рекламных кампаниях.
Чтобы сейчас снять, например, пролет сквозь маковое поле, нужно нанять человека, арендовать дорогую камеру, найти локацию и ориентироваться на период цветения. А здесь то же самое можно создать в любое время и суток: запустили нейросеть, заплатили за контент и получили ролик на руки. Это просто еще один шаг в сторону того, чтобы не тратить кучу денег на людей, которые вручную кадр за кадром станут прорисовывать какие-то вещи, а отдать это нейронке. К чему это приведет? К тому, что создавать фильмы станет проще, быстрее и дешевле. Скорее всего, мы получим чуть больше материала в кинотеатрах. Но тут возникнет вопрос качества и, конечно же, критического мышления режиссеров и сценаристов».
Новая модель уже доступна пользователям, правда, только в США и только подписчикам Google AI Ultra. Стоит она $250 в месяц.
С нами все ясно — Telegram-канал "Ъ FM".