Задело за живое

Александр Леви — о «живых фото» от «Алисы»

Обозреватель “Ъ FM” Александр Леви рассказывает о том, какие новые опции предлагает «Алиса».

Фото: Ирина Бужор, Коммерсантъ

Фото: Ирина Бужор, Коммерсантъ

В мобильном приложении «Алиса» появилась функция оживления изображений. Пользователю достаточно загрузить картинку, задать промт в тексте или доверить сценарий сервису и дождаться результата. Примерно через 20-30 секунд в зависимости от загрузки искусственный интеллект создаст видеоролик в разрешении 480p и продолжительностью около четырех секунд. Сейчас функция в бета-версии доступна только в мобильном приложении. В будущем разработчики обещают внедрить ее в веб и другие сервисы «Яндекса».

В самом оживлении картинок нет инновации или уникальных фишек (все мы помним про картины в Хогвартсе). Магазины приложений полны аналогов. И большинство из них — это так называемые монетизаторы или, что грубо, но точно описывает суть, «дойные приложения». Подписка и постоянные донаты — вот к чему они сводятся. При этом в развитии ИИ-инструментов авторы таких приложений обычно не заинтересованы. С теми же самыми картинками с точки зрения конгруэнтности, естественности объектов «Алиса» справилась лучше, чем сервисы и приложения, в которых я оживлял изображения раньше. Особенно это касается фотографий людей. Они получились столь хорошими, что я неожиданно зарыдал от полученного видео с моей бабушкой. Ее спокойное, даже немного напряженное лицо на фото, где ей 15 лет, вдруг расслабилось и очень тепло и беззаботно заулыбалось. Обман технологий, на который я согласен всем сердцем.

Конечно, разработчикам «Алисы» еще есть над чем поработать. Во-первых, подготовиться к возможным нагрузкам. Почти пару часов я просто не мог зайти в приложение и испытать его, и это при том, что разрешение и продолжительность роликов минимально приемлемые. Для работы со старыми фотоснимками, анимациями аватарок или изображений в книгах и журналах 480p и четырех секунд как будто достаточно. Но если креаторам на постоянной основе создавать видео для соцсетей, то этого мало. Уверен, будут совершенствовать и алгоритмы генерации. Пока на готовых роликах легко заметить анахронизмы или чуть ускоренные действия, характерные для видеохроники. Все это требует тонкой настройки, которая в том числе будет опираться на огромный набор будущих генераций.

Александр Леви