Следите за новостями по этой теме!
Подписаться на «Гик Гайд (3 апельсина) / Цифра сегодня»Искусственный интеллект Gemini от Google получил новую функцию: теперь любой желающий сможет превратить обычную фотографию в короткий видеоролик с помощью этого сервиса. За всеми чудесами стоит модель Google Veo третьего поколения, которая из одной картинки создает восьмисекундное видео, снабжённое сгенерированным ИИ звуком. Да-да, нейросеть не только рисует картину движения, но и озвучивает: наложит фоновый шум, добавит звуки окружающей среды и, если попросить, даже проговорит текст.
Пока что воспользоваться этой магией могут только абоненты сервисов Google AI Ultra и Pro — и только «в отдельных регионах». На сайте функция доступна уже сегодня, а на мобильные устройства доберётся в течение недели.
Чтобы запустить генерацию видео, нужно всего лишь зайти в инструменты, выбрать «видео», загрузить своё фото и описать в тексте, каким образом с ним следует поступить — например, как оно должно двигаться. Для самых взыскательных предусмотрена возможность добавить сценарий для озвучки: тут и диалоги, и эффекты, и атмосферный шум — Google обещает, что звук будет синхронизирован с происходящим на экране. На выходе пользователь получает видеофайл в формате MP4 с разрешением 720p и соотношением сторон 16:9 — идеальный случай для соцсетей и сторис.
В Google намекают на гигантские перспективы: теперь пусть оживут ваши скучные объекты, школьные рисунки станут анимацией, а природа будет шевелиться даже на ваших дачных фото. К каждому видеоролику добавляют заметный водяной знак о том, что это продукт ИИ, и ещё один — невидимый, чтобы особо хитрые одарённые не выдавали сгенерированное за своё искусство.
Кстати, нечто похожее Google интегрировал и в свой киношный AI-инструмент Flow, с которым компании носится с марта. Но теперь не обязательно запускать отдельное приложение, если хочется «оживить» фотографию. Дополнительно стало известно, что Flow сегодня становится доступным в 75 новых странах вместе с расширением новой видеофичи Gemini.
Google, кажется, окончательно решил, что люди не справляются с оживлением своих унылых пейзажей. В ход пошёл проверенный набор: искусственный интеллект, подписочная модель и немного доброго маркетингового пафоса.
Gemini научился превращать фотографии в восьмисекундные ролики, которые не только двигаются — они ещё и громко себя ведут, заставляя завывать листья и даже произносить звукосочинённые реплики. Аудио — отдельный пир для ушей: всё будет идеально совпадать с каждым пикселем. Такая избыточная забота, что даже ваши детские рисунки оживут и прочтут стихи.
Вот только воспользоваться этим будут, как обычно, не все: опция доступна избранным — обладателям Ultra и Pro подписок, да ещё и только в благословенных "выбранных регионах". Россия, конечно, в очереди может не стоять.
Для старта требуется минимум движений — нажал, загрузил, загадал желание, ИИ перекрасил унылый снимок в современную медиа-химеру и добавил пару водяных знаков. Даже у особо рвущихся к славе не выйдет прикинуться новым Кэмероном.
Грусть только одна: всё это мы видели. Аналогичное в Google Flow появилось ещё весной. Теперь это просто интегрировали и увеличили охват, а списки доступности торжественно надувают до 75 новых стран. Ждём, когда AI сам начнет делать новости и писать головоломные посты в Telegram — чтобы журналистам окончательно стало нечего делать. А пока искусственный интеллект поднимает ставки, живые люди всё чаще изображают удивление и грусть. Мир никогда не будет прежним – но он и раньше не был особенно живым.