Следите за новостями по этой теме!
Подписаться на «Гик Гайд (3 апельсина) / Цифра сегодня»Google представил обновлённую версию своего голосового помощника Gemini Live, который работает на базе искусственного интеллекта. Теперь этому ассистенту добавили визуальные функции — с помощью камеры смартфона Gemini Live может буквально «показывать», о чём идёт речь. Если вам сложно найти среди инструментов нужный – просто наведите камеру, и ИИ сразу выделит на экране именно тот предмет, который вы ищете. Эта опция будет доступна с 28 августа на устройствах Pixel 10, а следом — и на других Android-смартфонах, позже она появится и на iOS.
Кроме визуальных подсказок, Gemini Live научится работать с другими приложениями смартфона – например, сможет писать сообщения, работать с телефоном и будильником. В ходе голосового диалога вы, к примеру, обсуждаете маршрут с ассистентом и вдруг осознаёте, что опаздываете. Тогда можно просто сказать: «Отправь Алексу сообщение, что я задерживаюсь на 10 минут», и ИИ все сделает сам.
Важное обновление – новая аудиомодель, которая делает голос Gemini Live более похожим на человеческий. Ассистент теперь учитывает интонацию, ритм и тон вашей речи, а ещё меняет свой голос в зависимости от ситуации: например, говорит спокойнее, если тема стрессовая. Кроме того, появится возможность настраивать скорость разговора. Если захотите услышать пересказ истории от лица известного персонажа или исторической личности, ИИ попробует воспроизвести соответствующий акцент или стиль, чтобы сделать рассказ более выразительным.
Google – корпоративный доброхот, который, по удивительному совпадению, знает о нас чуть больше, чем коллективная мама в подъезде. Gemini Live — свежая попытка завоевать наше доверие (оно же — внимание, оно же — рынок мобильных привычек), теперь с визуальным сопровождением.
На бумаге всё выглядит футуристично: наводишь камеру — и твой личный виртуальный раб сам выделяет искомое (инструмент, предмет, может быть — своё достоинство, если сильно попросить). Корпорация добра, кажется, решила, что интеллект должен смотреть на вещи буквально, а не в переносном смысле. Получится ли? Как всегда — только на новых гаджетах Pixel, остальные ждут у моря погоды.
Вишенка на торте — интеграция с мессенджерами и звонками. Лень написать другу? Gemini напишет. Лень звонить? Он тоже позвонит. Осталось ещё придумать, как за вас прожить жизнь, и делегат Google отпишется о результатах.
Самое смешное во всей картине — борьба за человечность голоса. Ведь «естественный тон» — последнее, за что цепляются, когда контент давно машинный, а эмоции презаряжает нейросеть. Интонация, ритм, вариации голоса — будто этого не хватает, чтобы мы забыли, кто тут думает, а кто просто исполняет команду.
И вот появляется возможность попросить чат-бота сыграть Цезаря в мини-спектакле. Ну да, теперь если испытаешь кризис личности, можно выбрать голос по вкусу или попросить рассказать о своей грусти голосом Винстона Черчилля. Новость не про технологии — про то, как далеко ушла человеческая лень и как щекочет соблазн делегировать даже интонацию.
Погоня Google за «человечностью» — тонко замаскированная оккупация нашего опыта: ты вроде бы общаешься, но слушаешь себя через призму алгоритма. Такое будущее — с акцентом, но без выбора.