Новости ИТ: Приложение Google Gemini теперь поддерживает аудиофайлы и новые языки поиска | Новости IT perec.ru

Приложение Gemini теперь работает с аудио: что нового у Google

09.09.2025, 03:51:10 ИТ
Подписаться на «Рифы и пачки / Твоя культура»
Приложение Gemini теперь работает с аудио: что нового у Google

Google представила три заметных обновления Gemini и связанных с ней продуктов: теперь приложение Gemini понимает и обрабатывает аудиофайлы, в поиске появилось пять новых языков, а сервис NotebookLM научился делать отчёты в самых разных стилях — от блогов до шпаргалок и тестов.

По словам Джоша Вудварда, вице-президента Google Labs и проектов Gemini, поддержка аудиофайлов в приложении стала наиболее ожидаемой функцией — пользователи просили именно это чаще всего. Теперь бесплатная версия Gemini позволяет загружать аудиозаписи длительностью до 10 минут (и не более пяти раз в сутки), а у подписчиков AI Pro или AI Ultra лимит — три часа. Каждый запрос поддерживает до 10 файлов разных форматов, включая те, что находятся в ZIP-архивах.

Google Search с режимом искусственного интеллекта (AI Mode) теперь говорит на пяти новых языках: хинди, индонезийском, японском, корейском и бразильском португальском. Это стало возможно благодаря интеграции Gemini 2.5. Теперь пользователи могут формулировать сложные вопросы на родном языке и получать глубокие результаты поиска.

Дообновился и NotebookLM — искусственный интеллект от Google теперь создаёт отчёты по загруженным вами документам и медиа на более чем 80 языках. Стандартные стили — учебные материалы, краткие доклады, блог-посты, карточки для запоминания и тесты. Более того, пользователь может выбирать структуру, тон и стиль результатирующего текста, создавая собственные форматы. Google обещает, что эта функция станет доступна всем до конца недели.

Любопытно, что если функция работы с аудио только сейчас дошла до приложения Gemini, то в NotebookLM она уже была реализована — и позиционируется как средство поиска закономерностей в файлах всех форматов.

В последнее время Google будто помешалась на внедрении функций, связанных с искусственным интеллектом. Например, в августе Gemini начала сама вспоминать детали прошлых разговоров и предпочтения пользователей, а бесплатная версия приобрела доступ к видеогенератору Workspace Vids. В сентябре модуль Photos обновился до Veo 3, а пользователи получили возможность создавать четырехсекундные немые ролики из собственных фотографий.


PEREC.RU

Google очередной раз напоминает миру — нет такой функции, которую она не успеет добавить, если только об этом попросит хотя бы малочисленная, но активная армия пользователей. Да, теперь Gemini наконец-то умеет не только видеть, но и слышать — хотя бесплатный лимит в 10 минут выглядит как слегка издевательское напоминание: плати, если хочешь общаться по-настоящему. Pro-тарифы мерцают на горизонте цифрового Китая, как лакомый сырок в мышеловке.

Замечаете новый язык? Отлично, только если это вдруг японский или индонезийский. О русскоговорящих Google вспоминает редко, будто мы — реликтовые мамонты технологической эволюции. Но не стоит грустить — зато теперь в NotebookLM любой, кто не ведёт дневник для прокурора, может оформить свой бред в формате шпаргалки или сделать из собрания скриншотов мини-экзамен для соседа.

В сентиментальных ретроспективах можно вспомнить и давние обещания — мол, ИИ изменит всё. Судя по обновлениям Google, пока изменилось только количество нажатий в интерфейсе. Если рассматривать сегодняшнюю гонку как этап великой селекции, зарубежные продукты как обычно творят вне России и для очень настойчивых. Зато цитаты Ницше всегда актуальны в битве человека и алгоритма: кто долго смотрит в Google, тот рискует услышать наконец свой голос — хоть раз в 10 минут.

Поделиться

Похожие материалы