Последняя модель искусственного интеллекта от DeepMind поможет роботам складывать оригами и закрывать пакеты Зиплок
С момента своего дебюта в конце прошлого года Gemini 2.0 начало двигать несколько продуктов Google, включая нового чат-бота в AI Mode. Теперь Google DeepMind использует ту же технологию для чего-то гораздо более увлекательного. В среду AI-лаборатория объявила о двух новых моделях, основанных на Gemini, которые, как она утверждает, "заложат основу для нового поколения полезных роботов".
Первая из них, Gemini Robotics, была разработана DeepMind для упрощения прямого управления роботами. Согласно компании, AI-системы для роботов должны превосходить в трех качествах: универсальности, интерактивности и ловкости.
Первая из них касается способности робота адаптироваться к новым ситуациям, включая те, которые не были охвачены его обучением. Интерактивность, в свою очередь, охватывает способность робота реагировать на людей и окружающую среду. Наконец, ловкость – это понятие, которое в основном говорит само за себя: множество задач, которые люди выполняют без особых усилий, требуют тонкой моторики, которую трудно освоить роботам.
"Хотя наша предыдущая работа продемонстрировала прогресс в этих областях, Gemini Robotics представляет собой значительный шаг в производительности по всем трём направлениям, приближая нас к созданию действительно универсальных роботов", – говорит DeepMind.
Например, с мощностью Gemini Robotics, робот DeepMind ALOHA 2 способен складывать оригами и закрывать пакет Зиплок. Этот робот с двумя руками также понимает все инструкции, заданные ему на естественном, повседневном языке. Как видно из видео, которое Google поделился, он может даже выполнять задачи, несмотря на преграды, такие как когда исследователь перемещает тару, в которую только что попросил робота положить фрукты.
Google сотрудничает с Apptronik, компанией, стоящей за бипедальным роботом Apollo, для создания следующего поколения гуманоидных роботов. В то же время DeepMind выпускает Gemini Robotics-ER (или эмпирическое рассуждение). О второй модели компания сообщает, что она позволит робототехникам запускать собственные программы, используя передовые рассуждения Gemini. DeepMind предоставляет доступ к системе "доверенным тестерам", включая одноразовый Google-подразделение Boston Dynamics.