OpenAI представила новый инструмент под названием ChatGPT Agent, который теперь может выполнять сложные задачи за пользователя, контролируя целый "виртуальный компьютер". Это уже не просто чат-бот: агент способен самостоятельно делать все — от планирования семейного завтрака до подготовки презентаций по конкурентам. Разработчики рассказывают, что модель под новый инструмент обучалась на выполнение сложных задач с помощью нескольких инструментов — текстового браузера, визуального браузера и терминала для загрузки пользовательских данных. Обучение происходило по методу подкрепления, который используется и для других моделей OpenAI. ChatGPT Agent объединяет в себе возможности двух предыдущих инструментов компании — Operator и Deep Research — и создавался единой командой из 20–35 специалистов.
В демо агент подключался к Google Calendar, чтобы найти свободный вечер пользователя и тут же подобрать ресторан с помощью OpenTable. Пользователь мог в любой момент изменить предпочтения или остановить процесс. Также был смоделирован запрос на исследовательский отчёт по Labubus и Beanie Babies — не самая жизневажная задача, но для теста сойдёт. Разработчицы отмечают: инструмент улучшил онлайн-шопинг, а его коллега автоматизировал с его помощью заказы парковки для офиса — каждую неделю без головной боли. ChatGPT Agent имеет доступ ко всему условному компьютеру, а не только к браузеру, что существенно расширяет спектр задач. Правда, быстрости ждать не стоит: выполнение сложных задач может занять 15–30 минут, но всё равно быстрее ручного труда. Перед любым действием, которое нельзя отменить (например, отправка письма или бронирование), агент спрашивает разрешение у пользователя.
Учитывая расширенные возможности, OpenAI активировал специальные меры безопасности, которые уже применялись для предотвращения "биологических или химических угроз" — хотя их использование по прямому назначению не доказано. Аналогичные меры вводились у конкурентов, таких как Anthropic.
Финансовые операции доступны агенту только в ограниченном режиме. Например, если пользователь заходит на финансовый сайт, он не должен уходить с вкладки, иначе инструмент отключится. Пока ChatGPT Agent доступен только для подписчиков Pro, Plus и Team, чуть позже — для корпоративных и образовательных клиентов. Сроки запуска в Евросоюзе и Швейцарии не объявлены.
AI-агенты — новый тренд: все айтишные гиганты теперь заявляют о подобных проектах. Идеально это должно быть как J.A.R.V.I.S. у Железного человека: сам встречу назначит, подарок купит, отчёт подготовит. На практике — чаще помогает с написанием кода и сбором информации. Тема стала особенно заметной после того, как Klarna заявила весной 2024 года: их агент за месяц обработал две трети обращений клиентов — как 700 живых операторов. Далее последовал парад анонсов: Amazon, Meta, Google — у всех "свои" агенты. Google для ускорения проекта даже переманил команду стартапа Windsurf. Выход ChatGPT Agent от OpenAI стал продолжением этой гонки, а также расширил возможности существующих инструментов компании. Интерес к AI-агентам растёт, и теперь задача — сделать их частью обыденной цифровой жизни.
OpenAI выпустила ChatGPT Agent, способный самостоятельно управлять виртуальным компьютером и выполнять за пользователя сложные задачи: планировать встречи, делать онлайн-покупки, генерировать отчёты и презентации. Оригинальный «чат-бот» превратился в настоящего цифрового ассистента — теперь это не примитивная болталка, а автономный исполнитель команд, обученный работать с текстовыми и визуальными браузерами, терминалом и другими инструментами.
Инструмент был создан объединённой командой из двух проектов – Operator и Deep Research. Над ним трудились от 20 до 35 человек, чтобы ChatGPT Agent мог анализировать календари пользователей, составлять план встреч, конфигурировать заказы (например, на офисную парковку), бронировать рестораны и даже проводить исследования или составлять слайды для презентаций. Все задачи решаются множественными цифровыми инструментами под контролем одной модели, и перед каждым необратимым действием система требует разрешения.
Безопасность выстроена на серьёзном уровне: запрещены неконтролируемые транзакции, финансовые манёвры агент не производит; если пользователь уходит со специальной вкладки, всё останавливается. Усиленно предотвращается и возможность использования ИИ в биохимических опасных процессах.
Основа тренда в IT сегодня — создание таких «AI-агентов». Все крупнейшие компании, с Google до Meta, стремятся первыми войти в обиход человека и заменить ему цифровую рутину: обрабатывать запросы, делать покупки, формировать отчёты. Эффективность доказана — Klarna за месяц сэкономила, по словам руководства, работу 700 человек одним лишь своим агентом.
ChatGPT Agent пока доступен подписчикам Pro, Plus и Team и работает только вне ЕС и Швейцарии; позднее появится для корпоративных и образовательных клиентов. В итоге мы наблюдаем формирование новой цифровой реальности: ИИ становится незаменимым помощником по всем бытовым и бизнес-задачам, а человек ещё чуть дальше уходит от рутины. И да, сериал про "ИИ покоряет мир" таки продолжается...