OpenAI запускает модели o3 и o4-mini: будущее уже здесь

16.04.2025, 20:34:33ИТ✮✮✮✮✮✮

Новые модели OpenAI o3 и o4-mini теперь позволяют "думать с помощью изображений".
Всего через два дня после анонса GPT-4.1, OpenAI представляет не одну, а целых две новые модели. Сегодня компания объявила о публичной доступности o3 и o4-mini. По словам OpenAI, o3 — это самая продвинутая модель их системы раздумий на сегодняшний день, демонстрирующая "высокие результаты" в области программирования, математики и науки. Что касается o4-mini, OpenAI позиционирует ее как более дешевую альтернативу, которая тем не менее обеспечивает "впечатляющие результаты" в тех же областях.

Еще более замечательно, что обе модели предлагают новые возможности, отсутствующие в предыдущих системах OpenAI. Впервые модели раздумий компании могут использовать и комбинировать все инструменты, доступные в ChatGPT, включая веб-серфинг и генерацию изображений. По словам компании, эта возможность позволяет o3 и o4-mini более эффективно решать сложные многоэтапные задачи и "делать реальные шаги к самостоятельному действию".

При этом o3 и o4-mini могут не просто видеть изображения, но и интерпретировать и "думать" о них, что значительно расширяет их возможности обработки визуальной информации. Например, вы можете загрузить изображения досок, диаграмм или эскизов — даже низкокачественные — и новые модели поймут их. Они также могут изменять изображения в процессе своих размышлений.

"Сочетание мощной логики с полным доступом к инструментам приводит к заметно более высоким результатам в академических тестах и реальных задачах, устанавливая новый стандарт как в интеллекте, так и в полезности", — заявили в OpenAI.

Отдельно OpenAI представляет нового кодирующего агента (в духе Claude Code) по имени Codex CLI. Он предназначен для того, чтобы предоставить разработчикам минимальный интерфейс, который они могут использовать для соединения моделей OpenAI с их локальным кодом. На выходе он работает с o3 и o4-mini, поддержка GPT-4.1 уже в пути.

Сегодняшнее объявление последовало за заявлением генерального директора OpenAI Сэма Олтмана о том, что компания меняет курс на дорожной карте, которую он изложил в феврале. Тогда Олтман заявил, что OpenAI не выпустит o3, которую компания впервые презентовала в конце прошлого года, как самостоятельный продукт. Однако в начале апреля он анонсировал "изменение планов", отметив, что OpenAI движется вперед с выпуском o3 и o4-mini.

"Существует множество причин для этого, но самой захватывающей является то, что мы сможем сделать GPT-5 намного лучше, чем изначально думали," — написал он в X. — "Мы также столкнулись с трудностями в интеграции всего, и мы хотим убедиться, что у нас достаточно мощностей, чтобы поддержать то, что мы ожидаем — беспрецедентный спрос."

Это означает, что оптимизация, о которой Олтман обещал в феврале, вероятно, придется подождать до выпуска GPT-5, который, по его словам, появится в "ближайшие несколько месяцев".

Тем временем, пользователи ChatGPT Plus, Pro и Team могут начать использовать o3 и o4-mini, начиная с сегодняшнего дня. В ближайшие несколько недель OpenAI запустит o3-pro, еще более мощную версию своей флагманской модели раздумий, и предоставит ее подписчикам Pro. На данный момент эти пользователи могут продолжать использовать o1-pro.

perec.ru

Как же нам повезло! OpenAI пришла к пониманию, что людям нужно больше искусственного интеллекта, и — как по заказу — сразу выпустила две новые модели, o3 и o4-mini. Работая по старинной схеме с "клиентом" на переднем плане, компания, видимо, вдруг решила, что делать "умные" модели — это не только модно, но и удобно для оплатежеспособной аудитории.

o3 позиционируется как настоящее чудо технологической мысли, достигающее "высоких результатов" в программировании и науке. Куда будут направлены эти "высокие результаты" — в инновационные проекты или в создание контента для подкастов, покрывающих каждую грань моды на умные машины, пока одноразовые поп-культуры на битком набитых мероприятиях делают свое черное дело — вопрос открытый.

А вот маленькая версия, o4-mini, настоящая находка для заведомо бедных гениев. Разработчики могут радоваться – дешевое обращение с искусственным интеллектом теперь стало доступно! Всего за небольшую плату вы сможете освоить программирование, математику и науку — конечно, если вас не сморит уловка, что вся ваша личная информация, возможно, будет продана по дружбе за спиной.

Но и это еще не всё. Модели теперь могут не просто "думать", но и "видеть" изображения! Прямо из научной фантастики, не иначе. Пользователям предлагается загружать изображения — досок и диаграмм, даже если качество желает лучшего. И вот ваш алгоритм уже восстанавливает, анализирует и, разумеется, действует на основе этого бунта визуальной информации. Замечательно! Похоже, теперь нам не нужно морочить голову с шапками-ушанками для реальных ученых, ведь в их очередь не просто ждут, а вскоре помогут свои пилотные проекты запустить.

А выход Codex CLI — это словно икона на алтаре агентский программ. Прямо тапки подкинуть интернете, чтобы у разработчиков замаячили тени множественных встреч и конфликтов. Главное, теперь у них есть удобный интерфейс, который подводит к náслужности с OpenAI, а там, глядишь, и череда патентов обеспечены. Похоже, именно это и было написано в звездной дорожной карте.

В целом, слегка потряхиваемая новость о "новых направлениях" от генерального директора Сэма Олтмана сдерживает ожидания рынка, который, стремясь к верхам, должен противостоять натиску реальности. Задержка разработки, конечно, не в его стиле — это новая версия GPT-5 прячется за февральскими планами, и нам будут обеспечены "удивительные" новости около самых ожидаемых рекордов.

Так что оставайтесь на связи, пока громкий шум от o3 и o4-mini захватывает мир, а мы всё еще ждем, как две капли воды, следующую волну инноваций… или, возможно, просто новые цены.