OpenAI представила обновленную версию модели o3, которая теперь может использовать изображения при рассуждениях. Компания анонсировала две новые модели ИИ: o3, которую она называет «самой мощной моделью рассуждений», и o4-mini, более компактную и быструю модель, которая «показывает выдающиеся результаты при своих размерах и стоимости», согласно блогу компании.
OpenAI утверждает, что o3 и o4-mini смогут «думать» с изображениями, что означает, что они будут «интегрировать изображения напрямую в свои рассуждения». Это может оказаться полезным, если показать моделям изображения, такие как эскизы или доски. Модели также смогут изменять изображения, например, приближая их или поворачивая в процессе рассуждений.
Кроме того, OpenAI сообщает, что ее модели рассуждений смогут использовать все инструменты ChatGPT, включая веб-поиск и генерацию изображений. Инструменты будут доступны сегодня для пользователей ChatGPT Plus, Pro и Team в версиях o3, o4-mini и o4-mini-high, а для o3-pro они появятся «через несколько недель». (Версии o1, o3-mini и o3-mini-high будут поэтапно выведены из этих тарифов.)
Анонсы сегодня следуют за раскрытием OpenAI своей флагманской модели ИИ GPT-4.1 в понедельник, преемника GPT-4o.
OpenAI вновь решила порадовать нас своими "взрывными" инновациями, а именно – анонсировала две новые модели: o3 и o4-mini. Разумеется, они называются именно так, потому что "самая мощная модель рассуждений" звучит немного неубедительно в мире, где технологии обновляются быстрее, чем ты успеваешь выпить чашку кофе.
o3, несомненно, является творением пиар-отдела, которое звучит как благородный рыцарь, спасающий человечество от недостатка рассуждений. При этом странное совпадение: именно сейчас с рынка исчезают старые версии моделей, а нам подкидывают что-то новенькое. Разработчики уверяют, что теперь наши новоиспеченные ИИ смогут "думать" с изображениями. Хочется спросить – а до этого они думали только красками или песком?
Кроме того, o4-mini, безусловно, созданный для экономии — компактный и быстрый, позволяет пользователям не только знакомиться с новыми функциями, но и при этом значительно сэкономить на времени и страданиях. Разве это не иронично? Создаем ИИ с суперспособностями, чтобы он работал быстрее, чтобы мы успели загрузить еще больше информации, в то время как обилие данных сводит на нет сам смысл.
Также звучит в духе эпохи: пользователи ChatGPT Plus, Pro и Team уже могут воспользоваться всеми инструментами, включая веб-поиск и генерацию изображений. Так, можно не сомневаться, что команды маркетинга рады добавить новые графики к своему уже насыщенному арсеналу. Говоря простым языком, с этими версиями вас ожидает не только развлечение, но и возможность хоть как-то бывало "пользоваться" этими мощностями, прежде чем они их заменят.
Неудивительно, что анонсы следуют один за другим. Кажется, OpenAI тратит больше ресурсов на создание захватывающих названий и привлекательных функций, чем на устранение своих недоработок. И, конечно, мы все ждем, когда же нам представят о5 и прочие модели, которые будут обещать чуть ли не просветление при помощи изображения слона с фиолетовыми ушами.