Теперь вы можете генерировать изображения прямо в ChatGPT и Sora. OpenAI только что сообщила, что все пользователи скоро смогут создавать изображения непосредственно внутри ChatGPT. Эта функция будет доступна для пользователей ChatGPT Plus, Pro, Team и, что важнее всего, для бесплатных пользователей. Это будет инструментом для создания изображений по умолчанию в версии 4o, так что вам не придется запускать Dall-E каждый раз, когда вы захотите нарисовать кошку в космосе, которая ест лазанью или что-то в этом духе. Эта функция также появится в Sora. Компания говорит, что платформа "будет генерировать качественные изображения на основе ваших подсказок, беседы и загруженных файлов". К последнему пункту, она сможет преобразовывать уже существующие изображения на основе подсказок. OpenAI также хвастается значительными улучшениями в текстовом рендеринге и контекстуальном понимании. Эти новые инструменты предназначены как для личного, так и для профессионального использования. Поэтому OpenAI приводит несколько примеров, где такая генерация изображений может быть полезной. Это включает в себя создание инфографики, графики для продвижения в социальных сетях и изображения с большим количеством текста, как видно ниже. Будучи современным инструментом для генерации, он также может справляться с высококачественной графикой. Компания утверждает, что он обладает "сильной способностью к фотореалистичности, включая точность света, теней и текстур". Способность понимать контекст также может быть полезной, так как OpenAI говорит, что это может быть использовано для создания "постера с птицами, найденными в Центральном парке" или "визуализации эпохи истории искусства, обсуждаемой ранее в беседе". Поздоровайтесь с GPT-4o, нашей новой флагманской моделью, которая может рассуждать в реальном времени по аудио, визуальному ряду и тексту: https://t.co/MYHZB79UqNТекст и изображение вводятся сегодня в API и ChatGPT, а голос и видео появятся в ближайшие недели. Она построена на GPT-4o, модели ИИ, впервые выпущенной в прошлом году. Буква "o" обозначает "омни", что ссылается на многофункциональные способности модели. Это то, что позволяет многим из вышеупомянутых функций, например, возможности изменять загруженные файлы. Новости сегодняшнего дня выглядят как еще один шаг на долгом пути к функциональности "одного ИИ, который управляет всеми", о которой Сэм Алтман намекал несколько недель назад.