OpenAI внедряет генерацию изображений на базе GPT-4o в ChatGPT.
Сегодня OpenAI начинает интеграцию новых возможностей генерации изображений напрямую в ChatGPT — эта функция называется «Изображения в ChatGPT». Теперь пользователи могут использовать GPT-4o для создания изображений прямо в ChatGPT.
Этот первоначальный выпуск сосредоточен исключительно на создании изображений и будет доступен в рамках подписок ChatGPT Plus, Pro, Team и Free. Лимит использования для бесплатной версии такой же, как и у DALL-E, сообщила представительница компании Тая Кристиансон изданию The Verge, добавив, что у них «нет конкретного числа для публикации» и «это может изменяться со временем в зависимости от спроса». Согласно FAQ ChatGPT, ранее пользователи бесплатной версии могли генерировать «три изображения в день с DALL-E 3». Что касается дальнейшей судьбы DALL-E, Кристиансон сказала, что «фаны» всё равно «будут иметь доступ через кастомизированный GPT».
«Эта модель является значительным шагом вперед по сравнению с предыдущими моделями», — сказал ведущий исследователь Габриэль Гох, добавив, что команда использовала «омнимодальную» модель GPT-4o — то есть модель, которая может генерировать любой тип данных, таких как текст, изображения, аудио и видео — в качестве основы для этой функции.
Некоторые улучшения, о которых упомянул Гох, включают «связывание», которое относится к тому, насколько хорошо генераторы изображений на базе ИИ поддерживают правильные отношения между атрибутами…
Читать полную статью в The Verge.