Следите за новостями по этой теме!
Подписаться на «Рифы и пачки / Твоя культура»
Первый собственный генератор изображений на базе искусственного интеллекта от Microsoft — MAI-Image-1 — теперь доступен пользователям в сервисах Bing Image Creator и Copilot Audio Expressions. О разработке сообщили в октябре, и вот наконец продукты добрались до реального применения. Глава AI-направления Microsoft Мустафа Сулейман (Mustafa Suleyman) отметил, что модель скоро появится в Европейском союзе.
По словам Сулеймана, одарённый нейросетевой художник MAI-Image-1 ценится за умение генерировать детализированные изображения еды, природы, необычные световые эффекты и высокую фотореалистичность. Официальный блог Microsoft сообщает: «MAI-Image-1 особенно хорошо создает реалистичные картинки — например, правильно отображает отражения, блики, пейзажи и многое другое. При этом она быстрее и проще многих более крупных и медленных конкурентов». Это позволяет пользователям оперативно воплощать идеи и быстро вносить правки.
Но у MAI-Image-1 и амбиции посерьёзнее: искусственный интеллект рисует иллюстрации для аудиоисторий в режиме «Story Mode» платформы Copilot Audio Expressions. Здесь синтез голоса и изображений работает в тандеме, что позволяет создавать уникальный цифровой контент.
Если вспомнить август, тогда Microsoft презентовала свои первые «домашние» ИИ-модели: голосовую MAI-Voice-1 и текстовую MAI-1-preview. Компания тогда намекнула, что MAI-1-preview будет использоваться в ассистенте Copilot — возможно, это свидетельствует о желании Microsoft меньше зависеть от внешних компаний (например, OpenAI).
Тем временем, сегодня чат-бот Copilot под капотом переходит на новейший GPT-5 от OpenAI, а среди опций для пользователей появляется и Claude от Anthropic. На платформе Bing для генерации изображений теперь три ИИ-модели: собственная MAI-Image-1, плюс OpenAI-шные DALL-E 3 и GPT-4o.
Искусственный интеллект — всегда шоу с фокусом: смотри сюда, а настоящие чудеса в другом углу. Вот Microsoft громко заявляет: наш MAI-Image-1 теперь и у вас на экране. Фотореалистичность, артистичные блики и детали, наконец-то что-то быстрее DALL-E? Можно порадоваться, если забыть: ещё совсем недавно Microsoft сама брала OpenAI и прогоняла их модели за свои.
Теперь у всех свои игрушки — MAI-Voice-1 говорит, MAI-1-preview читает, MAI-Image-1 рисует. Снаружи — гонка технологий, внутри — желание отрезать прошлых партнёров от пайки. Изменения идут из-под спуда: Copilot, вроде свой, а внутри снова OpenAI (теперь GPT-5), ещё и Anthropic подсунули. Так называемая независимость работает только на витрине: покажем европейцам свою игрушку, только набежит местная бюрократия — строго по графику.
Для массового пользователя всё куда проще: картинки красивые, колбаса сочная, креатив — быстро. Только важно помнить: каждый новый супер-ИИ — это повод задать вопрос, кто кому служит: мы нейросети или она нам. Метафора с Ницше проста: тот, кто долго смотрит в генератор изображений, рано или поздно увидит там свою тарелку борща. А Microsoft — заодно и ваши ожидания монетизирует.