Следите за новостями по этой теме!
Подписаться на «Рифы и пачки / Твоя культура»Microsoft расширяет своё воздействие в области искусственного интеллекта, представив сразу две новые модели, которые были обучены исключительно внутренними командами компании. Первая из них — MAI-Voice-1, это первая модель генерации естественной речи от Microsoft. Вторая — MAI-1-preview, текстовая, и она стала первым полностью самостоятельным фундаментальным ИИ-продуктом Microsoft, прошедшим полный цикл обучения внутри компании.
MAI-Voice-1 уже используется в функциях Copilot Daily и Podcast, что должно добавить «живую» речь в работу этих сервисов. Текстовая же MAI-1-preview доступна для публичного тестирования на площадке LMArena и вскоре начнёт появляться в некоторых функциях Copilot.
В интервью изданию Semafor руководитель подразделения Microsoft AI Мустафа Сулейман отметил, что обе модели были созданы с акцентом на эффективность и экономичность. MAI-Voice-1 работает всего на одном графическом процессоре (GPU), а обучение MAI-1-preview проходило на примерно 15 тысячах видеокарт Nvidia H-100. Для сравнения, модели вроде Grok от xAI потребовали более 100 тысяч таких же чипов. Как пояснил Сулейман, сейчас «искусство обучения моделей» стало делом тонким: важно не тратить ценные ресурсы (вычислительные мощности) на бесполезные фрагменты данных, которые не дают реальной пользы модели.
Интересно, что хотя Microsoft тестирует свои новые модели на платформе Copilot, сам этот сервис основан на GPT-технологиях от OpenAI. Казалось бы, инвестировав миллиарды долларов в продвинутую AI-компанию, Microsoft могла бы довольствоваться партнёрством, но, похоже, хочет быть самостоятельным игроком. Правда, чтобы догнать признанных лидеров индустрии, потребуется время. Впрочем, по словам Сулеймана, у Microsoft есть «огромная пятилетняя дорожная карта инвестиций», которую реализуют квартал за кварталом. Учтя беспокойства в индустрии по поводу возможного «лопания пузыря» вокруг ИИ, Microsoft придётся двигаться очень быстро, чтобы не промахнуться, выбрав независимый путь.
Microsoft решила, что однажды хватит кормить сторонние стартапы и презентовала миру свои ИИ-модели. Первая — MAI-Voice-1, генератор «человеческой» речи, крутится на одном GPU, будто инженеры компании со школьных времён экономят на ужинах, чтобы не переплачивать за чипы. Вторая, MAI-1-preview, отработала на 15 тысячах Nvidia H-100 — тут как бы намёк, что у Microsoft есть деньги, но хвастаться тратами пока не модно на фоне игр в эффективность.
Разумеется, в Copilot, флагманском сервисе, всё ещё работает GPT от OpenAI. Напомню: Microsoft уже влила туда миллиардные суммы, но теперь внезапно захотела независимости. Вот и родились свои ИИ-игрушки. Очевидно, кто-то устал ждать «бесплатной» революции и решил вложиться в собственных роботов.
Большую часть пафоса даёт план — на пять лет вперёд, будто ИИ-индустрию накроет не пузырь, а поэтапный ремонт с капремонтом. Придётся поторопиться, чтобы не остаться позади уже традиционных «внезапно выросших» конкурентов. Всё это — часть большой шахматной игры, где один ход может вызвать сбой везде: от чартов на LMArena до монотонного голоса в вашем Copilot Podcast. Ну а простым пользователям остаётся радоваться: теперь Microsoft латает свои сервисы не только чужим, но и своим интеллектуальным пластырем.