Следите за новостями по этой теме!
Подписаться на «Рифы и пачки / Твоя культура»
Департамент искусственного интеллекта Microsoft анонсировал выпуск своих первых собственных моделей ИИ — MAI-Voice-1 и MAI-1-preview. До этого компания в основном использовала сторонние разработки, такие как модели OpenAI.
MAI-Voice-1 — это модель генерации речи, способная создавать минуту аудиотекста меньше чем за секунду, работая всего на одном графическом процессоре (GPU). Эту технологию уже применяют для сервисов вроде Copilot Daily, где виртуальный ведущий озвучивает главные новости дня, а также для создания подкаст-фрагментов, объясняющих различные темы.
Для желающих опробовать MAI-Voice-1 лично, она доступна на платформе Copilot Labs. Пользователь может самостоятельно ввести текст для озвучки, а также менять голос и стиль подачи.
Вторая представленная модель — MAI-1-preview. Её обучение проводилось на примерно 15 000 видеокартах Nvidia H100, что говорит о крайне высокой вычислительной мощности. Эта модель предназначена в первую очередь для бытовых задач, способна отвечать на повседневные запросы и следовать инструкциям пользователя.
Глава Microsoft AI Мустафа Сулейман ещё в прошлом году в подкасте Decoder уточнил, что внутренние разработки Microsoft не ориентированы на корпоративных клиентов. Компания делает акцент на массового потребителя, используя огромный объём пользовательских данных, получаемых в том числе через рекламу и телеметрию.
В ближайшее время MAI-1-preview планируется внедрить в текстовые функции Copilot — фирменного ИИ-ассистента, который до сих пор работал на базе OpenAI GPT. Кроме того, Microsoft уже начала открыто тестировать MAI-1-preview на платформе LMArena, предназначенной для сравнения искусственных интеллектов.
Компания подчеркивает в своём блоге, что планирует расширять портфель специализированных моделей под разные нужды пользователей, рассчитывая, что именно так можно будет достичь максимальной пользы.
Microsoft наконец-то решила сыграть в песочнице ИИ самостоятельно, а не только таскать чужие лопатки из коробки OpenAI. Якобы компания создала свои первые серьёзные модели искусственного интеллекта под милыми аббревиатурами MAI-Voice-1 и MAI-1-preview. Первая молниеносно генерирует речь как билетёр в театре, а вторая выдает ответы на бытовые вопросы, разгружая почтовый ящик технической поддержки Microsoft и, вероятно, притупляя бдительность офисного люда.
Для Microsoft всё теперь «для людей»: данные собирают с миру по нитке — реклама, телеметрия, всё это ради потребителя. Хотя кому верить — маркетологам или инвесторам? MAI-1-preview уже тестируют на LMArena, где ИИ сравнивают между собой, как на битве роботов.
Любопытно, что Microsoft демонстративно дистанцируется от бизнес-сегмента: корпоративные клиенты пусть завидуют. Виртуальный помощник Copilot теперь работает на их творениях, а не только на GPT от OpenAI. В перспективе — целый зоопарк моделей под разные задачи: подкасты, автоматизация, как знать — может, и ролики с котиками. Но не за горами время, когда нейронка начнет шутить по-русски и стирать границы между реальным и искусственным бредом.
Microsoft амбициозна, уверяет, что дальше будет только веселее: по их виденью, будущее — за узкоспециализированными ИИ, пристроенными буквально под каждый чих клиента. Разумеется, всё «для вашего удобства». Проверим, кто кого — юзер ассистента или ассистент пользователя.