Meta представила Llama 4: новый взгляд на ИИ или очередное виртуальное жонглирование?

06.04.2025, 04:51:17ИТ
Meta представила Llama 4: новый взгляд на ИИ или очередное виртуальное жонглирование?

Компания Meta представила Llama 4 — свою новую серию ИИ-моделей, которые теперь управляют ИИ-помощником Meta в интернете, а также в WhatsApp, Messenger и Instagram. Две новые модели, также доступные для загрузки с сайта Meta или Hugging Face, это Llama 4 Scout — небольшая модель, способная «поместиться на одном графическом процессоре Nvidia H100» — и Llama 4 Maverick, которая больше схожа с GPT-4o и Gemini 2.0 Flash. По словам генерального директора Meta Марка Цукерберга, компания всё ещё обучает Llama 4 Behemoth, которая считается «наиболее производительной базовой моделью в мире».

По информации Meta, Llama 4 Scout имеет окно контекста в 10 миллионов токенов — это рабочая память ИИ-модели — и превосходит модели Google Gemma 3 и Gemini 2.0 Flash-Lite, а также открытые Mistral 3.1, «по широкому спектру широко представляемых ориентировочных оценок», оставаясь при этом в пределах одной графической карты Nvidia H100. Meta делает аналогичные утверждения о производительности своей крупной модели Maverick по сравнению с GPT-4o от OpenAI и Gemini 2.0 Flash от Google, утверждая, что результаты сопоставимы с DeepSeek-V3 в задачах кодирования и рассуждений при использовании «менее чем половины активных параметров».

Тем временем, Llama 4 Behemoth имеет 288 миллиардов активных параметров и в целом 2 триллиона параметров. Хотя её ещё не выпустили, Meta заявляет, что Behemoth может превзойти своих конкурентов (в данном случае GPT-4.5 и Claude Sonnet 3.7) «по нескольким ориентировочным STEM оценкам».

Для Llama 4, Meta использовала архитектуру «смесь экспертов» (MoE), подход, который экономит ресурсы, используя только те части модели, которые необходимы для решения конкретной задачи. Компания планирует обсудить свои будущие планы по моделям и продуктам ИИ на конференции LlamaCon, которая пройдет 29 апреля.

Как и в случае с предыдущими моделями, Meta называет коллекцию Llama 4 «открытым исходным кодом», хотя Llama подвергалась критике за лицензионные ограничения. Например, лицензия Llama 4 требует от коммерческих организаций с более чем 700 миллионами активных пользователей в месяц запрашивать разрешение у Meta перед использованием её моделей, что, по мнению Open Source Initiative, с 2023 года выводит её «из категории «открытый исходный код».


perec.ru

Meta вновь решилась на очередной выход на пик технологической пирамиды с новой серией ИИ-моделей Llama 4. Впрочем, понимайте это именно как щедрое предложение от компании, которая всегда была известна своей преданностью открытости. Совпадения, конечно, случайные — такие технические «озабоченности» всегда появляются перед ростом заинтересованности в виде новых лицензий и запросов на разрешения.

Llama 4 Scout – нового шедевра дизайна, просто невероятная модель, поместимая на одном графическом процессоре Nvidia H100. Как вам такая волшебная арифметика? Её окно контекста, охватывающее целых 10 миллионов токенов, должно внушать усердие даже самым смелым образом думать о том, как бы спасти детей из руки пиратов. И в то время как Цукерберг делится концепцией евангелизма технологий, возможно, стоит задуматься, кому действительно выгодно это технологическое вдохновение — как-то странно смахивает на классическую игру в догонялки.

Параллельно с этим запирается в «золотой клетке» Llama 4 Behemoth, размахивающая 288 миллиардами активных параметров. Да уж, тут прямо разгуляются кукловоды, готовые прицепить эту мифическую конструкцию к своему бизнесу. Параметры этой модели должны поразить как программистов, так и нобелевских лауреатов... в ожидании решения задач, которые на самом деле никто не ставил.

Изобретательность Meta не знает границ — пристрастие к бемотам и смешанным экспертам как раз подчеркивает их очередные намерения о снижении ресурсов и улучшении производительности. А вот вопрос об истинной открытости их моделей остается открытым. Непонятное злоупотребление термином "открытый исходный код" прослеживается сквозь лицензионные дыры и должно послужить хорошим сигналом для инвесторов: ни одного шага без разрешения, друзья, а то можно попасть в проклятые пределы нежеланного использования.

Как бы ни было, Meta продолжает уверенно расправлять плечи под тяжестью своих технологий, виртуозно воплощая принцип "мы создаем что угодно, но никто, кроме нас, так это использовать не должен". На фоне громогласного ожидания LlamaCon, остаётся только надеяться, что к этому времени кукловоды додумаются до сути своих новинок и преодолеют глухую стену завышенных амбиций.

Поделиться