Meta* выпустила семейство языковых моделей Llama 4

Это самые мощные рассуждающие нейросети с открытым кодом.

Редакция «Код» Skillbox Media

Онлайн-журнал для тех, кто влюблён в код и информационные технологии. Пишем для айтишников и об айтишниках.

Meta* выпустила четвёртое поколение открытых языковых моделей Llama, которое включает в себя три мультимодальных нейросети с разным количеством параметров. В бенчмарках языковая модель обходит GPT-4o, но пользователям кажется, что разработчики Meta* смухлевали, чтобы вырваться вперёд.

Llama 4 изнутри

Llama 4 — семейство языковых моделей, которое включает в себя следующие нейросети:

Llama 4 Scout — мультимодальная нейросеть со 109 миллиардами параметров и контекстным окном в 10 миллионов токенов. Нейросеть может конкурировать с Gemini 2.0 Flash-Lite от Google, а чудеса оптимизации позволяют запускать её всего на одной видеокарте NVIDIA H100.

Llama 4 Maverick — рассуждающая мультимодальная нейросеть с 400 миллиардами параметров. Разработчики отмечают, что в тестах языковая модель обходит конкурентов в лице Gemini 2.0 и GPT-4o и при этом потребляет меньше ресурсов.

Llama 4 Behemoth — самая мощная нейросеть от Meta* с 2 триллионами параметров. Компания утверждает, что в тестах производительности и качества ответов модель превосходит Gemini 2.0 Pro, GPT-4.5 и Claude Sonnet 3.7. При этом финальная версия Behemoth ещё находится на этапе обучения, поэтому пользователи получат к ней доступ позже.

Разработчики Llama впервые применили архитектуру MoE (Mixture of Experts — смесь экспертов), которая не использует сразу все слои модели для генерации ответа. Вместо этого в ход идут только эксперты — слои, которые лучше справятся с поставленной задачей.

Критика Llama 4

Первые пользователи и журналисты заметили, что в локальных тестах Llama 4 Maverick оказывается хуже конкурентов одного уровня и даже уступает более слабым нейросетям. При этом на портале LLM Arena языковая модель занимает уверенное второе место, разделяя его с GPT-4o и Grok-3-Preview.

Таблица лидеров LLM Arena
*Скриншот: LLM Arena / Skillbox Media*

Эксперты считают, что команда Meta* решила завысить показатели в тестах и обучила нейросеть хорошо их проходить. В результате получилась мощная модель для бенчмарков, но слабая в реальных задачах.

Пресс-служба Llama не отвечает на запросы журналистов, но если мошенничество подтвердится, то компания рискует опорочить свою репутацию. Впрочем, пользователи социальных сетей уже недовольны тем, что им пообещали открытого конкурента GPT-4o, а дали языковую модель, которая работает хуже DeepSeek.

Как получить доступ

Модели Scout и Maverick можно скачать на официальном сайте Llama или на портале Hugging Face, а Behemoth выпустят позже. Meta* использует новые нейросети в своих продуктах, включая WhatsApp, Instagram* и Facebook Messenger.

Больше интересного про код — в нашем телеграм-канале. Подписывайтесь!

Читайте также:

* Решением суда запрещена «деятельность компании Meta Platforms Inc. по реализации продуктов — социальных сетей Facebook и Instagram на территории Российской Федерации по основаниям осуществления экстремистской деятельности».