Скидки до 50% и курс в подарок : : Выбрать курс
Код
#новости

Meta* выпустила семейство языковых моделей Llama 4

Это самые мощные рассуждающие нейросети с открытым кодом.

Meta* выпустила четвёртое поколение открытых языковых моделей Llama, которое включает в себя три мультимодальных нейросети с разным количеством параметров. В бенчмарках языковая модель обходит GPT-4o, но пользователям кажется, что разработчики Meta* смухлевали, чтобы вырваться вперёд.

Llama 4 изнутри

Llama 4 — семейство языковых моделей, которое включает в себя следующие нейросети:

  • Llama 4 Scout — мультимодальная нейросеть со 109 миллиардами параметров и контекстным окном в 10 миллионов токенов. Нейросеть может конкурировать с Gemini 2.0 Flash-Lite от Google, а чудеса оптимизации позволяют запускать её всего на одной видеокарте NVIDIA H100.
Изображение: Meta* AI
  • Llama 4 Maverick — рассуждающая мультимодальная нейросеть с 400 миллиардами параметров. Разработчики отмечают, что в тестах языковая модель обходит конкурентов в лице Gemini 2.0 и GPT-4o и при этом потребляет меньше ресурсов.
Изображение: Meta* AI
  • Llama 4 Behemoth — самая мощная нейросеть от Meta* с 2 триллионами параметров. Компания утверждает, что в тестах производительности и качества ответов модель превосходит Gemini 2.0 Pro, GPT-4.5 и Claude Sonnet 3.7. При этом финальная версия Behemoth ещё находится на этапе обучения, поэтому пользователи получат к ней доступ позже.
Изображение: Meta* AI

Разработчики Llama впервые применили архитектуру MoE (Mixture of Experts — смесь экспертов), которая не использует сразу все слои модели для генерации ответа. Вместо этого в ход идут только эксперты — слои, которые лучше справятся с поставленной задачей.

Критика Llama 4

Первые пользователи и журналисты заметили, что в локальных тестах Llama 4 Maverick оказывается хуже конкурентов одного уровня и даже уступает более слабым нейросетям. При этом на портале LLM Arena языковая модель занимает уверенное второе место, разделяя его с GPT-4o и Grok-3-Preview.

Таблица лидеров LLM Arena
Скриншот: LLM Arena / Skillbox Media

Эксперты считают, что команда Meta* решила завысить показатели в тестах и обучила нейросеть хорошо их проходить. В результате получилась мощная модель для бенчмарков, но слабая в реальных задачах.

Пресс-служба Llama не отвечает на запросы журналистов, но если мошенничество подтвердится, то компания рискует опорочить свою репутацию. Впрочем, пользователи социальных сетей уже недовольны тем, что им пообещали открытого конкурента GPT-4o, а дали языковую модель, которая работает хуже DeepSeek.

Как получить доступ

Модели Scout и Maverick можно скачать на официальном сайте Llama или на портале Hugging Face, а Behemoth выпустят позже. Meta* использует новые нейросети в своих продуктах, включая WhatsApp, Instagram* и Facebook Messenger.

Больше интересного про код — в нашем телеграм-канале. Подписывайтесь!


* Решением суда запрещена «деятельность компании Meta Platforms Inc. по реализации продуктов — социальных сетей Facebook и Instagram на территории Российской Федерации по основаниям осуществления экстремистской деятельности».



Изучайте IT на практике — бесплатно

Курсы за 2990 0 р.

Я не знаю, с чего начать
Бесплатный курс по Python ➞
Мини-курс для новичков и для опытных кодеров. 4 крутых проекта в портфолио, живое общение со спикером. Кликните и узнайте, чему можно научиться на курсе.
Смотреть программу
Понравилась статья?
Да

Пользуясь нашим сайтом, вы соглашаетесь с тем, что мы используем cookies 🍪

Ссылка скопирована