Google DeepMind анонсировала семейство открытых ИИ-моделей Gemma 3. Они отличаются высокой производительностью и компактным размером, и это позволяет запускать их на одном GPU или TPU. Новые модели поддерживают более 140 языков и способны обрабатывать текст, изображения и короткие видео.
Основные характеристики
Модели Gemma 3 имеют веса от 1 до 27 миллиардов параметров. Несмотря на компактность, они превосходят более крупные модели, такие как Llama-405B и DeepSeek-V3. Контекстное окно моделей достигает 128 тысяч токенов, что позволяет обрабатывать большие объемы данных. Кроме того, модели поддерживают мультимодальность, включая текст, изображения (кроме версии на 1 миллиард параметров) и короткие видео.
Преимущества новых моделей
Одним из ключевых преимуществ Gemma 3 являются квантованные версии, которые снижают требования к памяти и вычислительным ресурсам. Модели демонстрируют улучшенную безопасность, воспроизводя меньше дословного текста и избегая использования персональных данных. Кроме того, модель Gemma 3-27B-IT получила рейтинг Elo 1338, что позволяет ей войти в десятку лучших ИИ-моделей.
Ещё Google представила ShieldGemma 2 — специализированный инструмент с 4 миллиардами параметров для обнаружения опасного контента и откровенных материалов. Разработчики Gemma 3 обещают, что новая ИИ-модель станет важным шагом в развитии ИИ, предлагая мощные возможности при оптимизированных ресурсах.
Доступность
Модели Gemma 3 доступны на платформах Hugging Face, Kaggle и Google AI Studio. Они поддерживают такие фреймворки, как PyTorch, JAX и Keras. Модели могут работать на графических процессорах NVIDIA, Google Cloud TPU, графических процессорах AMD, а также на процессорах с помощью Gemma.cpp. Для академических исследователей предусмотрена программа поддержки с облачными кредитами на сумму 10 тысяч долларов.
Больше интересного про код — в нашем телеграм-канале. Подписывайтесь!