Google выпустил модель машинного обучения Gemini

В тестах нейросеть превосходит GPT-4, а разработчики подготовили компактную версию для локального запуска на смартфонах.

Редакция «Код» Skillbox Media

Онлайн-журнал для тех, кто влюблён в код и информационные технологии. Пишем для айтишников и об айтишниках.

Google выпустил большую языковую модель Gemini, которая позиционируется как конкурент OpenAI. Нейросеть может работать с текстом, изображениями, видео и аудио. Разработчики подготовили три модели разной мощности и размеров. Релиз средней Gemini Pro уже состоялся, а в ближайшее время ожидается выход остальных.

Gemini от Google

Gemini представляет собой набор из трёх моделей различной мощности и размера:

Gemini Pro. Средняя нейросеть для решения повседневных задач. С её помощью можно генерировать контент, задавать вопросы и искать информацию. Пока поддерживается только английский язык, но в ближайшее время компания добавит и другие.
Gemini Nano. Маленькая модель для запуска на мобильных устройствах. С её помощью ИИ-функции работают локально на смартфонах без необходимости постоянного доступа к сети. На базе Nano внедрят функцию Smart Reply в Gboard. Сначала поддержка появится в WhatsApp, а потом в этот список добавят и другие мессенджеры.
Gemini Ultra. Самая большая и мощная модель от Google. Согласно тестам, Ultra превосходит GPT-4 по всем показателям с разной долей эффективности. Разработчики отмечают, что модель подойдёт для решения сложных задач с большим количеством контекста. Примечательно то, что Gemini Ultra стала первой нейросетью, превзошедшей людей в многозадачном тесте MMLU.

Результаты мультимодального тестирования Gemini Ultra
*Инфографика: Google*

Как получить доступ

Пользователям уже доступна средняя модель Gemini Pro. Google интегрировал её в фирменного чат-бота Bard. Разработчики и корпоративные клиенты смогут получить доступ к нейросети 13 декабря 2023 года. Модель появится на платформах Google Generative AI Studio и Google Cloud Vertex AI. Компания пока не сообщает стоимость тарифов.

Gemini Nano выйдет в декабре 2023 года для смартфонов Pixel 8 Pro. Разработчики смогут интегрировать модель в свои приложения с помощью системы Android AICore, которая пока является эксклюзивной для Pixel 8 Pro.

Самая мощная модель Ultra станет доступна пользователям в начале 2024 года. Google пока не сообщает точную дату релиза, но рассказал, что выпустит продвинутого чат-бота Bard Advanced. Он будет работать на базе Gemin Ultra. Из разработчиков в ближайшее время доступ к ней получат только избранные партнёры Google. В 2024 году компания представит подробный план распространения API.

Компания рассказала в блоге, что все модели Gemini мультимодальные, и это позволяет им по умолчанию работать с разными типами контента. Инженеры Google осознанно отказались от подхода OpenAI и не стали разрабатывать разные модели для разных задач.

Больше интересного про код — в нашем телеграм-канале. Подписывайтесь!

Читайте также: