Google выпустил большую языковую модель Gemini, которая позиционируется как конкурент OpenAI. Нейросеть может работать с текстом, изображениями, видео и аудио. Разработчики подготовили три модели разной мощности и размеров. Релиз средней Gemini Pro уже состоялся, а в ближайшее время ожидается выход остальных.
Gemini от Google
Gemini представляет собой набор из трёх моделей различной мощности и размера:
- Gemini Pro. Средняя нейросеть для решения повседневных задач. С её помощью можно генерировать контент, задавать вопросы и искать информацию. Пока поддерживается только английский язык, но в ближайшее время компания добавит и другие.
- Gemini Nano. Маленькая модель для запуска на мобильных устройствах. С её помощью ИИ-функции работают локально на смартфонах без необходимости постоянного доступа к сети. На базе Nano внедрят функцию Smart Reply в Gboard. Сначала поддержка появится в WhatsApp, а потом в этот список добавят и другие мессенджеры.
- Gemini Ultra. Самая большая и мощная модель от Google. Согласно тестам, Ultra превосходит GPT-4 по всем показателям с разной долей эффективности. Разработчики отмечают, что модель подойдёт для решения сложных задач с большим количеством контекста. Примечательно то, что Gemini Ultra стала первой нейросетью, превзошедшей людей в многозадачном тесте MMLU.
Как получить доступ
Пользователям уже доступна средняя модель Gemini Pro. Google интегрировал её в фирменного чат-бота Bard. Разработчики и корпоративные клиенты смогут получить доступ к нейросети 13 декабря 2023 года. Модель появится на платформах Google Generative AI Studio и Google Cloud Vertex AI. Компания пока не сообщает стоимость тарифов.
Gemini Nano выйдет в декабре 2023 года для смартфонов Pixel 8 Pro. Разработчики смогут интегрировать модель в свои приложения с помощью системы Android AICore, которая пока является эксклюзивной для Pixel 8 Pro.
Самая мощная модель Ultra станет доступна пользователям в начале 2024 года. Google пока не сообщает точную дату релиза, но рассказал, что выпустит продвинутого чат-бота Bard Advanced. Он будет работать на базе Gemin Ultra. Из разработчиков в ближайшее время доступ к ней получат только избранные партнёры Google. В 2024 году компания представит подробный план распространения API.
Компания рассказала в блоге, что все модели Gemini мультимодальные, и это позволяет им по умолчанию работать с разными типами контента. Инженеры Google осознанно отказались от подхода OpenAI и не стали разрабатывать разные модели для разных задач.
Больше интересного про код — в нашем телеграм-канале. Подписывайтесь!