OpenAI представила новую нейросеть GPT-4o-mini

Компактный ИИ уже можно попробовать бесплатно.

Редакция «Код» Skillbox Media

Онлайн-журнал для тех, кто влюблён в код и информационные технологии. Пишем для айтишников и об айтишниках.

OpenAI представила GPT-4o-mini. Это упрощённая версия модели GPT-4o, задача которой — сделать ИИ технологии более доступными и менее энергоёмкими. Модель должна прийти на смену устаревшей GPT-3.5 Turbo и будет доступна как бесплатным, так и премиум-пользователям ChatGPT.

Что ещё за новый терминатор

По словам OpenAI, новая нейросеть превосходит модель GPT-4 при использовании в качестве чат-бота. Так, в бенчмарке MMLU модель набрала 82% — против 77,9% у Gemini Flash от Google и 73,8% у Claude Haiku от Anthropic.

Прямо сейчас GPT-4o-mini умеет работать с текстом и распознавать образы через API. Поддержку других модальностей, включая аудио и видео, обещают завезти в будущем.

Цены для разработчиков в сравнении с GPT-3.5 Turbo значительно снизились. Так, обработка миллиона входных токенов моделью GPT-4o mini обойдётся всего в 15 центов, а выходных — в 60 центов. Разница по сравнению с предшественницей — почти 60%.

OpenAI также отмечает, что GPT-4o mini — это первая ИИ-модель компании, которая применяет новую тактику безопасности под названием «иерархия инструкций». Её цель — заставить ИИ отдавать приоритет некоторым инструкциям (например, инструкциям компании) над другими, чтобы люди не смогли заставить нейросеть делать то, чего она не должна.

Мама и дочка

Новая ИИ-модель является упрощённой версией GPT-4o, которую OpenAI представила 13 мая. GPT-4o может воспринимать и генерировать звук, изображение и текст и доступна в бесплатном виде.

Буква О в GPT-4o означает omni, что отражает универсальность её работы, — модель способна как генерировать тексты и изображения, так и общаться голосом с пользователем. Эта нейросеть показала себя лучше конкурентов почти во всех бенчмарках, включая программирование, перевод текста в реальном времени и генерацию сказок. Она умеет не только общаться голосом, понимать тон и направление беседы, но и шутить и разговаривать естественно, как человек.

Больше интересного про код — в нашем телеграм-канале. Подписывайтесь!

Читайте также: