OpenAI работает над новым, более продвинутым подходом к своим ИИ-моделям. Кодовое название проекта — Strawberry. Его разработку ведёт отдельная команда, подробностей работы над этим проектом не знают даже другие сотрудники.
Лучше, чем человек
Технология Strawberry позволит ИИ не только генерировать ответы на запросы пользователя, но и проводить глубокие исследования, чтобы давать более развернутые ответы по той или иной теме. По словам представителя OpenAI, компания хочет, чтобы ИИ-модели видели и понимали мир лучше, чем человек.
Сотрудник компании также отметил, что непрерывные исследования новых возможностей искусственного интеллекта — обычная практика в отрасли. Более того, по его словам, существует общее убеждение, что модели со временем будут совершенствоваться в своих рассуждениях.
Изначально проект Strawberry носил название Q*. Участники закрытой презентации проекта сообщали, что благодаря новой технологии ИИ-модель способна отвечать на сложные научные и математические запросы, которые не под силу другим коммерчески доступным моделям.
Метод постобучения
Strawberry включает в себя специальный способ так называемого «постобучения» генеративных ИИ-моделей или адаптации базовых. Это позволяет оттачивать работу ИИ после того, как модель уже обучили на массивах общих данных. Подход к обучению в Strawberry похож на метод, разработанный в Стэнфордском университете в 2022 году, — он получил название STaR. Этот метод позволяет ИИ-моделям совершенствоваться до более высоких уровней интеллекта с помощью итеративного создания собственных данных для обучения.
Согласно документам OpenAI, Strawberry позволит ИИ выполнять задачи с большим горизонтом (LHT, long-horizon tasks). Такие задачи требуют от модели заблаговременного планирования и выполнения действий в течение длительного времени. Кроме того, компания намерена протестировать возможности ИИ при выполнении функций инженера ПО и специалиста по машинному обучению.
Больше интересного про код — в нашем телеграм-канале. Подписывайтесь!