Нейросеть научили понимать длинные и подробные промпты. Сам алгоритм теперь создаёт более реалистичные изображения. Релиз для платных подписчиков запланирован на октябрь.
Что улучшили?
При генерации изображений DALL-E 3 учитывает расположение объектов относительно друг друга и общей композиции. Сложные запросы теперь чётко разделяются на составляющие, что позволяет точно описывать желаемый результат.
Разработчики поработали над детализацией сгенерированных изображений. Предыдущие версии DALL-E плохо справлялись с изображением рук человека. Нейросеть могла добавлять лишние пальцы или использовать неестественные пропорции. Теперь эти и другие детали учитываются, а изображения получаются более точными.
Интеграция с ChatGPT
Разработчики рассказали, что DALL-E 3 будет функционировать в связке с ChatGPT. Чат-бот поможет составить максимально подробный промпт, а потом перенаправит его нейросети для генерации. А ещё ChatGPT можно использовать в качестве помощника при мозговом штурме. Если результат не устроит, можно попросить чат-бота дополнить запрос.
OpenAI напомнила, что DALL-E 3 оснащена инструментами, ограничивающими генерацию по конкретным запросам. Так, промпты, содержащие имена общественных деятелей, будут отклоняться. Сделано это для того, чтобы минимизировать случай распространения дезинформации и пропаганды. Кроме того, нейросеть не будет создавать картинки, имитирующие стиль современных художников и дизайнеров.
Сейчас DALL-E 3 находится на стадии финального тестирования. В октябре 2023 года нейросеть станет доступна владельцам премиальной подписки ChatGPT Plus и корпоративным пользователям. В блоге OpenAI сказано, что все сгенерированные изображения принадлежат их создателям: их можно продавать, распространять и вставлять в коммерческие проекты.
Больше интересного про код — в нашем телеграм-канале. Подписывайтесь!