Stability AI выпустила новую версию своей модели Stable Diffusion XL 1.0 (SDXL 1.0), которая, по заверениям компании, является самой продвинутой нейросетью по генерации изображений на сегодняшний день. Она доступна на GitHub, через Stability AI API и в отдельных приложениях, например в ClipDrop и DreamStudio.
По заявлению компании, SDXL 1.0 обеспечивает более точные и яркие цвета, а также лучше работает с контрастностью, тенями и освещением по сравнению с предыдущей моделью. При этом генерация одного изображения размером 1 мегапиксель (1024×1024) занимает всего несколько секунд.
По сравнению с предыдущими версиями в SDXL 1.0 появились новые функции:
- inpainting, позволяющая восстанавливать недостающие части изображения;
- outpainting, обеспечивающая дорисовку по краям существующего изображения;
- продвинутая генерация текста — в отличие от других нейросетей, новая модель от Stability AI создаёт разборчивые надписи на изображении (например, теперь можно будет создать логотип или афишу);
- инструмент image-to-image, позволяющий после получения изображения создать его варианты с помощью текстовых подсказок.
Кроме того, модель научилась понимать составные инструкции (из нескольких частей). Это облегчает составление промпта, так как от пользователя не требуется написать один большой текстовый запрос, включающий всю информацию об изображении.
Больше интересного про код — в нашем телеграм-канале. Подписывайтесь!