Релиз Stable Diffusion XL 1.0 с 3,5 млрд параметров

Точная настройка, короткие промпты и генерация изображения за несколько секунд.

Редакция «Код» Skillbox Media

Онлайн-журнал для тех, кто влюблён в код и информационные технологии. Пишем для айтишников и об айтишниках.

Stability AI выпустила новую версию своей модели Stable Diffusion XL 1.0 (SDXL 1.0), которая, по заверениям компании, является самой продвинутой нейросетью по генерации изображений на сегодняшний день. Она доступна на GitHub, через Stability AI API и в отдельных приложениях, например в ClipDrop и DreamStudio.

По заявлению компании, SDXL 1.0 обеспечивает более точные и яркие цвета, а также лучше работает с контрастностью, тенями и освещением по сравнению с предыдущей моделью. При этом генерация одного изображения размером 1 мегапиксель (1024×1024) занимает всего несколько секунд.

Пример изображения, сгенерированного Stable Diffusion XL 1.0
*Изображение: StabilityAI*

По сравнению с предыдущими версиями в SDXL 1.0 появились новые функции:

inpainting, позволяющая восстанавливать недостающие части изображения;
outpainting, обеспечивающая дорисовку по краям существующего изображения;
продвинутая генерация текста — в отличие от других нейросетей, новая модель от Stability AI создаёт разборчивые надписи на изображении (например, теперь можно будет создать логотип или афишу);
инструмент image-to-image, позволяющий после получения изображения создать его варианты с помощью текстовых подсказок.

Кроме того, модель научилась понимать составные инструкции (из нескольких частей). Это облегчает составление промпта, так как от пользователя не требуется написать один большой текстовый запрос, включающий всю информацию об изображении.

Больше интересного про код — в нашем телеграм-канале. Подписывайтесь!