Код
#новости

Stability AI представила нейросеть Stable Cascade для генерации изображений

Новую модель машинного обучения можно использовать на системах с ограниченными ресурсами.

Команда разработчиков Stability AI выпустила предварительную версию нейросети Stable Cascade для генерации изображений. Инженеры компании использовали адаптированную архитектуру Вюрстчена с коэффициентом сжатия в латентном пространстве до 42 раз.

Примеры изображений, созданных с помощью Stable Cascade
Изображение: Stability AI / GitHub

Возможности Stable Cascade

Нейросеть состоит из трёх моделей машинного обучения, которые работают вместе. Суммарно Stable Cascade включает в себя 10 млрд параметров. Такое малое количество не снижает общее качество и позволяет запускать нейросеть на устройствах с ограниченным количеством ресурсов.

Важная особенность Stable Cascade заключается в том, что разработчики использовали адаптированную архитектуру Вюрстчена, которая сжимает латентное пространство. Благодаря этому изображения генерируются быстрее, и в итоге пользователю приходится меньше ждать результата работы нейросети. Представители компании отмечают, что Stable Diffusion может сжать изображение с разрешением 1024×1024 пикселей всего в 8 раз, добившись разрешения 128×128. В новой нейросети увеличенный коэффициент сжатия преобразует такое же изображение до картинки 24×24 пикселей.

Архитектура нейросети Stable Cascade
Изображение: Stability AI / GitHub

Stable Cascade поддерживает следующие режимы генерации:

  • Text-to-Image. Позволяет создать картинку по текстовому описанию.
Промпт: Cinematic photo of an anthropomorphic penguin sitting in a cafe reading a book and having a coffee
Изображение: Stability AI / GitHub
  • Image Variation. Нейросеть можно попросить сгенерировать несколько вариантов на основе одного запроса.
Пример работы функции Image Variation
Изображение: Stability AI / GitHub
  • Image-to-Image. Создание изображений на основе другого изображения.
Слева исходное изображение, по которому нейросеть создала дополнительные варианты
Изображение: Stability AI / GitHub
  • Inpainting/Outpainting. Заполнение области картинки по маске или расширение границ изображения.
С помощью режимов Inpainting и Outpainting можно редактировать изображения
Изображение: Stability AI / GitHub
  • Canny Edge. Создание картинок по контурам или зарисовка и текстовому запросу.
В качестве промпта можно использовать набросок
Изображение: Stability AI / GitHub
  • Super Resolution. Увеличение разрешения в два раза.
Пример работы функции Super Resolution
Изображение: Stability AI / GitHub

Разработчики Stability AI опубликовали код модели и данные для обучения и файн-тюнинга на GitHub и Hugging Face.

Больше интересного про код — в нашем телеграм-канале. Подписывайтесь!

Проверьте свой английский. Бесплатно ➞
Нескучные задания: small talk, поиск выдуманных слов — и не только. Подробный фидбэк от преподавателя + персональный план по повышению уровня.
Пройти тест
Понравилась статья?
Да

Пользуясь нашим сайтом, вы соглашаетесь с тем, что мы используем cookies 🍪

Ссылка скопирована