Код

19 фев 2024
0

Stability AI представила нейросеть Stable Cascade для генерации изображений

Новую модель машинного обучения можно использовать на системах с ограниченными ресурсами.

Команда разработчиков Stability AI выпустила предварительную версию нейросети Stable Cascade для генерации изображений. Инженеры компании использовали адаптированную архитектуру Вюрстчена с коэффициентом сжатия в латентном пространстве до 42 раз.

Примеры изображений, созданных с помощью Stable Cascade
Изображение: Stability AI / GitHub

Возможности Stable Cascade

Нейросеть состоит из трёх моделей машинного обучения, которые работают вместе. Суммарно Stable Cascade включает в себя 10 млрд параметров. Такое малое количество не снижает общее качество и позволяет запускать нейросеть на устройствах с ограниченным количеством ресурсов.

Важная особенность Stable Cascade заключается в том, что разработчики использовали адаптированную архитектуру Вюрстчена, которая сжимает латентное пространство. Благодаря этому изображения генерируются быстрее, и в итоге пользователю приходится меньше ждать результата работы нейросети. Представители компании отмечают, что Stable Diffusion может сжать изображение с разрешением 1024×1024 пикселей всего в 8 раз, добившись разрешения 128×128. В новой нейросети увеличенный коэффициент сжатия преобразует такое же изображение до картинки 24×24 пикселей.

Архитектура нейросети Stable Cascade
Изображение: Stability AI / GitHub

Stable Cascade поддерживает следующие режимы генерации:

Text-to-Image. Позволяет создать картинку по текстовому описанию.

Промпт: Cinematic photo of an anthropomorphic penguin sitting in a cafe reading a book and having a coffee
Изображение: Stability AI / GitHub

Image Variation. Нейросеть можно попросить сгенерировать несколько вариантов на основе одного запроса.

Пример работы функции Image Variation
Изображение: Stability AI / GitHub

Image-to-Image. Создание изображений на основе другого изображения.

Слева исходное изображение, по которому нейросеть создала дополнительные варианты
Изображение: Stability AI / GitHub

Inpainting/Outpainting. Заполнение области картинки по маске или расширение границ изображения.

С помощью режимов Inpainting и Outpainting можно редактировать изображения
Изображение: Stability AI / GitHub

Canny Edge. Создание картинок по контурам или зарисовка и текстовому запросу.

В качестве промпта можно использовать набросок
Изображение: Stability AI / GitHub

Super Resolution. Увеличение разрешения в два раза.

Пример работы функции Super Resolution
Изображение: Stability AI / GitHub

Разработчики Stability AI опубликовали код модели и данные для обучения и файн-тюнинга на GitHub и Hugging Face.

Больше интересного про код — в нашем телеграм-канале. Подписывайтесь!

Читайте также:

Листая дальше, вы перейдете на страницу Создаём контент с помощью нейросетей с нуля

Курс по нейросетям с бесконечными обновлениями

Освойте 45 нейросетей на реальных задачах. Научитесь применять их в работе

Подробнее

Нейросети. Практический курс

45+ топовых нейросетей в одной программе: ChatGPT, Nano Banana, Midjourney, Flux, Krea, Sora, Runway, Kling, Cursor, Suno и другие

Узнать о курсе

Освойте 45+ топовых нейросетей в одном курсе

На курсе Skillbox вы на практике изучите ИИ-инструменты. Сможете делать за минуты то, на что раньше уходили часы.

Узнать о курсе

Хотите освоить нейросети?

На курсе Skillbox вы изучите 45+ нейросетей и научитесь решать с их помощью рабочие задачи.

Подробнее

Нейросети. Практический курс

🤖 45+ топовых нейросетей в одном курсе. Вы научитесь создавать текст, графику, видео, аудио и сможете зарабатывать больше.

Понравилась статья?

Да

Пользуясь нашим сайтом, вы соглашаетесь с тем, что мы используем cookies 🍪

Ссылка скопирована