«Сбер» выпустил нейросеть Kandinsky 2.1. Об этом написали на сайте компании 4 апреля 2023 года. Разберёмся, для каких задач подходит нейросеть и как её использовать.
Что такое Kandinsky 2.1
Kandinsky 2.1 — нейросеть, которая умеет создавать с нуля и обрабатывать изображения. Нейросеть разработали в Sber AI — подразделении «Сбера», разрабатывающем сервисы на базе искусственного интеллекта. Использовать нейросеть можно бесплатно на сайте «Сбера» и на нескольких других платформах.
Kandinsky 2.1 умеет создавать изображения по текстовому описанию того, что на нём должно быть. Например, можно написать «человек читает книгу», а она это проиллюстрирует. Кроме того, в неё можно загрузить любые изображения, чтобы их изменить:
- совместить несколько изображений;
- удалить фон или заменить крупные объекты на фото;
- создать новые изображения, похожие на заданное;
- дорисовать недостающие части изображения.
И при создании, и при изменении изображения можно выбирать стиль. Например, стиль Малевича или стиль советских мультфильмов.

Скриншот: «Сбер» / Skillbox Media
Kandinsky 2.1 — вторая версия нейросети. Первая версия — Kandinsky 2.0 — была обучена на миллиарде пар «текст — изображение». Kandinsky 2.1 дообучили ещё на 172 млн изображений высокого разрешения. 2 млн из этой массы — отдельная выборка качественных изображений, в которую попали и картинки с текстом и лицами людей.
Использовать нейросеть можно в разных отраслях — в маркетинге, SMM, дизайне, рекламе и других. Первый заместитель председателя правления Сбербанка Александр Ведяхин считает, что у каждого может найтись задача для Kandinsky 2.1.
Например, с помощью нейросети можно создавать иллюстрации для постов в соцсетях. А пресс-служба «Сбера» говорит, что в «банковской сфере её можно использовать для создания персонализированных маркетинговых решений, ярких образов продуктов, привлечения и удержания внимания клиентов».
Нейросеть доступна без ограничений — чтобы использовать её на сайте «Сбера», регистрация не нужна. Кроме того, она доступна на умных устройствах Sber с помощью команды «Запусти художника», в мобильном приложении «Салют», на платформах ML Space, Fusion Brain и в телеграм-боте.
Как использовать нейросеть Kandinsky 2.1
Мы покажем процесс работы с Kandinsky 2.1 на платформе Fusion Brain в браузере.
У платформы простой интерфейс. Чтобы сделать изображение, нужно описать то, что на нём должно быть, и нажать на кнопку «Создать». Или загрузить свою картинку, а потом написать, как её обработать.

Скриншот: Fusion Brain / Skillbox Media
Стиль изображения можно задать в описании или выбрать из предложенных, нажав на кнопку «Без стиля» в нижнем левом углу. Если задать описание изображения и менять стили, нейросеть каждый раз будет генерировать новые результаты.

Скриншот: Fusion Brain / Skillbox Media
Получившееся изображение можно изменить — обрезать нужную область, стереть часть картинки ластиком — или скачать. Чтобы скачать изображение, нужно нажать на кнопку загрузки в верхнем правом углу. Картинка сохранится в формате PNG.

Изображение: Fusion Brain
На создание одного изображения уходит около 30 секунд. Если нагрузка на нейросеть высокая, время обработки запроса может увеличиться.