Код
#статьи

Топ-8 нейросетей, которые рисуют, редактируют и дополняют изображения

Собрали главных конкурентов Midjourney и пытаемся с их помощью продать нарисовать слона.

Иллюстрация: kjpargeter / pvproductions / Freepik / resource database / cdd20 / Unsplash / Cameron Butler / Wikimedia Commons / Дима Руденок для Skillbox Media

Изображения, сгенерированные нейросетями, заполонили интернет и стали настолько востребованными, что разработчикам самой известной из них, Midjourney, пришлось даже ограничить бесплатный доступ.

Однако на одной Midjourney свет клином не сошёлся. Команда Product Star вместе с Павлом Исаенко, дизайн-директором в «Яндексе», собрала подборку нейросетей, которые умеют рисовать по текстовым запросам и фото не хуже, а может, даже и лучше. Чтобы конкурс был честным, всем участникам предложили одно и то же задание — нарисовать симпатичного слона.

Павел Исаенко

Дизайн-директор в «Яндексе». Эксперт в Product Star на курсе «Профессия UX/UI-дизайнер»

Итак, представляем победителей:

  • Kandinsky 2.1 — бесплатная нейросеть от «Сбера».
  • Stable Diffusion — нейросеть с открытым исходным кодом.
  • Scribble Diffusion — генерирует изображения по эскизам.
  • «Шедеврум» — рисует картинки по текстовым запросам.
  • Craiyon — позволяет генерировать изображения как на ПК, так и в смартфоне.
  • Dream — редактирует фотографии.
  • Image Creator — нейросеть, интегрированная в Bing.
  • Starryai — рисует картинки по референсам.

А теперь подробно о каждой.

Kandinsky 2.1 — бесплатная нейросеть от «Сбера»

Изображение: Kandinsky / Product Star

Язык интерфейса: русский и английский.

Доступна в России: да.

Необходимость авторизации: да, через любой почтовый клиент, аккаунт в Discord или «Сбер ID».

Пробная версия: бесплатно генерирует неограниченное количество изображений.

Попробовать онлайн →

Нейросеть от «Сбера» умеет генерировать изображения по тексту, рисовать их по фото, дополнять картинки, а также смешивать их. Kandinsky интегрирована в Discord и работает через платформу fusionbrain.ai. Ещё есть бот в Telegram, однако он доступен не всем. Если вы не входите в круг избранных, бот предложит вам перейти в Discord или мобильное приложение «Салют», предупредив, что очередь в Discord значительно выше.

Проще всего начать работу непосредственно через fusionbrain.ai. Вас попросят ввести email и подтвердить регистрацию. Затем на главном экране всплывёт подсказка: «Введите описание изображения и нажмите кнопку „Создать“».

Писать текст можно на русском: чем детальнее вы опишете задачу — тем лучше будет результат. Не забудьте указать стиль, в котором нейросеть должна нарисовать изображение. Его можно описать текстом или выбрать из списка, нажав на специальную кнопку в левом нижнем углу. Однако количество предварительно заданных стилей ограничено, а вот словесных описаний нейросеть понимает намного больше.

Stable Diffusion — нейросеть с открытым исходным кодом

Изображение: Stable Diffusion / Product Star

Язык интерфейса: английский.

Доступна в России: да.

Необходимость авторизации: да, если использовать платформу DreamStudio. Понадобится аккаунт в Google или Discord.

Пробная версия: платформа даёт 25 кредитов, которые тратятся в зависимости от детализации и качества изображения. Если установить приложение на компьютер, можно использовать нейросеть без ограничений.

Попробовать онлайн →

Нейронная сеть с открытым кодом. Если её обучить, получите больше инструментов для самовыражения. Чтобы использовать все возможности Stable Diffusion, её нужно установить на компьютер. Минимальные требования:

  • 25 ГБ свободного места на жёстком диске;
  • видеокарта NVIDIA с памятью от 10 ГБ;
  • операционная система Windows.

Есть и онлайн-версия, которая работает через платформу DreamStudio. Для авторизации понадобится аккаунт в Google или Discord.

Нейросеть позволяет рисовать изображения по фото или на основе запросов на английском языке. Русский язык Stable Diffusion тоже понимает, но результат будет чуть хуже. Также можно выбрать стиль изображения: например, нарисовать с помощью нейросети собственный портрет в стиле аниме или сгенерировать 3D-модель домашнего животного.

Scribble Diffusion — генерирует изображения по эскизам

Изображение: Scribble Diffusion / Product Star

Язык интерфейса: английский.

Доступна в России: да.

Необходимость авторизации: нет.

Пробная версия: количество рисунков не ограничено.

Попробовать онлайн →

Нейросеть, которая генерирует изображения на основе ваших рисунков.

Чтобы превратить наброски в шедевр, не нужна авторизация. Как только вы перейдёте по ссылке, откроется страница со случайными каракулями. Возьмите их за основу, чтобы посмотреть на способности нейросети. Или сотрите и нарисуйте скетч самостоятельно.

Если помимо рисунка добавить подробное описание, результат получится намного лучше. Благодаря запросам Scribble Diffusion точнее определит, что вы нарисовали, и дополнит набросок необходимыми элементами. Укажите в запросе стиль изображения, что нарисовано на переднем плане и на фоне, какое действие выполняет объект и так далее.

«Шедеврум» — модель от «Яндекса», которая рисует картинки по текстовым запросам

Изображение: «Шедеврум» / Product Star

Язык интерфейса: русский.

Доступна в России: да.

Необходимость авторизации: да, через «Яндекс ID». Если на устройстве уже выполнен вход в «Яндекс», авторизация пройдёт автоматически.

Пробная версия: бесплатно генерирует неограниченное количество изображений.

Скачать приложение на телефон →

Нейросеть от «Яндекса» с простым интерфейсом. Чтобы создать рисунок, нужно:

  • скачать приложение на телефон;
  • авторизоваться через «Яндекс ID»;
  • написать запрос;
  • дождаться очереди.

На главном экране укажут время ожидания — до наступления часа Х приложение можно спокойно закрыть, никто вас в очереди не подвинет, доказывать, кому-то: «Вы здесь не стояли, а я здесь стоял» — не придётся. Когда картинка будет готова, на телефон придёт пуш-уведомление.

Нейросеть распознаёт только текстовые запросы. Нарисовать картинку по фото не получится. Если есть сложности с запросом, вам на помощь придёт бот. Просто нажмите на кнопку со знаком плюс, и вам предложат несколько модификаторов на выбор. Ещё одна подсказка — лента. В ней публикуются все изображения пользователей и описания к ним.

Craiyon — позволяет генерировать изображения как на ПК, так и на смартфоне

Изображение: Craiyon / Product Star

Язык интерфейса: английский.

Доступна в России: да.

Необходимость авторизации: нет.

Пробная версия: количество рисунков не ограничено.

Попробовать онлайн →

Так же как и другие зарубежные нейросети, Craiyon рисует картинки на основе текста и понимает только английский. Генерировать по фото не получится. Перед началом работы вам предложат три стиля: art, drawing и photo. Кнопка None позволяет рисовать без выбора определённой стилистики. Дальше всё стандартно: вводите запрос и получаете несколько изображений на выбор.

Рисовать можно и с компьютера, и через приложение на смартфоне.

Dream — редактирует фотографии

Изображение: Dream / Product Star

Язык интерфейса: английский.

Доступна в России: да.

Необходимость авторизации: да, но достаточно ввести логин.

Пробная версия: да, однако некоторая функциональность ограничена.

Попробовать онлайн →

Чаще всего Dream используют для создания обоев на телефон. Она генерирует изображения в вертикальном формате. Чтобы нарисовать картинку, нужно ввести описание длиной до 200 символов. Также нейросеть предлагает несколько десятков стилей на выбор: от чернильной графики до стрит-арта. Некоторые опции доступны только по подписке. Бесплатно вам сделают только одну картинку в рамках запроса.

С недавних пор Dream начала работать с готовыми фотографиями. Чтобы их редактировать, опишите в запросе, что конкретно нужно изменить. Дисклеймер: эта функция находится в стадии бета-тестирования, так что результат может не совпасть с вашими ожиданиями.

Image Creator — нейросеть, интегрированная в Bing

Изображение: Image Creator / Product Star

Язык интерфейса: английский.

Доступна в России: нет.

Необходимость авторизации: да, через аккаунт в Microsoft.

Пробная версия: да, количество изображений не ограничено.

Попробовать онлайн →

Нейросеть от Microsoft. В конце марта её интегрировали в чат-бот Bing. Однако генерировать изображения можно и вне его: достаточно перейти по ссылке и авторизоваться через учётную запись в Microsoft.

Отлично рисует по текстовым описаниям, но разработчики предупреждают: текст на картинке может выглядеть неправдоподобным, а некоторые части тела, возможно, будут искажены. Этот недостаток присущ многим нейросетям, так как для развития любой новой технологии нужно время.

Image Creator не предлагает стили изображения на выбор, но просит указать их в запросе. Там же можно указать настроение рисунка и прочие детали.

В день пользователю даётся 25 улучшений, благодаря которым создавать картинки можно вне очереди. Как только улучшения закончатся — время ожидания рисунка увеличится.

Starryai — рисует картинки по референсам

Изображение: Starryai / Product Star

Язык интерфейса: английский.

Доступна в России: да.

Необходимость авторизации: да, через аккаунт в Google или Apple.

Пробная версия: да, пять бесплатных генераций. Затем нужно оплатить подписку.

Попробовать онлайн →

Рисует по текстовому запросу, а также на основе готовых фотографий. После авторизации через Google-аккаунт будут доступны пять генераций в день. Если хотите больше, просто посмотрите рекламу.

Для начала работы выберите вид ИИ — искусство или фото. Затем сгенерируйте запрос. Если у вас есть картинка-референс — нажмите на кнопку «Загрузить изображение». Нейросеть возьмёт его за основу. Кнопка Promt builder предлагает выбрать стилистику. Здесь есть текстуры, направления в живописи, а также имена известных художников.

Бесплатно будет доступен формат изображения 4:5. Чтобы изменить его — оплатите подписку. Также за дополнительную плату нейросеть улучшит качество рисунка.

Когда изображение будет готово, над ним можно продолжить работу. Для этого кликните по рисунку и нажмите кнопку Evolve. Откроется окно с загруженным референсом и вашим запросом.

Кому принадлежат права на сгенерированные нейросетью изображения?

На данный момент ответ — никому.

Нейросеть не человек, поэтому никакие права принадлежать ей не могут. Создатели нейросетей никакого участия в генерации изображений не принимают, поэтому также не могут претендовать на авторские права. Вам, в свою очередь, права тоже не принадлежат: вы не принимали значительного участия в создании изображения (пока что идея и текстовый запрос активным участием не считаются).

Пока не введено никакого регулирования, вы можете генерировать сколько угодно изображений и использовать их где и как захотите.

Рисующие нейросети хорошо работают с абстрактными запросами, но с отрисовкой конкретных деталей могут возникнуть проблемы. Например, чтобы проиллюстрировать эту статью, мы писали запрос: «Слонёнок ест бананы, на фоне город, закатное солнце, стиль Pixar». Только три из восьми нейросетей изобразили бананы, а стиль Pixar удалось повторить лишь двум. Про другие эксперименты с нейросетями читайте в канале isaenko.tech.

Хоть логика построения запросов везде примерно одинаковая, в каждой нейросети есть свои нюансы. Поэтому рекомендуем выбрать одну, самую удобную, и тренироваться писать запросы в ней. Тогда результат получится более предсказуемым.

Больше интересного про код — в нашем телеграм-канале. Подписывайтесь!

Научитесь: Нейросети: практический курс Узнать больше
Понравилась статья?
Да

Пользуясь нашим сайтом, вы соглашаетесь с тем, что мы используем cookies 🍪

Ссылка скопирована