Топ-10 нейросетей для создания и редактирования картинок
Собрали главных конкурентов Midjourney и пытаемся с их помощью продать нарисовать слона.
Иллюстрация: kjpargeter / pvproductions / Freepik / resource database / cdd20 / Unsplash / Cameron Butler / Wikimedia Commons / Дима Руденок для Skillbox Media
Изображения, сгенерированные нейросетями, заполонили интернет и стали настолько востребованными, что разработчикам самой известной из них, Midjourney, пришлось даже ограничить бесплатный доступ.
Однако на одной Midjourney свет клином не сошёлся. Команда ProductStar вместе с Павлом Исаенко, дизайн-директором в «Яндексе», составила подборку нейросетей, которые умеют создавать картинки по текстовым запросам и фото не хуже, а может, даже и лучше. Чтобы конкурс был честным, всем участникам предложили одно и то же задание — сгенерировать симпатичного слона в городе.
Павел Исаенко
Дизайн-директор в «Яндексе». Дизайн-директор в «Яндексе». Эксперт на курсе по UX/UI-дизайну в ProductStar.
Итак, представляем победителей.
- Kandinsky 3.1 — бесплатная нейросеть от «Сбера»
- Stable Diffusion 3.0 — нейросеть с открытым исходным кодом
- Scribble Diffusion — генерирует изображения по эскизам
- «Шедеврум» — рисует картинки по текстовым запросам
- Craiyon — позволяет создавать картинки на ПК и на смартфоне
- Dream by Wombo — бесплатно создаёт эстетичные иллюстрации
- Image Creator — нейросеть, интегрированная в Bing
- Starryai — рисует картинки по референсам
- Lexica — платный генератор с большой медиатекой
- Easy-Peasy.AI — агрегатор популярных нейросетей на выбор
А теперь подробно о каждой.
Kandinsky 3.1 — бесплатная нейросеть от «Сбера»
Язык интерфейса: русский и английский.
Нужна ли авторизация: да, через любой почтовый клиент, аккаунт в Discord или «Сбер ID».
Пробная версия: бесплатно генерирует неограниченное количество фото.
Нейросеть «Сбера» может создавать изображения по текстовому запросу, рисовать по фотографии, видоизменять пользовательские картинки или их отдельные элементы.
Основная функциональность реализована на платформе Fusion Brain, для начала работы с которой достаточно ввести email и подтвердить регистрацию. После этого вы попадёте в раздел «Картинки» и сможете описать изображение. Также на сайте есть раздел «Видео», где можно сгенерировать короткий ролик или анимацию с помощью нейросети Kandinsky Video 1.1.
Помимо платформы Fusion Brain, нейросеть Kandinsky доступна в приложении «СберБанк Онлайн», а также в ботах во «ВКонтакте» и в Telegram. Причём в телеграм-боте используется версия Kandinsky 3.1 Flash, которая генерирует изображения в десять раз быстрее базовой версии.
Текст промпта можно написать на русском или английском языке — достаточно в произвольной форме описать то, что вы хотите получить. Для описания можно использовать ИИ-ассистента ArtGPT, который поможет уточнить контекст и создать более детализированное изображение. Ещё есть вкладка «Негативный промпт», в которой можно записать всё, что искусственный интеллект изображать не должен.
После подготовки запроса вы можете выбрать стиль картинки — например, цифровая живопись, мультфильм, аниме, киберпанк, детальное фото, пиксельный арт и другие. Можно описать стиль рисунка текстом или загрузить фото в качестве референса. Также можно выбрать ориентацию изображения или оставить его квадратным.
Читайте также:
Stable Diffusion 3.0 — нейросеть с открытым исходным кодом
Язык интерфейса: английский.
Нужна ли авторизация: да, если использовать платформу DreamStudio. Понадобится аккаунт в Google или Discord.
Пробная версия: платформа даёт 25 кредитов, которые тратятся в зависимости от детализации и качества фото. Их хватает примерно на 100–125 изображений. Если установить приложение на компьютер, можно создавать картинки без ограничений.
Stable Diffusion — это нейронная сеть с открытым исходным кодом. Если её обучить, вы получите больше ИИ-инструментов для самовыражения. Чтобы использовать все возможности генерации изображений, Stable Diffusion нужно установить на компьютер. Вот минимальные требования:
- 25 ГБ свободного места на жёстком диске;
- видеокарта NVIDIA с памятью от 10 ГБ;
- операционная система Windows.
Есть и онлайн-версия, которая работает через платформу DreamStudio. Для авторизации потребуется аккаунт Google или Discord.
Нейросеть позволяет создавать картинки по фото или по текстовому запросу на английском языке. Stable Diffusion также понимает русский язык, но результат генерации может быть менее точным. Вы можете выбрать стиль изображения — например, создать собственный портрет в стиле аниме или сгенерировать 3D-модель домашнего животного. Кроме того, можно задать разные соотношения сторон и установить нужное количество вариантов, которые будут генерироваться по одному промпту.
За один раз мы сгенерировали сразу четырёх слонов на онлайн-платформе DreamStudio. В итоге из 25 кредитов у нас осталось 24,1.
Мы в Skillbox Media давно рассказываем о Stable Diffusion, поэтому, если вас заинтересовала эта нейросеть, рекомендуем следующие статьи:
Scribble Diffusion — генерирует изображения по эскизам
Язык интерфейса: английский.
Нужна ли авторизация: да, через GitHub.
Пробная версия: количество рисунков не ограничено.
Scribble Diffusion — это нейросеть, которая генерирует картинки на основе ваших рисунков. Для начала работы вам нужен персональный токен, который новые пользователи получают после авторизации через GitHub-аккаунт. Зарегистрируйтесь, введите токен и можете начинать.
Читайте также:
После регистрации вы попадёте на главную страницу, где сможете создать скетч и детализировать его с помощью описания. Укажите в запросе стиль картинки, элементы на переднем плане и на фоне, действия объекта и любые другие детали, которые помогут дополнить набросок.
Попробуем нарисовать слона. Для этого нам необходимо создать эскиз и добавить текстовое описание. Если что-то будет пропущено, кнопка Go останется неактивной и нейросеть не сможет сгенерировать картинку.
Из-за простого эскиза и короткого описания у нас не получился шедевр. Однако для профессиональных иллюстраторов Scribble Diffusion может стать отличным инструментом создания высококачественных работ.
«Шедеврум» — модель «Яндекса», которая рисует картинки по текстовым запросам
Язык интерфейса: русский.
Нужна ли авторизация: да, через «Яндекс ID». Если на устройстве уже выполнен вход в «Яндекс», авторизация произойдёт автоматически. В онлайн-версии можно авторизоваться через «ВКонтакте», Google и другие соцсети.
Пробная версия: в приложении можно бесплатно генерировать неограниченное количество изображений. В онлайн-версии доступно пять генераций в день.
«Шедеврум» — это платформа с простым интерфейсом, предназначенная для создания изображений и видео. Она работает на основе нейросетей YandexART и YandexGPT, которые обучены на большом объёме данных и поддерживают ввод промптов на русском, английском и казахском языках.
Также «Шедеврум» действует как социальная сеть, где пользователи могут публиковать свои работы, ставить лайки, комментировать рисунки других участников и подписываться на их профили.
Сервис доступен в онлайне и в мобильных приложениях на iOS и Android. Онлайн-версия ограничена пятью картинками в день, а в приложении можно генерировать неограниченное количество изображений, получать по два варианта за раз и создавать видео по описанию. Для начала работы авторизуйтесь через «Яндекс ID», введите запрос и дождитесь очереди.
На главном экране будет указано время ожидания, и до наступления часа икс вы можете закрыть приложение, не переживая, что позиция в очереди изменится. Не нужно будет доказывать кому-то: «Вы здесь не стояли, а я здесь стоял». Когда картинка будет готова, вы получите пуш-уведомление.
Пока нейросеть распознаёт только текстовые запросы, поэтому создать картинку по фото не получится. Если у вас возникнут трудности с запросом, на помощь придёт ИИ-бот. Просто нажмите на кнопку со знаком +, чтобы получить несколько модификаторов на выбор. Ещё одна подсказка — лента, где публикуются все изображения пользователей с описаниями. Важно помнить, что в «Шедевруме» нельзя создавать фото с упоминанием известных людей: такие промпты блокируются.
Craiyon — позволяет генерировать изображения на ПК и на смартфоне
Язык интерфейса: английский.
Нужна ли авторизация: не обязательна.
Пробная версия: можно создавать неограниченное количество картинок.
Как и другие зарубежные нейросети, Craiyon генерирует изображения на основе текстовых запросов и понимает только английский язык. Сгенерировать картинку по фото не получится. Перед началом работы вам предложат выбрать один из трёх стилей: art, drawing и photo. Также можно нажать кнопку None и создавать изображение без выбора определённой стилистики. Затем всё стандартно: вводите запрос и получаете несколько вариантов от искусственного интеллекта на выбор. Дополнительно можно указать негативный промпт, чтобы обозначить, каких элементов на картинке быть не должно.
Для работы с сервисом регистрироваться не обязательно, однако в браузере Opera с включённым VPN запросы не всегда срабатывают. В Google Chrome всё стабильнее, но приготовьтесь к тому, что во время генерации вас могут отвлекать многочисленные рекламные баннеры.
Читайте также:
Получать картинки можно с компьютера и из приложения на смартфоне. За одну генерацию сервис создаёт девять вариантов в разрешении 256×256 пикселей. Вы можете выбрать понравившееся изображение и улучшить его с помощью ИИ-функции Upscale до разрешения 1024×1024 пикселя.
Подписка на платную версию нейросети Craiyon начинается от 5 долларов в месяц. За эту сумму вы можете убрать рекламу и водяной знак, использовать функцию удаления фона за 15 секунд, а также генерировать неограниченное количество изображений — по 9 картинок за 45 секунд.
Dream by Wombo — бесплатно создаёт эстетичные иллюстрации
Язык интерфейса: английский.
Нужна ли авторизация: да, через аккаунт Google или Apple либо через электронную почту.
Пробная версия: редактор бесплатный. По подписке доступны дополнительные стили, генерация четырёх картинок по одному промпту вместо одной, а также создание видео. Премиум-подписка стоит от 9,99 доллара в месяц.
После регистрации вы попадёте в раздел Create, где можно написать промпт до 350 символов и выбрать стиль — от чернильной графики до стрит-арта. Нейросеть создаст вертикальные изображения, которые подходят в качестве иллюстраций для соцсетей и обоев для смартфонов.
В бесплатной версии вы получите одно изображение по вашему запросу. По подписке можно получить сразу четыре варианта. Также подписка позволяет редактировать результат, для этого нужно нажать кнопку Make variations. На момент обзора доступен бесплатный пробный период — 3 дня, но для его активации необходимо пополнить счёт на 90 долларов.
Помимо онлайн-версии, вы можете скачать мобильное приложение для iOS и Android. Однако на момент обзора в нём не получится бесплатно сгенерировать картинки — требуется подписка. В приложении можно редактировать фотографии и загружать собственные изображения для добавления различных эффектов с помощью нейросети. Например, можно вставить фото известной личности рядом с вашим фотопортретом.
Image Creator — нейросеть, интегрированная в Bing
Язык интерфейса: русский, английский и другие.
Нужна ли авторизация: да, через аккаунт в Microsoft.
Пробная версия: есть, количество изображений не ограничено.
Image Creator — это нейросеть Microsoft, которая позволяет создавать картинки через чат-бота Bing или на отдельной странице в любом браузере. Для начала работы вам достаточно перейти по ссылке и авторизоваться.
Image Creator отлично воплощает текстовые описания, но разработчики предупреждают: некоторые картинки могут выглядеть неправдоподобно или искажать определённые элементы. Этот недостаток присущ многим нейросетям, так как развитие любой новой технологии требует времени.
Стиль изображения следует указывать в запросе, где также можно указать настроение рисунка и другие детали. Нейросеть генерирует квадратные картинки в высоком разрешении, размер выбрать нельзя.
В день вы можете использовать 25 улучшений, позволяющих создавать картинки без очереди. Как только улучшения закончатся, время ожидания рисунка увеличится. Нейросеть создаёт сразу четыре иллюстрации за один запрос и сохраняет их историю. Таким образом, вы можете сгенерировать несколько вариантов и выбрать из них лучший.
Starryai — рисует картинки по референсам
Язык интерфейса: английский.
Нужна ли авторизация: да, через аккаунт в Google или Apple.
Пробная версия: есть, позволяет бесплатно сгенерировать пять картинок.
Нейросеть Starryai создаёт изображения по текстовым запросам, а также на основе готовых фотографий. После авторизации вам будут доступны пять бесплатных Lumen — валюта сервиса, одна единица которой позволяет сгенерировать четыре картинки по одному запросу в разрешении 2048×2560 пикселей. Нейросетью можно пользоваться в онлайне или в iOS-приложении. Версия для Android пока недоступна.
Если пяти бесплатных генераций вам оказалось недостаточно, Lumen можно купить отдельно — от 40 до 1000 штук. За 40 штук нужно заплатить 15,99 доллара. Также Lumen можно зарабатывать, рассказывая о сервисе в различных соцсетях и на других платформах. Например, вы можете заработать 3 Lumen, опубликовав своё творение и упомянув «starryai» на любом сабреддите.
Для начала работы выберите стиль изображения. Нейросеть умеет создавать художественные рисунки, реалистичные фотографии, детализированные, плоские и 3D-иллюстрации. Вы также можете создать собственный стиль. Для этого выберите от 5 до 60 фото в желаемом стиле, и нейросеть сможет сгенерировать рисунки на их основе.
После выбора стиля сгенерируйте текстовый запрос. Если у вас есть фотореференс, нажмите на кнопку «Загрузить изображение», и нейросеть возьмёт её за основу. Кнопка Prompt builder предлагает выбрать стилистику: текстуры, направления в живописи, а также имена известных художников. Кнопка Inspire me генерирует с помощью искусственного интеллекта случайный запрос, который вы можете взять для вдохновения.
Изображения создаются в формате 4:5. Если вы хотите изменить разрешение или улучшить готовый образ, потребуется оформить подписку. Также за дополнительную плату сервис предлагает улучшение качества рисунка, эксклюзивные стили и возможность масштабирования картинок. Подписку можно оформить на неделю или на год. Минимальный тариф стоит 1,99 доллара в неделю и включает 50 Lumen.
Lexica — платный генератор с большой медиатекой
Язык интерфейса: английский.
Нужна ли авторизация: да, через аккаунт в Google или электронную почту.
Пробная версия: нет, оплата иностранной картой.
Lexica — это платный онлайн-сервис, доступный только авторизованным пользователям. Минимальный тариф стоит 8 долларов в месяц при плате за год и включает 1000 быстрых генераций, при которых используются самые мощные серверы компании. Если вы исчерпаете лимит генераций на стартовом тарифном плане, то до начала следующего месяца создавать новые изображения будет невозможно.
Однако доступны тарифы Pro и Max, которые предлагают до 7000 быстрых генераций и позволяют продолжать создание иллюстраций даже после исчерпания лимита. В этом случае новые картинки будут обрабатываться в медленной очереди, а их количество не будет ограничено.
Для начала работы перейдите во вкладку Generate, введите текстовый запрос и при необходимости добавьте негативный промпт — элементы, которые вы не хотите видеть на фото. Также можно изменить разрешение и ориентацию изображения, а после генерации отредактировать его.
Lexica не предлагает бесплатного тарифа для пробного периода и знакомства с ИИ-сервисом. Однако на главной странице есть поисковая строка, где вы можете ввести запрос и просмотреть примеры работ. Также вы можете кликнуть на любое изображение, чтобы увидеть его вариации.
Easy-Peasy.AI — агрегатор популярных нейросетей на выбор
Язык интерфейса: английский.
Нужна ли авторизация: да, можно зайти через аккаунт Google или электронную почту.
Пробная версия: есть, 5 бесплатных кредитов.
Easy-Peasy.AI — это онлайн-сервис, который позволяет создавать изображения с помощью одной из четырёх нейросетей: DALL-E 3, Midjourney v6, Stable Diffusion 3.0 и Stable Diffusion XL. Помимо выбора нейросети, вы можете задать стиль изображения или указать имя художника, чей стиль искусственный интеллект должен будет воспроизвести. Однако есть ограничение: стили современных художников нельзя скопировать из-за авторских прав.
По умолчанию сервис рекомендует использовать модель DALL-E 3. Одна стандартная картинка в разрешении 1024×1024 пикселя стоит 2 кредита. Пример такого рисунка вы можете увидеть выше. За дополнительные кредиты можно изменить разрешение и повысить качество изображения.
Для получения лучших результатов сервис рекомендует использовать Midjourney v6. За генерацию одной картинки нейросеть берёт 2 кредита и создаёт 4 картинки за раз — то есть для одного промпта нужно 8 кредитов. На бесплатном тарифе протестировать нейросеть не получится, так как вам доступно всего 5 кредитов. За дополнительную плату можно изменять соотношение сторон изображения в диапазоне от 1:1 до 9:21.
Читайте также:
За создание картинки размером 1024×1024 пикселя нейросеть Stable Diffusion 3.0 берёт 2 кредита. За дополнительную плату можно повысить качество изображения и выбрать другое соотношение сторон вместо 1:1.
Самой экономичной является нейросеть Stable Diffusion XL, которая берёт 0,25 кредита за одно изображение. За 1 кредит можно создать 4 картинки.
Минимальная стоимость подписки на Easy-Peasy.AI начинается от 4,99 доллара в месяц при плате за год. Подписка включает все инструменты сервиса, но для генерации картинок на базовом тарифе доступно всего 25 кредитов. За 40 долларов в месяц вы можете приобрести максимальный пакет, но он ограничен 700 кредитами.
Кому принадлежат права на сгенерированные нейросетью изображения?
На данный момент ответ — никому.
Нейросеть не человек, поэтому никакие права принадлежать ей не могут. Создатели нейросетей никакого участия в генерации изображений не принимают, поэтому также не могут претендовать на авторские права. Вам, в свою очередь, права тоже не принадлежат: вы не принимали значительного участия в создании картинки (пока что идея и текстовый запрос активным участием не считаются).
Пока не введено никакого регулирования, вы можете генерировать сколько угодно изображений и использовать их где и как захотите.
Рисующие нейросети хорошо справляются с абстрактными запросами, но могут испытывать трудности в отрисовке конкретных деталей. Если интересно, попробуйте сами и напишите такой запрос: «Слонёнок ест бананы на фоне города, закатное солнце, стиль Pixar». Скорее всего, только три из восьми нейросетей смогут изобразить бананы, а стиль Pixar удастся воспроизвести лишь двум.
Хоть логика построения запросов везде примерно одинаковая, в каждой нейросети есть свои нюансы. Поэтому рекомендуем выбрать одну, самую удобную, и тренироваться писать запросы в ней. Тогда результат получится более предсказуемым.
Больше интересного про код — в нашем телеграм-канале. Подписывайтесь!