10 янв 2024
0

10 нейросетей для работы с картинками в 2024 году

Читабельный текст внутри картинок, создание видео из статичных картинок, создание моделей в своей стилистике и другие новые возможности нейросетей.

Иллюстрация: Полина Честнова для Skillbox Media

Дарья Тамилина

Пишет о дизайне в Skillbox Media, а в перерывах и сама орудует графическим планшетом. Влюблена в советские шрифты, японскую рекламу и русский язык.

В этом году вышло много новых нейросетей, а уже существующие игроки на рынке выпустили обновления. Разработчики улучшают качество изображений, внедряют возможности анимации и обучают нейросети копировать любую стилистику, чтобы ИИ стал полезнее в работе над коммерческими проектами.

Firefly

Adobe в 2023 году представила генеративный ИИ Firefly и внедрила его в Photoshop. В этой программе нейросеть отвечает за функцию Generative Fill — добавление и перерисовку объектов на фото.

Также Firefly добавили в Adobe Express — приложение Adobe с базовыми функциями для работы с диджитал-контентом. Также нейросетью можно пользоваться отдельно в браузере — сейчас она доступна бесплатно, но заблокирована для пользователей из России.

Что умеет

Создавать растровые изображения по текстовому запросу.
Создавать готовые дизайн-макеты по описанию.
Делать векторную графику по промпту.
Дорисовывать изображения с учётом содержимого.
Применять эффекты и текстуры к тексту.
Перекрашивать изображения.

Где использовать

По подписке в продуктах Adobe или бесплатно в браузере.

Примеры работы Firefly
*Скриншот: сайт Firefly / Skillbox Media*

Exactly.ai

Главная фишка сервиса — возможность создавать собственные модели. Сначала эта нейросеть называлась Durer.ai и имела ограниченный набор инструментов: релиз состоялся в декабре 2022 года. Но в 2023-м разработчики выпустили несколько обновлений и переименовали ИИ в Exactly.ai.

Что умеет

Генерировать изображения по текстовому запросу на основе существующих моделей: можно выбрать из десятков моделей в разной стилистике.
Редактировать сгенерированные изображения: стирать и добавлять объекты в последующих генерациях.
Создавать новые модели на основе нескольких загруженных изображений в схожей стилистике.

Где использовать

На сайте Exactly.ai. Есть бесплатная версия с широким функционалом: можно создать до трёх своих моделей. Мы подробно описали процесс в небольшом гайде.

Пример работы Exactly.ai — модель для создания комиксов
*Изображение: Sally Hill / Exactly.ai*

Узнали, как обучать нейросеть на основе собственных работ и применять сгенерированные изображения в своих проектах.

Пример работы Exatly.ai — модель с ботаническими иллюстрациями на чёрном фоне
*Изображение: Calavera Catrina / Exactly.ai*

Midjourney 6

Одна из самых популярных нейросетей в 2023 году выпустила обновление. В Midjourney 6 добавили несколько новых инструментов, улучшили качество изображений и точность генерации — теперь нейросеть допускает меньше ошибок и может выдавать картинки в высоком разрешении.

Что умеет

Zoom Out — эта функция напоминает Generative Fill в Photoshop: нейросеть достраивает окружение, расширяя картинку в разные стороны. Также есть опция Custom Zoom, которая позволяет по мере генерации менять запрос.
Make Square — дорисовка изображения такая же, как и в Zoom Out, но нейросеть будет достраивать изображение любого формата до квадратного.
Vary (Strong & Subtle). В Midjourney давно можно было делать разные вариации сгенерированного изображения, но в модели 5.2 можно выбирать, насколько сильно новая версия должна отличаться от исходного изображения.
В версии 6.0 нейросеть научилась правильно генерировать текстовые картинки на английском языке.

Функция Zoom Out
*Изображение: Midjourney / Marloes Ratten / Sprinkle of AI*

Пример работы Vary (Strong)
*Изображение: Midjourney*

Пример работы Vary (Sublte)
*Изображение: Midjourney*

Где использовать

На сайте можно оформить подписку. В 2023 году нейросеть стала полностью платной — от 8 долларов в месяц.

Эксперты делятся опытом, как составлять промпты, генерировать варианты решений и экономить часы работы.

YandexART

«Яндекс» выпустил новую нейросеть, которая работает в мобильном приложении «Шедеврум». На официальном сайте отмечают, что нейросеть будет полезна для творческих экспериментов и создания рекламных объявлений, а в дальнейшем YandexART планируют обучить генерации видео.

Что умеет

Создавать изображения по текстовому запросу.
Создавать видео на основе изображений — функцию запустили в режиме тестирования, она доступна только активным пользователям приложения.

Где использовать

YandexART доступна только в мобильном приложении «Шедеврум».

Пример работы Yandex.ART
*Изображение: «Шедеврум»*

В преддверии Нового года «Шедеврум» предложил пользователям сгенерировать ёлочную игрушку и повесить на виртуальную ёлку «Яндекса». Пример работы Yandex.ART
*Изображение: «Шедеврум»*

Gen-1 и Gen-2

Компания Runway ML в начале 2023 года выпустила нейросеть для генерации видео — Gen-1. А в ноябре уже успела улучшить её: сейчас пользователям доступна версия Gen-2.

Что умеет Gen-1

Перерисовывать исходный ролик в заданной стилистике: например, из реалистичного видео можно сделать мультфильм.
Накладывать маски — так можно перекрасить какой-то объект или добавить нужную текстуру.
Создавать видео по рендеру без текстур — нейросеть делает реалистичное изображение и анимирует его.

Подробнее посмотреть, как работают эти функции, можно на официальном сайте.

Что умеет Gen-2

Генерировать видео по текстовому запросу.
Оживлять статичные фотографии.

Эти функции также подробно демонстрируют на сайте.

Где использовать

Работать с нейросетью можно в сервисе Runway ML. В бесплатной версии единоразово доступно 125 кредитов и создание трёх коротких видео. Стоимость платной подписки начинается от 12 долларов в месяц.

Пример работы Gen-2
*Изображение: Runway ML*

DALL-E 3

Популярный генеративный ИИ от OpenAI в 2023 году обновился до третьей версии. Теперь модель точнее реагирует на запросы пользователей, прорисовывает больше деталей. Пользователи отмечают, что в новой версии действительно улучшили изображение рук и текста в картинках. При этом функционал программы остался прежним.

Осенью DALL-E 3 интегрировали в ChatGPT. Теперь пользователи могут запрашивать нужные картинки прямо в диалоге с ChatGPT. Если запрос был подробный, он будет в точности передан DALL-E 3. Если деталей не хватает, ChatGPT поможет дополнить описание.

Что умеет

Генерировать изображения по текстовому описанию.
Интерпретировать даже неточные запросы, написанные в любой манере в диалоге с ChatGPT.

Пример работы DALL-E 3
*Изображение: DALL-E 3*

Где использовать

DALL-E 3 доступна в платном тарифе ChatGPT. Бесплатно опробовать возможности нейросети можно в сервисе Microsoft Bing, но для пользователей из России эта функция недоступна.

Kandinsky 3.0

«Сбер» выпустил третью версию своей нейросети. В ней можно создавать ещё более фотореалистичные изображения, а также разработчики обучили ИИ новым возможностям.

Что умеет

Понимать образы русской культуры: «Кандинский» может нарисовать Бабу-Ягу или Нарышкинское барокко.
Генерировать видео. Ролики можно создавать по текстовым запросам, длительностью до 8 секунд. При создании запроса можно выбирать направление камеры и количество сцен, составляя описание для каждой из них. Однако реалистично придавать движение объектам, как Gen-2, нейросеть пока не умеет. Также при выборе двух и более сцен трудно синхронизировать их стилистику.

Где использовать

«Кандинский» доступен на сайте Fusion Brain, а также в чат-ботах в Telegram и VK. Нейросеть полностью бесплатная.

Пример работы Kandinsky 3.0
*Изображение: Fusion Brain*

Генерировать картинки по текстовым промптам, совмещать несколько изображений и стирать ненужное ― «Кандинский» к вашим услугам.

Stable Doodle

Это новая нейросеть от Stability.AI, которая работает в разных стилях: от фотореализма до pexel-арта.

Что умеет

Генерирует изображения по эскизам. От руки можно нарисовать желаемое изображение чёрной линией, написать текстовый промпт к нему.
Может соблюдать выбранный стиль или работать без стиля.

Где использовать

Сервис доступен на сайте ClipDrop, но только для PRO-аккаунтов c платной подпиской за 79,99 доллара, есть бесплатный пробный период. Оплата с устройств с российской геолокацией недоступна.

Пример работы Stable Doodle
*Изображение: Stability.AI / Jonkaja / Reddit*

Stable Diffusion 2.0

Stability.AI не только выпускают новые нейросети, но и дорабатывают свой самый известный сервис — Stable Diffusion. Улучшилось качество изображений и появилось больше возможностей.

Что умеет

Значительно видоизменять исходное изображение с помощью ИИ: новая версия отличается креативным подходом.
Лучше работать с дорисовыванием и стиранием объектов на сгенерированном изображении.

Где использовать

Пользоваться Stable Diffusion 2 можно бесплатно: скачать и установить программу или работать в онлайн-редакторе.

Для чего стоит скачать Stable Diffusion, как установить программу и какие параметры пригодятся при генерации картинок.

StyleDrop

Это нейросеть от Google, которая делает качественный плагиат. Предполагается, что StyleDrop станет полезным инструментом для дизайнеров и художников. Google представила нейросеть летом 2023 года, но для пользователей она пока недоступна.

Что умеет

Пользователь загружает изображение какого-то художника или свою работу, а потом меняет промпты — ИИ будет создавать картинки в стилистике заданного изображения.

Где использовать

Релиз ожидается в 2024 году. Пока можно почитать об этом ИИ подробнее на GitHub.