10 нейросетей для работы с картинками в 2024 году
Читабельный текст внутри картинок, создание видео из статичных картинок, создание моделей в своей стилистике и другие новые возможности нейросетей.
Иллюстрация: Полина Честнова для Skillbox Media
В этом году вышло много новых нейросетей, а уже существующие игроки на рынке выпустили обновления. Разработчики улучшают качество изображений, внедряют возможности анимации и обучают нейросети копировать любую стилистику, чтобы ИИ стал полезнее в работе над коммерческими проектами.
Firefly
Adobe в 2023 году представила генеративный ИИ Firefly и внедрила его в Photoshop. В этой программе нейросеть отвечает за функцию Generative Fill — добавление и перерисовку объектов на фото.
Также Firefly добавили в Adobe Express — приложение Adobe с базовыми функциями для работы с диджитал-контентом. Также нейросетью можно пользоваться отдельно в браузере — сейчас она доступна бесплатно, но заблокирована для пользователей из России.
Что умеет
- Создавать растровые изображения по текстовому запросу.
- Создавать готовые дизайн-макеты по описанию.
- Делать векторную графику по промпту.
- Дорисовывать изображения с учётом содержимого.
- Применять эффекты и текстуры к тексту.
- Перекрашивать изображения.
Где использовать
По подписке в продуктах Adobe или бесплатно в браузере.
Exactly.ai
Главная фишка сервиса — возможность создавать собственные модели. Сначала эта нейросеть называлась Durer.ai и имела ограниченный набор инструментов: релиз состоялся в декабре 2022 года. Но в 2023-м разработчики выпустили несколько обновлений и переименовали ИИ в Exactly.ai.
Что умеет
- Генерировать изображения по текстовому запросу на основе существующих моделей: можно выбрать из десятков моделей в разной стилистике.
- Редактировать сгенерированные изображения: стирать и добавлять объекты в последующих генерациях.
- Создавать новые модели на основе нескольких загруженных изображений в схожей стилистике.
Где использовать
На сайте Exactly.ai. Есть бесплатная версия с широким функционалом: можно создать до трёх своих моделей. Мы подробно описали процесс в небольшом гайде.
Читайте также:
Exactly.ai — как и зачем создавать свои модели в нейросети
Узнали, как обучать нейросеть на основе собственных работ и применять сгенерированные изображения в своих проектах.
Midjourney 6
Одна из самых популярных нейросетей в 2023 году выпустила обновление. В Midjourney 6 добавили несколько новых инструментов, улучшили качество изображений и точность генерации — теперь нейросеть допускает меньше ошибок и может выдавать картинки в высоком разрешении.
Что умеет
- Zoom Out — эта функция напоминает Generative Fill в Photoshop: нейросеть достраивает окружение, расширяя картинку в разные стороны. Также есть опция Custom Zoom, которая позволяет по мере генерации менять запрос.
- Make Square — дорисовка изображения такая же, как и в Zoom Out, но нейросеть будет достраивать изображение любого формата до квадратного.
- Vary (Strong & Subtle). В Midjourney давно можно было делать разные вариации сгенерированного изображения, но в модели 5.2 можно выбирать, насколько сильно новая версия должна отличаться от исходного изображения.
- В версии 6.0 нейросеть научилась правильно генерировать текстовые картинки на английском языке.
Где использовать
На сайте можно оформить подписку. В 2023 году нейросеть стала полностью платной — от 8 долларов в месяц.
Читайте также:
Как правильно работать в Midjourney: лучшие команды, промпты и лайфхаки от дизайнеров
Эксперты делятся опытом, как составлять промпты, генерировать варианты решений и экономить часы работы.
YandexART
«Яндекс» выпустил новую нейросеть, которая работает в мобильном приложении «Шедеврум». На официальном сайте отмечают, что нейросеть будет полезна для творческих экспериментов и создания рекламных объявлений, а в дальнейшем YandexART планируют обучить генерации видео.
Что умеет
- Создавать изображения по текстовому запросу.
- Создавать видео на основе изображений — функцию запустили в режиме тестирования, она доступна только активным пользователям приложения.
Где использовать
YandexART доступна только в мобильном приложении «Шедеврум».
Gen-1 и Gen-2
Компания Runway ML в начале 2023 года выпустила нейросеть для генерации видео — Gen-1. А в ноябре уже успела улучшить её: сейчас пользователям доступна версия Gen-2.
Что умеет Gen-1
- Перерисовывать исходный ролик в заданной стилистике: например, из реалистичного видео можно сделать мультфильм.
- Накладывать маски — так можно перекрасить какой-то объект или добавить нужную текстуру.
- Создавать видео по рендеру без текстур — нейросеть делает реалистичное изображение и анимирует его.
Подробнее посмотреть, как работают эти функции, можно на официальном сайте.
Что умеет Gen-2
- Генерировать видео по текстовому запросу.
- Оживлять статичные фотографии.
Эти функции также подробно демонстрируют на сайте.
Где использовать
Работать с нейросетью можно в сервисе Runway ML. В бесплатной версии единоразово доступно 125 кредитов и создание трёх коротких видео. Стоимость платной подписки начинается от 12 долларов в месяц.
DALL-E 3
Популярный генеративный ИИ от OpenAI в 2023 году обновился до третьей версии. Теперь модель точнее реагирует на запросы пользователей, прорисовывает больше деталей. Пользователи отмечают, что в новой версии действительно улучшили изображение рук и текста в картинках. При этом функционал программы остался прежним.
Осенью DALL-E 3 интегрировали в ChatGPT. Теперь пользователи могут запрашивать нужные картинки прямо в диалоге с ChatGPT. Если запрос был подробный, он будет в точности передан DALL-E 3. Если деталей не хватает, ChatGPT поможет дополнить описание.
Что умеет
- Генерировать изображения по текстовому описанию.
- Интерпретировать даже неточные запросы, написанные в любой манере в диалоге с ChatGPT.
Где использовать
DALL-E 3 доступна в платном тарифе ChatGPT. Бесплатно опробовать возможности нейросети можно в сервисе Microsoft Bing, но для пользователей из России эта функция недоступна.
Kandinsky 3.0
«Сбер» выпустил третью версию своей нейросети. В ней можно создавать ещё более фотореалистичные изображения, а также разработчики обучили ИИ новым возможностям.
Что умеет
- Понимать образы русской культуры: «Кандинский» может нарисовать Бабу-Ягу или Нарышкинское барокко.
- Генерировать видео. Ролики можно создавать по текстовым запросам, длительностью до 8 секунд. При создании запроса можно выбирать направление камеры и количество сцен, составляя описание для каждой из них. Однако реалистично придавать движение объектам, как Gen-2, нейросеть пока не умеет. Также при выборе двух и более сцен трудно синхронизировать их стилистику.
Где использовать
«Кандинский» доступен на сайте Fusion Brain, а также в чат-ботах в Telegram и VK. Нейросеть полностью бесплатная.
Читайте также:
«Кандинский»: как пользоваться нейросетью «Сбера»
Генерировать картинки по текстовым промптам, совмещать несколько изображений и стирать ненужное ― «Кандинский» к вашим услугам.
Stable Doodle
Это новая нейросеть от Stability.AI, которая работает в разных стилях: от фотореализма до pexel-арта.
Что умеет
- Генерирует изображения по эскизам. От руки можно нарисовать желаемое изображение чёрной линией, написать текстовый промпт к нему.
- Может соблюдать выбранный стиль или работать без стиля.
Где использовать
Сервис доступен на сайте ClipDrop, но только для PRO-аккаунтов c платной подпиской за 79,99 доллара, есть бесплатный пробный период. Оплата с устройств с российской геолокацией недоступна.
Stable Diffusion 2.0
Stability.AI не только выпускают новые нейросети, но и дорабатывают свой самый известный сервис — Stable Diffusion. Улучшилось качество изображений и появилось больше возможностей.
Что умеет
- Значительно видоизменять исходное изображение с помощью ИИ: новая версия отличается креативным подходом.
- Лучше работать с дорисовыванием и стиранием объектов на сгенерированном изображении.
Где использовать
Пользоваться Stable Diffusion 2 можно бесплатно: скачать и установить программу или работать в онлайн-редакторе.
Читайте также:
Stable Diffusion: что это за нейросеть и как её использовать
Для чего стоит скачать Stable Diffusion, как установить программу и какие параметры пригодятся при генерации картинок.
StyleDrop
Это нейросеть от Google, которая делает качественный плагиат. Предполагается, что StyleDrop станет полезным инструментом для дизайнеров и художников. Google представила нейросеть летом 2023 года, но для пользователей она пока недоступна.
Что умеет
Пользователь загружает изображение какого-то художника или свою работу, а потом меняет промпты — ИИ будет создавать картинки в стилистике заданного изображения.
Где использовать
Релиз ожидается в 2024 году. Пока можно почитать об этом ИИ подробнее на GitHub.
Больше интересного про дизайн в нашем телеграм-канале. Подписывайтесь!