10 нейросетей для работы с картинками в 2024 году
Читабельный текст внутри картинок, создание видео из статичных картинок, создание моделей в своей стилистике и другие новые возможности нейросетей.
![](https://248006.selcdn.ru/main/iblock/e98/e98ed41df8430fe5531a32521b5fd19f/d2dd271921da83ff1487c9e661cbfb55.jpg)
![](https://248006.selcdn.ru/main/iblock/e98/e98ed41df8430fe5531a32521b5fd19f/d2dd271921da83ff1487c9e661cbfb55.jpg)
Иллюстрация: Полина Честнова для Skillbox Media
В этом году вышло много новых нейросетей, а уже существующие игроки на рынке выпустили обновления. Разработчики улучшают качество изображений, внедряют возможности анимации и обучают нейросети копировать любую стилистику, чтобы ИИ стал полезнее в работе над коммерческими проектами.
Firefly
Adobe в 2023 году представила генеративный ИИ Firefly и внедрила его в Photoshop. В этой программе нейросеть отвечает за функцию Generative Fill — добавление и перерисовку объектов на фото.
Также Firefly добавили в Adobe Express — приложение Adobe с базовыми функциями для работы с диджитал-контентом. Также нейросетью можно пользоваться отдельно в браузере — сейчас она доступна бесплатно, но заблокирована для пользователей из России.
Что умеет
- Создавать растровые изображения по текстовому запросу.
- Создавать готовые дизайн-макеты по описанию.
- Делать векторную графику по промпту.
- Дорисовывать изображения с учётом содержимого.
- Применять эффекты и текстуры к тексту.
- Перекрашивать изображения.
Где использовать
По подписке в продуктах Adobe или бесплатно в браузере.
![](/upload/setka_images/14155905012024_accf102caaa970ce65d217b9ae9a8e9a57caa67c.jpg)
Скриншот: сайт Firefly / Skillbox Media
Exactly.ai
Главная фишка сервиса — возможность создавать собственные модели. Сначала эта нейросеть называлась Durer.ai и имела ограниченный набор инструментов: релиз состоялся в декабре 2022 года. Но в 2023-м разработчики выпустили несколько обновлений и переименовали ИИ в Exactly.ai.
Что умеет
- Генерировать изображения по текстовому запросу на основе существующих моделей: можно выбрать из десятков моделей в разной стилистике.
- Редактировать сгенерированные изображения: стирать и добавлять объекты в последующих генерациях.
- Создавать новые модели на основе нескольких загруженных изображений в схожей стилистике.
Где использовать
На сайте Exactly.ai. Есть бесплатная версия с широким функционалом: можно создать до трёх своих моделей. Мы подробно описали процесс в небольшом гайде.
![](/upload/setka_images/14155805012024_08fda0244b5397e030ee401fd2bea5b24f78a72b.jpg)
Изображение: Sally Hill / Exactly.ai
![](/upload/setka_images/14155805012024_bd473197c461193ea9b6d317f4c236910d065887.png)
Читайте также:
Exactly.ai — как и зачем создавать свои модели в нейросети
Узнали, как обучать нейросеть на основе собственных работ и применять сгенерированные изображения в своих проектах.
![](/upload/setka_images/14260405012024_a3e9b924b0c79cb7169afa563a255fa0a5b1cadd.png)
Изображение: Calavera Catrina / Exactly.ai
Midjourney 6
Одна из самых популярных нейросетей в 2023 году выпустила обновление. В Midjourney 6 добавили несколько новых инструментов, улучшили качество изображений и точность генерации — теперь нейросеть допускает меньше ошибок и может выдавать картинки в высоком разрешении.
Что умеет
- Zoom Out — эта функция напоминает Generative Fill в Photoshop: нейросеть достраивает окружение, расширяя картинку в разные стороны. Также есть опция Custom Zoom, которая позволяет по мере генерации менять запрос.
- Make Square — дорисовка изображения такая же, как и в Zoom Out, но нейросеть будет достраивать изображение любого формата до квадратного.
- Vary (Strong & Subtle). В Midjourney давно можно было делать разные вариации сгенерированного изображения, но в модели 5.2 можно выбирать, насколько сильно новая версия должна отличаться от исходного изображения.
- В версии 6.0 нейросеть научилась правильно генерировать текстовые картинки на английском языке.
![](/upload/setka_images/14155805012024_6896a8696b8038f4fc8989ab005e4fccc3b90047.jpg)
Изображение: Midjourney / Marloes Ratten / Sprinkle of AI
![](/upload/setka_images/14155805012024_c7c2d6650fe8dd3125b1541cb39af56649bd56fa.jpg)
Изображение: Midjourney
![](/upload/setka_images/14160005012024_0ed1686442ac630326a48ddcef43684fa02b904b.jpg)
Изображение: Midjourney
Где использовать
На сайте можно оформить подписку. В 2023 году нейросеть стала полностью платной — от 8 долларов в месяц.
![](/upload/setka_images/14155805012024_a3e9b924b0c79cb7169afa563a255fa0a5b1cadd.png)
Читайте также:
Как правильно работать в Midjourney: лучшие команды, промпты и лайфхаки от дизайнеров
Эксперты делятся опытом, как составлять промпты, генерировать варианты решений и экономить часы работы.
YandexART
«Яндекс» выпустил новую нейросеть, которая работает в мобильном приложении «Шедеврум». На официальном сайте отмечают, что нейросеть будет полезна для творческих экспериментов и создания рекламных объявлений, а в дальнейшем YandexART планируют обучить генерации видео.
Что умеет
- Создавать изображения по текстовому запросу.
- Создавать видео на основе изображений — функцию запустили в режиме тестирования, она доступна только активным пользователям приложения.
Где использовать
YandexART доступна только в мобильном приложении «Шедеврум».
![](/upload/setka_images/14155805012024_fc9956ee2f4201e204a5532c68850c6715ed24e0.jpg)
Изображение: «Шедеврум»
![](/upload/setka_images/14155805012024_6caf85fa09e0642959e62c753d9a2f18236eb1da.jpg)
Изображение: «Шедеврум»
Gen-1 и Gen-2
Компания Runway ML в начале 2023 года выпустила нейросеть для генерации видео — Gen-1. А в ноябре уже успела улучшить её: сейчас пользователям доступна версия Gen-2.
Что умеет Gen-1
- Перерисовывать исходный ролик в заданной стилистике: например, из реалистичного видео можно сделать мультфильм.
- Накладывать маски — так можно перекрасить какой-то объект или добавить нужную текстуру.
- Создавать видео по рендеру без текстур — нейросеть делает реалистичное изображение и анимирует его.
Подробнее посмотреть, как работают эти функции, можно на официальном сайте.
Что умеет Gen-2
- Генерировать видео по текстовому запросу.
- Оживлять статичные фотографии.
Эти функции также подробно демонстрируют на сайте.
Где использовать
Работать с нейросетью можно в сервисе Runway ML. В бесплатной версии единоразово доступно 125 кредитов и создание трёх коротких видео. Стоимость платной подписки начинается от 12 долларов в месяц.
![](/upload/setka_images/14155905012024_11a1d33ad10be24be98dc84cf3f4c2293103c450.gif)
Изображение: Runway ML
DALL-E 3
Популярный генеративный ИИ от OpenAI в 2023 году обновился до третьей версии. Теперь модель точнее реагирует на запросы пользователей, прорисовывает больше деталей. Пользователи отмечают, что в новой версии действительно улучшили изображение рук и текста в картинках. При этом функционал программы остался прежним.
Осенью DALL-E 3 интегрировали в ChatGPT. Теперь пользователи могут запрашивать нужные картинки прямо в диалоге с ChatGPT. Если запрос был подробный, он будет в точности передан DALL-E 3. Если деталей не хватает, ChatGPT поможет дополнить описание.
Что умеет
- Генерировать изображения по текстовому описанию.
- Интерпретировать даже неточные запросы, написанные в любой манере в диалоге с ChatGPT.
![](/upload/setka_images/14155905012024_cece785eb92cd643f5e788e5f37e3d933a76f56c.jpg)
Изображение: DALL-E 3
![](/upload/setka_images/14160105012024_2229e417950c39bd1ac90259b6c781a232a40430.jpg)
Изображение: DALL-E 3
Где использовать
DALL-E 3 доступна в платном тарифе ChatGPT. Бесплатно опробовать возможности нейросети можно в сервисе Microsoft Bing, но для пользователей из России эта функция недоступна.
Kandinsky 3.0
«Сбер» выпустил третью версию своей нейросети. В ней можно создавать ещё более фотореалистичные изображения, а также разработчики обучили ИИ новым возможностям.
Что умеет
- Понимать образы русской культуры: «Кандинский» может нарисовать Бабу-Ягу или Нарышкинское барокко.
- Генерировать видео. Ролики можно создавать по текстовым запросам, длительностью до 8 секунд. При создании запроса можно выбирать направление камеры и количество сцен, составляя описание для каждой из них. Однако реалистично придавать движение объектам, как Gen-2, нейросеть пока не умеет. Также при выборе двух и более сцен трудно синхронизировать их стилистику.
Где использовать
«Кандинский» доступен на сайте Fusion Brain, а также в чат-ботах в Telegram и VK. Нейросеть полностью бесплатная.
![](/upload/setka_images/14155905012024_ef20dc169f47ed88607e79936fa7ef349bc53487.gif)
Изображение: Fusion Brain
![](/upload/setka_images/14155805012024_44e69e18d5579b310b71a78d394ed8c7a91c182f.png)
Читайте также:
«Кандинский»: как пользоваться нейросетью «Сбера»
Генерировать картинки по текстовым промптам, совмещать несколько изображений и стирать ненужное ― «Кандинский» к вашим услугам.
Stable Doodle
Это новая нейросеть от Stability.AI, которая работает в разных стилях: от фотореализма до pexel-арта.
Что умеет
- Генерирует изображения по эскизам. От руки можно нарисовать желаемое изображение чёрной линией, написать текстовый промпт к нему.
- Может соблюдать выбранный стиль или работать без стиля.
Где использовать
Сервис доступен на сайте ClipDrop, но только для PRO-аккаунтов c платной подпиской за 79,99 доллара, есть бесплатный пробный период. Оплата с устройств с российской геолокацией недоступна.
![](/upload/setka_images/14155805012024_d75dd4921f9f5ca9dc828e1efafbd5a21dfa9c5d.jpg)
Изображение: Stability.AI / Jonkaja / Reddit
Stable Diffusion 2.0
Stability.AI не только выпускают новые нейросети, но и дорабатывают свой самый известный сервис — Stable Diffusion. Улучшилось качество изображений и появилось больше возможностей.
Что умеет
- Значительно видоизменять исходное изображение с помощью ИИ: новая версия отличается креативным подходом.
- Лучше работать с дорисовыванием и стиранием объектов на сгенерированном изображении.
Где использовать
Пользоваться Stable Diffusion 2 можно бесплатно: скачать и установить программу или работать в онлайн-редакторе.
![](/upload/setka_images/14155805012024_b76bc71fa80c20942ed01e19c21ead7b69ad6b89.jpg)
![](/upload/setka_images/14155905012024_1c076733da30d01108464d85a8ffad1517acec59.jpg)
![](/upload/setka_images/14155905012024_3511985f8d2fe60f5a689701dcfbe84110df1893.png)
Читайте также:
Stable Diffusion: что это за нейросеть и как её использовать
Для чего стоит скачать Stable Diffusion, как установить программу и какие параметры пригодятся при генерации картинок.
StyleDrop
Это нейросеть от Google, которая делает качественный плагиат. Предполагается, что StyleDrop станет полезным инструментом для дизайнеров и художников. Google представила нейросеть летом 2023 года, но для пользователей она пока недоступна.
Что умеет
Пользователь загружает изображение какого-то художника или свою работу, а потом меняет промпты — ИИ будет создавать картинки в стилистике заданного изображения.
Где использовать
Релиз ожидается в 2024 году. Пока можно почитать об этом ИИ подробнее на GitHub.
![](/upload/setka_images/14155905012024_62bf1942effdabf0107c530d35221fdf53489254.jpg)
Изображение: StyleDrop
![](/upload/setka_images/14160005012024_ea2b2f998665356b094cbc9e4d99ecdc646b93d5.jpg)
Изображение: StyleDrop
![](/upload/setka_images/14155905012024_b200d8bc76303a5287d3954213dd40d331052ae4.jpg)
Изображение: StyleDrop
Больше интересного про дизайн в нашем телеграм-канале. Подписывайтесь!