Как создаётся современное искусство при помощи промптов: объясняет AI-художник
Евгений Никитин рассказал про свою работу с ИИ для берлинской галереи Марата Гельмана.
Иллюстрация: Midjourney / Евгений Никитин / Владимир Сорокин / Guelman and Unbekannt / Полина Честнова для Skillbox Media
Для выставки Владимира Сорокина «Голубое сало» Марат Гельман предложил сделать картины по мотивам романа при помощи ИИ. Работой с искусственным интеллектом занимался художник Евгений Никитин, которого впоследствии на выставке даже не упомянули.
Создание связного визуального высказывания по сложному материалу при помощи нейросети — достаточно трудоёмкая задача. Также важно было иметь в виду техническое задание от автора. По сюжету клоны русских писателей вырабатывали некое таинственное «голубое сало», вокруг которого разворачивается основное действие романа.
Медиахудожник подробно рассказал и показал, что труд промпт-инженера — это сложная, творческая и кропотливая работа.
Евгений Никитин
AI-художник, прозаик, поэт, преподаватель Пражской медиашколы.
AI-искусство инклюзивно и доступно каждому
Нейросеть Midjourney придумана не для того, чтобы дать возможность заработать старым художественным институциям и арт-рынку.
Мало кто понимает, что возможность быть художником — это привилегия. Смысл Midjourney в том, чтобы каждый мог испытать радость от визуального воплощения своих образов.
Создать полноценную картину теперь может каждый, вне зависимости от состояния здоровья или статуса. Можно не иметь возможности учиться академической живописи и всю жизнь заниматься тяжёлым физическим трудом, но всё равно воплотить любую свою художественную идею. Midjourney даёт возможность творить каждому — так заявляют сами разработчики ИИ.
Как устроена работа промпт-инженера
Распространено мнение, что промпт-инженер — это «вбивальщик текста» и занятие это сугубо техническое. Хочется по этому поводу устроить показ черновиков и продемонстрировать, как на самом деле строится работа.
Всего для создания каждой иллюстрации было сделано свыше сотни генераций. Для выставки утвердили семь работ.
Подготовка заняла два месяца: это подбор референсов, генерации, исправления и разработка новых идей.
Задача Сорокина по иллюстрации звучала так: «Гигантский кусок голубого сала полтора человеческих роста, куб (ветчины) втиснут в интерьер с людьми, одетыми в рабочую одежду химиков будущего, лаборатория, хай-тек».
Это само по себе неплохой промпт, кстати. Кроме того, писатель просил побольше фантасмагоричности. Однако первая картинка никого не удовлетворила.
Сало было не похоже на сало. Картинка не была особенно сюрреалистичной. Так что началась работа, собственно, промпт-инженера или, будем честны, AI-художника.
Я работал в версии Midjourney 5.1. Я стал развивать картинку в двух направлениях:
1. Добавлять больше фантасмагоричности с помощью конкретных деталей, которые я выдумывал сам в духе романов Сорокина (я читал большую часть из них).
2. Искать «формулу голубого сала».
Второе было, как ни странно, самым сложным.
Ранее с Владимиром Сорокиным работал другой художник, и он сделал пару сотен генераций, прежде чем получил одну приемлемую картинку.
Через варианты промптов «blue fat, blue lard» он путём проб и ошибок пришёл к «blue ham» (ветчина). Но эта «формула сала» была ненадёжной и в других сюжетах выдавала картинки, связанные с едой, всяческие застолья. Собственно, поэтому галерист Марат Гельман обратился ко мне — он курировал выставку.
В результате мучений я выяснил, что писать надо «белое сало с синими прожилками», то есть «white lard with blue veins».
Фантасмагоричности я добавлял, сначала варьируя референсы к различным художникам (эти варианты не прошли на выставку), а потом пририсовывая то всякие анатомические ужасы, то персонажа романа — Глогера, то изображал Толстого и даже Ахматову в клетке, что было в духе романа. Два из таких вариантов и прошли на выставку.
Также в вариантах можно видеть использование функции аутпейнтинга — рисования за пределами виртуального холста — и инпейнтинга — редактирования и добавления деталей внутри картинки. Два удачных варианта сала я вставлял с помощью приложения на основе Stable Diffusion, а бороду одному из гигантов — с помощью DALL-E.
Конечно, за полгода нейросети сильно продвинулись вперёд, и теперь получить эти картинки было бы гораздо проще, даже работая только с Midjourney.
А новинка DALL-E 3 может справиться с задачей целиком за один прогон промпта, правда, результат будет не слишком интересен эстетически, так как этот ИИ выдаёт крайне однотипные по стилю изображения. На момент написания этой статьи их не получится обрабатывать инпейнтингом, потому что интерфейса у этой нейросетки нет.
Как уговорить ИИ нарисовать поле голубого сала
Описание от Владимира Сорокина: «Толстой пашет поле из голубого сала».
В качестве референса пришлось брать картину Репина «Пахарь». Сразу выяснилось, что Midjourney не понимает, что такое «поле из голубого сала». Неудивительно, ведь я очень много времени потратил на изображение обычного куска голубого сала. А тут надо было этим салом засеять целое поле.
Поэтому я изобрёл такой трюк:
1. Рисуем поле голубой пшеницы. Эта задача для нейросети достаточно проста: всего лишь надо раскрасить пшеницу.
2. Делаем remix полученной картинки, заменяя в промпте слово «пшеница» на «сало». Вуаля, готово!
Получив приемлемое поле, я стал пытаться «врисовать» в него пахаря-Толстого. Midjourney не очень разбирается в пахарских аксессуарах, поэтому добиться этого было трудно.
Сначала я пошёл по неверному пути. Получив более-менее хорошего пахаря, я сделал эскиз: «приклеил» пахаря прямо в своё поле голубого сала с помощью программы на основе Stable Diffusion (но можно было это сделать и в Phoroshop).
Дальше я использовал эту картинку как референс в промптах (то есть загрузил её в Discord и вставлял ссылку на неё в начале своих промптов). Нейросеть «смотрела» на этот эскиз и опиралась на него для дальнейших генераций.
В результате я получал приемлемых пахарей или хотя бы фигурку деда с конём, но Midjourney стала терять фактуру голубого поля.
Поэтому я вернулся к полю из голубого сала и стал добавлять Толстого инпейнтингом, ссылаясь на портрет писателя (тоже кисти Репина). Вставлялись только голова и плечи Толстого, но я сделал zoom out, и Толстой наконец нарисовался целиком.
AI-творчество объединяет людей
В работе с нейросетью возникает новый тип авторства, в котором устанавливаются горизонтальные отношения между всеми участниками процесса: автором идей, заказчиком, художником 1, художником 2 (и так далее) и самой нейросетью.
Для пользователей Midjourney нормой являются коллективные дискорд-пленэры, на которых все рисуют одновременно и развивают работы друг друга, так что изначальное авторство трудно отследить: работы возникают как звенья одной цепи.
Художники не конкурируют, а создают непредсказуемые коллаборации. Эту уникальную особенность может предложить AI-искусство. Вместо иерархий — сотрудничество. Вместо эксплуатации — соавторство. Вместо раздутого эго человека — подобающее ему место в сложном взаимодействии с природой, культурой и технологиями.
Больше интересного про дизайн в нашем телеграм-канале. Подписывайтесь!