Как разработать игру с помощью нейросетей: опыт креативного продюсера
Код, графика и музыка — всё с помощью нейросетей.
Иллюстрация: Lo-fi Sort / Anastasiia Kirilenko / freepik / Freepik / Дима Руденок для Skillbox Media
Для создания полноценной мобильной игры нужна большая команда профессионалов и много времени. А что, если парочка нейросетей может заменить целую команду и сократить время разработки до нескольких недель? В статье рассказываем про кейс Анастасии Кириленко, которая разработала игру для iOS без знания программирования, опыта в 3D-моделировании, но с помощью нейросетей.
Эта статья написана по мотивам треда Анастасии Кириленко в социальной сети X.
Содержание
Анастасия Кириленко
Креативный продюсер, маркетолог, разрабатывает телеграм-игры.
Ведёт канал «Настя и роботы в геймдеве!».
Идея создания
В мае 2024 года проект, в котором я работала маркетологом, закрылся. Последние месяцы я трудилась сутками напролёт. В моей карьере такое случилось впервые — до этого я шесть лет работала на одном месте. Навыка проходить собеседования у меня не было, так как это моё первое место работы.
Эти дни выдались очень напряжёнными, и на фоне стресса я начала играть в популярную игру Water Sort. В ней надо переливать жидкости разного цвета по колбам так, чтобы цвета не смешивались. За неделю прошла больше 500 уровней, параллельно занимаясь поисками работы.
В процессе поиска поняла, что не хочу отдавать всё время работе, поэтому просто начинаю жить: играю, читаю книги, каждый день ем пирожные, живу одним днём и даже становлюсь сертифицированным дайвером. Впервые со школы моё лето снова ощущается беззаботным и весёлым.
На этот момент в Water Sort я прошла уже больше 1500 уровней и мне начали надоедать долгие анимации переливания жидкости. Появилась идея создать игру с похожей механикой, но без долгих анимаций. Важно отметить, что я не умею писать код и рисовать. Решила просто проверить, смогут ли нейросети заменить мне все эти навыки. Так и родилась идея создать игру Lo-fi Sort, а на реализацию ушло чуть больше двух недель.
Код
Я почти пять лет вообще не писала код, поэтому делегировала эту задачу чат-боту Claude. У него есть режим Projects, который позволяет создавать рабочие пространства с собственными базами данных. Например, можно загрузить в Claude код проекта, чтобы при генерации ответов нейросеть анализировала именно этот код.
Флоу работы с Claude выглядит следующим образом:
- Продумайте, какой результат вы хотите получить от нейросети и подробно опишите свои хотелки.
- Скопируйте код и проверьте, работает ли он так, как вы это задумывали.
- Если всё работает правильно, то добавьте код в базу знаний Claude и продолжайте генерировать код дальше.
В качестве движка для своей игры я выбрала Unity, так как Claude отлично справлялся с генерацией кода для него.
Сейчас для разработки других проектов использую Cursor — среду разработки с интегрированными нейросетями. Её интерфейс похож на Visual Studio Code, а во время генерации также учитывается контекст всего проекта. Это избавляет вас от постоянного копирования и вставки кода, так как нейросеть сразу может вносить изменения в проект, а не просто генерирует решение в чате.
Графика и анимации
Генерация графики и анимации персонажей — один из самых сложных процессов. Тут нейросети могут додумать лишние детали и удалить важные. Поэтому я выработала для себя специальный алгоритм. Расскажу о нём далее.
Генерируем концепт 3D-персонажа
Для генерации 3D-персонажа нужно сначала создать картинку, а после передать её нейросети, которая создаст трёхмерную модель. Важно, чтобы персонаж на картинке стоял в позе буквы «А» или «Т» — так его будет проще анимировать.
Персонажей для своей игры я генерировала в Midjourney с помощью следующего промпта:
3d model [описание персонажа] in [стиль] style, free hands, T-pose ready to animation, front view on simple blue background
Midjourney предлагает четыре варианта, выбираем из них наиболее подходящий, апскейлим его и редактируем области с помощью функции Vary (Region), если это нужно. Например, так можно изменить положение рук персонажа.
Читайте также:
Превращаем картинку в 3D-модель
Для конвертации картинок в трёхмерные модели я использовала сервис HyperHuman. Тут всё просто: отправляете сгенерированное изображение и в ответ получаете готовую 3D-модель. Можно выбрать уровень детализации: 3, 10 или 20 тысяч полигонов.
Для простых объектов можно не заморачиваться с концептом. В HyperHuman есть встроенная нейросеть, которая с нуля генерирует 3D-модели. Это пойдёт для объектов окружения, мебели и декораций.
У сервиса есть и минусы. Например, нейросеть не очень хорошо справляется с созданием UV-разметки. HyperHuman обойдётся в 30 долларов в месяц. За эти деньги можно сгенерировать 30 моделей, а каждую модель можно бесплатно переделывать 20 раз.
Анимируем модель
3D-модели я анимировала в сервисе Mootion и пользовалась им через Discord. У сервиса есть официальный сервер, а для генерации надо отправить команду /motion с промптом в один из чатов под названием Creation и выбрать из списка наиболее подходящего по комплекции персонажа. После этого нейросеть сгенерирует FBX-файл и пришлёт его в чат. Сгенерированную анимацию можно связать с 3D-моделью персонажа в Blender. На моём ютуб-канале есть подробное руководство, в котором я пошагово показала весь процесс создания анимированного персонажа.
Музыка
С генерацией саундтреков отлично справляется сервис Suno. В нём можно создавать инструментал и песни. Для начала генерации надо просто выбрать жанр и указать запрос. Даже бесплатного тарифа хватит для экспериментов и поиска того самого трека.
Читайте также:
Маркетинг
Скорее всего, в социальных сетях вы встречали странные рекламные ролики, в которых герой попадает в странную ситуацию. Обычно ему можно помочь из неё выпутаться, если перейти по ссылке и скачать мобильную игру. Такие рекламные ролики тоже можно генерировать с помощью нейросетей.
Сперва создадим в Midjourney несколько кадров, которые будем использовать для рекламы. В промпте надо детально описать персонажей, которые будут на изображениях, и их действия. Много картинок не надо, хватит 2–4 кадров.
После изображения надо анимировать с помощью сервиса Luma AI и увеличить разрешение с помощью Video Quality Enhancer на портале Vmake AI. В итоге получим короткий видеоролик.
Для видео, конечно же, нужна фоновая музыка. Её можно сгенерировать с помощью уже знакомого сервиса Suno. В конце останется собрать всё это вместе и наложить звуковые эффекты.
Читайте также:
На создание такого ролика уйдёт около двух часов, и его можно будет использовать для своей рекламной кампании.
Авторские права
Я выпускала игру Lo-fi Sort в App Store. Весь контент в ней полностью сгенерирован: от музыки до 3D-моделей и кода. Но это не помешало Apple задержать выпуск приложения из-за опасений, что музыка и графика могут нарушать авторские права третьих лиц.
Ситуация неприятная, но её тоже можно решить с помощью нейросети. Просто отправьте ChatGPT текст письма от Apple и попросите рассказать, что надо сделать, чтобы решить вопрос.
В моём случае пришлось предоставить Apple ссылки на лицензионные соглашения сервисов, которые я использовала, а также подтверждение того, что у меня оформлены на них подписки. Всё дело в том, что многие сервисы отчуждают права на сгенерированный контент, только если оформить подписку.
Что в итоге
- Простую игру можно полностью создать с помощью нейросетей. Есть сервисы для генерации кода, 3D-графики, анимаций и музыки.
- Этот способ отлично подходит для прототипирования. Если раньше на тестовую версию проекта уходило несколько месяцев разработки и силы нескольких команд, то с помощью нейросетей можно справиться за пару недель.
- У магазинов приложений могут возникать вопросы к соблюдению авторского права, но если предоставить ссылки на лицензионные соглашения, то администрация одобрит релиз игры.