Размышления о будущем интерактивных персонажей в видеоиграх
Разбираемся, чего ждать от искусственного интеллекта.
Кадр: фильм «Бегущий по лезвию 2049»
Этот текст поможет лучше понять сложности социального взаимодействия в реальном мире и трудности его перевода в образ действий видеоигровых NPC. Наше поведение формирует общение с людьми, помогает понимать друг друга. И в виртуальных мирах именно поведение NPC во многом определяет впечатления от них.
Статья написана на основе исследования Венделина Райха и Вернера Ширмера о будущем искусственного интеллекта в игровой индустрии.
Венделин Райх — доктор философии, бывший научный сотрудник в области поведения ИИ в Стэнфорде, исследователь в Кембридже и Упсальском университете, разработчик Unity со стажем в несколько лет.
Вернер Ширмер — старший научный сотрудник кафедры социологии Свободного университета Брюсселя. Изучал социологию, психологию и политологию в Мюнхенском университете Людвига-Максимилиана, где получил степень доктора философии.
Райх и Ширмер вместе с ветераном игровой индустрии Софи Пезе — основатели стартапа Virtual Beings. Студия изучает поведение искусственного интеллекта и разрабатывает мобильные игры с глубоко интерактивными NPC — виртуальными компаньонами, которые могут заменить людям домашних питомцев.
10 принципов поведения
Академические корни исследований Virtual Beings уходят в психологию и искусственное поведение (AB — Artificial Behavior). Разработчики сопоставили поведение человека с поведением игровых NPC и получили 10 принципов, характеризующих правдоподобность ИИ в играх.
Если вы работаете над собственным AB-движком, стоит проверить, отвечает ли поведение ваших NPC всем 10 свойствам.
1. Поведение поддаётся наблюдению
Наблюдаемое поведение — действия, которые можно увидеть. К нему не относятся психические процессы, которые не видны человеческому глазу.
Для AB первый принцип упрощён: разработчик не должен пытаться воссоздать саму жизнь — только её внешний вид. Уолт Дисней называл это иллюзией жизни.
2. Поведение непрерывно
Живые существа действуют постоянно — с момента рождения и до самой смерти. Это не противоречит первому принципу — даже когда, казалось бы, мы ничего не делаем, можно наблюдать поведение: человек спит, сидит неподвижно, затаил дыхание. Люди живут в непрерывных потоках поведения.
Проблема AB состоит в том, чтобы генерировать такие потоки из отдельных связанных между собой видов поведения.
В мире игры Animal Crossing: New Horizons NPC взаимодействуют с игроком упрощёнными, заскриптованными способами. Одинаковые зацикленные анимации простоя дают понять, что эта простота намеренная.
3. Поведение интерактивно
В реальной жизни любое поведение интерактивно. Например, частота дыхания зависит от плотности кислорода в атмосфере. Если убрать контекст (кислород), то поведение (дыхание) потеряет смысл. Поведение всегда в контексте, он обуславливает взаимодействие людей с миром.
Для AB принцип означает следующее: всё поведение должно генерироваться процедурно — в противоположность ИИ в большинстве современных игр. Вместо процедурной генерации собираются потоки действий из заранее сконфигурированного поведения с переходами между ними — например, стоять, идти, прыгать.
Пример правдоподобных NPC — летающие бумажные рыбки в Journey. Они интерактивны, красивы, поэтичны, никогда не совершают разрушающих погружение действий. Конечно, они очень просты и созданы таким образом, чтобы программистам ИИ не приходилось продумывать сложные системы анимации или поиска пути. Зато они идеально работают на атмосферу игры.
4. Поведение ограничено
Контекст создаёт условия и накладывает ограничения, которые могут быть пассивными или активными. Ограничения динамически и непредсказуемо направляют поведение.
Реалистичный ИИ должен выйти за рамки простого процедурного выбора поведения и предложить полноценную процедурную анимацию, адаптирующуюся к ограничениям на лету.
5. Поведение упорядочено
В учебниках по ИИ часто различают сценарное и несценарное поведение. Образ действий человека — всегда комбинация того и другого. Наш мозг хранит гигантские базы последовательностей движений, которые облегчают стандартные формы поведения.
В то же время последовательности легко адаптируются к среде и контексту. Вместо того чтобы каждый раз заново решать, какие мышцы нужны для действия, мозг использует шаблоны — они уменьшают сложность каждого отдельного действия. Также подход упрощает синхронизацию между людьми — например, в танцах.
Создатели современных AB-движков черпают вдохновение в нейронауке и включают в их архитектуру параметрическую, адаптивную последовательность действий.
F.E.A.R. — первая игра, использующая в своей системе ИИ технику GOAP (Goal Oriented Action Planning). Враги не только реагируют на действия игрока, но и планируют свою цель — победить противника.
6. Поведение можно прервать
В соблюдении принципа непрерывности есть сложности. Требование непрерывности и тот факт, что поведение можно быстро прервать, тянут ИИ в противоположные стороны.
Создатели AB-движков сталкиваются с дополнительной проблемой — кажущийся недостаток контроля может быть тем, чего хочет добиться пользователь движка, — например, для достижения комического эффекта. Трудно не улыбнуться фразе трусливого NPC, когда игрок GTA V достаёт пистолет.
7. Поведение демонстрирует закономерную вариативность
Естественное поведение всегда вариативно. Какие-то различия, пусть даже небольшие, есть всегда. Произнося слова, человек может по-разному держать голову или открывать губы, но не может закрыть рот.
Для создания правдоподобных вариаций AB-движок не должен моделировать весь голосовой аппарат. На практике возможные вариации часто ограничены и упрощены.
8. Поведение иерархично
Человек одновременно делает несколько действий — и они выстраиваются в определённом порядке. Поведение почти всегда организовано иерархически, что хорошо иллюстрирует рукопожатие: оно предполагает координацию многих частей тела, которые находятся в иерархических отношениях.
Во время рукопожатия всё начинается с туловища, которое определяет положение руки (подчинённая туловищу часть тела) и наклоняется вперёд. Голова также зависит от туловища: лицо обращено в сторону второго человека. Глаза зависят от головы: сначала смотрят вниз для координации руки, затем — вверх, чтобы взгляды людей пересеклись.
9. Поведение параллельно
Это нормально — делать несколько вещей параллельно. Люди могут совмещать раздельные процессы. Например, если идти и курить, походка не будет мешать курению.
Также есть пересекающиеся действия. Скажем, идти и трястись от страха — два вида поведения, которые будут воздействовать на одни и те же части тела разными способами.
Последствия восьмого и девятого принципа для АВ идентичны — поток поведения должен состоять из множества иерархически организованных «подповедений». В качестве дополнительного усложнения подповедения могут контролировать разные или пересекающиеся моторные области тела (глаза, рот, конечности).
10. Поведение обусловлено, контролируемо и читаемо
Последний принцип, объединяющий несколько близких понятий, касается отношений между поведением и познанием. Эволюция научила нас считывать ненаблюдаемые причины поведения, придавать ему намеренность и смысл. Такое присвоение смысла действиям происходит автоматически.
Для ИИ десятый принцип означает, что невозможно отделить поведение от смысла. Оно всегда что-то выражает. Разработка AB-движка — в первую очередь психологическая задача, и только потом инженерная. Разработчик должен убедить игрока в осмысленности генерируемого поведения.
Повествовательные приключенческие игры могут выйти на совершенно новый уровень, если игровой ИИ станет более совершенным. Сейчас такие игры можно разделить на две группы. Первые — с геймплеем без акцента на NPC: например, Gone Home или What Remains of Edith Finch.
Вторые позволяют игрокам взаимодействовать с NPC в очень ограниченных условиях и используют простые деревья диалогов и поведения, как, например, в Life Is Strange и Detroit: Become Human. Подобный подход ограничивает возможности повествования и погружения в вымышленный мир.
Вас впечатляют NPC в играх?
Как игроки оценивают ИИ в современных видеоиграх? Поиск на Reddit по ключевым словам положительных тем про NPC и тем с негативом подсказывает — обсуждения игрового ИИ в положительном ключе вызывают гораздо меньше интереса, чем отрицательные отзывы.
Около 75% обсуждений сосредоточено на восхвалении NPC в горстке старых игр, особенно F.E.A.R. и Black & White. Игроки сходятся во мнении, что качественного прорыва в области ИИ персонажей не было примерно с 2005 года, когда вышла First Encounter Assault Recon. Подробнее про ИИ в играх вы можете прочитать в нашем отдельном материале.
Что делает поведение ИИ правдоподобным?
NPC правдоподобен, если его действия и контакт с игроком соответствуют врождённым и приобретённым психологическим ожиданиям относительно поведения. Правдоподобные NPC ощущаются как живые — даже если игрок знает, что это не так.
Белоснежка в классическом мультфильме Уолта Диснея кажется художественно совершенной даже в эпоху CGI. Никакой захват движения или моделирование причёски не могут заставить сильнее почувствовать её беззаботное счастье, когда она танцует с гномами. Про один из главных приёмов, оживляющий героев мультфильмов Диснея, — фотоперекладку — мы писали ранее.
Уолт Дисней знал, что ключ к тому, чтобы заставить зрителей воспринимать мультипликационных персонажей как живых существ, — не визуальный реализм. Суть в том, чтобы создать правдоподобное поведение.
Наше восприятие является автоматическим
В книге Дэниела Канемана «Думай медленно, решай быстро» автоматическое познание описывается как быстрое, непроизвольное, обусловленное ожиданиями и эмоциональное. Яркое подтверждение — эксперимент Фрица Хайдера и Марианны Зиммель в 1944 году.
Исследователи показывали людям анимацию и просили их описать, что те видят. Практически все испытуемые придавали трём движущимся фигурам человеческие качества и строили историю вокруг событий: большой треугольник «задирает» меньший, круг «чувствует страх».
Попробуйте при просмотре ролика увидеть бессмысленные движения простых фигур вместо осмысленных социальных действий — это почти невозможно.
Наше восприятие обусловлено ожиданиями
Природа и социум (через гены и воспитание соответственно) совместными усилиями наделили нас предположениями о том, как устроен мир. Человек постоянно формирует ожидания в отношении всего, что его окружает. Когда они не оправдываются, происходит две вещи:
- Познание становится медленнее и требует больше усилий — необходимо выяснить, какие ожидания были нарушены и почему.
- Позитивные психические состояния заменяются нейтральными или негативными, такими как замешательство или отвращение.
Проблема визуального реализма получили название uncanny valley — эффект зловещей долины. Социальная нейронаука учит, что мозг не знает, как понять смысл поступков существ, которые выглядят как живые, но при этом ведут себя невозможно или ненормально для живых организмов. Это касается не только изображений, но также движений и поведения.
Например, диссонанс в Cyberpunk 2077 вызывается реалистичной графикой и открытым миром, которые создают ожидания правдоподобного взаимодействия с многочисленными NPC. Впоследствии они нарушаются самыми элементарными способами — отсутствием зрительного контакта или элементарной отзывчивости персонажей под руководством ИИ.
Опираясь на психологические исследования, ожидания работают на трёх уровнях: физиология, биология и психология.
Физический уровень
Относится к нашему повседневному и отчасти врождённому пониманию того, как устроен физический мир. Мы ожидаем, что одушевлённые и неодушевлённые объекты будут подчиняться законам того, что психологи называют «наивной физикой».
Объекты имеют вес и обладают инерцией, движутся, а не появляются из воздуха, сталкиваются, а не проникают друг в друга. Одна из главных тем мемов современных игр — нарушение физических ожиданий от игры.
Биологический уровень
Постоянное наблюдение за поведением людей, домашних животных, птиц и насекомых даёт нам данные для взаимодействия с другими существами. Они неодинаковы для разных групп людей: создать виртуального питомца, правдоподобного в глазах малышей, проще, чем сделать такого для ветеринаров.
Психологический уровень
Касается ожиданий от других существ. Создание искусственных персонажей, которые будут соответствовать всем нашим ожиданиям относительно других разумов, всё ещё что-то из разряда научной фантастики. Такие персонажи должны пройти тест Тьюринга.
Идея эмпирического теста была предложена Аланом Тьюрингом в статье «Вычислительные машины и разум», опубликованной в 1950 году в философском журнале Mind. Тьюринг задался целью определить, может ли машина мыслить.
Стандартная интерпретация теста: «Человек взаимодействует с компьютером и человеком. На основании ответов на вопросы он должен определить, с кем он разговаривает: с человеком или с компьютерной программой. Задача компьютерной программы — ввести человека в заблуждение, заставив сделать неверный выбор».
Каким будет ИИ в играх будущего?
Какие проблемы игровых NPC предстоит решить разработчикам в ближайшем будущем? Основываясь на исследовании Венделина Райха и Вернера Ширмера, можно выделить несколько главных вызовов для программистов ИИ:
Не нарушать визуальный реализм, избегать проблемы «зловещей долины».
Сделать ИИ по-настоящему отзывчивым к действиям игрока и изменениям в мире игры.
Избегать упрощённых заскриптованных анимаций, разрушающих погружение.
Не нарушать ожиданий игрока о физических законах мира игры.
Убедить игрока в осмысленности поведения NPC.