Метагейм

Как сбалансировать игру, используя статистику?

Артур Мостовой, Lead Game Designer
25 апреля 2017

В своей предыдущей статье я постарался описать, каким образом можно превращать абстрактные игровые сущности в конкретные числа для дальнейших манипуляций (какими бы они ни были). Умело орудуя математическим аппаратом, можно без особых сложностей вывести первую версию сбалансированной системы для данной нам игры. Однако, поскольку она, как правило, базируется на некоем числе допущений и порой нетривиальных вычислениях, мы не можем гарантированно утверждать, что эта теоретически хорошая система покажет себя так же хорошо на практике, когда мы зарелизим ее для миллионов игроков. Опять же, если в дальнейшем нам потребуется что-то в ней подправить, как определить, в какой момент подправлено уже достаточно?

Конечно, всегда есть вариант рискнуть и просто зарелизить то, что мы придумали — будь то первый релиз игры или апдейт — и посмотреть, как пойдет. Обычно это не самый лучший вариант, потому что можно просто-напросто сломанным балансом немного подправить себе DAU — не в сторону увеличения.

К счастью, есть способ получше — обильное тестирование в условиях, максимально близких к реальным. Для этой цели большое число компаний используют различные методы тестирования при поддержке статистических данных, чтобы убедиться, что финальный продукт получится надлежащего качества. Методы, которые я бы хотел упомянуть в рамках данной статьи — это бета-тест (обычно проводимый перед первым релизом) и т.н. публичный тестовый сервер (на котором обычно проверяют апдейты, запланированные для уже выпущенной игры).


Как это работает

Оба метода достаточно хорошо воспроизводят условия, максимально близкие к реальности, если статистическая выборка при этом достаточно велика и релевантна.

Релевантность обеспечивает качественный эффект. Когда вы проводите бета-тест, предполагается, что вы стараетесь подобрать для этого аудиторию, заинтересованную в вашей игре после ее релиза, ведь они, вероятно, и станут вашими непосредственными игроками. Если попросить любителей жанра match-3 сыграть в хардкорный соревновательный онлайн-зомби-шутер, какой после этого можно ожидать фидбек? Статистические данные будут нерелевантными. Говоря же о публичном тестовом сервере, скорее всего, в роли тестирующих будут выступать люди, уже играющие в вашу игру — кому еще интересно погонять будущий апдейт? В данном случае релевантность является данностью.

Большой размер выборки обеспечивает количественный эффект. Статистически, чем больше людей проверили баланс вашей игры на прочность, тем точнее будет окончательный результат. Но это не значит, что нужно разворачивать предвыборную кампанию. Помните о релевантности. Несколько тысяч людей — уже неплохо, получится больше — отлично. Говоря о мотивации, помимо того, что вы даете людям доступ к эксклюзивному будущему контенту (даже если это лишь балансные правки, что вообще-то является основной соревновательных игр), вы также можете награждать их за участие и фидбек чем-то ценным в самой игре.


На что смотреть?


Статистические данные уместно поделить на две разные категории: фидбек (впечатления) и поведение (статистика).

Что касается впечатлений, ключевым моментом здесь является то, что вес каждого отдельно взятого мнения уменьшается с числом уникальных мнений. Помимо этого, у человека есть физический предел по количеству данных, которые он может (и хочет) обработать вручную. Если в игру играет 5 человек, можно просто сходить в кафе и выслушать их, обсудить их идеи и сделать для себя выводы. Если же аудитория составляет несколько миллионов человек, как много отзывов и мнений можно попробовать прочесть\услышать прежде, чем потеряется связь с реальностью? Опять же, сколько людей — столько и мнений, как реагировать на абсолютно полярные впечатления?

По этой причине, если аудитория теста велика, логично было бы дать игрокам способ выразить свои мысли, но так, чтобы вы могли при этом взглянуть на картину глобально. Первый инструмент, способный справиться с данной задачей, который приходит в голову — опрос. После проведения теста спросите ваших игроков о каждой важной детали и дайте им необходимые варианты ответа. Например, в War Robots при тестировании нового оружия (которое является, по сути, не просто новой единицей контента и дополнением к текущему оружию, а сущностью, которая меняет текущий баланс одним своим существованием), мы обычно в качестве вариантов ответа перебираем все значимые параметры оружия и спрашиваем, нужно ли их увеличить или уменьшить. Конечно, есть вариант ответа «все супер» и возможность свободно высказаться. Это позволяет нам собирать отдельные мнения в коллективный фидбек для глобальной оценки.

С поведением все зависит от того, какие на ваш взгляд метрики вам нужно оценить для принятия решения о том, нужны ли дополнительные изменения. Если рассмотреть пример с оружием, обычно я смотрю на то, сколько урона нанесло оружие в среднем за бой, как часто его выбирали игроки и т.д. Важно помнить, что некоторые метрики могут быть не совсем очевидными, но при этом тоже могут дать некое представление об общем балансе. Например, сколько раз в среднем игрок погибал, экипировав конкретно это оружие. Старайтесь думать вне привычных шаблонов, когда определяете метрики для измерения.


Corner cases

После того, как мне стала понятна картина впечатлений игроков, я соотношу ее со статистическими данными — числовым видом того, как игроки вели себя в бою. Этой информации обычно хватает для принятия решения о том, готов ли апдейт или игра к релизу или необходима дополнительная калибровка.

Стоит заметить, что эксперимент не всегда может быть чистым — людские ошибки и баги все еще являются частью нашей реальности. Кто-нибудь мог забыть донастроить один из десятка параметров или на тесте присутствовал функционал, который косвенно видоизменял первичный предмет теста и, таким образом, бесповоротно менял конечную картину самого теста для игрока. Небольшой рефакторинг расчета попаданий может полностью изменить боевую систему и поведение пользователей, даже если такой эффект не закладывался по плану. В конечном итоге, все эти моменты влияют на получаемые нами данные. Поэтому важно все время следить за тем, чтобы тест проводился при надлежащих условиях или учитывать эти условия при оценке и принятии решений.

Помимо этого, ситуация очевидна в случае, если впечатления игроков совпадают с их поведением (статистикой). Но что если они коренным образом различаются? Например, протестированное оружие статистически наносит гораздо больше урона, чем было рассчитано и превосходит любое другое оружие в игре. Игроки с этим оружием просто аннигилируют все живое. Дисбаланс! Не беда, можно поправить. Секундочку — игроки просто счастливы после проведенного теста и считают, что оружие непременно должно попасть в игру! Что тогда?

Практика показывает, что в таких случаях, хотя реакция пользователей изначально может быть положительной, если действительно зарелизить дисбалансное оружие, оно довольно скоро начнет каннибализировать весь остальной контент и обеднять игровую мету (по сути становлясь единственной метой). Радость от нового крушителя черепов скоро сменится ненавистью к балансу игры. Я бы сказал, что в таких случаях (когда фидбек и статистика расходятся), стоит руководствоваться статистикой и калибровать оружие, пока оно не будет в балансе. Конечно, при этом предполагается, что статистика считается верно и с этим нет технических проблем (кстати, вышеописанный кейс может вполне указывать именно на это).

Есть и другой вариант — такой горячий прием несбалансированного контента может означать, что баланс в целом где-то проседает и при расчетах не были учтены особые факторы данного контента. Возможно, он привносит какую-то новую механику или косвенно влияет на другие процессы в геймплее. На это тоже стоит обратить внимание перед принятием решения.


Послесловие


Хотя я и использовал конкретную сущность в качестве примера (оружия), описанные подходы и кейсы могут быть генерализованы и применены к чему угодно — контенту, исправлению бага или системе баланса в целом.

Не стоит после прочтения этой и предыдущей статей предполагать, что математика и статистика обязательно нужны для того, чтобы задизайнить и выпустить хорошо сбалансированную игру, в которую люди будут играть с удовольствием. Если можете сделать это и без них — замечательно! И то и другое, в конце концов, просто инструменты в руках гейм-дизайнера — инструменты, призванные облегчить жизнь и лишний раз подвергнуть дизайн проверке, если уметь ими пользоваться.

Комментарии

Войдите на сайт, чтобы оставить комментарий

К сожалению, браузер, которым вы пользуйтесь, устарел и не позволяет корректно отображать сайт. Пожалуйста, установите любой из современных браузеров, например:

Google Chrome Firefox Opera