图片由 ChatGPT DALL·E 生成
本文共 5300 字,阅读大概需要 25 分钟
「文末有招聘启示,欢迎推荐」
摘要:
随机奖励机制在当代游戏设计中已成为提升玩家黏性和游戏乐趣的关键要素。本文深入探讨了随机奖励机制在数值模型中的数学设计原理,结合具体案例,阐述了其在概率分布、期望值计算、泊松分布、指数分布等方面的应用。同时,分析了随机奖励机制对玩家心理的影响,探讨了操作性条件反射、不确定性和多巴胺效应等心理学理论如何支持这一机制的有效性。通过理论与实践的结合,本文旨在为游戏设计提供更加科学的理论分享。
关键词: 随机奖励,数值模型,概率分布,泊松分布,指数分布,操作性条件反射,玩家心理
1. 引言
在游戏设计领域,数值模型是构建游戏平衡性和可玩性的核心。随机奖励机制作为数值模型的重要组成部分,通过引入概率和随机性,增强了游戏的趣味性和挑战性。它不仅影响着玩家的游戏体验,还在很大程度上决定了游戏的商业成功。笔者将从数学和心理学的角度,深入分析随机奖励机制的设计原理和实践应用。
2. 随机奖励机制的定义与分类
随机奖励机制是指在游戏过程中,玩家在完成某项任务或行为后所获得的奖励并非固定,而是基于一定的概率分布随机生成。根据其实现形式,可以分为以下几类:
2.1 抽奖系统(Gacha Systems)
玩家使用虚拟货币或真实货币进行抽奖,获得随机的角色或道具。例如,日本手游《怪物弹珠》的抽奖系统通过概率分布控制每个角色的获取概率。
2.2 战利品箱(Loot Boxes)
玩家在游戏过程中获得战利品箱,打开后可随机获取道具。以《守望先锋》为例,战利品箱的物品稀有度按一定概率分布生成。
2.3 装备掉落机制(Loot Drop Systems)
动作类或角色扮演类游戏中,敌人被击败后会随机掉落装备。例如,《暗黑破坏神》系列使用随机数生成器(RNG)和预设的概率模型决定装备掉落。
2.4 事件奖励
在限时活动中,玩家通过完成特定任务获得随机奖励。比如,《炉石传说》中的节日活动,玩家完成任务后可以随机获得卡牌包。
3. 随机奖励的数值模型设计
随机奖励机制的核心在于其概率模型设计,涉及概率论和统计学的基础。根据奖励机制的不同,常用的概率分布有以下几种:
3.1 概率分布的应用
- 普通物品概率: ( P_common = 0.6 )
- 稀有物品概率: ( P_rare = 0.3 )
- 史诗物品概率: ( P_epic = 0.09 )
- 传奇物品概率: ( P_legendary = 0.01 )
这些概率值通过均匀分布、二项分布或指数分布等分布模型实现。其中,均匀分布适用于低价值道具掉落,指数分布用于稀有事件的发生频率控制。
3.2 期望值与方差的计算
为了平衡游戏经济系统,需要计算奖励的期望值和方差:
-
期望值 E (X) : 表示玩家平均可获得的奖励价值,公式为:
其中,( x_i ) 为奖励的价值, P (x_i) 为其获取概率。
-
方差 Var(X) : 表示奖励的不确定性,公式为:
方差较大意味着奖励的不确定性较高,可能增加玩家的兴奋感,但也可能导致挫败感增加。设计师需要找到平衡点。
3.3 渐进式概率调整与保底机制
为了防止玩家长时间未获得稀有奖励,许多游戏引入保底机制。其通过渐进式调整概率,例如,随着玩家抽奖次数 ( n ) 增加,获得稀有奖励的概率也相应增加,公式如下:
- 线性增加:
- 指数增加:
例如,手游《原神》在连续 89 次抽奖未获得五星角色时,第 90 次的概率提升至 100%。
3.4 泊松分布控制低频事件的发生
泊松分布是一种用于描述低频事件发生概率的模型,尤其适合稀有奖励掉落的场景。例如,设定平均每 100 次抽奖掉落 1 次稀有奖励,使用泊松分布可以精确计算不同情况下奖励掉落的概率。泊松分布的公式为:
其中,( lambda ) 代表事件发生的平均频率,( k ) 表示事件发生的次数。例如,当 ( lambda = 1/100 ) 时,表示每 100 次抽奖期望发生 1 次稀有奖励,基于此可以计算不同抽奖次数的掉落概率。
泊松分布确保了奖励不会过于频繁地发生,但也不会让玩家在长时间内无法获得奖励。例如,在 ( lambda = 1/100 ) 时,单次抽奖获得稀有奖励的概率约为 0.99%,但随着多次尝试,累计掉落概率会显著提高。
累计概率可以通过对立事件的概率计算:即“不掉落奖励”的概率随着尝试次数增加而减少。因此,我们计算连续 n 次抽奖都没有获得奖励的概率,并从 1 中减去这个概率,即可得出累计掉落概率。
unsetunset更详细的解释:unsetunset
泊松分布是一种用于描述低频事件发生次数的概率分布,常用于建模那些很少发生但有可能在一定时间内发生的事件。它的特点是,给定一个平均发生率 ( lambda ),可以计算某个时间段内某事件发生 0 次、1 次、2 次等的概率。
公式如下:
解释:
- ( P (X=k) ):这是事件发生 ( k ) 次的概率。
- ( lambda ):代表事件在特定时间段内的平均发生频率(或期望值)。例如,假设我们期望每 100 次抽奖中有一次稀有奖励,那么 ( lambda = 1/100 )。
- ( k ):我们想计算的事件发生的次数,( k ) 可以是 0, 1, 2, ... 等。
- ( e ):自然常数,约等于 2.718。
假设我们设计了一个抽奖系统,每 100 次抽奖中期望会掉落 1 次稀有奖励,也就是 ( lambda = 1/100 )。泊松分布可以用来描述稀有奖励的掉落频率,并帮助我们计算不同情况下掉落稀有奖励的概率。
例子:假设玩家进行了一次抽奖,想知道稀有奖励是否会掉落。
- 如果 ( lambda = 1/100 ),那么平均每 100 次抽奖才掉落一次稀有奖励。
- 我们可以使用泊松分布来计算在某一次抽奖中,稀有奖励掉落 0 次、1 次或多次的概率。
我们来看几个不同的 ( k ) 值,解释泊松分布的含义:
-
( k = 0 ):没有掉落奖励的概率
当 ( k = 0 ) 时,表示玩家抽奖后没有获得稀有奖励的概率。根据泊松分布公式:
所以,没有掉落稀有奖励的概率是大约 99%。这符合我们的预期,因为我们设计的系统是每 100 次抽奖才掉落一次稀有奖励。
-
( k = 1 ):掉落 1 次稀有奖励的概率
当 ( k = 1 ) 时,表示玩家在一次抽奖中获得 1 次稀有奖励的概率。根据公式:
这表明,在单次抽奖中,玩家获得 1 次稀有奖励的概率大约是 0.99%,与我们希望的每 100 次抽奖掉落一次奖励的平均概率一致。
-
( k = 2 ):掉落 2 次稀有奖励的概率
如果我们继续增加 ( k ),例如 ( k = 2 ),表示玩家在一次抽奖中获得 2 次稀有奖励的概率。这是极小的概率,因为我们设计的是每 100 次掉落 1 次:
所以,掉落 2 次稀有奖励的概率几乎为 0,这也符合稀有奖励的低频设计目标。
unsetunset用泊松分布控制稀有奖励频率unsetunset
通过调整 ( lambda ) 的大小,我们可以控制稀有奖励的掉落频率:
- 当 ( lambda ) 变大,奖励的掉落频率变高。例如,如果我们希望玩家平均每 50 次抽奖获得一次稀有奖励,可以将 ( lambda ) 设置为 1/50。此时,稀有奖励的掉落概率将明显增加。
- 当 ( lambda ) 变小,奖励的掉落频率变低。例如,如果我们希望玩家平均每 200 次抽奖才获得一次稀有奖励,可以将 ( lambda ) 设置为 1/200,稀有奖励的掉落概率将进一步降低。
泊松分布帮助我们精确控制这些概率,使我们能够设计出合理的游戏奖励系统,确保奖励掉落既不会过于频繁(削弱吸引力),也不会过于稀少(让玩家失去动力)。这样通过设置合理的 ( lambda ),可以确保奖励系统在长期游戏中既能吸引玩家,也不会打破经济系统的平衡。
3.5 指数分布的应用
指数分布用于模拟稀有事件的间隔时间,其概率密度函数为:
在稀有奖励掉落设计中,指数分布帮助控制奖励的掉落时间。随着尝试次数的增加,累计掉落的概率逐渐增加。这种分布设计能有效保持游戏的平衡,确保奖励掉落频率合适。
unsetunset更详细的解释:unsetunset
假设在一个 MMORPG 游戏中,有一个稀有物品“龙之宝珠”,玩家在每次击败一只怪物后都有可能获得这个物品。游戏设计者希望平均每 10 次击败怪物能掉落一次这个稀有物品。
根据指数分布,我们可以设定掉落率参数:
- λ = 0.1(因为平均间隔时间为 1/λ,所以 λ = 1/10 = 0.1)
指数分布的概率密度函数为:
λλλ
但是我们更关注的是累计分布函数(CDF),因为它表示在经过 x 次尝试后,至少发生一次事件的概率:
λ
计算具体概率:
-
经过 1 次尝试后的概率:
- 也就是说,经过一次击败怪物后,获得“龙之宝珠”的概率约为 9.52%。
-
经过 5 次尝试后的概率:
- 经过 5 次尝试,累计获得奖励的概率增加到约 39.35%。
-
经过 10 次尝试后的概率:
- 经过 10 次尝试,概率提升到约 63.21%。
-
经过 20 次尝试后的概率:
- 经过 20 次尝试,概率进一步提高到约 86.47%。
总结
- 随着尝试次数 x 的增加,指数分布的累计分布函数 F (x) 也逐渐增大。
- 这意味着,虽然每次尝试获得奖励的即时概率(瞬时概率)是恒定的,但在多次尝试后,累计获得奖励的总体概率会提高。
- 这是因为指数分布具有“无记忆性”,每次尝试的成功概率不受之前尝试结果的影响,但累计成功的概率随着尝试次数的增加而增加。
4. 随机奖励的心理学原理
随机奖励机制的有效性依赖于其背后的心理学原理。
4.1 操作性条件反射(Operant Conditioning)
斯金纳提出的操作性条件反射强调行为与结果之间的关联。间歇性强化比持续性强化更能维持行为的持久性。随机奖励机制通过不确定的奖励,使玩家不断尝试以期获得稀有奖励。
数学模型可以表示为:玩家每次未获得奖励的概率为 ( q = 1 - p ),而连续未获奖 ( k ) 次后,第 ( k+1 ) 次获奖的概率为 ( p ),但玩家的心理期待值随着 ( k ) 的增加而不断提高。
4.2 不确定性与期望效应
不确定性会激发多巴胺系统的活跃,增强玩家的兴奋感。期望效应会让玩家在面对未知结果时,产生更高的心理投入。例如,《魔兽世界》中稀有坐骑的掉落率极低,玩家通过反复挑战来获得这些低概率、高价值的奖励。
4.3 心理账户理论与认知偏差
心理账户理论(Mental Accounting Theory)由诺贝尔经济学奖得主理查德·泰勒提出,解释了人们如何对不同的金钱或资源进行主观分类。在随机奖励的设计中,玩家往往会将游戏中的虚拟货币视为与真实货币不同的心理账户。当玩家花费虚拟货币进行抽奖时,其心理负担会远低于直接消费真实货币,这也解释了为什么许多游戏鼓励玩家通过游戏内货币进行抽奖。
案例:手游中的内购与随机奖励
许多手游设计了双层货币系统(如金币与钻石),玩家可以通过游戏内的免费货币抽取随机奖励,或者使用通过购买获取的高级货币进行高概率抽奖。这种设计通过分离不同的心理账户,降低了玩家在进行高频次抽奖时的心理成本,增加了他们进行进一步投入的可能性。
4.4 证实偏差与虚假希望效应
证实偏差(Confirmation Bias)是一种认知偏差,指人们倾向于寻找、解释并记住那些与自己既有信念一致的信息。在随机奖励机制中,玩家容易在获得稀有奖励后高估系统的奖励概率,并对自己的运气产生虚假的信心。这种“虚假希望效应”进一步推动了他们的持续投入。
案例:赌博型游戏中的“近中奖”设计
在一些赌博类游戏中,设计师有意设计“近中奖”事件,例如老虎机中三个奖品符号差一点匹配。这类设计利用了证实偏差,让玩家错误地认为自己离大奖仅差一步,从而激发他们继续投入时间与金钱。
4.5 游戏化的多巴胺机制与神经反馈
神经科学研究表明,多巴胺不仅在实际获得奖励时释放,也在期待奖励的过程中分泌。在随机奖励机制中,每次抽奖、开箱的等待时间与不确定性都会导致玩家体内多巴胺的波动,这一过程极大程度上影响了玩家的情绪反应。
神经反馈可以解释为何玩家会对随机奖励上瘾。在每次抽取奖励前,玩家的预期快感与实际快感之间的不平衡通过多巴胺反馈得以平衡,这种期待与获得的反差效应,进一步驱动了玩家的行为。
5. 设计中的挑战与伦理考量
5.1 概率公开与透明度
为了增加玩家信任,游戏应公开随机奖励的概率值。通过公开概率,玩家可以理性评估他们的投入和潜在回报。这不仅能提高游戏的透明度,还能避免过度利用玩家的认知偏差。例如,日本法律已规定“抽卡”游戏必须公开稀有物品的掉落概率,这样的透明性有助于减少玩家的负面情绪和不必要的支出。
5.2 避免赌博机制
随机奖励机制与赌博有相似之处,因此设计师必须小心避免过度利用玩家的心理弱点。在设计随机奖励时,设计师应遵守道德规范,避免引发玩家的强迫性行为。例如,一些玩家可能会在不知不觉中投入大量的时间和金钱试图获得稀有物品。为避免这种情况,设计师可以通过限制每日抽奖次数或提供更合理的保底机制来减少玩家的财务风险。
数学模型:
通过设置合理的期望值 E (X) 和方差 Var (X) ,设计师可以平衡玩家体验与商业利益,避免过高的波动性。玩家需要有一个可预期的投入-回报机制来防止出现类似赌博的行为倾向。与此同时,设计师应确保奖励机制符合相关法律规定,特别是在涉及未成年玩家时。
5.3 玩家体验的优化
为了提升玩家的体验,设计师应基于玩家数据动态调整随机奖励的掉落概率。数据分析可以帮助设计师了解玩家在不同游戏阶段的心理状态,并对奖励系统做出调整。例如,当检测到玩家长时间未获得重要奖励时,系统可以适当地增加奖励概率,确保玩家获得正反馈。这种平衡既能保持玩家的兴趣,又能降低他们因挫败感而流失的可能性。
案例分析:
《炉石传说》中的卡牌掉落系统结合了概率分布与保底机制,通过算法调整奖励的掉落概率,确保每位玩家都能在合理的时间内获得至少一个高价值奖励。这种设计提升了玩家的黏性,同时控制了游戏的经济平衡。
6. 结论
随机奖励机制在现代游戏设计中的应用,既需要精确的数学设计,又需要深刻理解玩家的心理。通过合理的概率模型(如泊松分布和指数分布)以及期望值计算,设计师可以在维持游戏吸引力和玩家黏性的同时,确保游戏内经济系统的平衡。与此同时,设计师还应重视设计中的伦理问题,避免随机奖励机制演变为赌博机制,从而造成负面社会影响。
随着大数据分析、人工智能等新技术的应用,未来的随机奖励机制设计将更具个性化与智能化。通过实时监控玩家行为数据,游戏可以动态调整奖励机制,从而为不同玩家提供更为精准的游戏体验。这不仅能够提高游戏的商业成功率,还能有效平衡玩家的兴趣与参与感。
以上是我要分享的
2024 年 9 月 20 日
Lucas 顺颂时祺
您可点赞,在看,分享,甚至打赏支持笔者,笔者微信号:Lucas_doushe,公众号:良明同学,欢迎交流
另外,插播一下招聘启示,代友寻人,欢迎推荐,有兴趣请私信
- Cocos 开发
- 优先本科(好拿工作签)
- 工作地址:日本公司,在大阪,成熟合法的德州项目
- 薪资待遇:保底 40 K x 16 个月,包吃住,按国内假期走
参考文献:
- Skinner, B. F. (1938). The Behavior of Organisms: An Experimental Analysis. Appleton-Century-Crofts.
- Schultz, W. (1998). Predictive reward signal of dopamine neurons. Journal of Neurophysiology.
- Hamari, J., Hanner, N., & Koivisto, J. (2017). Why do players buy in-game content? An empirical study on concrete purchase motivations. Computers in Human Behavior.
- Zendle, D., & Cairns, P. (2018). Video game loot boxes are linked to problem gambling: Results of a large-scale survey. PLOS ONE.
- Xi, N., & Hamari, J. (2019). The relationship between gamification, brand engagement and brand equity. Proceedings of the 52 nd Hawaii International Conference on System Sciences.