Page 51 - 《上海体育大学学报》2025年第8期
P. 51
2025 年 8 月 第 49 卷 第 8 期 原创成果
必然会选择回城补给,选手即可趁此间隙通过补刀或 即是通过“数据收集+机器学习”的方式模拟成为对方
击杀野怪等方式提升经济值等。再如,“在一个为某回 选手,包括操作习惯、反应速度、进攻强度乃至各种突
合制策略游戏构建高性能 AI 的实验中,······其中一个 发状况下的行为逻辑等,对己方选手进行适应性和针
解决方案······非常简单地占据了一个防御位置,并且 对性训练,并在此过程中探索“破敌之道”。相较而
使用远距离袭击来攻击任何接近的单位” [5]80 。角色 言,在传统体育中人工智能可以“分析”对方选手,如
AI“行为模式”的局限性导致其难以达到提升选手战 “NBA 球队将对手的技术动作视频进行处理,通过截
术策略的训练效果。对此,策略 AI(Strategy AI)是指 取不同时刻的战术片段,了解其进攻技战术的方法,包
小组中的每个角色都拥有自己的决策制定和移动算 括系统地确定对手的弱点,并评估球队训练效果和改
法,而它们的决策制定受到群体策略的影响 [13]13-14 ,其 进策略” [17] 等,而在电竞场域中人工智能可以在“分析”
多样化和复杂化发展将对训练等级的提升有所助益。 对方选手的基础上“模拟”对方选手。
(2)对于作为训练对手的角色 AI 而言,“拟人化” “模拟对方选手”这一功能的实现相较前述“作为
要求其在竞技游戏中的表现与人类选手相似,既有着 训练对手”更为困难,其一方面需要点对点收集对方选
与人类选手相近的反应速度、应对方式、战术布局等, 手的信息数据,另一方面则需要更为复杂的算法来强
也会犯人类选手常见的错误。相反,不够成熟的角色 化角色 AI 与对方选手的相似性。在前一方面,已有数
AI 会释放出非人化的信号,如展示极端迅速的动作反 据分析机构“针对选手在游戏中的各种比赛数据进行
应、不存间隔的指令切换,不会尝试失败的动作或不会 汇总,并把每个选手比赛习惯的相关信息进行量化,将
做出没有必要的动作,并且不会犹豫或停下来思考 数据通过相关模型进行效果分析,运用这些数据发现
等。这类角色 AI 会给人类选手以不真实感,难以将其 每位选手的优缺点,以此来指导战队的英雄选择和战
带入身临其境的训练环境,或者说难以应用于“机械训 术设计,同时提供比赛对手的各种情报” [18] 。在后一方
练”之外的场景。实现“拟人化”的途径之一即是提高 面,模拟对方选手特定且常见的行为逻辑虽然较易实
角色 AI 的“随机性”。比如,在 FTG 类竞技游戏中, 现,但训练效果也仅限于机械性的应对训练。然而,
人类选手施以上段攻击后,角色 AI 进行格挡可能成功 人类选手的战术策略通常是多元的,亦会随着比赛的局
也可能不成功,而将不成功的概率调整为 10%以上即 势进行改变、创造乃至突破,如果仅通过简单的行为树
是随机性的表现;格挡成功后,如若角色 AI 反击的方 进行模拟,所能实现的无非是带有选手特色的普通 AI。
式有 20 种,任意且无规律地抽取其中一种,亦是随机 为增强模拟的真实性,不仅需要使 AI 的各项参数
性的表现。其中,个体策略的随机性可以通过决策树、 (如反击速度、技能释放速度、瞄准射击速度等)无限
状态机或行为树等来实现,群体策略的随机性则可通 接近于模拟对象,而且需要丰富 AI 的行为库,使其能
过进化强化学习(Evolutionary Reinforcement Learning) 在多元策略中进行灵活选择,并确保每一种选择的合
等来实现 [5]83 。实践中,2020 年腾讯 AI Lab 研发的策 理性,从而实现全方位模拟。其实现途径包括:①记录
略协作型 AI“绝悟”精通所有英雄的所有技能,可为职 公开赛事中对方选手的竞技过程数据,提取相应特征
业选手提供数据、战略与协作类实时分析与建议及不 并用作人工神经网络的输入。在给定输入与期望输出
同强度与级别的专业陪练 [15] 。2023 年《英雄联盟》开 的组合后,通过反向传播训练人工神经网络,以预测在
发团队为 AI 决策开发了一套全新的行为树系统,旨在 当前游戏状态中会被对方选手选择执行的动作 [5]53 。
实现“会打野、抓人和抢龙”“能够响应环境变化”“配 ②记录公开赛事中对方选手的行动轨迹,并在监督学
[16]
合更有策略性、更团结”等功能 。 习的框架下训练某些函数逼近器做出类似对方选手的
2.2 角色 AI 模拟对方选手 行为。这个轨迹被记录在元组“特征,目标”的列表
除常规训练外,电竞选手的另一项重要任务是备 中,其中特征代表了游戏状态,而目标是对方选手在这
战特定比赛场次,即在某一赛事进行过程中了解并熟 个状态下做出的动作。一旦函数逼近器被充分地训
悉对方选手的信息数据、优势和短板、竞技水平和常 练,角色 AI 即可具备对方选手的风格 [5]96-97 。③记录同
用战术等,通过“知己知彼”实现“克敌制胜”,这在双 一对方选手在相同或类似的赛场情形下不同的行为选
方实力接近的情况下尤为重要。此时,角色 AI 的功能 择,将之灌注到行为树“根节点-父节点-子节点”系
47

