Page 51 - 《上海体育大学学报》2025年第8期

P. 51

2025 年 8 月第 49 卷第 8 期原创成果

必然会选择回城补给，选手即可趁此间隙通过补刀或即是通过“数据收集+机器学习”的方式模拟成为对方

击杀野怪等方式提升经济值等。再如，“在一个为某回选手，包括操作习惯、反应速度、进攻强度乃至各种突
合制策略游戏构建高性能 AI 的实验中，······其中一个发状况下的行为逻辑等，对己方选手进行适应性和针
解决方案······非常简单地占据了一个防御位置，并且对性训练，并在此过程中探索“破敌之道”。相较而
使用远距离袭击来攻击任何接近的单位” [5]80 。角色言，在传统体育中人工智能可以“分析”对方选手，如
AI“行为模式”的局限性导致其难以达到提升选手战 “NBA 球队将对手的技术动作视频进行处理，通过截
术策略的训练效果。对此，策略 AI（Strategy AI）是指取不同时刻的战术片段，了解其进攻技战术的方法，包
小组中的每个角色都拥有自己的决策制定和移动算括系统地确定对手的弱点，并评估球队训练效果和改
法，而它们的决策制定受到群体策略的影响 [13]13-14 ，其进策略” [17] 等，而在电竞场域中人工智能可以在“分析”
多样化和复杂化发展将对训练等级的提升有所助益。对方选手的基础上“模拟”对方选手。

（2）对于作为训练对手的角色 AI 而言，“拟人化” “模拟对方选手”这一功能的实现相较前述“作为
要求其在竞技游戏中的表现与人类选手相似，既有着训练对手”更为困难，其一方面需要点对点收集对方选
与人类选手相近的反应速度、应对方式、战术布局等，手的信息数据，另一方面则需要更为复杂的算法来强
也会犯人类选手常见的错误。相反，不够成熟的角色化角色 AI 与对方选手的相似性。在前一方面，已有数
AI 会释放出非人化的信号，如展示极端迅速的动作反据分析机构“针对选手在游戏中的各种比赛数据进行
应、不存间隔的指令切换，不会尝试失败的动作或不会汇总，并把每个选手比赛习惯的相关信息进行量化，将
做出没有必要的动作，并且不会犹豫或停下来思考数据通过相关模型进行效果分析，运用这些数据发现
等。这类角色 AI 会给人类选手以不真实感，难以将其每位选手的优缺点，以此来指导战队的英雄选择和战
带入身临其境的训练环境，或者说难以应用于“机械训术设计，同时提供比赛对手的各种情报” [18] 。在后一方
练”之外的场景。实现“拟人化”的途径之一即是提高面，模拟对方选手特定且常见的行为逻辑虽然较易实
角色 AI 的“随机性”。比如，在 FTG 类竞技游戏中，现，但训练效果也仅限于机械性的应对训练。然而，

人类选手施以上段攻击后，角色 AI 进行格挡可能成功人类选手的战术策略通常是多元的，亦会随着比赛的局
也可能不成功，而将不成功的概率调整为 10％以上即势进行改变、创造乃至突破，如果仅通过简单的行为树
是随机性的表现；格挡成功后，如若角色 AI 反击的方进行模拟，所能实现的无非是带有选手特色的普通 AI。
式有 20 种，任意且无规律地抽取其中一种，亦是随机为增强模拟的真实性，不仅需要使 AI 的各项参数
性的表现。其中，个体策略的随机性可以通过决策树、（如反击速度、技能释放速度、瞄准射击速度等）无限
状态机或行为树等来实现，群体策略的随机性则可通接近于模拟对象，而且需要丰富 AI 的行为库，使其能
过进化强化学习（Evolutionary Reinforcement Learning）在多元策略中进行灵活选择，并确保每一种选择的合
等来实现 [5]83 。实践中，2020 年腾讯 AI Lab 研发的策理性，从而实现全方位模拟。其实现途径包括：①记录

略协作型 AI“绝悟”精通所有英雄的所有技能，可为职公开赛事中对方选手的竞技过程数据，提取相应特征
业选手提供数据、战略与协作类实时分析与建议及不并用作人工神经网络的输入。在给定输入与期望输出
同强度与级别的专业陪练 [15] 。2023 年《英雄联盟》开的组合后，通过反向传播训练人工神经网络，以预测在
发团队为 AI 决策开发了一套全新的行为树系统，旨在当前游戏状态中会被对方选手选择执行的动作 [5]53 。
实现“会打野、抓人和抢龙”“能够响应环境变化”“配 ②记录公开赛事中对方选手的行动轨迹，并在监督学
[16]
合更有策略性、更团结”等功能。习的框架下训练某些函数逼近器做出类似对方选手的

2.2 角色 AI 模拟对方选手行为。这个轨迹被记录在元组“特征，目标”的列表
除常规训练外，电竞选手的另一项重要任务是备中，其中特征代表了游戏状态，而目标是对方选手在这
战特定比赛场次，即在某一赛事进行过程中了解并熟个状态下做出的动作。一旦函数逼近器被充分地训
悉对方选手的信息数据、优势和短板、竞技水平和常练，角色 AI 即可具备对方选手的风格 [5]96-97 。③记录同
用战术等，通过“知己知彼”实现“克敌制胜”，这在双一对方选手在相同或类似的赛场情形下不同的行为选
方实力接近的情况下尤为重要。此时，角色 AI 的功能择，将之灌注到行为树“根节点－父节点－子节点”系

46 47 48 49 50 51 52 53 54 55 56