Page 313 - 《软件学报》2021年第5期
P. 313
马钰锡 等:面向智能攻击的行为预测研究 1537
a∈× j∈N A j 的收益.
玩家策略是一种功能,在玩家做出决定时提供不同的动作,分为纯粹策略和混合策略:纯粹策略针对每种情
况提供单一的措施,混合策略则为每种情况分配一组玩家行动的概率分布.博弈论中解决方案的概念并不明确,
最常用的是纳什均衡 [70] .在纳什均衡中,两个玩家都选择了同样的策略,但是他们都不偏离策略;通常找到博弈
的纳什均衡比较难以计算,但是某些类型的博弈可以使用近似于纳什均衡,计算复杂度较低的算法.
有多种类型的博弈模型可用于攻击预测,根据表现形式,可以分为一般博弈和战略博弈:战略博弈中,每个
玩家选择且仅选择一次动作,并且所有玩家的动作同时进行;相反,在一般形式的博弈中,玩家依次或同时选择
动作(可能无限多次),并且可以将所有可用信息用于决定中.另外,根据玩家获得的彼此历史动作信息的完善度,
可以分为完善信息与不完善信息的博弈模型 [71] .
早期网络攻击预测框架的博弈理论形式化如图 4 所示,防御者和攻击者拥有共同的知识、各自的私有信
息、策略空间及收益,通过正常访问的信息进行重复博弈,预测未来的攻击者意图.智能攻击的攻击策略更加复
杂,例如,现有的基于随机博弈的网络攻防分析方法都采用了完全理性的假设,但在实际的网络攻防中,攻守双
方都很难满足完全理性的高要求.因此,研究人员以此为基础,提出了不同的博弈模型进行应对:Zhang 等人 [61] 在
分析了有限理性对攻防随机游戏影响的基础上,构建了一个随机博弈模型,针对网络节点数量增加时状态爆炸
的问题,设计了博弈攻防图来压缩状态空间,提取网络状态和防御策略.攻防对抗的过程和策略选择如图 5 所示.
A secure A attacking
system system
Game plays
Knowledge Knowledge
base base
defense attack
Game strategy strategy Game
engine engine
Strategy utilities utilities Strategy
space space
Time
good accesses
Fig.4 Framework of game theory predicting attack behavior [72]
图 4 博弈论攻击行为预测框架 [72]
...
t 1 t 2 t i
Optimal Optimal Optimal
Strategy of Strategy of ... Strategy of
1 t S 2 t S′′ i t S
Game Game ... Game
Current Current Current
state state ... state
1 t S 2 t S′′ i t S
Attacker Defender Attacker Defender
Optimal
Strategy of ...
1 t S′
Game ...
Current
state ...
2 t S′
Attacker Defender
Fig.5 Game process and strategy selection in attack and defense [39]
图 5 攻防中的博弈过程和策略选择 [39]