Page 129 - 《软件学报》2020年第11期
P. 129

汪洁  等:子图相似性的恶意程序检测方法                                                            3445


                 子图比较来判断其包含的特征子图,这可以避免进行图匹配,从而使得整个算法效率能够明显提高.
                 5.2   参数最优化
                    本小节中将讨论实验中参数的最优化.图 6 列出了最大深度 D 以及选择阈值 t 的参数效果图,其中,符号(1)、
                 符号(2)分别表示矩阵 M 的两种计算方法.从图 6(a)和图 6(b)可以看出,随着最大深度 D 的增大,其精度也在提高;
                 但深度 D≥5 后预测结果花费的时间(提取子图和训练的时间总和)却呈现大幅度增长,我们可以认为提取子图
                 的深度最佳为 5.图 6(c)和图 6(d)表明,选择阈值 t 增加,其精度呈现下降趋势,而花费的时间呈上升趋势.这是因
                 为 t 取值越大,剔除的子图越少,增加了子图库中的无关子图数,从而增加了时间开销.


















                                       (a)                                       (b)
















                                       (c)                                       (d)

                                            Fig.6  Effect chart of different parameters
                                                  图 6   不同参数的效果图

                 6    结   论

                    本文提出了基于子图相似性的恶意程序检测方法,利用神经网络学习数据流图中子图的分布式表示,使得
                 上下文相似的子图其向量也相近;然后使用子图向量构建图相似性函数,同时,结合 SVM 分类器算法进行分检
                 测;最后,实验证实我们的方法在恶意程序检测上的准确性和有效性.本文的下一步工作考虑数据流图中的数据
                 量,即将子图的数据量也纳入进检测模型.引入子图的数据量,可以进一步优化检测模型.同时,我们的方法也可
                 以向安卓平台进行拓展,问题的关键是构建安卓端的系统行为图.

                 References:
                 [1]    Caballero J, Grier C, Kreibich C, Paxson V. Measuring pay-per-install: The commoditization of malware distribution. In: Proc. of
                     the Usenix Security Symp. 2011. 13−31.
   124   125   126   127   128   129   130   131   132   133   134