Page 273 - 《软件学报》2021年第7期
P. 273
徐海燕 等:针对复杂用户评论的代码质量属性判断 2191
依存句法关系剪枝. 去掉除核心关系(HED)、主谓关系(SBV)、状中关系(ADV)、动宾关系(VOB)、间宾
关系(IOB)、前置宾语关系(FOB)之外的其他依存句法关系对应的有向边,以及该有向边的开始节点.
停用词剪枝. 定义“n、v、a、d”词性以外的词语节点为停用词节点,去掉停用词节点.
综上,对于满足并列关系主题判断规则与动宾关系主题判断规则的依存句法关系有向图,则对断开并列关
系(COO)或动词与宾语的依存关系(VOB/IOB/FOB)后形成的有向图的子图执行剪枝操作;对于满足单一主题
判断规则的依存句法关系有向图只执行剪枝操作即可.以第 4.1 节中复杂用户评论“编码格式不对一直报错,而
且没有注释所以看不懂.一堆堆错误!”3 个分句依存句法关系有向图(图 1 中的(1)、(2)、(3))为例,3 个分句分别
满足 3 种主题判断规则.
分句“编码格式不对一直报错”依存句法关系有向图(图 1 示例中(1))中包含并列关系(COO),满足并列关系
主题判断规则,应用并列关系主题判断规则对分句进行处理,处理过程与结果如图 5 所示.节点“编码”“格式”“不
对”构成一个主题,节点“报错”构成一个主题.
Fig.5 Example of coordinate relation topic judgment rule processing clause result
图 5 并列关系主题判断规则处理分句结果示例
分句“而且没有注释所以看不懂”依存句法关系有向图(图 1 示例中(2))中核心关系(HED)指向的词“没有”
为动词,且包含动宾关系(VOB),满足动宾关系主题判断规则,因而应用动宾关系主题判断规则进行处理,处理结
果如图 6 所示,节点“注释”“没有”构成一个主题,节点“看不懂”构成一个主题.
Fig.6 Example of verb-object relation topic judgment rule processing clause result
图 6 动宾关系主题判断规则处理分句结果示例