Page 271 - 《软件学报》2021年第7期
P. 271
徐海燕 等:针对复杂用户评论的代码质量属性判断 2189
的语义相对完整,而两个子图之间的语义则相对独立,独立、完整的语义在分句中会形成主题,从而并列关系
(COO)可以由两个词语的并列扩展为两个主题的并列.因此,若以并列关系(COO)为标志,则可对复杂用户评论
中的主题进行判断.本文以并列关系(COO)为核心,制定了并列关系主题判断规则,如图 2 所示.
Fig.2 Topic judgment rule of coordinate relation
图 2 并列关系主题判断规则
由图 2 可以看出,两个并列关系(COO)连接的 3 个部分分别构成了主题 Topic x 、Topic y 、Topic z .根据图 2 并
列关系主题判断规则,可给出并列关系主题判断规则的定义如下.
并列关系主题判断规则. 复杂用户评论分句存在并列关系(COO),则以并列关系(COO)为界,并列关系
(COO)连接的两部分各构成一个主题.
通过对大量的复杂用户评论分析后发现,在复杂用户评论分句中,当存在多个主题时,一般分句中的主谓成
分及其修饰成分会构成一个主题的语义,而宾语成分及其修饰成分构成另一个主题的语义.而在依存句法关系
中,经过依存句法分析的句子会存在唯一的一个核心关系(HED).当核心关系(HED)对应的词为动词时,该动词
对应句子主谓宾中的谓语成分,与该动词构成动词与宾语的依存关系(VOB/IOB/FOB)的节点则对应句子主谓
宾中的宾语成分.因此,若以核心关系(HED)以及动词与宾语的依存关系(VOB/IOB/FOB)为标志,则可对复杂用
户评论中的主题进行判断.本文以核心关系(HED)为核心,制定了动宾关系主题判断规则,如图 3 所示,其中核心
关系(HED)对应的核心词为 Word m .
Fig.3 Topic judgment rule of verb-object relation
图 3 动宾关系主题判断规则