Page 271 - 《软件学报》2021年第7期
P. 271

徐海燕  等:针对复杂用户评论的代码质量属性判断                                                        2189


                 的语义相对完整,而两个子图之间的语义则相对独立,独立、完整的语义在分句中会形成主题,从而并列关系
                 (COO)可以由两个词语的并列扩展为两个主题的并列.因此,若以并列关系(COO)为标志,则可对复杂用户评论
                 中的主题进行判断.本文以并列关系(COO)为核心,制定了并列关系主题判断规则,如图 2 所示.






















                                          Fig.2    Topic judgment rule of coordinate relation
                                                图 2   并列关系主题判断规则
                    由图 2 可以看出,两个并列关系(COO)连接的 3 个部分分别构成了主题 Topic x 、Topic y 、Topic z .根据图 2 并
                 列关系主题判断规则,可给出并列关系主题判断规则的定义如下.
                    并列关系主题判断规则.  复杂用户评论分句存在并列关系(COO),则以并列关系(COO)为界,并列关系
                 (COO)连接的两部分各构成一个主题.
                    通过对大量的复杂用户评论分析后发现,在复杂用户评论分句中,当存在多个主题时,一般分句中的主谓成
                 分及其修饰成分会构成一个主题的语义,而宾语成分及其修饰成分构成另一个主题的语义.而在依存句法关系
                 中,经过依存句法分析的句子会存在唯一的一个核心关系(HED).当核心关系(HED)对应的词为动词时,该动词
                 对应句子主谓宾中的谓语成分,与该动词构成动词与宾语的依存关系(VOB/IOB/FOB)的节点则对应句子主谓
                 宾中的宾语成分.因此,若以核心关系(HED)以及动词与宾语的依存关系(VOB/IOB/FOB)为标志,则可对复杂用
                 户评论中的主题进行判断.本文以核心关系(HED)为核心,制定了动宾关系主题判断规则,如图 3 所示,其中核心
                 关系(HED)对应的核心词为 Word m .




















                                         Fig.3    Topic judgment rule of verb-object relation
                                                图 3   动宾关系主题判断规则
   266   267   268   269   270   271   272   273   274   275   276