Page 122 - 《软件学报》2021年第12期
P. 122

3786                                Journal of Software  软件学报 Vol.32, No.12, December 2021

         元素的识别.不过,本质上零元素并不是单纯的“缺失的语义成分”,而是在上下文衔接中缺失的有意义的语义成
         分,需要根据上下文进行判断.另外,汉语重意合的特点使得汉语表达更加灵活,许多固定句式虽然从谓词驱动
         的角度似乎存在语义成分的缺失,但从整体表达的语义信息看又不存在缺失.
             例如,例 2 所示的句子包含 3 个谓词:“防止”“出现”和“出台”.其中,“出台”的各语义成分都齐全,未出现任何
         省略;“防止”的施事者“新区管委会”在篇章后面提及了,可以认为在“防止”前存在一个语义省略,后文进行了恢
         复;“出现”的施事者在文中并未提及,说明这一语义对象并非当前篇章关注的焦点,不存在上下文衔接中有语义
         成分缺失.
             例 2:为防止出现无序现象,新区管委会及时出台了一系列规范建设市场的文件.
             汉语重意合的特点,决定了汉语零指代表示体系的确立必须从篇章的视角进行.从形式上看,零元素是句子
         中省略的某个成分;而从语义理解的角度看,省略的这个成分一定包含明确的语义信息,承担了一定的语用功
         能,即这个语义成分是依赖于篇章的上下文表述的,是衔接上下文的特殊语义载体.
             需要特别说明的是:盛晨等人          [35,36] 提出从篇章视角分析汉语零指代,他们从篇章视角将零元素分成主干型
         和修饰型两大类,同时又根据零元素所处篇章基本单元的句法结构将零元素细分成若干小类.但他们的工作存
         在两方面缺陷:首先,大类的划分是篇章视角的,而小类的划分是句法层面的,句法虽然利于语料标注质量的控
         制,但从分类体系的角度,两种视角存在一定的冲突;其次,盛晨等人                      [35,36] 仅对零元素的分类体系进行了研究,但
         篇章中更重要的是衔接上下文的零元素,离开指代关系独立分析零元素对服务篇章的支撑是有限的.受盛晨等
         人工作的启发,葛海柱等人         [37] 进一步梳理了篇章视角的零指代结构.基于盛晨和葛海柱等人的工作,我们从服务
         于篇章分析和文本理解的目标出发,我们构建了完整的篇章视角的汉语零指代结构体系,它由篇章视角的零元
         素分类体系和篇章视角的零指代结构两部分构成,下面分别加以说明.
         2.1   篇章视角的零元素分类

             在汉语篇章微观修辞结构表示体系             [38,39] ,将基本篇章单元(elementary discourse unit,简称 EDU)定义成至少
         包含一个谓语部分,即至少表达一个命题,认为 EDU 是篇章构成的基本单位.从服务于篇章分析的目标出发,我
         们将 EDU 看作考察是否包含零元素的基本单元.与盛晨等人                    [35,36] 的工作类似,依据 EDU 内是否存在缺失的语
         义成分,以及缺失的语义成分在 EDU 中是否承担主干成分,我们将零元素划分成两大类,即主干型零元素和修
         饰型零元素,但不再进行小类的区分.
             以例 3 所示的句子为例,从篇章分析的视角看,它由 3 个基本篇章单元构成,图中用“[⋅]”进行分割,分别记作
         e1,e2 和 e3,这 3 个基本篇章单元构建形成的修辞结构树如图 1 所示.
             例 3:[国家统计局预测,一九九六年全球经济将继续保持增长,] e1  [这种良好的态势对中国的发展十分有
         利,] e2  | [ϕ使其面临很多发展机遇.] e3
                                                  顺承关系





                                                        解说关系



                                        e1           e2          e3

                                Fig.1    Discourse rethorical structure tree of example 3
                                  图 1   例 3 中各基本篇章单元形成的修辞结构树

             可以看到:基本篇章单元 e1 和 e2 在语义成分上是完整的,不存在零元素;但对于 e3 而言,独立观测这一单元,
         它表达了两层含义:一是“其(中国的发展)面临很多发展机遇”,二是“这种良好的态势造成了其面临很多发展机
   117   118   119   120   121   122   123   124   125   126   127