Page 132 - 《软件学报》2021年第12期
P. 132
3796 Journal of Software 软件学报 Vol.32, No.12, December 2021
例 15:董建华在*pro*评论该指数时表示,香港特区已连续四年成为全球最自由的经济体.
例 16:如*pro*省里出台并实施的《四川省鼓励外商投资优惠政策》等,为外商提供了优惠、宽松的政策
环境.
例 17:*pro*在*pro*与中国缔结友好城市中,以日本为最多.
例 18:研究人员介绍说,*pro*国外目前普遍使用的各种化学合成降糖药对糖尿病并发症均无多大的防治
作用.
例 19:镍储量占*pro*中国国内已探明储量的百分之七十.
IP
VP
IP-OBJ
NP-SBJ VP
公署
公司
NP-SBJ VV PU VP PU VP
,
,
他 他 说 会积极配合中 密切与特区政府
说
会积极配合学校
密切与学校相关
国驻外使领馆 有关部门联系与
发展中心
部门联系与合作
合作
Fig.8 Syntatic parse tree of example 12
图 8 例 12 对应的句法树
4 篇章视角的零指代消解基准平台
完整的零指代消解平台由零元素识别和零元素消解两部分构成,其中:已有的零元素识别相关研究多以句
子或子句为单位,依据句法分析的结果从句法成分的缺失这一角度进行,使得零元素识别的性能对句法分析的
结果有着严重的依赖;另一方面,零元素消解的相关研究则集中在如何更好地表征零元素所处的上下文信息.从
篇章视角构建零指代消解基准平台需要进行以下几个方面的考虑:首先,既然是篇章层的语言现象,高效的零指
代消解必然需要多粒度的篇章信息的支持;其次,篇章级的任务更丰富、更复杂,它们之间必然存在密切的联系,
而这些联系决定了不能孤立地讨论零指代;最后,零指代归根结底是指代的一种,进行包括实体指代、事件指代
在内的多种指代的联合消解势在必行.因此,零指代消解应借鉴较为成熟的实体指代框架.
基于上述考虑,我们选择了 Kong 和 Zhou [26] 给出的链到链的汉语零指代消解方案作为基准平台构建的基
本方法,在实现上进行了以下改动:(1) 用基于篇章单元(EDU)的零元素识别模块替换了原来的零元素识别模
块;(2) 将实体指代消解模块替换成了性能更好的基于神经网络的实体指代消解平台 [26] ;(3) 在零元素链接环
节,将原有的人工特征都作为附加特征进行了向量表征,同时增加了基于 Mask 机制的零元素表征;(4) 零指代关
系的确定替换成了实体指代消解平台中的前馈神经网络方法.关于链到链的汉语零指代消解方法的细节,请参
考 Kong 和 Zhou 的论文 [26] ;实体指代消解平台及前馈神经网络方法,请参考 Kong 和 Fu 的论文 [26] .本节主要介
绍基于 EDU 的零元素识别和基于 Mask 机制的零元素表征.
4.1 基于EDU的零元素识别
给定一个 EDU,我们认为:构成 EDU 的每个词的前面均有可能存在零元素,唯一不可能存在零元素的位置
是最后一个词的后面.因此,我们将零元素识别看作一个边界点识别问题,通过编码-解码框架来进行,图 9 给出
了这一框架的具体构成.