Page 109 - 《软件学报》2020年第12期
P. 109
于东 等:中文文本蕴含类型及语块识别方法研究 3775
Table 1 Types of Chinese entailment
表 1 中文蕴含关系类型
类型 例句
上下位关系 P:一个用推土机挖土的男人. H:一个男人用重型施工设备挖土.
词汇
近义关系 P:一个人坐在家门口读一本书. H:一个人看书.
省略 P:一个男人推着一辆装满购物袋的购物车. H:那个男人推着购物车.
句法结构
结构变化 P:一只长耳狗在草地上奔跑. H:一只狗跑在草地上.
位置信息 P:人们在繁忙的人行道上打电话. H:人们在户外打电话.
推理 数量关系 P:3 名女子和两名男子举着弦乐器站在一个楼梯下. H:5 个人站在楼梯旁边.
常识 P:一个年轻人坐在椅子上脸上盖着帽子. H:一个年轻人坐在椅子上休息.
2.1 词汇蕴含关系
词汇学是语言学的重要组成部分,词汇之间的语义关系早已成为蕴含关系的重点研究对象.上下位关系和
近义关系对文本蕴含影响很大.
• 上下位关系(hyponymy)
这是语言学上一种不对称的词汇关系.上位词外延较大,内涵较小;下位词外延较小,内涵丰富.“水果-香蕉”
就是一对具有上下位关系的词组.上下位关系在蕴含句对中十分常见.例如:
(1) P:一个用推土机挖土的男人. H:一个男人用重型施工设备挖土.
“重型施工设备”是“推土机”的上位词,能够概括“推土机”的特点,外延较少,因此,P,H 之间存在上下位蕴含.
• 同义关系(synonym)
反映了词语之间意义相同或相近的现象.除了词汇之间的同义现象外,表示相同语义的不同语法结构也可
以归为同义关系.例如:
(2) P:一个人坐在家门口读一本书. H:一个人看书.
“读一本书”和“看书”都是动宾结构短语,两者具有同义关系.因此,P 和 H 之间存在同义蕴含.
2.2 句法蕴含关系
前人研究中不太重视句法蕴含,但我们在标注过程中发现,句法蕴含是经常在实际语料中出现的蕴含现象.
句法蕴含可以分为省略和结构变化两个大类.
• 省略(ellipsis)
省略了定中结构短语或状中结构短语的修饰成分,但不改变中心语的蕴含情况.
(3) P:一个男人推着一辆装满购物袋的购物车. H:那个男人推着购物车.
“一辆装满购物袋的”是修饰“购物车”的定语,在 P 中被省略掉,因此,P 和 H 之间存在省略蕴含.
结构变化(struct-change):
句法结构的变化有多种,如“把”字句、“被字句”变换,句中主要成分被抽取出来单独成句,第一人称换第二、
第三人称等.
(4) P:一只长耳狗在草地上奔跑. H:一只狗跑在草地上.
“在草地上奔跑”是状中结构短语,“跑在草地上”是动补结构短语,尽管两个短语的意义相同,但是两个的语
法结构发生了变化,因此,P 和 H 之间存在结构变化引起的蕴含现象.
2.3 推理蕴含关系
推理蕴含是比较复杂的蕴含现象.我们在参考了 Bentivogli 等人之前的分类体系 [25] ,将位置信息和数量关
系归入推理蕴含,并将其余依靠背景知识的蕴含现象归为常识类.
• 位置信息(located-in)
表示地点的信息在 h 中被抽象为“外面”“户外”等反映地理位置或空间的信息,而句子中其他的成分没有矛
盾关系,那么这两句话是蕴含的.空间地点信息的判断有时候需要借助背景知识的辅助.