Page 169 - 《软件学报》2021年第10期
P. 169
郭军军 等:融入案件辅助句的低频和易混淆罪名预测 3141
抢劫罪:被告人陈小平、吴某、杨某甲于2015年10月18日晚上,伙同陈某丁(另案
处理)共谋持刀抢劫,由被告人吴某、杨某甲购买作案工具两把水果刀,后由被告
人陈小平和陈某丁以雇请摩的为由将摩的驾驶员陈某丙骗至安溪县凤城镇美法村盛
世金元居住小区附近的菜园地,采用强行推倒、持刀威胁、刺伤等手段,抢走陈某
丙现金人民币110元并致其轻微伤害...(部分)
是 是 是
以暴力为手段 以非法占有为目的 故意犯罪行为
否 是 是
抢夺罪:2015年11月14日中午,被告人郭某驾驶豪爵踏板摩托车在保定市高新区朝
阳北大街朝阳龙座路口西边,趁被害人孙某不备,将其挎包抢走,包内有现金、银
行卡、钱包等物品,被告人郭某除将现金拿走外将其余物品丢弃,2015年11月15日
11时许,被告人郭某驾驶豪爵踏板摩托车在保定市××北大街火知了KTV北侧,趁
被害人贾某不备,将其拎包抢走...(部分)
Fig.1 Comparative analysis of robbery and snatch cases
图 1 抢劫罪与抢夺罪案例对比分析
综上所述,我们的主要贡献如下:
(1) 本文的核心工作是提高低频和易混淆罪名的预测准确率,为此,我们首次引入案件辅助句这一概念,
改善其预测性能;
(2) 本文采用一种融入案件辅助句构建双向互注意力的学习框架来改进低频和易混淆罪名预测性能,获
取具有案件辅助句指导的案情描述多粒度倾向性特征表征;
(3) 基于 3 个不同规模的中国刑事案件公共数据集进行实验,本文模型的实验结果比其他基线模型取得
了更显著的效果.
1 相关工作
[1]
罪名预测任务 是法律智能领域研究多年的任务.在早期工作中,由于缺少大量的标注数据,部分研究者基
[2]
于传统统计学习的方法解决罪名预测任务.例如:Kort 等人 采用定量方法,通过计算事实元素的数值来预测判
[4]
[3]
断;Nagel 等人 利用相关分析对重新分配的案例进行预测;Keown 等人 引入用于法律预测的数学模型,如线性
[5]
模型等.这些方法通常被限制在只有少量标签的小数据集上.Liu 和 Hsieh 在罪名预测任务中考虑了短语特征,
[7]
[6]
Liu 等人 使用 KNN(K 最近邻算法)对台湾 12 项指控进行预测,Sulea 等人 提出了一种基于支持向量机(SVM)
的集成系统,该系统利用案情描述、判决和时间跨度作为输入.然而,以上方法只能获取浅层的语义特征,对于罪
名预测任务而言,不足以捕捉到足够的案件关键信息.随着神经网络模型能够提取自然语言更深层次的语义特
征,研究人员考虑基于神经网络建模,旨在提取案件更深层次的语义信息,从而提高罪名预测的准确率.
研究人员基于神经网络模型将罪名预测形式化为文本分类任务,文本分类通常着重于从案情描述中提取
[8]
关键特征.Zhong 等人 基于神经网络模型,结合多个子任务间的拓扑结构信息提出联合模型,同时完成法律判
[9]
决预测的多个子任务.Luo 等人 基于注意力机制的神经网络模型,在罪名预测任务中融入法条信息.该方法使
罪名预测任务更加合理化.Jiang 等人 [10] 采用神经网络模型抽取合理的、可读的、决定性的片段信息来强化法
律判决预测,提升法律判决预测的性能.由于只采用简单的文本分类可能导致案例信息交互不足,为了解决这个
问题,Long 等人 [11] 基于判决流程,采用阅读理解的方式对罪名预测进行建模.王加伟等人 [12] 基于词语语义差异
性完成罪名预测.基于神经网络模型的方法目前在常见罪名预测取得了较好的准确率,但对于低频和易混淆罪
名而言,预测准确率仍然较低.
因此,有研究者另辟他法,采用融入外部知识的方法构建神经网络模型.例如:Lin 等人 [13] 提出一种针对两类
罪名定义 21 个法律要素的方法进行多任务学习,该方法局限性较大,需投入大量的人工标注,可扩展性与针对
性较差;刘宗林等人 [14] 提出了融入罪名关键词的法律判决预测多任务学习模型,判决结果包括法条推荐和罪名
预测,该方法随着数据量的增加,同样需要投入大量的人工标注工作;Hu 等人 [15] 提出了融入罪名区分属性预测