Page 170 - 《软件学报》2021年第10期
P. 170
3142 Journal of Software 软件学报 Vol.32, No.10, October 2021
低频和易混淆罪名的方法,引入罪名区分属性在一定程度上减少了大数据集的标注工作,同时在低频和易混淆
罪名预测任务上取得了当前最好的效果.我们认为:仅通过给定的事实描述结合简单注意力机制提取的罪名区
分属性特征,未能更全面地捕捉到案件的关键信息,对于低频和易混淆罪名预测准确率的提升还存在一定的进
步空间.
受此启发,我们基于司法领域的大量刑事案件数据,根据其不同罪名案例数据的特性,定义了几类代表性较
强的案件辅助句,它们能够更简洁地概括案件的核心语义信息.借助于案件辅助句的指导,分别从低频和易混淆
罪名的案情描述中提取更多有助于罪名识别的案件关键信息.本文模型同样基于神经网络模型将罪名预测形
式化为一个多分类任务,主要借鉴 Minjoon 等人 [16] 提出的双向注意流建模的思想,我们提出一种融入案件辅助
句构建双向互注意力机制的神经网络模型.与以往工作不同,我们同时利用案件辅助句与案情描述构建双向互
注意力,强化案情描述和案件辅助句之间的信息交互,提取具有案件辅助句指导的案情描述多粒度倾向性特征,
提升低频和易混淆罪名预测的准确率.基于中国刑事案件公共数据集的实验结果表明:与基线模型相比,本文模
型能够更好地提升低频和易混淆罪名的预测准确率.
2 融入案件辅助句的双向互注意力罪名预测模型
针对低频和易混淆罪名预测准确率低这类问题,本文首次融入案件辅助句,并将其与案情描述相结合构建
双向互注意力模型.双向互注意力网络层与前后紧密衔接,每个时刻的注意力向量与此前的嵌入层息息相关,并
衔接之后的网络层.同时,我们采用多粒度特征计算的方式对案件辅助句和案情描述分别编码,获取其多层次的
语义特征向量,旨在提取具有案件辅助句指导的案情描述上下文特征,最终提升低频和易混淆罪名预测准确率.
案情描述词和案件辅助句词分别用{X 1 ,…,X T }和{A 1 ,…,A J }表示,其中,T 和 J 分别表示案件辅助句和案情描
述的长度.本文模型主要分为 4 部分,分别是案件辅助句的构建与多粒度特征提取、双向互注意力计算、具有
案件辅助句指导的上下文特征提取和罪名预测输出网络层,如图 2 所示.
Fig.2 Bi-direction mutual attention model based on the auxiliary sentence of case
图 2 融入案件辅助句的双向互注意力模型