Page 170 - 《软件学报》2021年第10期
P. 170

3142                                 Journal of Software  软件学报 Vol.32, No.10, October 2021

                 低频和易混淆罪名的方法,引入罪名区分属性在一定程度上减少了大数据集的标注工作,同时在低频和易混淆
                 罪名预测任务上取得了当前最好的效果.我们认为:仅通过给定的事实描述结合简单注意力机制提取的罪名区
                 分属性特征,未能更全面地捕捉到案件的关键信息,对于低频和易混淆罪名预测准确率的提升还存在一定的进
                 步空间.
                    受此启发,我们基于司法领域的大量刑事案件数据,根据其不同罪名案例数据的特性,定义了几类代表性较
                 强的案件辅助句,它们能够更简洁地概括案件的核心语义信息.借助于案件辅助句的指导,分别从低频和易混淆
                 罪名的案情描述中提取更多有助于罪名识别的案件关键信息.本文模型同样基于神经网络模型将罪名预测形
                 式化为一个多分类任务,主要借鉴 Minjoon 等人            [16] 提出的双向注意流建模的思想,我们提出一种融入案件辅助
                 句构建双向互注意力机制的神经网络模型.与以往工作不同,我们同时利用案件辅助句与案情描述构建双向互
                 注意力,强化案情描述和案件辅助句之间的信息交互,提取具有案件辅助句指导的案情描述多粒度倾向性特征,
                 提升低频和易混淆罪名预测的准确率.基于中国刑事案件公共数据集的实验结果表明:与基线模型相比,本文模
                 型能够更好地提升低频和易混淆罪名的预测准确率.

                 2    融入案件辅助句的双向互注意力罪名预测模型

                    针对低频和易混淆罪名预测准确率低这类问题,本文首次融入案件辅助句,并将其与案情描述相结合构建
                 双向互注意力模型.双向互注意力网络层与前后紧密衔接,每个时刻的注意力向量与此前的嵌入层息息相关,并
                 衔接之后的网络层.同时,我们采用多粒度特征计算的方式对案件辅助句和案情描述分别编码,获取其多层次的
                 语义特征向量,旨在提取具有案件辅助句指导的案情描述上下文特征,最终提升低频和易混淆罪名预测准确率.
                    案情描述词和案件辅助句词分别用{X 1 ,…,X T }和{A 1 ,…,A J }表示,其中,T 和 J 分别表示案件辅助句和案情描
                 述的长度.本文模型主要分为 4 部分,分别是案件辅助句的构建与多粒度特征提取、双向互注意力计算、具有
                 案件辅助句指导的上下文特征提取和罪名预测输出网络层,如图 2 所示.


































                             Fig.2    Bi-direction mutual attention model based on the auxiliary sentence of case
                                           图 2   融入案件辅助句的双向互注意力模型
   165   166   167   168   169   170   171   172   173   174   175