Page 176 - 《软件学报》2021年第10期
P. 176
3148 Journal of Software 软件学报 Vol.32, No.10, October 2021
高频罪名预测的性能也有很好的提升,宏观 F1 值最少提升分别为 10.9%和 8.7%.
其次,我们从“数据集 S”中选取案例数据均大于 1 000 的 4 类易混淆罪名,避免被低频数据干扰.主要是“放
火罪”和“失火罪”、“抢夺罪”和“抢劫罪”、“行贿罪”和“受贿罪”以及“盗伐林木罪”和“滥伐林木罪”,验证本文模
型对易混淆罪名预测性能的提升,实验结果见表 6.
Table 6 Macro F1 values for confusing charge on case dataset S
表 6 数据集 S 中易混淆罪名的宏观 F1 值
罪名类别 易混淆罪名
LSTM-200 79.7
Few-Shot Attri. 88.1
本文模型 96.3
从表 6 中的实验结果可知:对于易混淆罪名区分预测,本文模型比 LSTM-200 模型和 Few-Shot Attri.模型的
宏观 F1 值分别提升 16.6%和 8.2%.由此可以证明:本文模型能够更好地捕捉易混淆案例的区分特征,进一步提
高易混淆罪名预测的准确性.
3.5 案例分析
这一部分工作主要为了验证融入案件辅助句对低频和易混淆罪名预测性能的提升,我们选择一个如图
7(左)所示的易混淆案例.被告人在此案中被判定的最终罪名是“过失致人重伤罪”.该案例很具代表性,容易被
“争执”和“厮打”等噪声数据误导,包括人工阅读的第一直觉也会误认为是“故意伤害罪”.此外,该罪名对应的案
件辅助句如图 7(右)所示.
案情描述: 案件辅助句:
公诉机关指控:2015 年 3 月 24 日 16 时许,被告人周某某在本村“二分
地”因旋耕机轧地一事与本村李某某发生争执,后周某某姑爷裴某某
与李某某发生厮打,厮打中,被告人周某某将李某某拥倒在地摔伤头
部,致李某某双侧额叶脑挫裂伤、外伤性蛛网膜下腔出血、右侧硬膜 以暴力为手段,
下血肿、伴颈强,经鉴定构成重伤二级,被告人周某某对指控的事实和 该案件造成人身伤害
罪名没有异议…
Fig.7 Visualization of bi-direction mutual attention mechanism
图 7 双向互注意力机制可视化
由于“过失致人重伤罪”和“故意伤害罪”都与暴力行为和人身伤害相关,因此很难将该案件判定为过失伤
害还是故意伤害,两者的重要区别是:前者对应的案件辅助句还包含“故意犯罪行为”,而后者没有.因此我们认
为,该案件辅助句是两者的重要区分.从图 7 中可以直观地看到该案例的案情描述和案件辅助句的注意力机制
可视化分布(背景颜色较深的词具有较高的注意力权重),双向互注意力机制可以捕获案情描述和案件辅助句中
的核心语义信息.
针对上述案例,Few-Shot Attri.模型和本文模型的预测结果见表 7.本文模型正确预测为“过失致人重伤
罪”,Few-Shot Attri.模型预测结果为“故意伤害罪”.由此可以证明:融入具有案件核心语义信息的辅助句,可在很
大程度上帮助我们的模型捕捉案件的关键信息,提升低频和易混淆罪名预测的准确率.
Table 7 Charge prediction result of the selected case
表 7 选取案例罪名预测结果
模型 预测结果
真实罪名 过失致人重伤罪
Few-Shot Attri. 故意伤害罪
本文模型 过失致人重伤罪