Page 355 - 《软件学报》2024年第6期

P. 355

闫璟辉等: 中文医疗文本中的嵌套实体识别方法 2931

表 3 数据集实体类别统计表 4 主要参数设置

类别标签数量类别数量
疾病或综合症 dis 20 778 span embedding size 25
临床表现或症状 sym 16 399 encoder layer size 768
医疗检查程序 pro 8 389 dropout 0.1
医疗检查设备 equ 1 126 optimizer Adam
药物 dru 5 370 learning rate 2×10 −4
医学检验项目 ite 3 504 batch size 16
身体和身体物质 bod 23 580 max length 256
科室 dep 458
微生物类 mic 2 492

4.3 基线设置
为了证明我们所提出的 MTS-NER 模型在嵌套命名实体识别的结果上具有优势, 我们采用了以下几种模型作
为基线系统进行结果对比.
[8]
● BiLSTM-CRF : 使用 Bi-LSTM 作为编码器, CRF 作为解码器的基础命名实体识别模型, 不具备对嵌套实体
的识别能力.
● Pyramid [31] : 一种 layer-based 模型, 采用堆叠 NER 多层结构抽取嵌套命名实体的模型, 由底向上层层聚合的
方式对实体边界信息进行识别.
● Bi-affine [14] : 一种 span-based 模型, 采用双仿射注意力机制对实体首尾边界信息进行交互打分, 具有识别嵌
套命名实体的能力.
● GlobalPointer [33] : 一种 span-based 模型, 利用全局归一化的思路, 将多个实体类型的识别视为 multi-head 机
制, 将每一个 head 视为一种实体类型识别任务. 兼容了嵌套实体和非嵌套实体的识别, 在多个数据集上取得
SOTA 成绩.
4.4 整体结果 0.623
表 5 列出了 MTS-NER 和对比方法的实验结果.

表 5 不同模型在 CMeEE 数据集上的性能表现

Bi-LSTM-CRF Pyramid Bi-affine GlobalPointer MTS-NER
类别
P R F1 P R F1 P R F1 P R F1 P R F1
bod 0.595 0.563 0.579 0.661 0.684 0.672 0.597 0.674 0.633 0.678 0.603 0.638 0.708 0.646 0.675
dep 0.428 0.189 0.263 0.545 0.489 0.515 0.682 0.622 0.651 0.611 0.658 0.634 0.636 0.509 0.565
dis 0.659 0.692 0.675 0.671 0.740 0.704 0.699 0.739 0.718 0.745 0.708 0.726 0.724 0.739 0.731
dru 0.705 0.657 0.680 0.664 0.701 0.682 0.700 0.744 0.721 0.771 0.793 0.782 0.729 0.731 0.730
equ 0.557 0.243 0.339 0.517 0.411 0.458 0.520 0.435 0.474 0.516 0.687 0.589 0.594 0.431 0.5
ite 0.496 0.170 0.253 0.448 0.434 0.441 0.424 0.380 0.401 0.489 0.392 0.435 0.511 0.359 0.421
mic 0.667 0.658 0.663 0.611 0.725 0.663 0.671 0.646 0.767 0.691 0.727 0.676 0.737 0.705
pro 0.607 0.479 0.535 0.651 0.715 0.681 0.608 0.582 0.595 0.61 0.648 0.623 0.693 0.573 0.627
sym 0.594 0.288 0.388 0.476 0.442 0.458 0.524 0.438 0.477 0.567 0.41 0.475 0.506 0.436 0.468
total 0.625 0.521 0.568 0.628 0.635 0.631 0.613 0.622 0.617 0.663 0.621 0.641 0.668 0.618 0.642

从表 5 中可以看出, 相较于其他方法, MTS-NER 在多个单独实体类别和总体的 F1 值上都取得了最高得分
0.642, 对比于传统方法 BiLSTM-CRF、有着 7.3% 的提升, 和同样具备嵌套实体识别能力的 Pyramid、Bi-affine
和 GlobalPointer 方法对比, F1 值分别有着 1%、2.4% 和 0.1% 的提升, 准确率方面分别有着 4%、5.5% 和 0.5% 的
提升. 与同为 span-based 模型的 GlobalPointer 方法结果对比中可以发现, 尽管在总的 F1 值上差距不明显, 但在一
些如“bod”“pro”和“ite”这种多为内部嵌套的实体类别对比上, MTS-NER具有明显优势, 准确率分别有着 3%、

350 351 352 353 354 355 356 357 358 359 360