Page 33 - 《中国医疗器械杂志》2026年第1期
P. 33

Chinese Journal of Medical Instrumentation                                         2026年 第50卷 第1期

                                                     医  学  人   工  智  能




                                        表2   不同模型在甲状腺和乳腺结节恶性预测中的性能比较
                            Tab.2  Performance comparison of different models in predicting malignancy in thyroid and breast nodules
                     模型             AUC (95% CI)     灵敏度(%)        特异度(%)        准确率(%)         F1值     P值*
              甲状腺结节
               PEAIM              0.932 (0.914~0.951)    86.5          89.2          88.6       0.832     −
               单器官模型              0.902 (0.883~0.921)    83.3          86.5          85.7       0.790    0.008
               XGBoost            0.887 (0.865~0.909)    81.7          85.3          84.4       0.774    0.002
               TI-RADS评分          0.865 (0.841~0.889)    79.2          82.0          81.3       0.737   <0.001
              乳腺结节
               PEAIM              0.917 (0.896~0.938)    84.3          88.7          87.4       0.819     −
               单器官模型              0.891 (0.871~0.912)    81.5          85.8          84.6       0.787    0.013
               随机森林               0.874 (0.852~0.896)    78.6          84.2          82.7       0.761   <0.001
               BI-RADS评分          0.853 (0.829~0.877)    76.3          81.5          80.0       0.732   <0.001
              外部验证集
               PEAIM-甲状腺          0.912 (0.884~0.940)    84.2          87.5          86.4       0.808     −
               PEAIM-乳腺           0.903 (0.876~0.930)    82.7          86.3          85.1       0.793     −
              注:*P值为与PEAIM比较的结果。

                              1.2                                1.2
                              1.0                                1.0

                              0.8
                                                                 0.8
                             灵敏度(真阳性率)  0.6    DeLong检验:         灵敏度(真阳性率)  0.6    DeLong检验:


                                                                 0.4
                              0.4
                                               PEAIM vs. 单器官:P=0.008
                                                                                   PEAIM vs. 单器官:P=0.013
                                                                                   PEAIM vs. 随机森林:P<0.001
                                               PEAIM vs. XGBoost:P=0.002
                              0.2  敏感度: 0.865  PEAIM(AUC=0.932, 95% CI: 0.914~0.951)  0.2  敏感度: 0.843  PEAIM(AUC=0.917, 95% CI: 0.896~0.938)
                                 特异度: 0.892  单器官模型(AUC=0.902, 95% CI: 0.883~0.921)  特异度: 0.887  单器官模型(AUC=0.891, 95% CI: 0.871~0.912)
                                          XGBoost模型(AUC=0.887, 95% CI: 0.865~0.909)  随机森林模型(AUC=0.874, 95% CI: 0.852~0.896)
                                          TI-RADS评分(AUC=0.865, 95% CI: 0.841~0.889)  BI-RADS评分(AUC=0.853, 95% CI: 0.829~0.877)
                                          外部验证集(AUC=0.912, 95% CI: 0.884~0.940)  外部验证集(AUC=0.903, 95% CI: 0.876~0.930)
                               0                                  0
                                0    0.2  0.4   1.6  2.8   1.0     0    0.2   0.4  1.6   2.8  1.0
                                       1−特异度(假阳性率)                         1−特异度(假阳性率)
                                    (a) 甲状腺结节恶性预测ROC曲线                  (b) 乳腺结节恶性预测ROC曲线
                               (a) ROC curve for malignant thyroid nodule prediction  (b) ROC curve for malignant breast nodule prediction
              注:在小结节(≤1 cm)亚组中,相比单器官模型,PEAIM的AUC提升幅度更大。甲状腺:+0.053(P<0.01),乳腺:+0.062(P<0.01)。
                                                     图3   ROC曲线比较分析
                                                  Fig.3  ROC curve comparative analysis
                                                         高                                    高

                                性别                                   性别
                              TSH水平                               乳腺密度
                                年龄                               家族肿瘤史
                               假包膜                                   年龄
                           结节纵横比>1                               皮肤回缩性
                                                         中  特征值                               中  特征值
                            TI-RADS分级                          内部回声异质性
                           血流信号分布                               BI-RADS分级
                          内部回声异质性                                   微钙化
                               微钙化                              后方回声减弱
                           边缘不规则性                               边缘不规则性
                                                         低                                    低
                                  −2  −1  0  1   2  3                     0  0.5 1.0  1.5 2.0 2.5  3.0 3.5
                                     SHAP值(对预测的贡献度)                      SHAP值(对预测的贡献度)
                                 (a) 甲状腺结节恶性预测中的特征重要性                  (b) 乳腺结节恶性预测中的特征重要性
                            (a) Feature importance in malignant thyroid nodule prediction  (b) Feature importance in malignant breast nodule prediction
              注:★表示甲状腺和乳腺结节预测的共性特征,特征值颜色从蓝色(底)到红色(高),SHAP值表示特征对预测恶性风险的贡献度。
                                                    图4   SHAP特征重要性分析
                                                 Fig.4  SHAP feature importance analysis


                                                             29
   28   29   30   31   32   33   34   35   36   37   38