Page 32 - 《中国医疗器械杂志》2026年第1期
P. 32

Chinese Journal of Medical Instrumentation                                         2026年 第50卷 第1期

                                                     医  学  人   工  智  能



              召回率(recall)、F1值。③AUC值:DeLong检验                     1.6    统计分析与软件工具
              比较不同模型的AUC值。                                          连续变量以均数±标准差或中位数(四分位
                  验证方法:                                         距)表示,分类变量以频数(百分比)表示。组间
                  ①五折交叉验证评估内部性能稳定性。②在独                          比较采用独立样本t检验、Mann-Whitney U检验或
                                                                 2
              立外部测试集上验证模型泛化能力。③亚组分析:                            χ 检验。P<0.05被认为具有统计学意义。数据处理
              按年龄、性别、结节大小等因素进行分层分析。                             与模型构建使用Python 3.11.7,主要依赖库包括
                  模型解释:                                         pandas 1.3.4、scikit-learn 1.0.1、TensorFlow 2.8.0和
                  ①SHAP( SHapley  Additive  exPlanations) 分     PyTorch 1.10.0。统计分析使用R 4.1.2,可视化采
              析:识别并量化各变量对预测结果的贡献度。②t-                           用matplotlib 3.5.1、seaborn 0.11.2和ggplot2 3.3.5。
              SNE( t-distributed  stochastic  neighbor  embedding)   2    结果
              可视化:展示跨器官特征在高维空间的分布关系。

              ③热力图(heatmap):显示关键特征间的相关性。                         2.1    基线人口学和临床特征
                  临床实用性评估:                                          甲状腺结节患者中,恶性组年龄显著低于良性
                  ①决策曲线分析(decision curve analysis, DCA):        组,女性比例更高。乳腺结节患者中,恶性组与良
              评估模型在不同风险阈值下的临床净获益。②列线                            性组的年龄差异不显著,但家族肿瘤史比例更高。
              图(nomogram):构建基于模型预测的直观风险                         在影像学特征方面,恶性结节较良性结节更常表现
              评估工具。                                             为不规则形态、微钙化和高等级评分(见表1)。


                                               表1   甲状腺和乳腺结节患者的基线特征
                                       Tab.1  Baseline characteristics of patients with thyroid and breast nodules
                         特征                      甲状腺结节                        乳腺结节                   P值
              病例数/n                       良性 (n=1 842)  恶性 (n=544)   良性 (n=1 971)   恶性 (n=782)
                                                                                                      a
              年龄/岁(  ¯ x±s)               48.9±14.2     42.6±12.7    49.7±15.1      51.3±13.5    <0.001 , 0.089 b
              性别/n(%)
               女性                         1 258 (68.3%)  412 (75.7%)  1 971 (100%)  782 (100%)   0.003 a
               男性                         584 (31.7%)   132 (24.3%)  0 (0%)         0 (0%)
                                                                                                     a
                       2
              BMI /(kg/m ) (  ¯ x±s)      24.3±3.8      23.9±3.6     23.7±3.9       24.1±4.1     0.168 , 0.112 b
                                                                                                     a
              家族肿瘤史/n(%)                  137 (7.4%)    52 (9.6%)    112 (5.7%)     97 (12.4%)   0.095 , <0.001 b
                                                                                                     a
              吸烟史/n(%)                    294 (16.0%)   76 (14.0%)   59 (3.0%)      31 (4.0%)    0.270 , 0.175 b
                                                                                                      a
              形态不规则/n(%)                  451 (24.5%)   371 (68.2%)  617 (31.3%)    600 (76.8%)  <0.001 , <0.001 b
                                                                                                      a
              微钙化/n(%)                    280 (15.2%)   292 (53.7%)  335 (17.0%)    407 (52.0%)  <0.001 , <0.001 b
              TI-RADS/BI-RADS评分/n(%)
               1~3级                       1 310 (71.1%)  95 (17.5%)  1 269 (64.4%)  76 (9.7%)    <0.001 , <0.001 b
                                                                                                      a
               4~5(6)级                    532 (28.9%)   449 (82.5%)  702 (35.6%)    706 (90.3%)
                                           b
                  a
              注:  甲状腺良性vs.恶性, P<0.05 ,  乳腺良性vs.恶性,P<0.05。

               2.2    模型性能比较                                     2.3    特征重要性分析
                  泛内分泌结节AI模型(pan-endocrine nodule                   SHAP分析显示,边缘不规则性、微钙化和内
              AI model, PEAIM)在五折交叉验证中表现优异,                     部回声异质性是两类结节预测的共同重要特征。甲
              明显优于单器官模型和传统机器学习模型。在外                             状腺结节预测更依赖于血流信号分布和TI-RADS分
              部测试集上,PEAIM维持良好的泛化性能,而单                           级,乳腺结节预测则更依赖于后方回声特征和BI-
              器官模型性能显著下降。亚组分析显示PEAIM在                           RADS分级。年龄在甲状腺和乳腺结节预测中影响
              小结节(≤1 cm)预测上优势更为显著(见表2、                          方向相反。家族肿瘤史在乳腺结节预测中的重要性
              图3)。                                              更高(见图4)。


                                                             28
   27   28   29   30   31   32   33   34   35   36   37