Page 32 - 《中国医疗器械杂志》2026年第1期
P. 32
Chinese Journal of Medical Instrumentation 2026年 第50卷 第1期
医 学 人 工 智 能
召回率(recall)、F1值。③AUC值:DeLong检验 1.6 统计分析与软件工具
比较不同模型的AUC值。 连续变量以均数±标准差或中位数(四分位
验证方法: 距)表示,分类变量以频数(百分比)表示。组间
①五折交叉验证评估内部性能稳定性。②在独 比较采用独立样本t检验、Mann-Whitney U检验或
2
立外部测试集上验证模型泛化能力。③亚组分析: χ 检验。P<0.05被认为具有统计学意义。数据处理
按年龄、性别、结节大小等因素进行分层分析。 与模型构建使用Python 3.11.7,主要依赖库包括
模型解释: pandas 1.3.4、scikit-learn 1.0.1、TensorFlow 2.8.0和
①SHAP( SHapley Additive exPlanations) 分 PyTorch 1.10.0。统计分析使用R 4.1.2,可视化采
析:识别并量化各变量对预测结果的贡献度。②t- 用matplotlib 3.5.1、seaborn 0.11.2和ggplot2 3.3.5。
SNE( t-distributed stochastic neighbor embedding) 2 结果
可视化:展示跨器官特征在高维空间的分布关系。
③热力图(heatmap):显示关键特征间的相关性。 2.1 基线人口学和临床特征
临床实用性评估: 甲状腺结节患者中,恶性组年龄显著低于良性
①决策曲线分析(decision curve analysis, DCA): 组,女性比例更高。乳腺结节患者中,恶性组与良
评估模型在不同风险阈值下的临床净获益。②列线 性组的年龄差异不显著,但家族肿瘤史比例更高。
图(nomogram):构建基于模型预测的直观风险 在影像学特征方面,恶性结节较良性结节更常表现
评估工具。 为不规则形态、微钙化和高等级评分(见表1)。
表1 甲状腺和乳腺结节患者的基线特征
Tab.1 Baseline characteristics of patients with thyroid and breast nodules
特征 甲状腺结节 乳腺结节 P值
病例数/n 良性 (n=1 842) 恶性 (n=544) 良性 (n=1 971) 恶性 (n=782)
a
年龄/岁( ¯ x±s) 48.9±14.2 42.6±12.7 49.7±15.1 51.3±13.5 <0.001 , 0.089 b
性别/n(%)
女性 1 258 (68.3%) 412 (75.7%) 1 971 (100%) 782 (100%) 0.003 a
男性 584 (31.7%) 132 (24.3%) 0 (0%) 0 (0%)
a
2
BMI /(kg/m ) ( ¯ x±s) 24.3±3.8 23.9±3.6 23.7±3.9 24.1±4.1 0.168 , 0.112 b
a
家族肿瘤史/n(%) 137 (7.4%) 52 (9.6%) 112 (5.7%) 97 (12.4%) 0.095 , <0.001 b
a
吸烟史/n(%) 294 (16.0%) 76 (14.0%) 59 (3.0%) 31 (4.0%) 0.270 , 0.175 b
a
形态不规则/n(%) 451 (24.5%) 371 (68.2%) 617 (31.3%) 600 (76.8%) <0.001 , <0.001 b
a
微钙化/n(%) 280 (15.2%) 292 (53.7%) 335 (17.0%) 407 (52.0%) <0.001 , <0.001 b
TI-RADS/BI-RADS评分/n(%)
1~3级 1 310 (71.1%) 95 (17.5%) 1 269 (64.4%) 76 (9.7%) <0.001 , <0.001 b
a
4~5(6)级 532 (28.9%) 449 (82.5%) 702 (35.6%) 706 (90.3%)
b
a
注: 甲状腺良性vs.恶性, P<0.05 , 乳腺良性vs.恶性,P<0.05。
2.2 模型性能比较 2.3 特征重要性分析
泛内分泌结节AI模型(pan-endocrine nodule SHAP分析显示,边缘不规则性、微钙化和内
AI model, PEAIM)在五折交叉验证中表现优异, 部回声异质性是两类结节预测的共同重要特征。甲
明显优于单器官模型和传统机器学习模型。在外 状腺结节预测更依赖于血流信号分布和TI-RADS分
部测试集上,PEAIM维持良好的泛化性能,而单 级,乳腺结节预测则更依赖于后方回声特征和BI-
器官模型性能显著下降。亚组分析显示PEAIM在 RADS分级。年龄在甲状腺和乳腺结节预测中影响
小结节(≤1 cm)预测上优势更为显著(见表2、 方向相反。家族肿瘤史在乳腺结节预测中的重要性
图3)。 更高(见图4)。
28

