Page 30 - 《中国医疗器械杂志》2026年第1期

P. 30

Chinese Journal of Medical Instrumentation 2026年第50卷第1期

医学人工智能

438例）作为独立外部测试集。据并进行标准化处理；其次构建多任务深度学习模
1.2 研究流程型并与对照模型比较；然后通过内部交叉验证和外
研究分为数据收集、预处理、模型构建、性能部测试集评估模型性能；最后分析模型的可解释性
评估和临床验证五个阶段。首先收集多中心临床数并评估其临床应用价值。完整研究流程如图1所示。

数据来源
甲状腺相关
甲状腺结节患者 (n=2386)
乳腺结节患者 (n=2753) 乳腺相关
多中心回顾性收集 (2018.01－2023.12) 模型构建
评估与分析

数据预处理数据集划分
缺失值处理
标准化训练集 (n=3597)
独热编码验证集 (n=1542)
数据增强外部测试集 (n=835)

甲状腺结节特征乳腺结节特征
临床变量：年龄、性别、BMI等临床变量：年龄、性别、家族史等
影像学特征：大小、形态、钙化等影像学特征：大小、形态、回声等
TI-RADS评分 BI-RADS评分
病理结果病理结果

多任务深度学习模型架构 (PEAIM)
输入层：临床变量+影像学特征
共享表示层：多头自注意力机制
特异性子层：甲状腺结节特异性层+乳腺结节特异性层
融合层：特征融合
输出层：甲状腺结节恶性概率+乳腺结节恶性概率

模型性能评估模型解释与分析
AUC、灵敏度、特异度、准确率 SHAP特征重要性分析
F1值、95%CI、精确率、召回率 t-SNE特征分布可视化
五折交叉验证、DeLong检验热力图相关性分析
外部测试集验证决策曲线分析 (DCA)

临床价值与应用
辅助诊断、结节筛查、风险分层、临床决策支持

图1 基于深度学习的跨甲状腺与乳腺结节泛内分泌系统恶性风险预测模型研究流程
Fig.1 Research flowchart of a deep learning-based model for predicting malignancy risk of pan-endocrine system across thyroid and breast nodules

1.3 变量收集与处理位置、形态（规则/不规则）、边界（清晰/模糊）、
临床变量：年龄、性别、体重指数（BMI）、包膜（完整/不完整）、内部回声（低/等/高/混
吸烟史、饮酒史、家族肿瘤史、内分泌疾病史、甲合）、钙化（无/微钙化/粗大钙化/混合钙化）、血
状腺激素水平（FT3、FT4、TSH）、性激素水平流信号（无/低/中/高）、韧带侵犯征象、TI-RADS
（分级（1~5）等。②乳腺超声特征：结节大小、位
雌二醇、孕酮、睾酮）、肿瘤标志物[甲状腺球
蛋白（TG）、CEA、CA15-3]等。置、形态（规则/不规则）、边界（清晰/模糊）、
影像学变量：①甲状腺超声特征：结节大小、内部回声（低/等/高/混合）、后方回声（增强/减

25 26 27 28 29 30 31 32 33 34 35