Page 63 - 《中国医疗器械杂志》2025年第6期
P. 63
Chinese Journal of Medical Instrumentation 2025年 第49卷 第6期
临 床 医 学 工 程
( 1)训练方法。 1 N ∑
MAE = |y i − ˆy i | (4)
模型训练使用了2022年1月至2024年4月的数据 N
i=1
作为训练集,包含28个月的冠脉支架供货与使用数
N ∑
据。验证集则取剩余2024年5月至2024年8月的数 |y i − ˆy i | 2
据,验证集用于调整模型的超参数,选择最优参数 2 i=1
R = 1− (5)
组合,避免过拟合。使以上3种对比模型的学习 N ∑ 2
|y i −y|
率、训练Epoch以及批量大小等超参数保持一致,
i=1
如表2所示。 式中: y i 为第i个数据点的真实值, 为第i个数据
ˆ y i
表2 超参数 点的预测值, y为真实值的平均值,N为测试集样
Tab.2 Hyperparameters
本数量。
参数名称 值
RMSE为预测值与真实值误差平方平均值的平
学习率 0.001
方根,强调对大误差的惩罚力度;MAE为预测值
批量大小 32 与真实值绝对误差的平均值,直接衡量误差的平均
优化器 Adam 幅度;R 表示解释变量方差的能力,反映拟合程度
2
损失函数 MSE 的优劣。RMSE、MAE的值越小,表示模型预测值
训练Epoch 50 与真实值之间差距越小;R 越接近1,则表示拟合
2
程度越好。
表 2中 使 用 Adam 优 化 器 ( adaptive moment
estimation)优化深度学习模型 ,该优化器能够在 2 结果与分析
[9]
深度学习的各种任务和模型中自动调整学习率,并
且具有较好的收敛性能。Adam优化器原理包括动 2.1 数据预处理
量和自适应学习率的结合,即 在本研究中,数据预处理是确保模型训练和需
[10]
2 求预测准确性的重要环节 。为了提高数据的质
ν t = βv t−1 +(1−β)(∇ θ J(θ t )) (1)
量,须对2022年1月至2024年8月的冠脉支架供应及
式中: θ t 为迭代t时的参数, ∇ θ J (θ t )为迭代t 时的目
使用数据进行清洗与处理,具体包括以下操作。
标函数,β为二阶矩估计的指数衰减率,v 为上一
t−1
步平方梯度的指数加权平均值,v 为当下平方梯度 ( 1)去除空行。
t 原始数据中存在部分空行或不完整记录(如缺
的指数加权平均值。
少供货数量或使用数据)。经过统计,在总计11 680
( 2)验证评价指标。
条数据中,有37条记录缺失关键字段,已将其删
在深度学习中,验证是关键一环,可用于观察
除,剩余有效记录为11 643条。
模型性能。在训练过程中,使用训练集对模型进行
( 2)去除异常值。
训练,每个Epoch表示模型在训练集中完成传播,
为了保证数据的可靠性,对供货数量和使用数
训练结束后使用验证集评估模型性能,绘制MSE趋
量进行了异常值检测。通过统计学方法发现12条供
势曲线,具体见式(2),跟踪模型性能的变化趋
货记录存在异常,这些异常值已被移除,经核查其
势,根据变化趋势在适当的节点停止训练,避免过
为输入错误,故予以删除。
度拟合。同时建立模型的评价指标,分别选取均方
( 3)去除重复项。
根误差(root mean square error, RMSE)、平均绝
对数据集进行了重复项检测,发现25条重复记录
对误差(mean absolute error, MAE)、决定系数
( 主要为供应商的重复供货记录和科室使用记录),
( 2
R )对以上3种模型进行对比分析,具体计算方
去除重复记录,以避免模型训练中的数据偏差。
法见式(3)~式(5)。
统计清洗后的数据总记录数为11 606条,并
1 N ∑ 2 根据2022年1月至2024年8月清洗后的冠脉支架供
MSE = (y i − ˆy i ) (2)
N 应数据及临床使用数据,进行基本数据统计与趋势
i=1
v
u 可视化分析。统计出在此期间冠脉支架总计使用
t
1 N ∑
RMSE = (y i − ˆy i ) 2 (3) 10 832个,供货公司供货频次总计7 587次,同时
N
i=1 得出供货频次及使用量的时间序列,如图2所示。
649

