Page 63 - 《中国医疗器械杂志》2025年第6期
P. 63

Chinese Journal of Medical Instrumentation                                         2025年 第49卷 第6期

                                                     临  床  医   学  工  程



                 (  1)训练方法。                                                           1  N ∑
                                                                               MAE =      |y i − ˆy i |     (4)
                  模型训练使用了2022年1月至2024年4月的数据                                           N
                                                                                        i=1
              作为训练集,包含28个月的冠脉支架供货与使用数
                                                                                       N ∑
              据。验证集则取剩余2024年5月至2024年8月的数                                                 |y i − ˆy i | 2
              据,验证集用于调整模型的超参数,选择最优参数                                            2      i=1
                                                                               R = 1−                       (5)
              组合,避免过拟合。使以上3种对比模型的学习                                                    N ∑    2
                                                                                         |y i −y|
              率、训练Epoch以及批量大小等超参数保持一致,
                                                                                       i=1
              如表2所示。                                            式中:    y i 为第i个数据点的真实值, 为第i个数据
                                                                                                 ˆ y i

                                表2   超参数                        点的预测值,       y为真实值的平均值,N为测试集样
                             Tab.2  Hyperparameters
                                                                本数量。
                       参数名称                      值
                                                                    RMSE为预测值与真实值误差平方平均值的平
                        学习率                     0.001
                                                                方根,强调对大误差的惩罚力度;MAE为预测值
                       批量大小                      32             与真实值绝对误差的平均值,直接衡量误差的平均
                        优化器                     Adam            幅度;R 表示解释变量方差的能力,反映拟合程度
                                                                        2
                       损失函数                     MSE             的优劣。RMSE、MAE的值越小,表示模型预测值
                      训练Epoch                    50             与真实值之间差距越小;R 越接近1,则表示拟合
                                                                                         2

                                                                程度越好。
                  表 2中 使 用  Adam  优 化 器 ( adaptive  moment
              estimation)优化深度学习模型 ,该优化器能够在                       2    结果与分析
                                          [9]
              深度学习的各种任务和模型中自动调整学习率,并
              且具有较好的收敛性能。Adam优化器原理包括动                            2.1    数据预处理
              量和自适应学习率的结合,即                                         在本研究中,数据预处理是确保模型训练和需
                                                                                         [10]
                                                2               求预测准确性的重要环节 。为了提高数据的质
                          ν t = βv t−1 +(1−β)(∇ θ J(θ t ))  (1)
                                                                量,须对2022年1月至2024年8月的冠脉支架供应及
              式中:    θ t 为迭代t时的参数,      ∇ θ J (θ t )为迭代t 时的目
                                                                使用数据进行清洗与处理,具体包括以下操作。
              标函数,β为二阶矩估计的指数衰减率,v 为上一
                                                    t−1
              步平方梯度的指数加权平均值,v 为当下平方梯度                              (  1)去除空行。
                                             t                      原始数据中存在部分空行或不完整记录(如缺
              的指数加权平均值。
                                                                少供货数量或使用数据)。经过统计,在总计11 680
                 (  2)验证评价指标。
                                                                条数据中,有37条记录缺失关键字段,已将其删
                  在深度学习中,验证是关键一环,可用于观察
                                                                除,剩余有效记录为11 643条。
              模型性能。在训练过程中,使用训练集对模型进行
                                                                   (  2)去除异常值。
              训练,每个Epoch表示模型在训练集中完成传播,
                                                                    为了保证数据的可靠性,对供货数量和使用数
              训练结束后使用验证集评估模型性能,绘制MSE趋
                                                                量进行了异常值检测。通过统计学方法发现12条供
              势曲线,具体见式(2),跟踪模型性能的变化趋
                                                                货记录存在异常,这些异常值已被移除,经核查其
              势,根据变化趋势在适当的节点停止训练,避免过
                                                                为输入错误,故予以删除。
              度拟合。同时建立模型的评价指标,分别选取均方
                                                                   (  3)去除重复项。
              根误差(root mean square error, RMSE)、平均绝
                                                                    对数据集进行了重复项检测,发现25条重复记录
              对误差(mean absolute error, MAE)、决定系数
                                                               (  主要为供应商的重复供货记录和科室使用记录),
             (  2
               R )对以上3种模型进行对比分析,具体计算方
                                                                去除重复记录,以避免模型训练中的数据偏差。
              法见式(3)~式(5)。
                                                                    统计清洗后的数据总记录数为11 606条,并
                                   1  N ∑    2                  根据2022年1月至2024年8月清洗后的冠脉支架供
                            MSE =      (y i − ˆy i )      (2)
                                   N                            应数据及临床使用数据,进行基本数据统计与趋势
                                     i=1
                                  v
                                  u                             可视化分析。统计出在此期间冠脉支架总计使用
                                  t
                                     1  N ∑
                          RMSE =         (y i − ˆy i ) 2  (3)   10 832个,供货公司供货频次总计7 587次,同时
                                     N
                                       i=1                      得出供货频次及使用量的时间序列,如图2所示。
                                                             649
   58   59   60   61   62   63   64   65   66   67   68