Page 90 - 《中国医疗器械杂志》2026年第2期
P. 90

Chinese Journal of Medical Instrumentation                                         2026年 第50卷 第2期

                                                     临  床  医   学  工  程



              不发生改变,A、Ea、R不发生改变,因此将其视为                          度。简化的Arrhenius方程为特征工程提供了物理理
              常数项。    T = T 0 +β·WorkLoad, T 0 为基础工作温度,         论指导,证明工作负荷和热量指标是影响球管退化
              即实际采集数据中的扫描前比热容,                  β为负荷−温度         的关键。从多个维度捕捉的工作负荷特征指标如
              转换系数,设定为常数,             WorkLoad为工作负荷强            表1所示。


                                                     表1   15个工作负荷特征
                                                    Tab.1  Fifteen workload features
                   特征类别            特征名称                        计算方法                            特征意义
                                 每日扫描次数                 COUNT(每日扫描记录)                        设备使用频率
                使用强度与频率          日均扫描强度                累计扫描次数/累计使用天数                     设备平均每日工作负荷
                                 近期扫描次数        ROLLING_MEAN(每日扫描次数,window=7)                 短期使用趋势
                                 累计使用天数                 RANGE(1到当前天数)                      设备使用时长指标
                                 累计能量消耗         CUMSUM(每日平均功率×每日总曝光时间)                 设备总体负荷和运行成本指标
                累计负荷与老化
                                 累计扫描次数                CUMSUM(每日扫描次数)                      设备机械磨损指标
                                 累计曝光时间               CUMSUM(每日总曝光时间)                      球管寿命消耗指标
                                使用强度变化率              PCT_CHANGE(日均扫描强度)                    使用模式动态变化
                               每日平均曝光时间            SUM(每日曝光秒数)/每日扫描次数                   反应扫描复杂度和设备效率
              负荷严重性与热应力           近期热变化       ROLLING_MEAN(每日热容量变化,window=7)                 短期热稳定性
                                   近期功率        ROLLING_MEAN(每日平均功率,window=7)              短期功率使用稳定性
                                 日均能耗强度                累计能量消耗/累计使用天数                     设备平均每日能耗水平
                                 时间老化指标            累计使用天数/MAX(累计使用天数)                    基于时间的相对老化程度
                归一化老化指标          能耗老化指标            累计能量消耗/MAX(累计能量消耗)                    基于能耗的相对老化程度
                                 扫描老化指标            累计扫描次数/MAX(累计扫描次数)                    基于使用量的老化程度

                                                                                           TP
                  表1中所有大写公式为Python 3.10统计算法,                                   Precision =                  (6)
                                                                                         TP+FP
              SUM为求和函数,COUNT为计数函数,ROLLING_                          采用召回率(Recall)评价实际为正类的样本
              MEAN为滑窗平均函数,CUMSUM为累加函数。                          中被正确预测的比例,召回率计算式为:
               1.5    模型选择与评价
                                                                                          TP
                  在构建了特征集和标签后,依据机器学习流程                                          Recall =                    (7)
                                                                                        TP+FN
              进行分类任务。研究选用梯度提升(GradientBoost)                        采用F 得分(F  Score)评价精准率与召回率
                                                                                  1
                                                                          1
              模型、随机森林(RandomForest)模型、支持向量                      的调和平均数,F 得分计算式为:
              机(support vector machine,SVM)模型、K近邻                               1
                                                                                    Precision×Recall
              算法(KNN)模型、岭回归分类器(RidgeClassifier)                             F 1 = 2×                        (8)
                                                                                    Precision+Recall
              模型、逻辑回归分类器(LogisticRegression)模
                                                                    在评价指标计算式中,             TP表示预测真阳性,
              型  [16-22] 6种模型进行生命周期分类,这些模型对                     TN表示预测真阴性,          FP表示预测假阳性,          FN表示
              特征缩放不敏感,能够有效处理特征间的非线性
                                                                预测假阴性。为了提高模型泛化性能,本研究采用
              关系和交互作用。考虑到研究的样本量较小,为
                                                                五折交叉验证(cross validation,CV)进行模型训
              提高模型泛化性,研究采用五折交叉验证策略进行
                                                                练与评估,对交叉验证结果同样计算模型评价指标。
              训练。
                  在评价指标方面,研究采用准确率(Accuracy)                      2    结果与分析
              评价模型正确预测的样本比例,准确率计算式为:
                                                                 2.1    机器学习模型性能
                                       TP+TN
                        Accuracy =                        (5)       将表1中提取的15个工作负荷特征作为输入,
                                  TP+TN+FP+FN
                  采用精确率(Precision)评价预测为正类的样                     对6种机器学习模型进行了训练和五折交叉验证,
              本中实际为正类的比例,精确率计算式为:                               模型性能对比如表2所示。


                                                             204
   85   86   87   88   89   90   91   92   93   94   95