Page 87 - 《软件学报》2021年第7期
P. 87
安冬冬 等:不确定环境下 hCPS 系统的形式化建模与动态验证 2005
(1) 将已知的输入数据(观测值或示例)和对数据的已知响应(标签或类别)作为数据集输入;
(2) 选择参与训练的特征或者使用 PCA 降维,默认不降维,使用全部特征;
(3) 设定误分类代价,即类别准确率优先级,哪些类别一定要分对,哪些类别可接受一定的误差范围;
(4) 选择训练模型并进行模型参数配置;
(5) 输入样本数据来训练模型,采用并行训练的方式可同时训练多个分类器模型,提高训练效率,该训练模
型可以对新数据的响应生成预测;
(6) 分类器效果评价结果包括散点图、混淆矩阵、ROC 曲线等;
(7) 导出训练结果和模型文件,为接下来的线上训练做准备.
2.2 模型评价指标
针对一个二分类问题,我们将实例分为如下两类:正类(positive)和负类(negative).
那么在实际分类中,会出现如下 4 种情况.
(1) 真正类(true positive,简称 TP),即被预测为正类,实际为正类;
(2) 假正类(false positive,简称 FP),即被预测为正类,实际为负类;
(3) 真负类(true negative,简称 TN),即被预测为负类,实际为负类;
(4) 假负类(flase negative,简称 FN),即被预测为负类,实际为正类.
正确率(precision): Precision TP .
TP FP
TP
真阳性率(true positive rate,简称 TPR),灵敏度(sensitivity),召回率(recall):TPR=Sensitivity=Recall= .
TP FN
真阴性率(true negative rate,简称 TNR),特异度(specificity): TNR Specificity TN .
FP TN
FN
假阴性率(false negative rate,简称 FNR): FNR .
TP FN
FP
假阳性率(false positive rate,简称 FPR): FPR .
TN FP
2 Precision Recall
F1-score: 1-scoreF .
Precision Recall
2.3 案例研究
如图 2 所示.
Fig.2 Senario: Autonomous vehicle change to the lane where human-drive vehicle occupied
图 2 驾驶场景:无人驾驶车辆(黑色)变道至人工驾驶车辆(蓝色、红色)所在的车道上
图 2 中,人工驾驶的车辆(蓝色、红色)在直行道上行驶,旁边的车道上由一辆无人驾驶车辆(黑色)同向行驶.