Page 97 - 《软件学报》2020年第12期
P. 97
柏梦婷 等:行程时间预测方法研究 3763
Fig.3 Structure of SSNN
图 3 SSNN 结构图
Lint 等人 [32] 使用了 3 种 SSNN 模型:全连接状态空间神经网络(FC-SSNN)、简化状态空间神经网络
(R-SSNN)和局部连接状态空间神经网络(PC-SSNN).其中:FC-SSNN 的上下文和隐层之间完全连接;R-SSNN 是
FC-SSNN 的简化,它会删去对输入数据没有贡献的隐层神经元;PC-SSNN 的每个隐层神经元只连接到它自己的
上下文神经元和相邻神经元.仿真实验的平均相对误差小于 10%.Lint 等人 [80] 提出一个结合 SSNN、简单指数平
滑和空间插值方法的行程时间预测框架,通过对缺失数据的处理,该模型具有了较好的鲁棒性.仿真实验结果获
得了 1.6%的平均相对误差.Li 等人 [81] 提出了利用终止条件控制训练过程的贝叶斯状态空间神经网络(Bayesian
state space neural network,简称 BSSNN),该模型使用控制因子限制预测结果的置信区间,缩短了训练时间,加速
了收敛过程且稳定性增强.相比 SSNN 模型,BSSNN 训练时间从 179min 缩短到了 89min,平均绝对百分比误差
降低了 0.17%.
(2) 支持向量回归
自从 Vapnik 等人 [82] 提出支持向量机(support vector machine,简称 SVM)后,研究者们已经对 SVM 分类和回
归进行了深入研究 [33,34] .SVM 能根据训练样本,在模型复杂度和泛化能力之间寻求最佳折中.基于 SVM 的支持
向量回归(support vector regression,简称 SVR)方法也逐渐被用作非线性拟合的一种常用方法.SVR 的基本思想
是:通过拟合一个函数,将难以在低维空间分离的数据映射到高维特征空间,然后构造出具有最大边界的分离超
平面.
Wu 等人 [83] 应用 SVR 模型,使用台湾地区高速公路局收集的车速数据间接预测行程时间.实验设计了以线
性函数、多项式函数和径向基函数为核函数的 3 个模型.实验结果表明:相比历史平均方法等基线模型,SVR 模
型的平均相对误差减少了 3%~10%,均方根误差减少了 4%~24%.Castro-Neto 等人 [84] 提出了在线支持向量回归
机(online-SVR,简称 OL-SVR)用于交通预测.每次向 OL-SVR 模型添加新数据时,模型参数都会发生变化.随着
不断接收的实时数据,可以在不断产生新的预测值的同时更新模型.实验结果显示:在道路畅通时,平均绝对百
分比误差低于 9%;交通拥堵时,平均绝对百分比误差低于 23.4%.Gao 等人 [85] 将 SVR 和免疫遗传算法(immune
genetic algorithm,简称 IGA)结合,预测行程时间.IGA 通过模拟生物免疫系统来改进遗传算法,本质是将优化问
题的目标函数作为抗原,将优化问题的最优解作为抗体,通过模拟生物免疫系统来学习、记忆和自适应调节 [86] .
结合 IGA 能够提高 SVR 对交通状态变化的适应能力,避免陷入局部最优.实验表明,该模型的平均绝对百分比误
差为 12.4%.
(3) 最近邻
最近邻(nearest neighbor,简称 NN)算法也叫作 k 近邻(k-NN),是机器学习算法中的一种简单却广泛应用的分
类算法.k-NN 的思想是:如果一个样本在特征空间中的 k 个最相似样本大多数属于某一类别,则该样本也属于这
一类别.k-NN 回归方法使用相似的历史数据来预测未来值,因此 k-NN 的有效性直接取决于数据库的质量 [28] .
k-NN 预测方法有很多,如取近邻平均值、加权平均值或对近邻进行线性或非线性拟合来预测未来值等 [87] .