Page 176 - 《软件学报》2021年第12期
P. 176

3840                                Journal of Software  软件学报 Vol.32, No.12, December 2021

         demand differentiation index. Finally, the two models are integrated by a fully connected network. Then the prediction results are obtained.
         In this study, the large real ride demand data of Didi trips is used for experiments. The final experimental results show that the proposed
         method outperforms the existing forecasting methods in terms of prediction accuracy.
         Key words:    urban computing; spatial-temporal correlation; deformable convolutional network

             在城市交通日渐发达的今天,建立一个高效的交通系统已成为打造智慧城市的核心问题.准确的需求预测
         模型,成为解决此类问题的关键.如果我们能够准确地预测出乘客的出行需求,就可以预先分配资源,即可避免
         空载现象发生,从而达到节约资源、缓解交通压力的目的.目前,随着滴滴、Uber 等出租车服务的日益普及,我们
         能够以前所未有的规模收集大量需求数据.如何利用大数据来更好地预测交通需求的问题,已经引起了人工智
         能研究界越来越多的关注.
             本文主要研究区域乘车需求预测问题,即通过历史乘车请求数据来预测未来时间的区域乘车请求数量.随
         着道路上车流量逐年递增以及乘客对出租车、快车等服务需求量的不断增大,乘车服务供需不匹配的问题逐渐
         暴露出来.例如:有时候,一些司机因为所在区域乘客需求量较少而导致无单可接;同时,由于周边地区的乘客需
         求远超过出租车数量,导致大量乘客在恶劣天气或高峰时段很难乘车.所以,对出租车、快车等营利性车辆的需
         求预测,在近些年就越发引起研究人员重视.
             以往的文献显示研究人员已经对交通数据预测进行了长期研究.其中,预测对象包括人流量、车流量、出
         租车需求量等.在研究初期,研究人员把城市进行区块化处理,并把其中一块区域不同时间段的车辆需求数量看
                                                                                        [1]
         作时间序列,进而对时间序列进行预测.比较有代表性的方法为:整合移动平均自回归模型(ARIMA) 及其相关
                                                                                 [5]
                                                                      [4]
         变种,上述方法已被广泛应用于交通预测              [2,3] .在之前的研究基础上,Abadi 等人 、Wu 等人 以及 Tong 等人           [6]
         意识到天气、节假日、场地以及特殊事件等外在因素对城市的交通流量仍具有很大影响,所以就把此类影响因
         素加入到预测模型中.虽然研究表明,通过结合各类外部因素可以改善预测精度,但它们仍然无法捕捉到复杂且
         非线性的时空相关性.
             近几年,机器学习与深度学习在国内外科研人员的不懈努力下都取得了突破性的进展,同时也给交通流量
                                        [7]
                                                     [8]
         预测场景带来了新的解决方案.Yi 等人 与 Wang 等人 使用深度神经网络(DNN)对交通流量进行预测并取得
                                 [9]
         了较高的准确度,但 Zhao 等人 分别使用马尔可夫模型与神经网络(ANNs)模型对出租车需求进行预测,并将结
         果进行对比,实验结果表明,马尔可夫模型在可预测性高的场景下效果要好于神经网络模型.由此可见:在此场
         景下,简单的神经网络并不能捕捉到复杂的时空相关性.
             然而,深度学习在计算机视觉领域取得的成就却给了研究人员新的启发.例如:可以将整个城市的出租车需
         求按一定时间段切片,然后把城市每块区域内的需求数量看作一个像素点,这样就可以得到一张单位时间内的
         城市出租车需求图像.给定一组历史需求图像,用模型预测下一个时间戳的出租车需求图像.其中最典型的模型
         就包括卷积神经网络(CNN)        [10] 以及循环神经网络(RNN)    [11] :一些学者使用 CNN 及其变种模型来模拟城市复杂
         的空间相关性     [12−14] ;另一些学者则使用 RNN 以及长短期记忆网络(LSTM)           [15] 模拟城市交通流量的时序性       [16−18] .
         与之前的回归模型、神经网络等模型相比,这些开创性的尝试在性能上表现出明显的优越性.然而,这些尝试都
         没有同时考虑到时间和空间的相关性.近些年,Ke 等人                 [19] 与 Zhou 等人 [20] 则将 CNN 与 LSTM 相结合,使用卷积
         LSTM [21] 对出租车需求进行预测并取得了很好的效果.在此基础上,Yao 等人                  [22] 在 AAAI2018 会议中提出在一个
         联合模型中捕捉空间和时间的复杂非线性关系,从而对城市交通流量进行预测,其预测效果较之前模型有很大
         提升.
             但是该类模型也存在不足之处,模型中使用 CNN 对城市流量进行空间特征提取.众所周知,传统 CNN 中感
         受野的形状是固定的,所以在提取特征信息时,只能提取到关键像素点与其相邻区域内的特征信息.然而就实际
         情况而言,某一块区域内的交通情况可能与另一块相距较远的区域有很大关联                            [23] .如图 1 所示,这是将地图网格
         化处理后,两块在 11×11 范围内且曼哈顿距离大于 4 的区域乘车需求对比图.由图可得,两块区域在高峰时期需
         求趋势相似.然而这仅为可以被可视化的显性关联,还有很多隐性关联隐含在数据中.如果使用 CNN 进行空间
         特征提取,很可能使这些关联在池化层进行下采样时被模糊掉,最终导致空间特征提取结果存在误差.
   171   172   173   174   175   176   177   178   179   180   181