Page 181 - 《软件学报》2021年第12期
P. 181

于瑞云  等:基于可变形卷积时空网络的乘车需求预测模型                                                      3845


         2.3   POI需求关联模型
             本文通过研究发现,空间上不相近的两块区域在乘车需求上也可能存在相似关系.例如:大型商场所在的区
         域在周末可能具有较高的乘车需求,而居民区所在的区域在工作日的清晨将迎来乘车需求高峰等.因为前面所
         提到的局部 DCN 模型仅提取目标像素点邻近区域的空间相似性,所以本文从 POI 以及历史需求两个方面来提
         取较远区域间的相似关系.这样即可与局部 DCN 模型相互补充,使模型预测结果更加准确.
             因为在地图中每块区域皆可互通,所以本文将目标地图按区域划分后转换成一张无向完全图,具体定义为
         G=(V,E,W).V 为节点集合,对应城市地图中的所划分的区域集合 L;E 为图中点与点之间边的集合;W 为每条边上
         的权重,即表示两个区域之间的相似程度.W 的表达式为
                                      W=α⋅exp[−δ(D m )]+(1−α)exp[−δ(P ij )]                   (5)
         其中,D m 与 P ij 分别为区域间的 POI 差异化指数与需求差异化指数,将在接下来的部分着重讲解求解方法.δ(⋅)为
         min-max 标准化方法,为了避免因两个差异化指数数值上差距过大从而对结果造成影响;α则是为了权衡两种差
         异化指数对权重大小的影响,本文通过多次实验得出,当α取值在 0.4 与 0.6 之间时,模型准确性最高,所以本文将
         其最优区间平均数 0.5 作为α的最终取值.
         2.3.1  区域 POI 差异化指数
             现实生活中,POI 对其所在的区域乘车需求影响非常大,所以本文提取不同区域间的 POI 相似性,并将其嵌
         入到模型中.本模块着重考虑地铁站、公交车站、旅游景点、大型商场、医院、学校以及居民区这七类不易变
         更的 POI,使用线性神经网络模型          [30] 提取不同种类 POI 对乘车需求的影响权重.其中,线性神经网络的输入为各
         个区域不同种类 POI 的数量以及当前区域各个时间片乘车需求数量的总和,训练得出的不同种类 POI 对乘车需
         求的影响权重即为所求.表达式如下:
                                             N ⋅  i p  W =  p ∑ tT  d i t                     (6)
                                                       ∈
                                           i
               i
         其中, N 为区域 i 的不同种类 POI 数量, d 为 t 时段区域 i 的乘车需求值,W p 即为所要求的各类 POI 影响权重,
                                          t
               p
         ⋅为点乘运算.此处值得强调的是:线性神经网络中之所以使用区域不同时间片的需求总和作为标签,是因为本
         模块主要目的为捕捉不同类型 POI 对乘车需求的总体影响,并非忽略了此影响在不同时间段的潮汐变化.所以,
         不同区域间的需求时序相似关系将在下个模块的区域需求差异化指数中体现出来.得到各类 POI 的影响权重
         后,即可完成不同区域间的 POI 差异化指数计算,其计算公式如下:
                                           P =  ij  | N ⋅  i p  W −  p  N ⋅  p j  W p  |      (7)
         2.3.2  区域需求差异化指数
             经本文研究发现:在捕捉两个区域的相似关系时,不仅要从 POI 功能的角度出发,还应该考虑两个区域需求
         序列的相似性.本模块以周为单位对各个模块每个时间片的乘车需求数量取平均值,得出各区域一天的需求序
         列.进而对不同区域间的需求序列使用动态时间规整算法(DTW)                     [31] 求出区域需求差异化指数,其计算公式如下:
                                                       i
                                              D m =DTW(S ,S ) j                               (8)
              i
                j
         其中,S ,S 代表两个不同区域的平均需求序列,DTW(⋅)为动态时间规整算法,D m 即为所求区域需求差异化指数.
             得到区域 POI 差异化指数 P ij 及区域需求差异化指数 D m 后,即可使用公式(5)完成无向完全图中,边权重 W
                                                                                       i
         的计算.在获取完整的图信息后,本文使用 Node2vec 图嵌入方法                [32] 将区域节点 i 转化为多维向量 g .为使嵌入的
                  i
         多维向量 g 能与整个网络架构进行协同训练,本模块将区域节点 i 的特征向量馈送到全连接层,其公式定义为
                                             ˆ g =  i  ( fW g +  i  b  )                      (9)
                                                   pd    pd
                                      i
         其中,W pd 与 b pd 都为可学习的参数, ˆ g 即为整个 POI 需求关联模型的输出.
         2.4   模型整合
                                                                              i
             为了使前面两小节的模型相关联,本小节将可变形卷积时空模型输出的特征向量 h 与 POI 需求关联模型
                                                                              t
                                                  i
                                           i
                        i
         输出的特征向量 ˆ g 相连接,进而得到向量 y .此时, y 已经包含区域 i 的时空以及 POI 等特征,最后将其馈送到全
                                                  t
                                           t
   176   177   178   179   180   181   182   183   184   185   186