Page 180 - 《软件学报》2021年第12期
P. 180

3844                                Journal of Software  软件学报 Vol.32, No.12, December 2021

         分进行分析讲解.
         2.2.1  空间特征:局部 DCN 模型
             DCN 在 CNN 的基础上引入了两个全新的模块(即可变形卷积模块与可变形 RoI 池化模块),其主要思想为:
         从目标任务中学习偏移量,然后使用额外的偏移量来改变模型中的空间采样位置,从而有效提升 CNN 的泛化能
         力.本文研究发现,DCN 通过学习偏移量改变感受野范围的特性.在此场景下,能更好地模拟空间相关性,从而提
         取出更为准确的特征信息.
             本文使用 DCN 对地图区域间的需求进行空间特征提取时,借鉴 Yao 等人                    [22] 论文中所使用的局部分解方法,
         仅将要预测的区域以及其周围信息输入到模型中.在不同的时间片中,本文将每个区域及其周围邻域的乘车需
         求数量视为具有一个通道的 s×s 图像集合 D            T s s×× 1  (图像中,城市边界缺失部分用 0 补齐),其中,尺寸 s 控制空间粒
                                                                       i
                                                        i
         度.对于区域 i 的不同时间片 t,都可以得到二维张量图像 X ∈                 D T s s×  1 ×  ,进而将 X 输入到 DCN 模型中进行卷积.
                                                        t
                                                                       t
               i
         对于 X 中一个像素 x 0 的卷积操作可表示为
               t
                                       () =
                                       yx 0   n r ∈ R W ( )r ⋅ ∑  n  ( d x +  0  r +  n  r Δ n )  (2)
         其中,R={(−1,−1),(−1,0),…,(0,0),…,(1,0),(1,1)}表示卷积核为 3×3 的感受野网格,网格中心点坐标(0,0)映射到要
         做卷积操作的像素点 x 0 .W(⋅)表示获取卷积核中对应位置的卷积权重,d(⋅)表示获取张量图像中对应像素点的值.
         DCN 与 CNN 的主要差别就在于Δr n ,即为上文所提到的偏移量,通过对像素点周围部分图像卷积所得.具体形式
         为二通道矩阵,分别对应横纵坐标偏移量.
             对单一像素点的卷积过程如图 4 所示.
















                                  Fig.4    Deformable convolution process schematic
                                         图 4   可变形卷积过程示意图
                                                   i
             本文将区域 i 不同时间片 t 的乘车需求特征图 X 馈送到 K 个卷积层,第 k 层卷积表达式如下:
                                                   t
                                           Y  , ik  =  ( f Y  , i k − 1  *W +  k  b k  )      (3)
                                           t      t     t  t
               k
                    k
         其中,W 与 b 都为可学习的参数;*表示上文所述的可变形卷积运算;f(⋅)表示激活函数,本文使用线性整流函数
               t   t
         (ReLU)作为激活函数.在经过 K 个卷积层后,本文使用展平层和全连接层将卷积后得到的特征图转化为空间特
                                   i
                i
         征向量 s ,并结合外部特征向量 e 作为时序模型 LSTM 的输入.
                t
                                   t
         2.2.2  时间特征:LSTM 模型
             本文使用 LSTM 来捕获乘车需求时序相关性,该模块的基本表达式为
                                                     i
                                                       i
                                            i
                                           h =  LSTM ([ ; ],s e h i t− 1 )                    (4)
                                                     t
                                                       t
                                            t
                                                         i
               i
         其中, s 为上文所述的 DCN 模型所提取出的空间特征向量, e 为外部特征向量, h                    t− i  1  为 LSTM 模型中第 t−1 个时
              t
                                                         t
         间片的输出,LSTM(⋅)代表整个长短期记忆网络运算流程.上述表达式意为:使用第 t−1 个时间片的输出、第 t 个
                                                           i
         时间片的空间特征向量以及外部特征向量作为输入,最终得到 h ,即区域 i 第 t 个时间片的时空特征表示,同时也
                                                           t
         为可变形卷积时空模型的最终输出.
   175   176   177   178   179   180   181   182   183   184   185