Page 180 - 《软件学报》2021年第12期
P. 180
3844 Journal of Software 软件学报 Vol.32, No.12, December 2021
分进行分析讲解.
2.2.1 空间特征:局部 DCN 模型
DCN 在 CNN 的基础上引入了两个全新的模块(即可变形卷积模块与可变形 RoI 池化模块),其主要思想为:
从目标任务中学习偏移量,然后使用额外的偏移量来改变模型中的空间采样位置,从而有效提升 CNN 的泛化能
力.本文研究发现,DCN 通过学习偏移量改变感受野范围的特性.在此场景下,能更好地模拟空间相关性,从而提
取出更为准确的特征信息.
本文使用 DCN 对地图区域间的需求进行空间特征提取时,借鉴 Yao 等人 [22] 论文中所使用的局部分解方法,
仅将要预测的区域以及其周围信息输入到模型中.在不同的时间片中,本文将每个区域及其周围邻域的乘车需
求数量视为具有一个通道的 s×s 图像集合 D T s s×× 1 (图像中,城市边界缺失部分用 0 补齐),其中,尺寸 s 控制空间粒
i
i
度.对于区域 i 的不同时间片 t,都可以得到二维张量图像 X ∈ D T s s× 1 × ,进而将 X 输入到 DCN 模型中进行卷积.
t
t
i
对于 X 中一个像素 x 0 的卷积操作可表示为
t
() =
yx 0 n r ∈ R W ( )r ⋅ ∑ n ( d x + 0 r + n r Δ n ) (2)
其中,R={(−1,−1),(−1,0),…,(0,0),…,(1,0),(1,1)}表示卷积核为 3×3 的感受野网格,网格中心点坐标(0,0)映射到要
做卷积操作的像素点 x 0 .W(⋅)表示获取卷积核中对应位置的卷积权重,d(⋅)表示获取张量图像中对应像素点的值.
DCN 与 CNN 的主要差别就在于Δr n ,即为上文所提到的偏移量,通过对像素点周围部分图像卷积所得.具体形式
为二通道矩阵,分别对应横纵坐标偏移量.
对单一像素点的卷积过程如图 4 所示.
Fig.4 Deformable convolution process schematic
图 4 可变形卷积过程示意图
i
本文将区域 i 不同时间片 t 的乘车需求特征图 X 馈送到 K 个卷积层,第 k 层卷积表达式如下:
t
Y , ik = ( f Y , i k − 1 *W + k b k ) (3)
t t t t
k
k
其中,W 与 b 都为可学习的参数;*表示上文所述的可变形卷积运算;f(⋅)表示激活函数,本文使用线性整流函数
t t
(ReLU)作为激活函数.在经过 K 个卷积层后,本文使用展平层和全连接层将卷积后得到的特征图转化为空间特
i
i
征向量 s ,并结合外部特征向量 e 作为时序模型 LSTM 的输入.
t
t
2.2.2 时间特征:LSTM 模型
本文使用 LSTM 来捕获乘车需求时序相关性,该模块的基本表达式为
i
i
i
h = LSTM ([ ; ],s e h i t− 1 ) (4)
t
t
t
i
i
其中, s 为上文所述的 DCN 模型所提取出的空间特征向量, e 为外部特征向量, h t− i 1 为 LSTM 模型中第 t−1 个时
t
t
间片的输出,LSTM(⋅)代表整个长短期记忆网络运算流程.上述表达式意为:使用第 t−1 个时间片的输出、第 t 个
i
时间片的空间特征向量以及外部特征向量作为输入,最终得到 h ,即区域 i 第 t 个时间片的时空特征表示,同时也
t
为可变形卷积时空模型的最终输出.