Page 249 - 《软件学报》2021年第5期
P. 249
曹翰林 等:轨迹表示学习技术研究进展 1473
3.3.2 基于卷积神经网络
不同于循环神经网络仅考虑轨迹序列在时间维度上的影响,卷积神经网络的特点在于其可以对空间维度
上一块“区域”内的数据进行处理.换句话说,循环神经网络更多地是将轨迹看作一维时间序列,而卷积神经网络
则更多地是将轨迹看作多维张量.
文献[46]首先将轨迹数据表示成兴趣点序列,然后为每一个兴趣点分配互不相同的索引,再使用优化过的
哈希表将索引值嵌入到 k 维空间,由 k 维向量来表示兴趣点.于是,轨迹被表示为由兴趣点向量组成的矩阵.对该
矩阵使用卷积神经网络学习轨迹的抽象表示.除此之外,图像是卷积神经网络最常处理的数据类型.文献[41]将
轨迹转化为图像后用卷积神经网络来提取轨迹的模式.为了解决第 3.2 节中提到的图像分辨率对轨迹表示效果
的影响,作者认为综合多种尺度下的模式可以解决该问题,而这一点可以通过在卷积神经网络中使用多层卷积
层和池化层来完成.
3.4 有关整体轨迹表示的应用
相比于对轨迹序列单元的表示,针对整条轨迹序列表示的研究工作偏少.其原因主要在于:
(1) 数据标签较为单一.一条轨迹中通常包含了丰富的信息,例如轨迹中的不同区段都可以拥有不同的属
性和标签.而若将整条轨迹序列视为基本数据单元,那么一条轨迹只能拥有一个相应的标签,这在一
定程度上限制了该方法的使用场景.
(2) 不同的轨迹数据往往有不同的长度,即轨迹序列所包含的轨迹点的数量不同.由于大多数机器学习算
法,尤其是神经网络均要求输入数据是固定长度,这种长度上的不一致为算法设计带来了挑战.
(3) 缺乏一种有效的距离度量方式.在许多轨迹数据挖掘任务中都对计算轨迹间相似性提出了要求,例如
轨迹聚类、轨迹异常检测等.然而直接用整条轨迹计算相似性,除了上述长度不一致的缺点外,还会面
临不同轨迹采样率不一致等问题,这共同加剧了直接使用整条轨迹的难度.
尽管面临上述难点,依然有一批工作从各个角度出发丰富了这一类方法的应用场景.
3.4.1 轨迹分类
轨迹分类的目标是区分不同模式下的轨迹或轨迹段,例如,轨迹按照交通模式可以具体分为步行、骑车、
乘坐公交、乘坐出租车等.对轨迹进行分类是众多应用的基础,可以提供丰富的信息帮助我们理解移动主体.例
如,对实时轨迹的分类可以用来识别可疑的移动主体 [65] .
传统的轨迹分类方法通常使用人工设计的特征作为分类的依据.文献[23]基于轨迹中的换乘点将轨迹划分
成不同的轨迹段,通过实验对比了使用决策树、贝叶斯网络、支持向量机和条件随机场识别这些轨迹段所属类
别的效果.文献[35]以轨迹段中的频繁项为基础,将信息增益作为衡量分类能力的指标,筛选出有利于分类的频
繁轨迹段序列;然后将频繁轨迹段序列及其频率作为特征,将轨迹映射到特征空间中;轨迹特征向量的每一个维
度均是特征空间中的一个坐标轴,即轨迹段序列或轨迹段序列的频率;最后,将特征向量输入到支持向量机中进
行分类.
神经网络也被广泛用于此类应用中.文献[6]使用速度及其统计量作为特征,将其嵌入到特征空间中后再送
入 GRU 对轨迹进行分类.文献[5]将不同类别的轨迹转化为灰度图像进行分析,如图 5 所示;然后使用降噪自编
码器从轨迹图像中提取特征,并结合人工提取的物理量特征,共同用来训练轨迹模式的分类器.
此外,随着移动互联网的发展,近年来出现了众多互联网打车平台,如 Uber、滴滴等.这种通过移动设备和应
用程序将司机和乘客联系起来的出行服务逐渐成为了一种新的交通模式.不过,考虑到对用户隐私的保护,通常
难以从打车平台获取此类数据.为了解决这一问题,文献[42]通过迁移学习的方式对互联网打车轨迹进行识别.
3.4.2 异常检测
轨迹异常检测可以看作是轨迹分类的特殊情况,即把数据集中的正常轨迹和异常轨迹区分开来.但异常检
测通常要比一般的分类问题更难,其原因主要在于异常轨迹的样本量较少,导致异常模式难以被建模.
文献[8]采用 3 次 B 样条曲线来拟合正常轨迹,用求解出的控制点坐标级联时间信息作为轨迹的表示向量,
输入到混合高斯模型中对正常轨迹进行建模.对于一个新的轨迹样本,若模型给出很低的概率则被判定为异常