Page 240 - 《软件学报》2021年第5期
P. 240
1464 Journal of Software 软件学报 Vol.32, No.5, May 2021
表示问题的重点.因此,本文避开了传统的按照模型类别对轨迹表示方法分类的思路,回归到轨迹数据本身,将
轨迹数据按照不同的尺度划分为轨迹单元和整条轨迹,分别归纳了对轨迹序列单元的表示方法和对整条轨迹
序列的表示方法.对轨迹序列单元的表示方法主要是以轨迹序列单元为基础,通过学习单元的表示,进而得到轨
迹序列的表示.其中,轨迹序列单元可以细分为轨迹点和轨迹段;对整条轨迹序列的表示则着眼于完整的轨迹序
列,直接学习整条轨迹的表示.接下来将对这两类方法分别进行介绍.轨迹表示方法的整体分类见表 1.
Table 1 Classification of trajectory representation methods
表 1 轨迹表示方法的分类
表示方法类别 关健技术 表示结果 主要特点
缓解数据稀疏问题,
基于划分 确定兴趣点 兴趣点序列 具有一定的语义信息
[1,4,7,19−21]
划分网格 网格序列 缓解数据稀疏问题
基于人工设计特征 依赖专家知识,
基于轨迹点的 专家知识 特征序列
对轨迹 表示方法 [3,6,13,22−24] 定义词语; 特征表达能力有限
基于词袋
单元的 [1,2,7,15,16,21,25−28] 词嵌入 词向量序列 考虑轨迹序列的上下文信息
表示
基于图表示 构建图; 图节点序列 综合考虑多类型信息
[10,29−34] 图节点表示
适用基于轨迹点的表示方法;
基于轨迹段的表示方法 轨迹分段 轨迹段 相比轨迹点,轨迹段包含的
[3,10,15,16,35,36] 特征序列
信息更丰富,可操作空间更大
基于曲线拟合 选择参数曲线 多项式参数 数学意义明确;表示能力有限
[8,22,37−39]
对整条
轨迹的 基于图像 提取图像特征 轨迹图像 空间信息直观
[5,40−43]
表示
基于神经网络 设计网络结构
[1,10,12,15,36,41,44−46] 和损失函数 特征向量 特征提取能力强;任务相关
2 对轨迹序列单元的表示
如上所述,轨迹数据属于时空数据的一种,天然地表现为序列形式.因此,有很多轨迹表示方法都选择在轨
迹序列单元的基础上学习轨迹表示.在本节中,我们总结了基于轨迹点和轨迹段这两种尺度下的轨迹序列单元
表示方法.
2.1 方法概述:序列-序列框架
通常,我们拿到的轨迹数据是如定义 2 所示的带有时间信息的二维坐标序列 S={(l 0 ,t 0 ),…,(l k ,t k )},但直接使
用该数据存在着一些缺陷.
(1) 不同的轨迹离散序列通常包含不同数量的轨迹点,其数目可能差异巨大,即有的轨迹采样十分致密,
而有的轨迹采样则十分稀疏.这对轨迹表示方法的稳健性提出了很高的要求;此外,即使是在同一条
轨迹内部,不同区段的采样密度也可能会有所差异.
(2) 原始轨迹数据所包含的信息是松耦合的(loose coupling),例如时间信息(即时间戳 t i )和位置信息(即二
维坐标 l i )都是独立表示的,各个轨迹点的取值在数据空间中的分布无规律可循.尽管轨迹数据的序列
形式可以在一定程度上体现出轨迹点之间的次序关系,但这种简单的次序关系远不足以表现出轨迹
点之间的时空关系.
正是因为直接使用原始轨迹数据存在着诸多不便,因此涌现出了各种方法来对轨迹序列加以处理.在讨论
具体的方法之前,我们首先提出一个序列-序列框架,该框架总结了此类方法的常用模式,将不同种类的方法纳
入到相同的符号和概念基础上.
在序列-序列框架中,表示方法的目标是基于原始的轨迹序列得到新的序列:
EMB:S→Z.