Page 240 - 《软件学报》2021年第5期
P. 240

1464                                     Journal of Software  软件学报 Vol.32, No.5,  May 2021

                 表示问题的重点.因此,本文避开了传统的按照模型类别对轨迹表示方法分类的思路,回归到轨迹数据本身,将
                 轨迹数据按照不同的尺度划分为轨迹单元和整条轨迹,分别归纳了对轨迹序列单元的表示方法和对整条轨迹
                 序列的表示方法.对轨迹序列单元的表示方法主要是以轨迹序列单元为基础,通过学习单元的表示,进而得到轨
                 迹序列的表示.其中,轨迹序列单元可以细分为轨迹点和轨迹段;对整条轨迹序列的表示则着眼于完整的轨迹序
                 列,直接学习整条轨迹的表示.接下来将对这两类方法分别进行介绍.轨迹表示方法的整体分类见表 1.
                                      Table 1    Classification of trajectory representation methods
                                                 表 1   轨迹表示方法的分类
                                      表示方法类别               关健技术       表示结果            主要特点
                                                                                  缓解数据稀疏问题,
                                             基于划分         确定兴趣点      兴趣点序列        具有一定的语义信息
                                            [1,4,7,19−21]
                                                           划分网格       网格序列         缓解数据稀疏问题
                                          基于人工设计特征                                  依赖专家知识,
                              基于轨迹点的                       专家知识       特征序列
                       对轨迹     表示方法         [3,6,13,22−24]   定义词语;                 特征表达能力有限
                                             基于词袋
                       单元的               [1,2,7,15,16,21,25−28]  词嵌入   词向量序列   考虑轨迹序列的上下文信息
                       表示
                                            基于图表示           构建图;     图节点序列        综合考虑多类型信息
                                             [10,29−34]   图节点表示
                                                                               适用基于轨迹点的表示方法;
                                   基于轨迹段的表示方法              轨迹分段        轨迹段      相比轨迹点,轨迹段包含的
                                     [3,10,15,16,35,36]               特征序列
                                                                               信息更丰富,可操作空间更大
                                      基于曲线拟合              选择参数曲线     多项式参数     数学意义明确;表示能力有限
                                      [8,22,37−39]
                       对整条
                       轨迹的             基于图像               提取图像特征      轨迹图像          空间信息直观
                                       [5,40−43]
                       表示
                                      基于神经网络              设计网络结构
                                   [1,10,12,15,36,41,44−46]   和损失函数   特征向量      特征提取能力强;任务相关

                 2    对轨迹序列单元的表示

                    如上所述,轨迹数据属于时空数据的一种,天然地表现为序列形式.因此,有很多轨迹表示方法都选择在轨
                 迹序列单元的基础上学习轨迹表示.在本节中,我们总结了基于轨迹点和轨迹段这两种尺度下的轨迹序列单元
                 表示方法.
                 2.1   方法概述:序列-序列框架

                    通常,我们拿到的轨迹数据是如定义 2 所示的带有时间信息的二维坐标序列 S={(l 0 ,t 0 ),…,(l k ,t k )},但直接使
                 用该数据存在着一些缺陷.
                    (1)  不同的轨迹离散序列通常包含不同数量的轨迹点,其数目可能差异巨大,即有的轨迹采样十分致密,
                        而有的轨迹采样则十分稀疏.这对轨迹表示方法的稳健性提出了很高的要求;此外,即使是在同一条
                        轨迹内部,不同区段的采样密度也可能会有所差异.
                    (2)  原始轨迹数据所包含的信息是松耦合的(loose coupling),例如时间信息(即时间戳 t i )和位置信息(即二
                        维坐标 l i )都是独立表示的,各个轨迹点的取值在数据空间中的分布无规律可循.尽管轨迹数据的序列
                        形式可以在一定程度上体现出轨迹点之间的次序关系,但这种简单的次序关系远不足以表现出轨迹
                        点之间的时空关系.
                    正是因为直接使用原始轨迹数据存在着诸多不便,因此涌现出了各种方法来对轨迹序列加以处理.在讨论
                 具体的方法之前,我们首先提出一个序列-序列框架,该框架总结了此类方法的常用模式,将不同种类的方法纳
                 入到相同的符号和概念基础上.
                    在序列-序列框架中,表示方法的目标是基于原始的轨迹序列得到新的序列:
                                                        EMB:S→Z.
   235   236   237   238   239   240   241   242   243   244   245