Page 238 - 《软件学报》2021年第5期
P. 238
1462 Journal of Software 软件学报 Vol.32, No.5, May 2021
entire trajectory representation. In each category, the methods of different principles are compared and analyzed. Among them, the
methods based on trajectory point are emphasized, and also the widely used methods based on neural networks are systematically
classified. Besides, the applications related to trajectory representation under each category are introduced. Finally, the future research
directions are pointed out in the field of trajectory representation.
Key words: trajectory data mining; trajectory representation; spatial-temporal data mining
随着移动终端的兴起和定位技术的日趋成熟,基于位置信息的应用在人们的生产生活当中得到了前所未
有的广泛应用.与此同时,遥感卫星、监控影像系统以及具有 GPS(global positioning system)和 AIS(automatic
identification system)功能的设备无时无刻不在收集海量的轨迹数据,这其中既包含行人出行、动物迁徙、台风
移动等自由轨迹,也涵盖了汽车、舰船、飞机等交通工具的行驶轨迹.在如此庞大的轨迹数据量背后,同样有着
广泛的应用场景,从景点推荐(如预测游客下一到达位置)到智慧交通(如交通流量预测)、从公共安全(如预测台
风轨迹)到国防安全(如识别领海内异常舰船轨迹),不一而足.近年来,轨迹数据相关的研究工作的数量呈逐年递
增的趋势,如图 1 所示.轨迹数据挖掘已然成为了数据挖掘领域的研究热点之一.利用从轨迹数据中挖掘出的信
息和知识,能够帮助我们进一步理解人类活动,进而改善人与社会、人与自然的关系.
Fig.1 Number of papers relating trajectory data in the field of computer science during the last ten years
图 1 近 10 年来,计算机科学领域内轨迹数据相关的文章数量
传统的轨迹数据挖掘技术主要集中在轨迹相似性计算 [1,2] 、轨迹聚类 [3,4] 、交通模式分类 [5,6] 、轨迹异常检
测 [7−9] 等方面.近几年来,随着深度学习在各个领域大放异彩,使用深度神经网络来研究轨迹模式逐渐成为了主
流,极大地推动了诸如轨迹预测 [10−12] 、轨迹推荐 [13,14] 、行人-轨迹匹配 [15,16] 等技术的发展.
在众多基于轨迹数据的技术中,对轨迹数据进行有效的表示,始终是贯穿其中的一项重要任务.原始的轨迹
数据在形式上通常表现为由经纬度坐标-时间戳三元组构成的有序序列,然而常见的数据分析算法(例如支持向
量机)均要求输入数据位于向量空间中,因此,原始轨迹数据往往不能直接作为算法的输入数据.为了解决这一
问题,对轨迹数据进行表示成为了一项不可或缺的工作,其目的是将原始轨迹数据转换成为适合处理的数据形
式后,再输入到算法或模型中,例如向量、图像、图等形式.从数据降维的角度来看,原始轨迹数据可以被看作是
一种高维数据,三元组中不仅每一个元素均代表一个维度,而且还混合了时间(时间戳)和空间(坐标)这两种不同
维度的信息.显然,这样的数据不利于算法进行处理,因此需要使用轨迹表示来对高维轨迹数据进行降维.这样
不仅能够从形式上对原始轨迹数据进行规范和简化,还可以从冗余的原始信息中提取出有价值的部分,使整个
模型更加高效.除此之外,好的轨迹表示不仅能够保留轨迹数据原有的特征,还能在一定程度上弥补原始轨迹数
据的缺陷.例如,传感器在信号采集、传输的过程中往往会不可避免地受噪声影响,好的轨迹表示能够在一定程
度上缓解轨迹噪声所带来的误差.由于涉及到模型的输入,因此轨迹表示质量的好坏会直接影响到轨迹数据挖