Page 250 - 《软件学报》2021年第5期
P. 250

1474                                     Journal of Software  软件学报 Vol.32, No.5,  May 2021

                 轨迹.文献[39]同样先使用曲线拟合的方法表示原始轨迹,然后用优化的方法计算出待测轨迹属于不同正常轨
                 迹的权重向量,最后通过权重向量的稀疏程度来判断异常.
                 3.4.3    隐私保护
                    轨迹隐私是指产生轨迹的用户不愿意透露的关于用户身份的信息以及从轨迹中推导出的相关信息,例如
                 用户的家庭住址、个人偏好、生活习惯等.随着越来越多基于位置数据应用的出现,对轨迹主体的轨迹隐私保
                 护逐渐成为一个重要问题.
                    传统的轨迹隐私保护技术主要可以分成两类.第 1 类是基于泛化的方法,其主要思想是将轨迹点泛化到相
                 应的匿名区域,从而实现对轨迹隐私的保护.其中最有代表性的方法是位置 k-匿名技术                            [66] ,它通过将目标对象的
                 轨迹点与其他 k−1 个用户的轨迹点泛化到同一匿名区域中,使得目标对象在任意时刻的位置都无法与其他 k−1
                 个用户的位置区分开来.第 2 类是基于位置掩蔽(geomasking)的方法,其主要思想是通过隐藏或者更改部分位置
                 数据来达到保护隐私的目的;同时,空间模式不会受到显著的影响.例如,可以通过对原始数据添加噪声来降低
                 披露风险,以及根据具体情况有条件地发布轨迹来保证敏感位置信息不被泄露                           [67−69] .

                 4    未来研究方向

                    虽然众多研究工作针对各自的应用背景对轨迹表示提出了不同的解决方法,但随着轨迹数据的日益丰富
                 和轨迹应用场景的不断扩展,依然存在许多具有挑战性的问题有待解决.本节将对一些现有研究工作的不足以
                 及未来值得深入研究的问题作一探讨.
                 4.1   多模态数据融合
                    单纯依靠 GPS 轨迹数据已经逐渐难以满足当今轨迹应用的需求.例如,随着经济全球化程度的加深,航运业
                 务的快速增长要求更有效、更及时的轨迹获取方式来避免海上交通事故,如综合使用 AIS、GPS 和 ARPA
                 (automatic  radar plotting aid)等数据.与此同时,随着数据获取方式的不断丰富,人们可以收集到越来越多不同来
                 源、不同形式的轨迹数据.例如,基于地理位置的社交网络产生了大量具有时空标记的多模态数据,其中包括
                 GPS 信息、文本描述、图片、短视频等.综合考虑多种模态的数据,有利于更加全面地获取轨迹信息,从而获得
                 表达能力更强的轨迹表示.如何对多模态数据进行组织和融合,逐渐成为了轨迹表示领域所面对的新挑战.
                    多模态数据融合涉及模态转换、对齐、消歧、融合表示等多方面内容.早期的轨迹数据融合表示方法通常
                 是将不同类型的数据拼接成向量,例如将时间信息、位置信息、用户标识以及兴趣点信息分别表示成向量后,
                 再拼接到一起作为轨迹最终的表示向量              [3,8,67] .但这种数据融合方式过于简单粗糙,不同类别的信息在整体中的
                 权重以及在表示向量中的位置都缺乏考量.近年来,有越来越多的工作                         [2,70,71] 采用了深度神经网络来融合不同
                 来源的数据,通过数据驱动的学习方式以及配合注意力机制                     [70] ,能够在一定程度上缓解不同来源数据的权重问
                 题.但值得注意的是,目前针对非结构化数据融合的研究依然尚浅.同时,多模态融合的一个关键问题是充分利
                 用模态信息之间的互补性来构建不同模态信息之间的隐式关联关系,从而挖掘出更丰富的轨迹数据结构特征.
                 对不同类型数据的处理还有赖于相关研究领域的进展,因此,轨迹表示领域的多模态数据融合问题在未来还需
                 要更多的关注.
                 4.2   生成式轨迹表示

                    由于轨迹数据在采集、传输等过程中存在的诸多限制,往往导致收集到的轨迹数据中会不可避免地存在相
                 当一部分的低质量轨迹数据.例如,由于受采集精度、海上信号漂移、网络传输条件等因素的影响,AIS 系统在
                 实际场景中采集到的轨迹数据往往不尽如人意.质量不一、噪音、缺值等一直是船舶时空轨迹数据中普遍存在
                 的问题.低质量轨迹数据会从源头上影响轨迹数据挖掘的效果.因此,如何得到高质量的轨迹数据和高质量的轨
                 迹表示,一直以来都是轨迹数据挖掘领域的研究重点.
                    近年来,随着以 GAN 为代表的生成模型的广泛应用,利用生成模型来生成高质量轨迹数据成为了解决上述
                 问题的一种新思路.生成的高质量轨迹不仅可以用来缓解轨迹稀疏、噪声等问题,而且基于高质量轨迹得到的
   245   246   247   248   249   250   251   252   253   254   255