基本信息
文件名称:2025《用户行为轨迹分析的相关研究综述》3700字.docx
文件大小:25.8 KB
总页数:4 页
更新时间:2025-05-20
总字数:约3.75千字
文档摘要

PAGE

PAGE2

用户行为轨迹分析的相关研究综述

随着信息通讯技术(如无线通信)、移动定位技术(如GPS、基站定位等)、大数据计算技术的不断发展和创新,它们不但为用户提供便捷服务,同时也记录了大量的用户行为轨迹数据,这些数据能够被长久的保存,形成了用户的轨迹数据。

1.1轨迹数据的特点

轨迹数据是大数据的一种,通常以“流”的形式表达,它通常由用户在一系列的签到活动信息和轨迹的采样信息构成。轨迹数据符合大数据的一些特征,如数据量大,数据可实时获得以及数据的多样化等特征。虽然轨迹数据可以帮助我们建立相关模型,但它还是有如下不足:

(1)轨迹数据采集的模糊性

由于现有定位设备存在一定计算误差,使得定位技术受到一定的限制,定位的精度相对较差,在采集过程中,信号会有一定的衰减和消失,从而导致采集到的轨迹数据具有模糊性;而且,不同的采样方法也出现不同的采样频率,这会导致采集的轨迹数据,其位置信息和时序信息存在一定模糊性。

(2)轨迹数据的不均匀化分布

轨迹数据在活动频繁的区域会呈现数据密集状态,在偶然的访问区域则会呈现数据稀疏状态。这是因为移动对象的活动具有一定的周期性、规律性和随机性,在采集移动对象的位置信息、时序信息时,会导致轨迹数据分布具有不均匀性,例如,街道上的行人在逛街的过程中,可能会随着人流的移动而随机移动到某些地方,也可能在移动的过程中突然对某些场所产生兴趣,更或者直接奔着某些特定的场所而移动,这就导致移动轨迹的偶发性过强而使得轨迹数据过于分散。

1.2轨迹数据预处理技术

基于位置的定位技术及无线通信技术的快速发展,数据爆炸问题会越来越严重。基于位置服务的应用向位置服务器发出定位信息,获取物体的移动信息,而数据终端采集和传输这些信息,并将这些轨迹数据记录和存储在服务器上的数据库中,以满足其不同的应用需求。但由于采集设备的精度限制、存储机制等因素的影响,致使采集得到的时空轨迹数据很多都是不精确的,一般来说采集的轨迹点越多,轨迹精度相对也越精确,但由于用户的活动隐式反馈,使得采集的轨迹数据可能不足,而对于移动物体高频率的轨迹点的数据采集又会出现数据存储、传输和处理等问题。所以,我们需要对轨迹数据进行预处理,改善数据的精确性和稀疏性。

正如前面所述,通过基于位置服务的应用会获得很多轨迹数据,但这些数据有些会含有噪声数据。因此,就需要人们对这些轨迹数据进行稀疏处理及噪声过滤,这对于基于位置的服务的数据清理、传输、存储等具有重要作用。尽所周知运动物体的运动是持续性的,但采集到轨迹数据却有一定的离散性。而降低数据采集频率可以在一定程度上解决这种问题,然而,降低采集频率,又会使所采集到的数据有很大的一部分可能并非是应用所需的数据,甚至其中的大部分数据不能代表移动物体的运动特征。而且当我们处于室内时,如GPS这样的数据采集方式可能无法有效对我们的轨迹数据进行采集,更不能确定的是采用低采样频率采集到的数据否有效合理,并恰好满足需求。

通常将处理轨迹数据稀疏问题的方式有两种:1)离线压缩;2)在线报告。离线压缩技术是通过丢弃冗余数据进行数据的稀疏处理,它需要先一步收集全所有数据。而对于那些需求实时位置数据的应用则需采用在线报告方式。在线报告方式进行数据稀疏处理中,一般存在两种思路:首先为了更好的获取到线性拟合轨迹的几何性质,就需要尽量使用线段拟合尽可能多的位置点;其次对于那些明显偏离预测的位置点,就需要更精准的抓住物体的运动特征。针对轨迹数据的研究,人们通常都会考虑采取各种过滤方式对轨迹数据进行去噪预处理,以此去除噪声数据并减少测量误差等。常见的轨迹噪声过滤(GPSNoiseFiltering)有以下几种方法:

(1)均值滤波,也被称为线性滤波,它是一种降低平滑数据噪声的方法,公式如下,

Xi

从公式2.1也可以看出来,这种是一种移动平滑窗口滤波的方式,该方式可以根据己知的轨迹点进行滤波。同时,该方法对离散点敏感。进一步的还可以对GPS点z提出一种更有效的均值滤波方法,其运算公式如下所示。

Xi

如公式所示,使用值为5的滑动窗口处理的话,P5点的坐标是前面五个轨迹点的平均值。然而,当需要处理连续的噪声点时,则P

(2)卡尔曼滤波,一种通过线性系统状态方程(矩阵乘法),对测量模型和运动模型进行的折衷处理,并对系统状态进行最优估计。

(3)不需要假设前提的粒子滤波,与卡尔曼滤波类似,都是针对测量模型和运动模型进行的折衷处理,但实际应用中不如卡尔曼滤波有效。

(4)基于启发式离散点检测,是一种使用离散点探测算法并根据两个连续的轨迹点(段)计算速度值,进而将噪声数据移除。该方法通过设置速度阀值过滤噪声,进而计算出每个轨迹点的移动速度。

1.3轨迹聚类

轨迹聚类就是在轨迹数据相似性分析的基础上进一步将相似的轨迹段或