基本信息
文件名称:【《用户行为轨迹分析的相关研究综述》3700字】 .pdf
文件大小:1.44 MB
总页数:4 页
更新时间:2025-06-01
总字数:约5.27千字
文档摘要

用户行为轨迹分析的相关研究综述

随着信息通讯技术(如无线通信)、移动定位技术(如GPS、基站定位等)、大

数据计算技术的不断发和创新,它们不但为用户提供便捷服务,同时也记录了

大量的用户行为轨迹数据,这些数据能够被长以的保存,形成了用户的轨迹数据。

1.1轨迹数据的特点

轨迹数据是大数据的一种,通常以“流〃的形式表达,它通常由用户在一系

列的签到活动信息和轨迹的采样信息构成。轨迹数据符合大数据的一些特征,如

数据量大,数据可实时获得以及数据的多样化等特征。虽然轨迹数据可以帮助我

们建立相关模型,但它还是有如下不足:

(1)轨迹数据采集的模糊性

由于现有定位设备存在一定计算误差,使得定位技术受到一定的限制,定位

的精度相对较差,在采集过程中,信号会有一定的衰减和消失,从而导致采集到

的轨迹数据具有模糊性;而且,不同的采样方法也出现不同的采样频率,这会导

致采集的轨迹数据,其位置信息和时序信息存在一定模糊性。

(2)轨迹数据的不均匀化分布

轨迹数据在活动频繁的区域会呈现数据密集状态,在偶然的访问区域则会呈

现数据稀疏状态。这是因为移动对象的活动具有一定的周期性、规律性和随机性,

在采集移动对象的位置信息、时序信息时,会导致轨迹数据分布具有不均匀性,

例如,街道上的行人在逛街的过程中,可能会随着人流的移动而随机移动到某些

地方,也可能在移动的过程中突然对某些场所产生兴趣,更或者直接奔着某些特

定的场所而移动,这就导致移动轨迹的偶发性过强而使得轨迹数据过于分散。

1.2轨迹数据预处理技术

基于位置的定位技术及无线通信技术的快速发,数据爆炸问题会越来越严

重。基于位置服务的应用向位置服务器发出定位信息,获取物体的移动信息,而

数据终端采集和传输这些信息,并将这些轨迹数据记录和存储在服务器上的数据

库中,以满足其不同的应用需求。但由于采集设备的精度限制、存储机制等因素

的影响,致使采集得到的时空轨迹数据很多都是不精确的,一般来说采集的轨迹

点越多,轨迹精度相对也越精确,但由于用户的活动隐式反馈,使得采集的轨迹

数据可能不足,而对于移动物体高频率的轨迹点的数据采集又会出现数据存储、

传输和处理等问题。所以,我们需要对轨迹数据进行预处理,改善数据的精确性

和稀疏性。

正如前面所述,通过基于位置服务的应用会获得很多轨迹数据,但这些数据

有些会含有噪声数据。因此,就需要人们对这些轨迹数据进行稀疏处理及噪声过

滤,这对于基于位置的服务的数据清理、传输、存储等具有重要作用。尽所周知

运动物体的运动是持续性的,但采集到轨迹数据却有一定的离散性。而降低数据

采集频率可以在一定程度上解决这种问题,然而,降低采集频率,又会使所采集

到的数据有很大的一部分可能并非是应用所需的数据,甚至其中的大部分数据不

能代表移动物体的运动特征。而且当我们处于室内时,如GPS这样的数据采集

方式可能无法有效对我们的轨迹数据进行采集,更不能确定的是采用低采样频率

采集到的数据否有效合理,并恰好满足需求。

1

通常将处理轨迹数据稀疏问题的方式有两种:1)离线压缩;2)在线报告。离线

压缩技术是通过丢弃冗余数据进行数据的稀疏处理,它需要先一步收集全所有数

据。而对于那些需求实时位置数据的应用则需采用在线报告方式。在线报告方式

进行数据稀疏处理中,一般存在两种思路:首先为了更好的获取到线性拟合轨迹

的几何性质,就需要尽量使用线段拟合尽可能多的位置点;其次对于那些明显偏

离预测的位置点,就需要更精准的抓住物体的运动特征。针对轨迹数据的研究,

人们通常都会考虑采取各种过滤方式对轨迹数据进行去噪预处理,以此去除噪声

数据并减少测量误差等。常见的轨迹噪声过滤(GPSNoiseFiltering)有以下几

种方法:

(1)均值滤波,也被称为线性滤波,它是一种降低平滑数据噪声的方法,

公式如下,

叉]=版如5+1勺(2.1)

从公式2.1也可以看出来,这种是一种移动平滑窗口滤波的方式,该方式可

以根据己知的轨迹点进行滤波。同时,该方法对离散点敏感。进一步的还可以对

GPS点z提出一种更有效的均值滤波方法,其运算公式如下所示。