从原始 GPS (全球定位系统) 数据中提取 汽车停靠意图数据 是大多数位置感知应用程序中的关键任务,且随着从移动设备收集 GPS 数据的不断增长,这项任务变得越来越有趣。近期很多研究都集中在行人 (手机) 数据上 (可理解为红海市场),而商用车领域几乎没有探索 (蓝海市场)。 在本论文中,针对车辆 GPS 数据的汽车停靠意图的 识别 和 分类 问题 (利用来自不同行业的商业车队的大型异构数据集),按照意图分类,旨在把汽车停靠点分类为: 工作相关 和 非工作相关 ,以挖掘相关商业价值。 还对每个汽车停靠点计算一组含 100 个不同特征的集合,特征可分为四个主要类别: 汽车停靠点特征 , 兴趣点特征 , 汽车停靠点集群特征 和 序列特征 。并组合四组特征,加入训练,通过随机森林分类模型,我们得以评估四组特征中每个特征的相对重要性。 实验结果表明,本论文的方法显着地超越了现有商业车辆背景下用于汽车停靠意图的分类模型。 在过去的十年中,GPS 设备的巨大推广,使得人们越发关注 数据挖掘算法 在 时空数据 (GPS 产生的数据) 中的应用。而许多实际应用需要使用关于 用户行为 和 地理位置的语义信息 。例如,下述的两个实例: 语义标记 GPS 数据,目标旨在 识别 和 归类 GPS 沿途轨迹上的位置信息,即具体工作有 语义位置的侦察 和 汽车停靠或出游的意图归类 。尽管上述问题不是同一类型的问题,但却是强相关的。例如,对多个用户而言具有相同意图的共同定位点,可能是语义上相关联的地方,因为知道某个地方的语义对分类每个汽车停靠点意图有很大的帮助。 通常,对于上述 识别 和 归类 问题的解决方法分两个阶段执行: 最后,本论文解决了与参考文献 [7] 的同样问题,即利用四个不同的特征集,使用一个随机森林分类器,对商业车队的汽车停靠意图数据进行分类建模。且本文的主要贡献如下: 正如上述所描述的,关于瞬时车辆位置的原始数据是由 GPS Ping 组成的,将它们汇集起来以描述车辆的活动。为此本论文开发了一个 时空聚类程序 。 在 车辆停靠侦查技术 章节中描述的,从一系列的 GPS Pings 提取汽车停靠点,并从中提取 100 个不同的特征用于训练随机森林模型,随之将这些特征划分为 4 个不同的组: