论文笔记:SimiDTR: Deep Trajectory Recovery with Enhanced Trajectory Similarity

news2024/11/18 0:24:46

DASFFA 2023

1 intro

1.1 背景

  • 由于设备和环境的限制(设备故障,信号缺失),许多轨迹以低采样率记录,或者存在缺失的位置,称为不完整轨迹
    • 恢复不完整轨迹的缺失空间-时间点并降低它们的不确定性是非常重要的
  • 一般来说,关于轨迹恢复的先前研究可以分为两个方向
    • 第一个方向:模拟用户在不同位置之间的转换模式,以预测用户的缺失位置
      • 本质上是一个分类任务,恢复的轨迹通常由位置或POI组成
    • 第二个方向:基于记录的不完整轨迹数据,恢复缺失时间戳处的特定地理坐标
      • 最终重建的轨迹通常由精确的GPS或道路网络坐标组成
      • 论文专注于这个方法
      • 针对第二方向的一种直接方法是将单个轨迹直接视为二维时间序列,并应用时间序列插值方法来恢复不完整轨迹
        • 在恢复过程中耗尽单个不完整轨迹的所有精确信息
        • 当缺失轨迹数据的比例较小时效果非常好
        • 随着缺失比例的增加,有效性会显著下降
          • ——>无法处理稀疏的轨迹数据
      • 另一个常见的解决方案是基于单元格的方法
        • 将空间划分为离散的单元格,然后恢复由单元格描述的缺失轨迹,并设计不同的后校准算法来精炼结果
        • 将轨迹恢复问题从无限连续空间转换为有限离散空间,降低了预测的复杂性,提高了模型对转换模式的建模能力
        • 不足点
          • 仅使用不完整轨迹中包含的信息,而没有充分利用来自其他轨迹的信息
          • 使用单元格来表示轨迹,不可避免地会引入一些额外的噪声和不准确信息
          • 在校准阶段,缺乏获得准确轨迹坐标的有效信息

1.2 本文思路

  • 利用不同轨迹之间的相似性建模不完整轨迹的复杂移动规律,论文提出了一个新颖的轨迹恢复框架,称为具有增强轨迹相似性的深度轨迹恢复(SimiDTR),以恢复轨迹的精确坐标
    • 为了解决数据稀疏的问题,论文设计了一个基于规则的信息提取器,用于提取一个原始的相似轨迹,该轨迹具有关于给定不完整轨迹的相关空间信息
      • 原始的相似轨迹是通过整合来自几个其他相关不完整轨迹的信息得到的
    • 考虑到轨迹数据的特性(例如,空间偏差、时间偏差和时间位移),论文使用一个基于注意力的深度神经网络模型来整理这个原始的相似轨迹,并生成一个量身定制的相似轨迹,适应于不完整轨迹
      • 这个相似轨迹实际上并不存在,但最适合不完整轨迹的数据,用于恢复不完整轨迹
    • 为了充分利用轨迹坐标信息,我们在连续空间中进行轨迹恢复

2 related works

  • 根据要恢复的对象,轨迹恢复可以分为位置恢复和坐标恢复
    • 位置恢复旨在预测轨迹的缺失位置(例如,兴趣点POI)
      • Bi-STDDP考虑了双向时空依赖性
        • Modelling of bi-directional Spatio-temporal dependence and users’ dynamic preferences for missing poi checkin identification AAAI 2019
      • AttnMove利用注意力机制将聚合的历史轨迹信息注入恢复过程
        • AttnMove: history enhanced trajectory recovery via attentional network 2021 Arxiv
      • 在AttnMove的基础上,PeriodicMove考虑了轨迹移动周期性的影响
        • PeriodicMove: shiftaware human mobility recovery with graph neural network CIKM 2021
    • 坐标恢复
      • 基于时间序列的方法
        • 将轨迹数据视为二维时间序列,时间序列插补方法可以用来恢复轨迹(时间序列)中缺失的坐标
      • 基于单元格的方法
        • 生成由单元格表示的恢复轨迹,然后使用后校准算法获取轨迹的坐标
        • Wei等人构建了一个通过聚合轨迹的top-k路线推断框架
          • 使用线性回归作为后校准模块
        • Ren等人提出了一个深度学习模型,该模型利用传统的seq2seq框架和注意力机制
          • 将单元格级轨迹输入深度学习模型,并直接预测道路段ID和移动比例

3 问题定义

3.1 位置

一个位置由 l=(lon,lat) 表示,其中 lonlon 和 latlat 分别代表其经度和纬度

3.2 区域

将地理空间划分为一组离散且不相交的正方形区域,记为 R。每个区域(也称为网格或单元格),记为 r∈R

3.3 轨迹点

  • 轨迹点是从移动对象采样的点,表示为 )p=(lon,lat,t),其中 t 表示其时间戳。
  • 如果已知轨迹点的位置,则为记录的轨迹点(简称记录点),我们可以得到该点所在的区域 r。
  • 否则,它是一个缺失的轨迹点(简称缺失点),表示为\tilde{p}

3.4 采样间隔

  • 采样间隔,记为 Δ,是两个连续轨迹点之间的时间差
  • 理想情况下,轨迹数据的采样间隔是固定常数,但由于轨迹数据的固有时间偏差,采样间隔在大多数情况下经常接近 Δ 变化

3.5 完整轨迹

记为tr=p1​→…→pi​→…→pn​,是从移动对象采样的记录点序列,其中 pi​ 是 tr 的第 i 个轨迹点

3.6 不完整轨迹

一个不完整轨迹由记录点序列和缺失点组成

3.7 问题定义

给定一组具有采样间隔 Δ 的不完整轨迹,目标是恢复它们缺失的坐标

4 模型

4.1 基于规则的信息提取器

4.1.1 填充模组

4.2 轨迹embedding层

  • 对于一个不完整的轨迹 tr=p1​→⋯→pn​,n∈N,其中 n 是轨迹 tr 的长度,N 是数据集中最长轨迹的长度。
  • 轨迹 tr 的位置和时间戳分别是 L∈Rn×2 和T∈Rn×1

4.2.1 位置嵌入

4.2.2 时间戳嵌入

  • 对于 T 中的每个时间戳 t,可以计算出 t 是当前小时的第 t_{min}分钟和当前分钟的第t_{sec}
  • 然后我们将它们映射到区间 [-0.5, 0.5] 并遵循线性变换

4.2.3 坐标嵌入

为了确保缺失点(由0 \in R^{1 \times 2}填充)在映射到高维空间时仍然是 0 ( 0 \in R^{1 \times d} ),我们使用一维卷积作为映射函数

4.2.4 嵌入整合

  • 假设 tr 的原始相似轨迹表示为 trrs。
    • 因为trrs只是相关空间信息的刚性组合,这意味着 T 在缺失点上不适合 trrs

4.3 encoder-decoder

5 实验

5.1 数据

  • 从波尔图1和上海2收集的两个真实世界出租车轨迹数据集。
    • 对于波尔图数据集,我们将间隔从15秒转换为1分钟
    • 对于上海出租车数据集,我们将出租车的停留点视为边界来分割它们整天的轨迹
  • 移除所有包含超出纬度和经度范围点的轨迹
  • 如果某一区域中的轨迹点数量少于区域点阈值,我们将移除这些区域以及其中的点
  • 经过预处理后,波尔图的时间间隔是常数,即60秒,而上海的时间间隔是可变的
  • 将每个数据集分成三个部分,分割比例为7:1:2,作为训练集、验证集和测试集
  • 随机保留每条轨迹1 − ratio%(ratio =30, 50, 70)的点

5.2 结果

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1196768.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Python进行多维数据分析

多维数据分析是对数据的信息分析,它考虑了许多关系。让我们来介绍一些使用Python分析多维/多变量数据的基本技术。 从这里找到用于说明的数据的链接。(https://archive.ics.uci.edu/dataset/111/zoo) 以下代码用于从zoo_data. csv读取2D表格…

无人机航迹规划:五种最新智能优化算法(GRO、SWO、COA、LSO、KOA)求解无人机路径规划MATLAB

一、五种算法(GRO、SWO、COA、LSO、KOA)简介 1、淘金优化算法GRO 淘金优化算法(Gold rush optimizer,GRO)由Kamran Zolf于2023年提出,其灵感来自淘金热,模拟淘金者进行黄金勘探行为。VRPTW&am…

2015年计网408

第33题 通过 POP3 协议接收邮件时, 使用的传输层服务类型是( ) A. 无连接不可靠的数据传输服务 B. 无连接可靠的数据传输服务 C. 有连接不可靠的数据传输服务 D. 有连接可靠的数据传输服务 本题考察邮件接收协议POP3使用的运输层服务类型。 如图所示。接收方用户代理使用pop…

Maven内网开发使用离线仓库

Maven内网开发使用离线仓库 离线或者内网环境开发与外网不通,中央仓库连不上,使用 Maven 管理项目会遇到很多问题。 比如:依赖包缺失,内网的Nexus私服的包老旧,很久没有维护,项目无法运行打包,…

pytorch中对nn.BatchNorm2d()函数的理解

pytorch中对BatchNorm2d函数的理解 简介计算3. Pytorch的nn.BatchNorm2d()函数4 代码示例 简介 机器学习中,进行模型训练之前,需对数据做归一化处理,使其分布一致。在深度神经网络训练过程中,通常一次训练是一个batch&#xff0c…

Dart笔记:一些代码生成工具站点的介绍

Dart笔记: 一些代码生成工具站点的介绍 作者:李俊才 (jcLee95):https://blog.csdn.net/qq_28550263 邮箱 :291148484163.com 本文地址:https://blog.csdn.net/qq_28550263/article/details/1343…

Easyui DataGrid combobox联动下拉框内容

发票信息下拉框联动,更具不同的发票类型,显示不同的税率 专票 普票 下拉框选择事件 function onSelectType(rec){//选中值if (rec2){//普通发票对应税率pmsPlanList.pmsInvoiceTaxRatepmsPlanList.pmsInvoiceTaxRateT}else {//专用发票对应税率pmsPlan…

置换环算法

参考该博客大佬的讲解 置换环 - TTS-S - 博客园 (cnblogs.com) 置换环:一般用于解决数组排序元素间所需最小交换次数这类问题。 置换环思想:置换环是将每个元素指向其应在的位置,最终相连成一个环(若元素就在其应在的位置,则自身…

js 根据当前时间往前推15天或往后推15天等(例如当前时间往后15天后的日期。并实现今天、明天、后天、周)

本次分享,在项目中开发车票购买功能需要用到日期筛选 思路: 1、首先获取当前时间戳 2、根据当前时间戳拿到15天后的日期 3、根据天匹配星期几 4、将时间戳转换年、月、日并重组 实现代码 // 获取当前日期 const today new Date();// 往前推15天的…

【数据结构】树与二叉树(七):二叉树的遍历(先序、中序、后序及其C语言实现)

文章目录 5.2.1 二叉树二叉树性质引理5.1:二叉树中层数为i的结点至多有 2 i 2^i 2i个,其中 i ≥ 0 i \geq 0 i≥0。引理5.2:高度为k的二叉树中至多有 2 k 1 − 1 2^{k1}-1 2k1−1个结点,其中 k ≥ 0 k \geq 0 k≥0。引理5.3&…

Interactive Analysis of CNN Robustness

Interactive Analysis of CNN Robustness----《CNN鲁棒性的交互分析》 摘要 虽然卷积神经网络(CNN)作为图像相关任务的最先进模型被广泛采用,但它们的预测往往对小的输入扰动高度敏感,而人类视觉对此具有鲁棒性。本文介绍了 Pert…

优雅关闭TCP的函数shutdown效果展示

《TCP关闭的两种方法概述》里边理论基础,下边是列出代码,并且进行实验。 服务端代码graceserver.c的内容如下: #include "lib/common.h"static int count;static void sig_int(int signo) {printf("\nreceived %d datagrams\…

让各大运营商都默默流泪的 HTTPS 协议(HTTPS 的加密流程)

文章目录 前言1. 什么是 HTTPS1.1 臭名昭著的 "运营商劫持" 2. 什么是"加密"3. HTTPS 的加密流程3.1 对称加密用对称加密可行吗? 3.2 引入非对称加密用对称加密非对称加密可行吗? 3.3 中间人攻击如何证明浏览器收到的公钥一定是该网…

Linux系统上搭建高可用Kafka集群(使用自带的zookeeper)

本次在CentOS7.6上搭建Kafka集群 Apache Kafka 是一个高吞吐量的分布式消息系统,被广泛应用于大规模数据处理和实时数据管道中。本文将介绍在CentOS操作系统上搭建Kafka集群的过程,以便于构建可靠的消息处理平台。 文件分享(KafkaUI、kafka…

matplotlib 创建图和子图

Matplotlib 可能是 Python 2D-绘图领域使用最广泛的套件。它能让使用者很轻松地将数据图形化,并且提供多样化的输出格式。这里将会探索 matplotlib 的常见用法。 plt方式是先生成了一个画布,然后在这个画布上隐式的生成一个画图区域来进行画图&#xff1…

提升中小企业效率的不可或缺的企业云盘网盘

相比之大型企业,中小型企业在挑选企业云盘工具更注重灵活性和成本。那么市面上有哪些企业云盘产品更适合中小企业呢? 说起中小企业不能错过的企业云盘网盘,Zoho Workdrive企业云盘绝对榜上有名! Zoho Workdrive企业云盘为用户提…

利用Python代码提取shp中每个区域的图像

import geopandas as gpd import rasterio from rasterio.mask import mask import matplotlib.pyplot as plt import numpy as np# 载入shp文件 - 它只包含几何对象 shapefile_path rD:\Desktop\新建文件夹 (3)\01.shp shapes gpd.read_file(shapefile_path)# 打开图像 imag…

杂记杂记杂记

目录 Mybatis分页插件原理? ThreadLocal? 树形表的标记字段是什么?如何查询MySQL树形表? Mybatis的ResultType和ResultMap的区别? #{}和${}有什么区别? 系统如何处理异常? Mybatis分页插件原理&#…

家居美学:将水离子壁炉融入你的现代装饰

当谈及家居装饰和壁炉选择时,水离子雾化壁炉是一个备受瞩目的话题。水离子雾化壁炉的美学价值,还为室内装饰带来全新的维度。它甚至能够激发室内装饰的灵感。 水离子雾化壁炉是现代美学的标志,融合了简洁、线条清晰的设计。这种壁炉常常采用不…

Java性能测试中常用的锁

多线程编程在现代软件开发中扮演着至关重要的角色。它使我们能够有效地利用多核处理器和提高应用程序的性能。然而,多线程编程也伴随着一系列挑战,其中最重要的之一就是处理共享资源的线程安全性。在这个领域,锁(Lock)…