论文笔记:Estimating future human trajectories from sparse time series data

news2024/11/26 7:33:38

sigspatial 2023 humob竞赛paper

hiimryo816/humob2023-MOBB (github.com)

1 数据集分析

这里只分享了HuMob数据集1的内容

1.1 假日分析

  • 对HuMob数据集#1地理数据的方差分析显示了非工作日的模式
    • 在某些天的y坐标方差中有显著的峰值,这是非工作日的象征
    • 【x坐标有相似的模式】

——>识别了任务1数据集中最有可能是非工作日的日子

2 方法

2.1 方法1

  • 提出方法的基石,依赖于基于规则的机制
    • 用于预测常规和习惯性的移动,特别擅长处理工作日和常规商业时间的场景
    • 引入时间衰减因子增加了动态性,使模型能够适应用户不断变化的日常活动
    • k是通过经验优化训练数据的性能得到的,0.0063

2.2 方法2

  • 在方法1的基础上进行扩展,通过聚合每三个时间步骤而不是分析每个单独的时间步骤来进行
  • k变成了0.0178

2.3 方法3

  • 方法3 的目标是通过智能选择方法1和方法2生成的预测,使用 GEOBLEU 或 DTW 评估指标作为选择标准,以提高最终位置预测的准确性
    • 对于方法1和方法2,每天为每个用户计算 GEOBLEU 或 DTW 得分
    • ——>允许我们识别出每个具体日子哪种方法产生了更准确的预测
  • 为了促进分类任务,论文合并了反映用户行为的各种特征
    • 用户移动的倾向性和变化性
    • 不同时间段的活跃度水平
    • 位置数据的分散性
    • ——>通过整合这些多样化的特征,旨在捕捉用户行为的细微模式,从而增强模型在每个实例中准确选择更优方法的能力
  • 采用了四种不同的模型集成——随机森林、XGBoost、LightGBM 和 CatBoost

2.4 后处理

对于方法1、2和3,某些时间步骤由于缺乏历史数据而无法生成预测结果。为了解决这一问题,采用了系统的后处理程序,确保最终位置预测的全面性和可靠性。程序包括以下步骤:

  1. 用方法2预测填充: 当方法3的分类模型选择方法1并产生许多空值时,使用方法2的预测作为后备。
  2. 向前填充: 对于每个用户、每天和每个时间步骤,用最后观察到的非空值填充预测中的空值。
  3. 向后填充: 类似地,用每个用户在相应日子上随后观察到的非空值填充任何剩余的空值。
  4. 用最常访问位置填充: 如果任何时间步骤仍包含空值,则这些空值将被相应用户最常访问的位置替换,这提供了一个基于历史行为的可靠替代。

2.5 数据集切分

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2092602.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

写给LLM新手的建议,让你少走2年弯路!

大模型的爆火,在全球范围内引发了一场A1“狂也在业界点燃了一场百模大战。结合蕞近飙”,两年我在大模型领域的一些经验,分享一下在校学生/新人如何转到大模型阵营。 1、大模型有哪些从业方向? 首先你可以在求职网站搜索一下“大模型关键词&…

重卡智能充电机器人

产品介绍 随着新能源电池行业的发展,越来越多码头、矿山等场景的重型卡车都改为新能源供电形式,由于新能源重卡充电电压为1.2MW,充电口离地1.8m,充电枪充电线缆重量为50kg,人工操作难度大、危险性大,所以我…

arcpy将数据库要素类添加到图层组以及创建要素收藏夹如何创建文件夹并将模板中的符号添加到文件夹中

🏆本文收录于《CSDN问答解惑-专业版》专栏,主要记录项目实战过程中的Bug之前因后果及提供真实有效的解决方案,希望能够助你一臂之力,帮你早日登顶实现财富自由🚀;同时,欢迎大家关注&&收…

算法基础-位运算

>> (右移运算) x >> y:表示将x的二进制值右移y位。 正数是直接右移y位,则高位(最左边)补y个0。 负数是求补码,然后右移y位,最高位补y个1,再求反码&#xff…

react|useState的异步渲染

useState 组件里面的变量可以用state来表示,setState函数是用来更新state的值的用法 let [age,setAge]useState(0); // 0是变量age的初始值异步渲染 setState是异步指定的。也就是setAge是异步执行的。执行但不是立刻渲染,而是进入到微任务队列。注意…

数值分析笔记(六)非线性方程求根

非线性方程求根 二分法 二分法是线性收敛的。 不动点 对于非线性方程 f ( x ) 0 f(x)0 f(x)0,将其转化为 x φ ( x ) x\varphi(x) xφ(x),若 x ∗ x^* x∗满足 f ( x ∗ ) 0 f(x^*)0 f(x∗)0,称 x ∗ x^* x∗为 φ ( x ) \varphi(x) φ…

基于ASO-BP原子探索优化BP神经网络实现数据预测Python实现

本文提出了一种基于ASO算法优化BP神经网络的数据预测方法。通过ASO算法对BP神经网络的权值和阈值进行优化,克服了BP神经网络易陷入局部最优解和对初始权值敏感的缺点。实验结果表明,优化后的BP神经网络在预测精度上得到了显著提升,为数据预测…

【数学建模学习手册】python基本入门使用

本专栏内容为:数学建模原理 记录学习数学建模 💓博主csdn个人主页:小小unicorn ⏩专栏分类:数学建模 🚚代码仓库:小小unicorn的代码仓库🚚 🌹🌹🌹关注我带你学…

【三维重建】三角网格中轴骨架线提取

三维网格中轴线提取 方法介绍实现提取 三维网格中轴线提取是计算机图形学和三维建模领域中的一个重要技术,它对于理解三维形状的拓扑结构和几何特性具有重要意义。 方法介绍 以下是几种常见的三维网格中轴线提取方法: 基于距离变换的方法 基本原理&…

海康二次开发笔记10-独立Group导入、导出及执行

独立Group导入、导出及执行 1. 界面设计 2. 添加引用 Group相当于VM中的模块,因此在调用相关接口函数前,需要引用对应的动态库IMVSGroupCs,同时将复制本地的属性改为False using IMVSGroupCs;3. 添加VmSingleModuleSetConfigControl控件 拖入控件后,设置Dock为Fill 4. 选择G…

算法的学习笔记—把数字翻译成字符串

😀前言 在日常生活中,我们经常会遇到各种编码和解码的问题。今天,我们将讨论一个有趣的问题:如何将一串数字翻译成字母,并计算出有多少种不同的翻译方法。 🏠个人主页:尘觉主页 文章目录 &#…

虚拟化设置和虚拟机相关的环境搭建

目录 0.首先声明 1.背景知识 ​编辑 2.虚拟化设置 3.安装vm15.5过程 4.安装虚拟系统 4.1下载centos7.6 4.2安装centos7.6 5.我的总结 6.我的体会 0.首先声明 我的这个教程参考的就是韩顺平老师的这个linux学习教程,但是这个韩老师的这个教程就是2020年的教…

算法如何应用,思路都在这

目录 01 问题定义 02 问题建模 03 特征工程 04 模型选择 05 模型融合 本文深入探讨了算法在不同领域的应用方法和背后的思考逻辑。作者夏师傅通过丰富的案例分析,揭示了算法如何助力产品决策、优化业务流程,并提供了实用的策略和技巧。无论您是技术专家还…

2024 年 Web 开发者必备的 30 款 CSS 工具

2024 年 Web 开发者必备的 30 款 CSS 工具 | 瑆箫博客 找到合适的 CSS 工具可能需要花费不少时间,但是这份 2024 年最棒的 30 款 CSS 工具清单,可以让你的选择变得轻松许多。无论你的 CSS 技能水平如何,这份清单都能提供调试、优化代码和提升…

Bazel 快速入门与核心知识

Bazel 快速入门与核心知识 Bazel 简介 Bazel 是一款与 Make、Maven 和 Gradle 类似的开源构建和测试工具。 它使用人类可读的高级构建语言。Bazel 支持多种语言的项目 (C/C, Java, Python, …),可为多个平台构建输出。Bazel 支持跨多个代码库和大量用户的大型代码…

2024怎么选蓝牙耳机性价比品牌?四款小白必看优选王炸机型推荐!

如今国人对蓝牙耳机的选择日益重视,蓝牙耳机作为智能的手机备件,普及率也是一升再升,但市面上很多品牌虽然宣传自己音质好和佩戴感舒适,其实性能不佳,那么2024怎么选蓝牙耳机性价比品牌?身为资深的蓝牙耳机…

复变函数在大模型中的应用

1. 导入 说来惭愧,我研究生时的研究方向是复分析,但毕业近十年来几乎没用到它。 我还记得实习时做自我介绍时,我说我的研究方向是复分析。面试官不太了解,我便解释说,这是关于对 -1 开平方得到的虚数 i 的研究。 在…

信号的捕捉

1.信号的产生 信号递达:实际执行信号的处理动作称为信号的递达 信号未决:信号从产生到递达之间的状态 进程可以阻塞某个信号 被阻塞的信号产生时将保持在未决状态,直到进程解除对此信号的阻塞,才执行递达的动作 注意,忽略和阻塞是不同的,只要信号阻塞就不会被递达,而忽略是递达…

【Apache Doris】数据均衡问题排查指南

原文阅读:【巨人肩膀社区博客分享】【Apache Doris】数据均衡问题排查指南 一、前提概要 当集群处于以下几种情况时,可参考本文进行问题排查。 •BE节点之间的数据不均 •单个BE节点上的多个磁盘之间的数据不均 •BE节点的上线和下线进度卡死&#…

《高等代数》两条线行列式

说明:此文章用于本人复习巩固,如果也能帮助到大家那就更加有意义了。 注:两条线行列式的固定做法为按照第一列展开。