UrbanGPT: Spatio-Temporal Large Language Models

news2025/1/9 7:39:31

1.文章信息

本次介绍的文章是2024年arxiv上一篇名为《UrbanGPT: Spatio-Temporal Large Language Models》的文章,UrbanGPT旨在解决城市环境中的时空预测问题,通过大语言模型(LLM)的强大泛化能力来应对数据稀缺的挑战。

2.摘要

UrbanGPT是一种旨在解决城市时空预测问题的大型语言模型。时空预测的目标是预测城市生活各个方面的未来时空模式、趋势和事件,包括交通、人口流动和犯罪率。现有方法虽然在时空数据预测方面有一定成效,但大多依赖于大量的标注数据,这在实际的城市感知场景中往往难以获取。数据稀疏性是一个普遍存在的问题,在某些情况下,甚至难以收集任何标注数据,从而进一步加剧了这个问题。因此,构建一个能够在不同时空学习场景中展示出强泛化能力的时空模型变得至关重要。

受到大语言模型(LLMs)在处理文本数据方面显著成果的启发,UrbanGPT的目标是创建一个能够在广泛的下游城市任务中展现出卓越的泛化能力的时空LLM。为此,我们提出了UrbanGPT,改模型无缝集成了时空依赖编码器和指令微调范式,使得LLMs能够理解时间和空间之间的复杂相互依赖关系,从而在数据稀疏的情况下也能进行更全面和准确的预测。我们在各种公共数据集上进行了广泛的实验,涵盖不同的时空预测任务,结果一致表明,所设计的UrbanGPT始终优于最先进的基准模型。这些发现突显了在标记数据稀疏的零样本情景下构建大型语言模型进行时空学习的潜力。

3.介绍

时空预测在城市环境中的应用至关重要,如交通流量、人口移动和犯罪率预测。然而,现有方法依赖于大量标注数据,而实际应用中数据稀疏是一个普遍问题。因此,构建能够在数据稀疏情况下表现出色的时空预测模型成为一个重要挑战。   

本文的主要贡献如下:

(1) 据我们所知,这是首次尝试开发一种能够在不同数据集上预测各种城市现象的时空大语言模型,尤其是在训练样本受限的情况下。

(2) 本文提出了时空预测框架UrbanGPT,它使得大语言模型能够理解时空之间错综复杂的相互依赖关系。通过将时空依赖编码器无缝集成到指令微调范式中,有效地将时空上下文与大语言模型相结合。

(3) 在现实世界数据上进行的大量实验证明了本文提出的UrbanGPT在零样本时空学习场景中具有出色的泛化能力。这些发现突显了该模型的强大泛化能力,表明它在准确预测和理解时空模式方面的有效性,即使在零样本场景下也是如此。

4.预备知识

时空数据

时空数据通常表示为三维张量𝑋∈ℝ𝑅×𝑇×𝐹,每个元素𝑋𝑟,𝑡,𝑓代表在𝑟区域𝑡时间段内的第𝑓个特征值。例如,预测城市区域内出租车流量的场景中,数据表示特定区域在给定时间段内的出租车进出流量。

时空预测

在时空预测任务中,通常使用历史数据预测未来趋势。具体目标是根据前𝐻步信息预测接下来的𝑃步数据,模型𝑓(·)通过历史数据进行训练。时空预测任务主要分为两类:回归预测(例如交通流量或出租车需求预测)和分类预测(例如犯罪发生预测)。

ea65414702266d7211b963f3fb65f82c.png

时空零样本学习

尽管现有时空学习方法有效,但在泛化到广泛的下游时空学习场景中常遇到困难。本研究旨在解决时空零样本场景,即在未见过的数据集或任务中进行预测。在这种情况下,预测函数22920947343d9eb187eb35041545c16c.png负责预测从未遇见过的下游任务中的时空数据b46b0485b3ce304b93cd1f74ec406991.png

ee67ed5e8dd675557b369673e58bff4b.png

5.方法    

412703e1f675570cc5e4feda3d2b199f.png图图1 UrbanGPT整体框架

5.1时空依赖编码器

大型语言模型在语言处理方面表现出卓越的能力,但它们在理解时空数据中固有的时间演变模式方面面临挑战。为了克服这一限制,我们提出通过集成一个多层次时间卷积网络的时空编码器来增强大语言模型捕捉时空上下文中的时间依赖性的能力。时空编码器由两个关键组件组成:门控扩散卷积层和多层次关联注入层。让我们将这种架构形式化为:

096a35a9d3034585baccfda3c1375dc9.png

𝐸𝑟∈𝑅𝑇×𝑑为时空嵌入,这个嵌入是通过一个线性层增强原始数据𝑋获得的。为了解决梯度消失的问题,使用𝐸𝑟的一个切片,记为𝐸𝑟′(𝑙)∈𝑅𝑇′×𝑑,这个切片由膨胀卷积核的大小决定,用于执行残差操作。执行残差操作时使用1-D空洞卷积核Wk𝑊𝑔∈𝑅𝑇𝑔×𝑑𝑖𝑛×𝑑𝑜𝑢𝑡,以及相应的偏置项bkbg∈𝑅𝑑𝑜𝑢𝑡。sigmoid激活函数𝛿被用来控制在重复卷积操作中信息保存的程度。在门控时间膨胀卷积层编码之后,我们能够有效地捕捉跨多个时间步的时间依赖性,从而产生时间表示。

这些表示包含不同级别的时间依赖性,反映了各种粒度感知的时间演变模式。为了保存这些信息丰富的模式,我们引入了一个多层次关联注入层。这一层旨在将不同层次之间的相关性结合起来,形式化为:

e7dd4ad653abe971fc4ac54a27af194c.png    

其中W𝑠∈𝑅𝑇s×𝑑out×𝑑𝑜𝑢𝑡'是卷积核,经过L层编码后,我们使用一个简单的线性层融合门控扩散卷积层和多层次关联注入层的结果,最终的时空依赖性表征为0f74a184605c0c1f7aaaaff4f5ef11c3.png,为了解决下游可能出现的各种城市场景集,本文提出的时空编码器在建模空间相关性时独立于图结构。因为在零样本预测环境中,实体之间的空间关系可能是未知的或难以确定的。这确保UrbanGPT在广泛的城市环境中的适用性。

5.2时空指令微调框架

时空数据-文本对齐

为了使语言模型能够有效地理解时空模式,对齐文本和时空信息至关重要。这允许模型融合不同模态,从而产生信息更丰富的表示。通过集成文本和时空域的上下文特征,模型可以捕获互补信息并提取更具表示能力的高层语义表示c1e86bc0cbb153734a853c5221351ce0.png。为实现这一点,本文利用轻量级对齐模块来投影时空依赖性表示。投影操作采用线性层参数Wp∈𝑅d×𝑑L进行,其中dL表示大语言模型常用的隐藏维度。所得到的投影H∈𝑅R×F×𝑑L,在指令中使用特殊的标记表示为:<ST_start>,<ST_HIS>,...,<ST_HIS>,<ST_end>。其中,<ST_start>和<ST_end>为标识时空标记的开始和结束的标识符,这些标识符可以通过扩展其词汇量来包含在大语言模型中。占位符表示时空标记,对应于隐藏层中的投影H。通过使用该技术,模型获得了识别时空依赖性的能力,从而提高了其在城市场景中成功执行时空预测任务的能力。

时空指令提示

在时空预测的场景中,时间和空间信息都包含了有价值的语义细节,有助于模型理解特定上下文下的时空模式。例如,清晨和高峰时间段的交通流量有很大的不同,并且商业区和住宅区之间的交通模式也存在差异。因此,将时间和空间信息表示为提示文本的对时空预测任务是有益的,我们利用大语言模型的文本理解能力来编码这些信息。在UrbanGPT框架中,我们集成了多粒度的时间信息和空间细节,作为大语言模型的指令输入。时间信息包括一周的日期和时间等因素,而区域信息包括城市、行政区域和附近的兴趣点(POI)数据等,如下图所示。通过合并这些不同的元素,UrbanGPT能够识别和理解复杂的时空环境下不同区域和时段的时空模式,从而增强其零样本推理能力。   

4bbded72b9bf7b509bdc69c3668a1cd4.png

图2 编码时间和位置感知信息的时空提示指令

大预言模型的时空指令微调

使用指令微调LLMs以生成文本格式的时空预测存在两个挑战。首先,时空预测通常依赖于数值数据,其结构和模式与语言模型擅长处理的自然语言不同,后者侧重于语义和句法关系。其次,LLMs通常使用多分类损失进行预训练以预测词汇,从而得到潜在结果的概率分布。而回归任务则需要连续值分布。为了解决这些挑战,UrbanGPT采用了一种不同的策略,不直接预测未来的时空值,而是生成辅助预测过程的预测标记。这些标记随后通过回归层,将隐藏表示映射为生成更准确的预测值:

16f2f9e58aeccb7e6cbcfe11d81e7cbe.png

上式中预测标记的隐藏表征表示为𝛤𝑟,𝑓∈𝑅𝑑𝐿,其中预测标记可通过扩充大语言模型词表的方式引入。W1,W2,W3为回归层的权重矩阵,[⋅,⋅]为拼接操作。

6.实验

实验包括(1) 零样本预测性能:相同城市内未见区域的预测、跨城市预测任务;(2) 典型的有监督预测任务;(3) 消融实验:时空上下文影响、使用多个数据集进行指令微调的影响、时空编码器的影响和指令微调中的回归层;(4) 模型鲁棒性研究;(5) 案例研究   

ca596c0e8db6244f352091a9f6c4f535.png

图3 跨区域零样本预测场景性能比较

4992467803a110bb4d4d0e8621edc2d4.png

图4 跨城市零样本预测场景性能比较

016e973b539ddd9058ce9ca636f08572.png

图5 端到端有监督设置下的预测性能评估

4b764a2a4515edb66f2bf3792d673bd0.png

图6 消融实验    

d7c9deb8efc071ea096989522a430adc.png

图7 鲁棒性研究

9d332e1e4e6f674848e220faef8e7a0e.png

图8 案例研究

7. 总结与展望

本文提出了UrbanGPT,一个能够在不同的城市场景中具有良好泛化能力的时空大型语言模型。为实现时空上下文信号与LLMs无缝对齐,本文引入了一种时空指令微调范式。这赋予UrbanGPT在各种类型的城市数据中学习通用和可迁移的时空模式的卓越能力。大量实验分析展示了UrbanGPT架构及其关键组件的卓越有效性。   

然而,需要注意的是,虽然结果是令人鼓舞的,但在未来的研究中仍然存在待解决的限制。作为第一步,我们积极收集更多种类的城市数据,以增强和完善UrbanGPT在更广泛的城市计算领域的能力。此外,理解UrbanGPT的决策过程也是重要的。虽然该模型表现出卓越的性能,但提供可解释性同样重要。未来的研究也将集中于赋予UrbanGPT模型解释其预测的能力。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1898131.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Qt实现流动的管道效果代码示例

在现代图形用户界面&#xff08;GUI&#xff09;应用程序中&#xff0c;动态效果可以显著增强用户体验。本文将介绍如何使用Qt框架实现一个流动的管道效果。我们将通过自定义QWidget来绘制管道&#xff0c;并使用定时器来实现流动效果。 1. 准备工作 首先&#xff0c;确保你已…

【Linux进阶】磁盘分区2——MBR和GPT

1.磁盘的分区 因为如果你的磁盘被划分成两个分区&#xff0c;那么每个分区的设备文件名是什么&#xff1f; 在了解这个问题之前&#xff0c;我们先来复习一下磁盘的组成&#xff0c;因为现今磁盘的划分与它物理的组成很有关系。 我们谈过磁盘主要由碟片、机械手臂、磁头与主轴马…

计算机视觉 图像融合技术概览

在许多计算机视觉应用中(例如机器人运动和医学成像),需要将来自多幅图像的相关信息集成到一幅图像中。这种图像融合将提供更高的可靠性、准确性和数据质量。 多视图融合可以提高图像的分辨率,同时恢复场景的 3D 表示。多模态融合结合了来自不同传感器的图像,称为多传感器融…

【一念发动便是行】念头,就是命运

一个个恶念累积就是负能量&#xff0c;念头就是命运&#xff0c;克除恶念&#xff0c;防范念头&#xff0c;念头都有能量&#xff0c;学圣学须内外庄严检肃&#xff0c;言语有灵 多数人的问题都是出在念头上&#xff0c;念头&#xff0c;就是自己的命运&#xff1b; 当我们对自…

windows电脑网络重置后wifi列表消失怎么办?

我们的电脑网络偶尔会出现异常&#xff0c;我们通常会下意识选择网络诊断&#xff0c;运行完诊断后一般会让我们选择重置网络&#xff0c;然而&#xff0c;重置后wifi列表突然消失&#xff0c;无法愉快地上网了&#xff0c;找了一圈&#xff0c;都说是更改适配器选项&#xff0…

船舶雷达与导航系统选择7/8防水插座的原因分析

概述 船舶雷达与导航系统在现代航海中扮演着至关重要的角色&#xff0c;它们为船舶提供准确的导航信息&#xff0c;确保航行的安全和效率。在这些系统中&#xff0c;7/8防水插座的使用尤为重要&#xff0c;因为它们能够在恶劣的海上环境中提供稳定的电力和信号连接。接下来&am…

CASS7.0按方向和距离绘制图形

1、绘制工具 2、按方向和距离绘制 &#xff08;1&#xff09;切换方向 &#xff08;2&#xff09;距离输入

欧科云链大咖对话:Web3原生创新静默期,科技巨头却在两极化发展

出品&#xff5c;OKG Research 作者&#xff5c;Hedy Bi 上周末&#xff0c;欧科云链研究院接受FT中文的邀请&#xff0c;作为圆桌嘉宾参与了由FT中文网与上海交通大学上海高级金融学院联合主办的金融大师课。在圆桌环节&#xff0c;笔者与各位教授和金融行业科技创新前沿实践…

【UE5.3】笔记8 添加碰撞,检测碰撞

添加碰撞 打开BP_Food,添加Box Collision组件&#xff0c;与unity类似&#xff1a; 调整Box Collision的大小到刚好包裹物体&#xff0c;通过调整缩放和盒体范围来控制大小&#xff0c;一般先调整缩放找个大概大小&#xff0c;然后调整盒体范围进行微调。 碰撞检测 添加好碰撞…

MySQL中的DDL语句

第一题 输入密码登录mysql&#xff0c;创建数据库zoo&#xff0c;转换到zoo数据库&#xff0c; mysql> create database zoo character set gbk; mysql> use zoo查看创建数据库zoo信息 mysql> show create database zoo;删除数据库zoo mysql> drop database zo…

用requirements.txt配置环境

1. 在anaconda创建环境 创建Python版本为3.8的环境&#xff0c;与yolov5所需的包适配。 2. 在Anaconda Prompt中激活环境 (base) C:\Users\吴伊晴>conda activate yolov5 3. 配置环境 用指定路径中的requirements.txt配置环境。 (yolov5) C:\Users\吴伊晴>pip insta…

如何使用Maxscript访问C#类库?

本教程帮助你一步一步集成maxscript文档和C#类库&#xff0c;以便你能够在maxscript提供的相当有限的环境中访问dotnet框架的强大功能。这让你可以使用maxscript做一些功能更强大的事情&#xff0c;比如访问数据库、获取web部署的内容等等。 还是直接上教程实惠&#xff1a; …

Linux:进程间通信(一.初识进程间通信、匿名管道与命名管道、共享内存)

上次结束了基础IO&#xff1a;Linux&#xff1a;基础IO&#xff08;三.软硬链接、动态库和静态库、动精态库的制作和加载&#xff09; 文章目录 1.认识进程间通信2.管道2.1匿名管道2.2pipe()函数 —创建匿名管道2.3匿名管道的四种情况2.4管道的特征 3.基于管道的进程池设计4.命…

一些linux指令(转:一次服务器被入侵的处理过程分享)

https://www.cnblogs.com/operationhome/p/16637763.html 1.查找详细的入侵痕迹 last grep Accepted /var/log/secure 2.查看最近新增的一些用户 cat /etc/passwd 3.查看定时任务的日志 vi /var/log/cron 4.查看开机启动脚本 cat /etc/rc.local

单元测试Spring 上下文加载过程中遇到的阻塞或死锁问题

IDEA单元测试一直转圈&#xff0c;阻塞&#xff0c;前置后置的方法都不执行&#xff0c;无任何输出 1.单元测试类 SpringBootTest(classes {BareMetalApplication.class}) RunWith(SpringRunner.class) public class K8sUserNfsStoreInitServiceImplTest {BeforeEachpublic…

如何使用 SwiftUI 构建 visionOS 应用

文章目录 前言WindowsVolumes沉浸式空间结论 前言 Apple Vision Pro 即将推出&#xff0c;现在是看看 SwiftUI API 的完美时机&#xff0c;这使我们能够将我们的应用程序适应 visionOS 提供的沉浸式世界。苹果表示&#xff0c;构建应用程序的最佳方式是使用 Swift 和 SwiftUI。…

【C++】 解决 C++ 语言报错:Undefined Reference

文章目录 引言 未定义引用&#xff08;Undefined Reference&#xff09;是 C 编程中常见的错误之一&#xff0c;通常在链接阶段出现。当编译器无法找到函数或变量的定义时&#xff0c;就会引发未定义引用错误。这种错误会阻止生成可执行文件&#xff0c;影响程序的正常构建。本…

气压传感器在自动驾驶汽车还有哪些应用场景

气压传感器在近年来被广泛应用于各种新兴领域&#xff0c;以下是其中几个最新的应用&#xff1a; 1、自动驾驶汽车&#xff1a;自动驾驶汽车需要精确的气压传感器来监测道路上的气压变化&#xff0c;帮助车辆进行准确的定位和导航。气压传感器可以提供高精度、可靠的气压数据&…

2.ast快速脚本熟悉ast类型-cnblog

观察ast ast更换结果使a3 // 引入Node.js的文件系统模块&#xff0c;用于读写文件 const fs require(fs); const types require("babel/types") // 引入babel/parser模块&#xff0c;用于将源代码转换成AST&#xff08;抽象语法树&#xff09; const parser requ…

【东奥会计-注册安全分析报告】

前言 由于网站注册入口容易被黑客攻击&#xff0c;存在如下安全问题&#xff1a; 暴力破解密码&#xff0c;造成用户信息泄露短信盗刷的安全问题&#xff0c;影响业务及导致用户投诉带来经济损失&#xff0c;尤其是后付费客户&#xff0c;风险巨大&#xff0c;造成亏损无底洞…