论文解读(15)-UrbanGPT

news2024/12/28 20:57:43

加油,这一篇也是感受一下大语言模型的力量!

原文:
UrbanGPT: Spatio-Temporal Large Language Models
UrbanGPT: Spatio-Temporal Large Language Models (arxiv.org)

参考:

  • 时空预测与大语言模型的奇妙碰撞!UrbanGPT: Spatio-Temporal Large Language Models_时空大语言模型-CSDN博客
  • 首个智慧城市大模型UrbanGPT,全面开源开放|港大&百度 - 智源社区 (baai.ac.cn)

摘要

目标是创建一个时空语言大模型,可以在城市任务中进行很好的泛化。

1. Introduction

While current spatio-temporal neural network techniques have proven to be highly effective, it is crucial to acknowledge their strong dependence on having an abundance of labeled data in order to generate accurate predictions. However, the pervasive problem of data scarcity in practical urban sensing scenarios poses a significant challenge. For example, deploying sensors throughout the entire urban space to monitor citywide traffic volume or air quality is impractical due to the high cost involved [17, 41]. Moreover, the challenge of limited labeled data availability extends to spatiotemporal forecasting across different cities, in which acquiring labeled data for each target city becomes a daunting task [13, 38]. These issues emphasize the pressing need for novel solutions that address data scarcity and enhance the generalization capabilities of spatio-temporal models in various smart city applications.

这一段就讲述了目前的task或者说challenge:
1)稀缺标签数据和重新训练的巨大开销
2)LLMs和现有时空模型缺乏零样本场景下的泛化能力
3)如何将LLMs的出色推理能力扩展到时空预测场景

在这里插入图片描述

  • (看来重点就在于零样本的处理)
1.2 贡献
  • 首次尝试开发一种能够在不同数据集上预测各种城市现象的时空大语言模型
  • 时空预测框架UrbanGPT,它使得大语言模型能够理解时空之间错综复杂的相互依赖关系
  • UrbanGPT在零样本时空学习场景中具有出色的泛化能力。

2. Preliminaries

和related work 是一个意思,主要展示一些相关工作,如果有不懂的,可以看相关的内容。

  • spatio-temporal data
  • spatio-temporal forecasting
  • spatio-temporal zero-shot learning

3. Methodology

在这里插入图片描述

3.1 Spatio-Temporal Dependency Encoder (时空依赖编码器)

时空编码器包括两个关键的部分:

  • a gated dilated convolution layer (门控扩散卷积层)
  • a multi-level correlation injection layer (多层次关联注入层)

在这里插入图片描述

Er:initial spatial-temporal embedding (初始化时空嵌入)(由原始数据经过一个线性层得到)

Er‘ :是Er的切片。

Wk,Wg:分别是两个一维的空洞卷积核(1-D dilated convoution kernels)

bk,bg:就是相应的bias(corresponding bias)

激活函数Sigmoid:用于控制多层卷积运算的信息保留程度。

通过编码后,就可以获得不同级别的时间依赖关系了,但是这些数据毕竟属于不同的颗粒度,或者说是不同的level。因此,还需要一个注意力相关的机制去处理一下。

多层次关联注入层:
在这里插入图片描述

Ws:卷积核
bs:bias

3.2 Spatio-Temporal Instruction-Tuning

时空数据-文本对齐
在这里插入图片描述

这里有一点没有特别理解,
可以看一下博客中的内容:
在这里插入图片描述

  • (应该是指引入了special tokens)

时空提示指令

  • 就是prompt
    在这里插入图片描述

时间信息包括一周的日期和时间等因素,而区域信息包括城市、行政区域和附近的兴趣点(POI)数据等


时空指令微调

  • 就是模型本身不直接生成结果,而是生成预测标记(类似像之前几篇论文一样去帮助后续计算的理解,可以理解为一种enhancement)
    在这里插入图片描述
3.3 Model Optimization

loss计算:
在这里插入图片描述

  • 这个就是简单的常用的回归中用的loss(好像就是交叉熵)

4. 实验

跨区域零样本预测:
在这里插入图片描述

跨城市零样本预测:
在这里插入图片描述

总体还可以,下面是消融实验,这块就直接跳过了。

5. 展望

但在未来的研究中仍然存在待解决的限制。作为第一步,我们积极收集更多种类的城市数据,以增强和完善UrbanGPT在更广泛的城市计算领域的能力。此外,理解UrbanGPT的决策过程也是重要的。虽然该模型表现出卓越的性能,但提供可解释性同样重要。未来的研究也将集中于赋予UrbanGPT模型解释其预测的能力。

  • 就是可解释性的问题

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1991528.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

网卡与Linux网络结构(上)

原本是想借着之前学习的中断进一步拓展到网卡与中断的,标题都写好了,结果低估了其中的知识面和难度。。。。。于是调整为了网卡与Linux网络结构(上), 没错,仅仅只是上。。。我还是进一步低估了学习需要花费…

Zookeeper的监听机制及原理解析

系列文章目录 手把手教你安装Zookeeper 及可视化插件ZooInspector、ZKUI Zookeeper入门篇,了解ZK存储特点 使用Zookeeper的监听及原理解析 系列文章目录前言一、监听机制的基本概念二、Zookeeper监听原理1. 事件类型2. 监听模式与监听器类型(1&#xff…

深入理解计算机系统 CSAPP lab:bomb

实验资源下载地址:csapp.cs.cmu.edu/3e/labs.html 请先查看writeup 解压后 当我们运行bomb时,发现该程序要求我们输入行,如果输入错误,程序就会返回BOOM!!!提示我们失败了. 所以我们的目标是输入正确的行.以解开bomb程序. 实验前先详细阅读bomb.c //bomb.c /*****…

6.1 模块的导入与使用:Python的秘密武器

欢迎来到我的博客,很高兴能够在这里和您见面!欢迎订阅相关专栏: 工💗重💗hao💗:野老杂谈 ⭐️ 全网最全IT互联网公司面试宝典:收集整理全网各大IT互联网公司技术、项目、HR面试真题.…

Java语言程序设计基础篇_编程练习题*16.12(演示TextArea的属性)

目录 题目:*16.12(演示TextArea的属性) 习题思路: 代码示例 结果展示 题目:*16.12(演示TextArea的属性) 编写一个程序,演示文本域的属性。程序使用复选框表明文本是否换行&#xf…

Java面试题--JVM大厂篇之JVM监控与GC日志分析:优化Parallel GC性能的重要工具

目录 引言: 正文: 1. 理解GC日志的重要性 2. 启用GC日志 3. GC日志解析 4. JVM监控工具 5. 调优Parallel GC的实战技巧 痛点一:长时间停顿 痛点二:频繁的GC 痛点三:内存溢出 6. 实战案例分享 结束语&#…

linux进程----匿名管道和命名管道

linux进程----匿名管道和命名管道 在Linux中,管道是用于进程间通信的一种机制,可以分为两种类型:匿名管道(也称为匿名fifo)和命名管道(也称为命名fifo或named pipe)。 匿名管道(An…

如何解决整数溢出问题?

1、问题解析 当以整数数据类型(包括字节、短、长和其他类型)存储的值过大(大于变量可容纳的最大值)的值时,将发生整数溢出(或环 绕)。整数的最高有效位丢失,而其余值则相对于最小值…

Centos安装OpenSearch

Centos安装OpenSearch 下载并安装OpenSearch下载OpenSearch RPM包导入公共GNU Privacy Guard(GPG)密钥。此密钥验证您的OpenSearch实例是否已签名安装RPM包安装完设置开机自启动OpenSearch启动OpenSearch验证OpenSearch是否正确启动 测试OpenSearch向服务…

【lvs】超干货,包含理论+实验(详细步骤)

lvs理论部分 LVS(Linux Virtual Server)是Linux虚拟服务器的简称,是一个基于Linux操作系统的虚拟服务器集群系统。LVS主要用于实现负载均衡和高可用性,通过将客户端的请求分发到多台后端服务器上,从而提高整体服务的处…

JSON + AJAX + ThreadLocal

JSON数据交换 规则 JSON对象和字符串转换 <script type"text/javascript">var jsonPerson {"name": "jack","age": 20}console.log(jsonPerson);var strPerson JSON.stringify(jsonPerson);//对jsonPerson没有影响console.lo…

文件系统 --- 软硬链接

序言 经过上一篇的学习 在磁盘中的文件&#xff0c;我们大致了解了磁盘的物理结构&#xff0c;逻辑抽象结构以及文件在磁盘上的存储方式。在这篇文章中&#xff0c;我们会基于上一篇文章的部分知识点来介绍软链接&#xff0c;硬链接。 1. 软链接 1.1 软链接的概念 软链接是一个…

vue3+vite+ts 颜色选择器组件支持颜色吸取,透明度

ciw-color-picker-vue&#xff1a; vue3 vite ts 颜色选择器,支持颜色吸取,透明度&#xff0c;与浏览器原生颜色选择器相似,与饿了么颜色选择器相似 使用了ciw-color-picker-vue npm i ciw-color-picker-vue 安装 npm i ciw-color-picker-vue 全局引入方式 main.ts 或 m…

光伏检测室外气象站的重要性

在光伏产业的快速发展中&#xff0c;光伏检测室外气象站的重要性日益凸显。它不仅是光伏电站运维管理的“眼睛”&#xff0c;更是确保电站高效、稳定运行的关键因素。 首先&#xff0c;光伏检测室外气象站能够实时、准确地监测多种关键气象要素&#xff0c;如太阳辐射、风速、风…

【中间件】Redis从入门到精通-黑马点评综合实战

文章目录 一&#xff1a;Redis基础1.Redis是什么2.初识Redis3.Redis的数据结构A.通用命令B.String类型C.Key的层级格式D.Hash类型E.List类型F.Set类型G.SortedSet类型 二&#xff1a;Redis的Java客户端1.JedisA.引入依赖B.建立连接C.测试JedisD.释放资源 2.Jedis连接池3.Spring…

MM 13 -采购- 退货

思维导图 说明 情形1 直接冲销物料凭证 102 情形2 返货部分交货 情形3 退货PR贷项凭证 情形1 适用于已收货未开票&#xff0c;或者发票还可冲销的当月&#xff0c;冲销物料凭证所有数量 情形2 适用于跟情形1 一样&#xff0c;只是可以修改退货数量 情形3 如果已经跨越…

html+css+js网页设计字节跳动11个页面带js 效果很多

htmlcssjs网页设计字节跳动11个页面带js 效果很多 ui还原度100% 网页作品代码简单&#xff0c;可使用任意HTML编辑软件&#xff08;如&#xff1a;Dreamweaver、HBuilder、Vscode 、Sublime 、Webstorm、Text 、Notepad 等任意html编辑软件进行运行及修改编辑等操作&#xff0…

笔试练习day3

目录 BC149 简写单词题目解析代码 dd爱框框题目解析解析代码方法一暴力解法方法二同向双指针(滑动窗口) 除2!题目解析解法模拟贪心堆 感谢各位大佬对我的支持,如果我的文章对你有用,欢迎点击以下链接 &#x1f412;&#x1f412;&#x1f412; 个人主页 &#x1f978;&#x1…

【网络安全】玲珑安全第四期

鉴于玲珑安全漏洞挖掘前三期课程取得的优异成绩和获得的强烈反响,我们决定启动玲珑安全第四期漏洞挖掘培训计划。 文章目录 往期学员收获基础学员报喜(部分)课程反馈第四期课程课程内容免费课程往期学员收获 第一期课程总结及学员收获:->点我查看第一期学员收获<- …

leetcode 图论专题——(dfs+bfs+并查集 回顾)

DFS、BFS 回顾&#xff08;C语言代码&#xff09; map[i][j]里记录的是i点和j点的连接关系 基本DFS&#xff1a; int vis[101],n,map[101][101]; void dfs(int t) {int i;vis[t]1;for(i0;i<n;i)//找对t点所有有关联的点——“找路”{if(vis[i]!0&&map[t][i]1)//有…