论文笔记：GEOLLM: EXTRACTING GEOSPATIALKNOWLEDGE FROM LARGE LANGUAGE MODELS

论文笔记：GEOLLM: EXTRACTING GEOSPATIALKNOWLEDGE FROM LARGE LANGUAGE MODELS

news2026/2/16 11:46:26

ICLR 2024 reviewer 评分 35668

1 intro

1.1 地理空间预测

地理空间预测在各个领域都有广泛的应用
- 包括贫困估算，公共卫生，粮食安全，生物多样性保护，环境保护。。。
- 这些预测中使用的变量包括地理坐标、遥感数据、卫星图像、人类移动数据和手机元数据
尽管获取高质量协变量至关重要，但由于空间时间覆盖范围有限、成本高昂和获取障碍，这可能会面临挑战

1.2 论文背景

LLM压缩了其训练语料库中包含的知识，其中包括来自互联网的数十亿或数万亿的数据令牌
- 论文寻求理解LLM是否拥有地理空间知识，并探索提取此类知识的方法，以提供一套新的地理空间协变量，从而增强各种地理空间ML任务
如图1a所示，仅通过查询LLM来描述一个地址，就可以揭示出LLM中包含的大量地理空间知识

然而，从LLM中提取这些知识并非易事。
- 虽然最自然的接口涉及使用地理坐标，如纬度和经度来检索特定位置信息，但如图1b所示，这通常会产生不佳的结果。
- 困难在于LLM能否理解并解释这些数字坐标与实际位置之间的关系

1.3 论文思路

介绍了GeoLLM，一种新颖的方法
- 通过对LLM进行微调，利用构建的提示与OpenStreetMap的辅助地图数据，有效提取LLM中包含的丰富地理空间知识
- 通过在图1b中展示的提示策略，可以精确定位一个位置，并为LLM提供足够的空间上下文信息，从而使其能够访问并利用其广泛的地理空间知识
- 在提示中包括来自附近位置的信息，可以将GPT-3.5的性能提高3.3倍，相比仅提供目标位置的坐标

3 方法

抽象地说，论文希望将地理坐标（纬度、经度）和附加特征映射到响应变量，如人口密度或资产财富
目标是确定LLM对这些坐标了解多少，以及我们如何使用这些知识更好地预测感兴趣的响应变量

3.1 最小可行地理空间提示

一个最小可行的提示需要指定位置和预测任务
- 描述包括任务的名称和指示可能标签范围的规模
论文发现添加任务名称有帮助，但更具体的信息，如数据集名称，通常没有帮助

3.1.1 接近回归的分类任务

由于必须通过文本为LLM指定标签，论文使用分类而不是回归
论文发现更接近回归的分类任务（例如，0.0到9.9而不是1到5）是有益的，尽管LLM使用softmax
- 如果原始数据集已经具有近似均匀分布，则简单地将值缩放到0到9.9的范围，并四舍五入到一位小数
- 如果数据集本身不是均匀的，则将值均匀地分布在100个桶中，以维持均匀分布。然后，每个桶与0.0到9.9的值范围相关联。

3.2 带地图数据的提示

上述提示有一个主要限制——LLM难以识别坐标的位置
——>确保提示包含额外的上下文，帮助模型理解坐标的位置
——>使用地图数据构建了两个额外组件：
- 地址：详细的反向地理编码描述，包括从邻域级别到国家本身的地点名称
  - 使用Nominatim进行反向地理编码生成地址
- 附近地点：在100公里半径内最近的10个位置及其各自的名称、距离和方向列表
  - 从Overpass API获取附近地点的名称和位置

3.3 使用语言模型进行微调和推理

RoBERTaBASE
- 对模型进行了微调，其所有参数均可训练。
- 它接受整个提示并输出一个连续值，将其四舍五入到最近的桶
Llama 2 7B
- 尽管不适合回归任务，但由于训练了更多数据，它有潜力表现良好
- 类似于预训练模式，将prompt和label连接，使用无监督学习对Llama 2进行微调
  - 将prompt和对应的ground-truth标签作为一个整体，使用自回归的方式进行微调
  - 论文发现这种无监督学习比使用监督微调效果更好
    - 这意味着模型正在学习生成提示和标签
    - 学习给定坐标生成地址或使用坐标和地址生成附近地点是有益的
- 推理时：提供提示，并让它生成预测所需的三个令牌（例如，“9”、“。”和“9”）
- QLoRA能够大大降低计算成本，并仅用3300万可训练参数有效进行微调
  - 由于它还将冻结模型量化为4位，这带来了可能稀释权重中包含的知识
GPT-2
- 使用与Llama 2相同的微调和推理过程
GPT-3.5
- 通过OpenAI的微调API对GPT-3.5进行微调
- 与Llama 2类似，提供它提示，并让它生成完成所需的三个令牌

4 实验

4.1 任务

4.1.1 人口密度

WorldPop提供空间人口数据，覆盖了全世界的人口密度任务
- 使用了他们的2020年全球无约束拼图，其分辨率为30弧秒（赤道上约1km）
为了确保全面代表人口，采用了按人口加权的重要性抽样。这使我们能够捕获广泛的人口范围
- 如果没有重要性抽样，样本将主要由人口稀少的地区组成

4.1.2 人口相关指数

包括了从人口与健康调查（DHS）计划中派生的任务
- 供了48个国家家庭层面的、全国代表性的有关资产、住房条件和教育水平等属性的数据
- 使用资产财富指数、女性教育成就、卫生指数和女性BMI

4.1.3 美国人口普查

USCB 美国人口普查局所称的邮政编码制表区域的人口、平均收入和西班牙裔与非西班牙裔比例的任务

4.1.4 住房价值指数

反映了35%到65%百分位范围内房屋的典型价值
- 也在邮政编码级别使用这些数据
- 这个数据集也只覆盖美国

4.1.5 数据集的处理

当数据集中没有给出明确的坐标时，通过确定相关区域的中心来近似它们
- 近似每个邮政编码区域的中心
使用平方皮尔逊相关系数r²来评估性能

4.2 实验结果

4.2.1 预测结果

4.2.2 关于提示的消融研究

4.2.3 finetune 是否需要？

【部分来源于paper的rebuttal】

使用未经微调的基于聊天的LLMs的主要问题是，它们经常拒绝给出答案，特别是在偏远或不太发达的地区
- 零样本（zero-shot）是不可靠的，所以论文补充测试了一下few-shot的内容
- 通过为每个测试示例提供10个物理距离最近的训练样本序列，来展示它们的few-shot性能
- 为了进一步防止模型拒绝回答，我们在提供10个示例之前使用系统消息“你是一个详尽且知识渊博的地理学家”和“你用预测/估计来完成数据序列”
微调后的GPT-3.5大幅度超过了GPT-3.5甚至GPT-4

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1559689.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

手机无线投屏到windows11电脑

手机无线投屏到windows11电脑

1 安装无线投影组件 2 电脑端打开允许其他设备投影的开关 3 手机找到投屏选项 4 手机搜索可用设备连接即可这里的官方文档给的不太好,给了一些让人眼花撩乱的信息,以下是经过整合的有效信息

阅读更多...

PHP在线客服系统源码修复版

源码简介在线客服系统网站源码https://www.888host.cn/330.html 新增消息预知，消息撤回，消息已读未读， 修复需要刷新才能收到消息修复客户来源地址修复消息提示音修复桌面推送提醒搭建环境宝塔面板 ，Nginx1.16-1.18 …

阅读更多...

【A-012】基于SSH的在线学习考试系统

【A-012】基于SSH的在线学习考试系统

【A-012】基于SSH的在线学习考试系统开发环境： Eclipse/MyEclipse、Tomcat8、Jdk1.8 数据库： MySQL 适用于： 课程设计，毕业设计，学习等等系统介绍有偿

阅读更多...

centos7.5安装gitlab-runner,配置CI/CD流水线

centos7.5安装gitlab-runner,配置CI/CD流水线

一般不建议gitlab-server和gitlab-runner装在同一台服务器第一步：安装gitlab-runner,最好和gitlab实例版本一致 # 下载官方gitlab-runner安装脚本 curl -L "https://packages.gitlab.com/install/repositories/runner/gitlab-runner/script.rpm.sh" | s…

阅读更多...

基于FreeRTOS系统的STM32简易遥控器设计

基于FreeRTOS系统的STM32简易遥控器设计

项目说明该项目是一个基于FreeRTOS系统的Stm32遥控器设计。使用该项目主要是自己学习FreeRTOS的使用，以及模块化编程的思想。这个项目应该长期会有更新。项目开源 github:https://github.com/snqx-lqh/Stm32RemoteControl gitee:https://gitee.com/snqx-lqh/S…

阅读更多...

canvas画图，画矩形可拖拽移动,可拖拽更改尺寸大小

canvas画图，画矩形可拖拽移动,可拖拽更改尺寸大小

提示：canvas画图，画矩形，圆形，直线，曲线可拖拽移动文章目录前言一、画矩形，圆形，直线，曲线可拖拽移动总结前言一、画矩形，圆形，直线，曲线可拖…

阅读更多...

Lucene及概念介绍

Lucene及概念介绍

Lucene及概念介绍基础概念倒排索引索引合并分析查询语句的构成基础概念 Document：我们一次查询或更新的载体，对比于实体类 Field：字段，是key-value格式的数据，对比实体类的字段 Item：一个单词&#xff0…

阅读更多...

非周期连续函数的傅里叶变换

非周期连续函数的傅里叶变换

首先我们把一个非周期信号扩展成一个周期信号然后用傅里叶级数展开也可以得到对应的级数系数利用周期趋向于无穷大可以把傅里叶级数展开就变成了一个积分而神奇的是积分里其实还有一个积分这样我们就得到了傅里叶变换对我们把里面的积分成为函数的傅里叶变换把外面…

阅读更多...

Qt主窗口之：停靠/悬浮窗口(QDockWidget)

Qt主窗口之：停靠/悬浮窗口(QDockWidget)

一、QDockWidget概述 QDockWidget 是 Qt 中的一个窗口部件，用于创建可停靠的窗口，通常用于构建多文档接口（MDI）或可定制的用户界面。QDockWidget 允许用户将窗口停靠在应用程序的主窗口周围，或将其拖动到独立的浮动窗…

阅读更多...

【千帆杯】K12教育常规赛北京场线下交流会心得

【千帆杯】K12教育常规赛北京场线下交流会心得

千帆杯K12教育常规赛北京场线下交流会心得周日有幸参加了百度智能云千帆AppBuilder北京场线下交流会 ( 活动链接 )，去线下组队创作了 K12教育相关的智能体。参赛过程中认识了不少大佬与朋友，抱大佬队友的腿，他的猜成语应用获得了线…

阅读更多...

Android屏幕硬件宽高和当前View显示区域的宽高，Kotlin

Android屏幕硬件宽高和当前View显示区域的宽高，Kotlin private fun getScreenSize() {if (Build.VERSION.SDK_INT > Build.VERSION_CODES.R) {//屏幕实际显示区域的宽高，包含系Android统的状态栏和导航栏，可以简单理解这就是屏幕硬件尺寸固…

阅读更多...

刷题日记——重建二叉树专题

刷题日记——重建二叉树专题

1.层序建树给定一个二叉树的层序遍历序列，空节点用#表示，例如层序序列：“abc##de#g##f###”，其对应二叉树如下图所示： 分析创建根节点 TreeNode * rootNULL创建一个队列，用于保存将要插入的位置&#x…

阅读更多...

Kubernetes（k8s）架构原理

Kubernetes（k8s）架构原理

比如在服务器上部署一个博客应用服务，但是太过受欢迎，访问量太大，应用服务经常会挂，使用自动重启工具，并且将应用服务部署在了好几个服务器上，总算抗住了。后来又上线了商城应用服务和语言应用服务，随着应用服务变多，需求也千奇百怪，有的应用服务不希望被外网访问，有…

阅读更多...

CentOS系统下Docker的安装教程

CentOS系统下Docker的安装教程

🌟 前言欢迎来到我的技术小宇宙！🌌 这里不仅是我记录技术点滴的后花园，也是我分享学习心得和项目经验的乐园。📚 无论你是技术小白还是资深大牛，这里总有一些内容能触动你的好奇心。🔍 &#x…

阅读更多...

[Python] 如何导出PDF文件中的图片

[Python] 如何导出PDF文件中的图片

文章目录一、背景说明二、代码编写三、问题3.1、如何得到图片的xref？3.2、xref有什么用呢？ 四、总结一、背景说明最近在看一份pdf的书籍，其中有一些图片绘制地比较出色，所以就打算将其复制出来，以便于在需要的时候…

阅读更多...

webGIS 之智慧校园案例

webGIS 之智慧校园案例

1.引入资源创建地图 //index.html <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta http-equiv"X-UA-Compatible" content"IEedge"><meta name"viewport" content&qu…

阅读更多...

【PyQt学习篇 · ⑮】：qrc/rcc资源系统

【PyQt学习篇 · ⑮】：qrc/rcc资源系统

文章目录 qrc使用介绍rcc编译资源rcc 的安装与基本使用编译成Python文件使用资源系统文件方式一：导入资源系统文件方式二：整合资源系统文件 qrc使用介绍在PyQt中，qrc文件是一种资源文件，用于将应用程序所需的资源（如…

阅读更多...

中文Mistral模型介绍（Chinese-Mistral）——中文大语言模型

中文Mistral模型介绍（Chinese-Mistral）——中文大语言模型

中文Mistral简介 Chinese-Mistral由清华大学地学系地球空间信息科学实验室开发。该模型基于Mistral发布的Mistral-7B-v0.1训练得到。首先进行中文词表扩充，然后采用实验室提出的PREPARED训练框架（under review）在中英双语语料上进行增量预训…

阅读更多...

日历插件fullcalendar【笔记】

日历插件fullcalendar【笔记】

日历插件fullcalendar【笔记】前言版权开源推荐日历插件fullcalendar一、下载二、初次使用日历界面示例-添加事件，删除事件三、汉化四、动态数据五、前后端交互1.环境搭建-前端搭建2.环境搭建-后端搭建3.代码编写-前端代码fullcalendar.htmlfullcalendar.js 4.代码…

阅读更多...

事务传播行为Propagation

事务传播行为Propagation

目录背景Propagation测试程序1测试程序2分析背景前段时间，某个项目在部署时，被公司的一个检测拦截了，提示报错如下： Your code exists Method or Class with Transactional annotation that not use Propagation.REQUIRED.有…

阅读更多...

推荐文章

最新文章