【随笔】地理探测器原理与运用

news2025/7/17 0:41:44

文章目录

  • 一、作者与下载
    • 1.1 软件作者
    • 1.2 软件下载
  • 二、原理简述
    • 2.1 空间分异性与地理探测器的提出
    • 2.2 地理探测器的数学模型
      • 2.21 分异及因子探测
      • 2.22 交互作用探测
      • 2.23 风险区与生态探测
  • 三、使用:excel

一、作者与下载

1.1 软件作者

作者:
在这里插入图片描述
DOI: 10.11821/dlxb201701010

文献:地理探测器:原理与展望。直接看这个文献也可以。

1.2 软件下载

主页:http://www.geodetector.cn/Download.html

分别是excel宏、R包、QGIS和ArcGIS Pro工具箱。

excel的都带有示例数据,不过第三个和第一个的数据是相同的(可能是网站文件设置错误,截至我发文日期)。
在这里插入图片描述

二、原理简述

2.1 空间分异性与地理探测器的提出

空间分异性的科学意义:

空间分异性(空间分层异质性)表现为地理现象在子区域内的方差小于总区域方差,例如气候带、土地利用分区等。地理探测器通过量化这一分异性,为揭示其驱动因子提供了统计学工具。

地理探测器的核心优势:

  1. 无需线性假设:适用于非线性关系分析。
  2. 物理含义明确:通过方差分解直接量化因子解释力。
  3. 多类型数据兼容:支持类型量(如分类地图)和离散化数值量的分析。

基本逻辑:

  • 分异性检验:若子区域方差和( S S W SSW SSW)小于总方差( S S T SST SST),则存在空间分异。
  • 因子关联性:若两变量空间分布一致,则存在统计关联。

2.2 地理探测器的数学模型

2.21 分异及因子探测

q统计量用于度量因子解释力:
q = 1 − ∑ h = 1 L N h σ h 2 N σ 2 = 1 − S S W S S T q = 1 - \frac{\sum_{h=1}^{L} N_h \sigma_h^2}{N\sigma^2} = 1 - \frac{SSW}{SST} q=1Nσ2h=1LNhσh2=1SSTSSW
式中:

  • L L L为分层数, N h N_h Nh N N N为子区域与全区域样本数。
  • σ h 2 \sigma_h^2 σh2 σ 2 \sigma^2 σ2为子区域与总体方差。

在这里插入图片描述

显著性检验通过非中心F分布实现:
F = N − L L − 1 ⋅ q 1 − q ∼ F ( L − 1 , N − L ; λ ) F = \frac{N-L}{L-1} \cdot \frac{q}{1-q} \sim F(L-1, N-L; \lambda) F=L1NL1qqF(L1,NL;λ)
其中非中心参数 λ \lambda λ为:
λ = 1 σ 2 [ ∑ h = 1 L Y ˉ h 2 − 1 N ( ∑ h = 1 L N h Y ˉ h ) 2 ] \lambda = \frac{1}{\sigma^2} \left[ \sum_{h=1}^{L} \bar{Y}_h^2 - \frac{1}{N} \left( \sum_{h=1}^{L} N_h \bar{Y}_h \right)^2 \right] λ=σ21 h=1LYˉh2N1(h=1LNhYˉh)2

某个因子的q值越大,他对因变量的解释力就越强。显著性检验的p值,就不用说了吧,比如小于0.01,就代表xxx.


2.22 交互作用探测

通过比较单因子与多因子叠加的 q q q值,判断交互作用类型:

  1. 非线性增强 q ( X 1 ∩ X 2 ) > q ( X 1 ) + q ( X 2 ) q(X_1 \cap X_2) > q(X_1) + q(X_2) q(X1X2)>q(X1)+q(X2)
  2. 双因子增强 q ( X 1 ∩ X 2 ) > max ⁡ ( q ( X 1 ) , q ( X 2 ) ) q(X_1 \cap X_2) > \max(q(X_1), q(X_2)) q(X1X2)>max(q(X1),q(X2))
  3. 单因子主导 max ⁡ ( q ( X 1 ) , q ( X 2 ) ) < q ( X 1 ∩ X 2 ) < q ( X 1 ) + q ( X 2 ) \max(q(X_1), q(X_2)) < q(X_1 \cap X_2) < q(X_1) + q(X_2) max(q(X1),q(X2))<q(X1X2)<q(X1)+q(X2)
  4. 独立作用 q ( X 1 ∩ X 2 ) = q ( X 1 ) + q ( X 2 ) q(X_1 \cap X_2) = q(X_1) + q(X_2) q(X1X2)=q(X1)+q(X2)
  5. 非线性减弱 q ( X 1 ∩ X 2 ) < min ⁡ ( q ( X 1 ) , q ( X 2 ) ) q(X_1 \cap X_2) < \min(q(X_1), q(X_2)) q(X1X2)<min(q(X1),q(X2))

在这里插入图片描述
这里的叠加,不是把各个因子相加,而是相交,简单来说就是分类增加了。看下图就明白了:
在这里插入图片描述

2.23 风险区与生态探测

  1. 风险区差异检验(t检验):
    t Y ˉ h = 1 − Y ˉ h = 2 = Y ˉ h = 1 − Y ˉ h = 2 Var ( Y ˉ h = 1 ) n h = 1 + Var ( Y ˉ h = 2 ) n h = 2 t_{\bar{Y}_{h=1} - \bar{Y}_{h=2}} = \frac{\bar{Y}_{h=1} - \bar{Y}_{h=2}}{\sqrt{\frac{\text{Var}(\bar{Y}_{h=1})}{n_{h=1}} + \frac{\text{Var}(\bar{Y}_{h=2})}{n_{h=2}}}} tYˉh=1Yˉh=2=nh=1Var(Yˉh=1)+nh=2Var(Yˉh=2) Yˉh=1Yˉh=2
    自由度 d f df df为:
    d f = ( Var ( Y ˉ h = 1 ) n h = 1 + Var ( Y ˉ h = 2 ) n h = 2 ) 2 1 n h = 1 − 1 ( Var ( Y ˉ h = 1 ) n h = 1 ) 2 + 1 n h = 2 − 1 ( Var ( Y ˉ h = 2 ) n h = 2 ) 2 df = \frac{\left( \frac{\text{Var}(\bar{Y}_{h=1})}{n_{h=1}} + \frac{\text{Var}(\bar{Y}_{h=2})}{n_{h=2}} \right)^2}{\frac{1}{n_{h=1}-1} \left( \frac{\text{Var}(\bar{Y}_{h=1})}{n_{h=1}} \right)^2 + \frac{1}{n_{h=2}-1} \left( \frac{\text{Var}(\bar{Y}_{h=2})}{n_{h=2}} \right)^2} df=nh=111(nh=1Var(Yˉh=1))2+nh=211(nh=2Var(Yˉh=2))2(nh=1Var(Yˉh=1)+nh=2Var(Yˉh=2))2

  2. 生态探测(F检验):
    F = N X 1 ( N X 2 − 1 ) S S W X 1 N X 2 ( N X 1 − 1 ) S S W X 2 F = \frac{N_{X1}(N_{X2}-1)SSW_{X1}}{N_{X2}(N_{X1}-1)SSW_{X2}} F=NX2(NX11)SSWX2NX1(NX21)SSWX1
    其中 S S W X 1 SSW_{X1} SSWX1 S S W X 2 SSW_{X2} SSWX2为两因子分层后的层内方差和。


三、使用:excel

以excel版本为例,R语言和GIS版本的也是类似的,R语言看它的help有函数说明的。

直接打开excel版本的xlsm文件,你可能无法使用,因为这是带宏的表格,系统会阻止运行。

在xlsm文件上右键–>属性:在最下面的位置会有一个解除阻止运行之类的选项(名字忘了),设置一下即可。图中我已经解除限制了,没有显示。
在这里插入图片描述

🟢打开表格:里面的数据可以删除换成自己的。自变量需要设置为分类变量。比如一个自变量是全国各个城市的GDP,你可以使用各自算法将数据分为几类,比如使用分位数,分为高中低三类,再编码为1、2、3这种。这个不会的话问AI即可。

接着读取数据到GUI界面,设置自变量、因变量,运行。

在这里插入图片描述
运行后会生成几个sheet:一般只使用交互效应和因子探测的表格,环境和风险的不常用。
在这里插入图片描述


🟢 数据说明:

他需要你提供一个“表格”形式的数据,比如ArcGIS的属性表。

数据量不要太大了:

  • 第一是数据量大,你电脑内存可能不足,比如一个像元一个值,几十米分辨率,你的研究区可能就会有几十亿个像元,存为csv需要几十GB,运行的时候内存通常不足;
  • 第二是运行时间太久,这个不用多说;
  • 第三是使用excel的情况下,excel就支持几百万行数据。实际上几万行数据,这个程序就会溢出的。
  • 第四十结果q值会非常小,因为这个计算出来的方差会非常小,那个比值接近1,q就接近0了。

建议的数据示例:每个城市的数据(因变量+自变量),这样就只有几百或者几十行数据。

另外一点是,自变量的分类(离散化)可能会影响结果:因为这个地理探测器的原理可以看作是,找到一条或者几条分界线,使得自变量和因变量都是用这一组分界线,能将数据很好的区分(当然这个比喻并不是是否准确)。这个分界线其实就相当于你对自变量的分类


参考文献:

王劲峰, 徐成东. 地理探测器:原理与展望[J]. 地理学报, 2017, 72(1): 116-134 https://doi.org/10.11821/dlxb201701010
Jinfeng WANG, Chengdong XU. Geodetector: Principle and prospective[J]. Acta Geographica Sinica, 2017, 72(1): 116-134 https://doi.org/10.11821/dlxb201701010

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2343922.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

从零开始使用SSH链接目标主机(包括Github添加SSH验证,主机连接远程机SSH验证)

添加ssh密钥(当前机生成和远程机承认) 以下是从头开始生成自定义名称的SSH密钥的完整步骤&#xff08;以GitHub为例&#xff0c;适用于任何SSH服务&#xff09;&#xff1a; 1. 生成自定义名称的SSH密钥对 # 生成密钥对&#xff08;-t 指定算法&#xff0c;-f 指定路径和名称…

Maxscale实现Mysql的读写分离

介绍&#xff1a; Maxscale是mariadb开发的一个MySQL数据中间件&#xff0c;配置简单&#xff0c;能够实现读写分离&#xff0c;并且能根据主从状态实现写库的自动切换&#xff0c;对多个服务器实现负载均衡。 实验环境&#xff1a; 基于gtid的主从同步的基础上进行配置 中…

Spring Boot 启动生命周期详解

Spring Boot 启动生命周期详解 1. 启动阶段划分 Spring Boot 启动过程分为 4个核心阶段&#xff0c;每个阶段涉及不同的核心类和执行逻辑&#xff1a; 阶段 1&#xff1a;预初始化&#xff08;Pre-initialization&#xff09; 目标&#xff1a;准备启动器和环境配置关键类&am…

数据湖DataLake和传统数据仓库Datawarehouse的主要区别是什么?优缺点是什么?

数据湖和传统数据仓库的主要区别 以下是数据湖和传统数据仓库的主要区别&#xff0c;以表格形式展示&#xff1a; 特性数据湖传统数据仓库数据类型支持结构化、半结构化及非结构化数据主要处理结构化数据架构设计扁平化架构&#xff0c;所有数据存储在一个大的“池”中多层架…

解决conda虚拟环境安装包却依旧安装到base环境下

最近跑项目装包装到几度崩溃&#xff0c;包一直没有安装到正确位置&#xff0c;为此写下这篇文章记录一下&#xff0c;也希望能帮到有需要的人。&#xff08;此文章开发环境为anaconda和window&#xff09; 方法一 先conda deactivate,看到&#xff08;base&#xff09;消失…

字节跳动开源数字人模型latentsync1.5,性能、质量进一步优化~

项目背景 LatentSync1.5 是由 ByteDance 开发的一款先进的 AI 模型&#xff0c;专门针对视频唇同步&#xff08;lip synchronization&#xff09;任务设计&#xff0c;旨在实现音频与视频唇部动作的高质量、自然匹配。随着 AI 技术的快速发展&#xff0c;视频生成和编辑的需求…

Day12(回溯法)——LeetCode51.N皇后39.组合总和

1 前言 今天刷了三道回溯法和一道每日推荐&#xff0c;三道回溯法也迷迷糊糊的&#xff0c;每日推荐把自己绕进去了&#xff0c;虽然是一道之前做过的题的变种。刷的脑子疼。。。今天挑两道回溯题写一下吧&#xff0c;其中有一道是之前做过的N皇后&#xff0c;今天在详细写一写…

力扣HOT100——102.二叉树层序遍历

给你二叉树的根节点 root &#xff0c;返回其节点值的 层序遍历 。 &#xff08;即逐层地&#xff0c;从左到右访问所有节点&#xff09;。 示例 1&#xff1a; 输入&#xff1a;root [3,9,20,null,null,15,7] 输出&#xff1a;[[3],[9,20],[15,7]] /*** Definition for a bi…

搭建基于火灾风险预测与防范的消防安全科普小程序

基于微信小程序的消防安全科普互动平台的设计与实现&#xff0c;是关于微信小程序的&#xff0c;知识课程学习&#xff0c;包括学习后答题。 技术栈主要采用微信小程序云开发&#xff0c;有下面的模块&#xff1a; 1.课程学习模块 2.资讯模块 3.答题模块 4.我的模块 还需…

RAG技术与应用---0426

大语言模型>3.10 课程中会用到python 工具箱&#xff1a; faiss,modelscope,langchain,langchain_community&#xff0c;PyPDF2 1&#xff09;大模型应用开发的三种模式 提示词没多少工作量&#xff0c;微调又花费时间费用&#xff0c;RAG是很多公司招聘用来对LLM进行应用…

element-ui多个form同时验证,以及动态循环表单注意事项

多个form同时验证&#xff1a; validateForm(refs) {if (!refs) {return false}return new Promise((resolve, reject) > {refs.validate().then((valid) > {resolve(valid)}).catch((val) > {resolve(false)})}) }, async handleConfirm() {Promise.all([this.valid…

k8s学习记录(四):节点亲和性

一、前言 在上一篇文章里&#xff0c;我们了解了 Pod 中的nodeName和nodeSelector这两个属性&#xff0c;通过它们能够指定 Pod 调度到哪个 Node 上。今天&#xff0c;我们将进一步深入探索 Pod 相关知识。这部分内容不仅信息量较大&#xff0c;理解起来也有一定难度&#xff0…

文本预处理(NLTK)

1. 自然语言处理基础概念 1.1 什么是自然语言处理 自然语言处理( Natural Language Processing, NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于…

Neo4j 可观测性最佳实践

Neo4j 介绍 Neo4j 是一款领先的图数据库管理系统&#xff0c;采用图数据模型来表示和存储数据。它以节点、关系和属性的形式组织数据&#xff0c;节点代表实体&#xff0c;关系表示节点间的连接&#xff0c;属性则为节点和关系附加信息。Neo4j 使用 Cypher 查询语言&#xff0…

【教程】Windows通过网线共享网络给其它设备

转载请注明出处&#xff1a;小锋学长生活大爆炸[xfxuezhagn.cn] 如果本文帮助到了你&#xff0c;欢迎[点赞、收藏、关注]哦~ 1、打开“控制面板”。 2、点击“网络和共享中心”。 3、点击“更改适配器设置”。 4、选中要共享的网络适配器&#xff0c;右击选中“属性”。 5、勾选…

百度AI开发者大会:连发多款AI应用,覆盖AI数字人等热门赛道

4月25日&#xff0c;Create2025百度AI开发者大会在武汉隆重举办。百度创始人李彦宏发表了题为《模型的世界 应用的天下》的演讲。60分钟的演讲中&#xff0c;李彦宏发布了两大模型&#xff0c;多款热门AI应用&#xff0c;并宣布将帮助开发者全面拥抱MCP。 当天发布的文心大模型…

Java 线程的六种状态与完整生命周期详解

&#x1f680; Java 线程的几种状态详解 在 Java 中&#xff0c;线程状态&#xff08;Thread State&#xff09;是由 Thread.State 枚举定义的&#xff0c;总共有六种&#xff1a; 状态含义典型场景示例NEW新建状态&#xff0c;线程对象刚创建&#xff0c;还未调用 start() 方…

05--Altium Designer(AD)的详细安装

一、软件的下载 Altium Designer官网下载 1、临近五一的假期&#xff0c;想着搞个项目&#xff0c;且这个项目与PCB有关系&#xff0c;所以就下这个软件来玩玩。下面保姆级教大家安装。 2、选择适合自己的版本下载&#xff08;我安装的是24的&#xff09; 3、软件安装 1.下…

Java 队列与阻塞队列全面解析:从 Queue 到 TransferQueue 的实现与应用

文章目录 Queue队列QueueDeque 阻塞队列BlockingQueueArrayBlockingQueueLinkedBlockingQueuePriorityBlockingQueueSynchronousQueueDelayQueue BlockingDequeLinkedBlockingDeque TransferQueueLinkedTransferQueue Queue Queue&#xff08;队列&#xff09;是一种特殊的线性…

【蓝桥杯省赛真题56】Scratch抓不住的蜜蜂 蓝桥杯scratch图形化编程 中小学生蓝桥杯省赛真题讲解

目录 scratch抓不住的蜜蜂 一、题目要求 1、准备工作 2、功能实现 二、案例分析 1、角色分析 2、背景分析 3、前期准备 三、解题思路 四、程序编写 五、考点分析 六、推荐资料 1、scratch资料 2、python资料 3、C++资料 scratch抓不住的蜜蜂 第十五届青少年蓝桥…