地理空间数据分析技巧:优化的热点分析与异常值分析的应用

news2024/9/26 3:30:15

热点分析作为一种常用的空间统计方法,能够帮助我们识别地理空间中的热点和冷点区域,即那些高值或低值集中出现的地方。而优化的热点分析进一步简化了这一过程,使用户无需手动调整参数即可获得可靠的结果。此外,异常值分析则专注于发现那些与周围区域显著不同的地点,这些异常值往往能揭示出有趣的现象或问题所在,同样的优化的异常值分析也简化了这一过程,使用户无需手动调整参数即可获得可靠的结果。

到底哪些数据需要做热点分析?

官方文档是这样说明的:优化的热点分析 (空间统计)—ArcMap | 文档 (arcgis.com)

  • 计数(如街道十字路口处发生的交通事故数)
  • 比率(如城市失业率,各城市以点要素表示)
  • 平均值(如学校间数学测验的平均得分)
  • 指数(如国家汽车经销商的消费者满意度得分)

优化的热点分析与热点分析区别在哪?

简单来说,热点分析相当于专业相机,你想拍出更美或者根据当前环境特征进行调整焦距、光圈就用热点分析,而优化的热点分析它就相当于傻瓜相机,设置都帮你调好了直接拍照就行; 

优化的热点分析包括哪些默认配置?

1、初始数据评估:1.确保具有足够的加权要素可供分析(判断要素数是否是否达到 30 的标准,未达到时结果不可靠);2.评估分析字段值:最小值、最大值、平均值、标准差;3.查找位置异常值

2、通过增量空间自相关的方式寻找最佳距离,未找到基于30 个近邻的平均距离并将其用作分析范围;

3、输出结果,Gi_Bin 字段识别统计显著性热点和冷点,使用错误发现率 (FDR) 校正方法纠正了多重测试与空间依赖性。

这里我们依然拿上篇文章提到的网格尺度的上海人口分布来分析;

冷点
  • Cold Spot - 99% Confidence(冷点 - 99%置信度):用深蓝色表示,这类区域的人口密度相对较低,并且这一结论具有很高的可信度。
  • Cold Spot - 95% Confidence(冷点 - 95%置信度):用较浅的蓝色表示,这类区域的人口密度相对较低,并且这一结论具有较高的可信度。
  • Cold Spot - 90% Confidence(冷点 - 90%置信度):用青绿色表示,这类区域的人口密度相对较低,并且这一结论具有一定的可信度。
不显著
  • Not Significant(无显著性):用白色表示,这类区域的人口密度没有显著的高低之分。
热点
  • Hot Spot - 90% Confidence(热点 - 90%置信度):用橙色表示,这类区域的人口密度相对较高,并且这一结论具有一定的可信度。
  • Hot Spot - 95% Confidence(热点 - 95%置信度):用较深的橙色表示,这类区域的人口密度相对较高,并且这一结论具有较高的可信度。
  • Hot Spot - 99% Confidence(热点 - 99%置信度):用红色表示,这类区域的人口密度非常高,并且这一结论具有极高的可信度。

结论:

这里边缘深蓝色的部分是未匹配出来数据的部分,前面文章也进行说明了,所以这部分可以忽略不看,结合上篇文章的结论,我们可以明显看出来上海的人口分布格局一个主城和几个周边卫星城,人口分布呈现的高高聚集特征。从图中可以看到,上海市中心区域(红色部分)人口密度极高,这反映出上海市作为中国最大城市之一的地位。它拥有庞大的人口基数和繁荣的经济活动,使得市中心成为人口聚集的主要地点,在接近市中心的近郊地区(黄色部分),形成了多个卫星城。这些卫星城虽然人口数量相较于市中心较少,但仍然具有一定规模,它们为城市提供了重要的支持和服务功能最外层的绿色部分代表了远郊和农村地区,这些地方人口密度最低。由于这些区域主要以农业为主导产业,因此人口规模较小且分布较散。

到底哪些数据需要做异常值分析?

官方文档是这样说明的:优化的异常值分析 (空间统计)—ArcMap | 文档 (arcgis.com)

  • 研究区域中的富裕区和贫困区之间的最清晰边界在哪里?
  • 研究区域中存在可以找到异常消费模式的位置吗?
  • 研究区域中意想不到的糖尿病高发地在哪里?

优化的异常值分析与聚类异常值分析区别在哪?

参考''优化的热点分析与热点分析区别在哪?''的描述

优化的异常值分析包括哪些默认配置?

1、初始数据评估:1.确保具有足够的加权要素可供分析(判断要素数是否是否达到 30 的标准,未达到时结果不可靠);2.评估分析字段值:最小值、最大值、平均值、标准差;3.查找位置异常值

2、通过增量空间自相关的方式寻找最佳距离,未找到基于30 个近邻的平均距离并将其用作分析范围;

3、​ 输出结果,COType 字段可以识别统计显著性高低聚类(HH 和 LL)以及高低异常值(HL 和 LH),利用错误发现率 (FDR) 校正方法纠正了多重测试和空间依赖性。 ​

我们再来看看网格尺度的上海人口异常值的分布;

非显著
  • Not Significant(非显著):用白色表示,这类区域的变量值没有显著的聚类或离群值。
高-高聚类
  • High-High Cluster(高-高聚类):用粉色表示,这类区域的变量值较高,并且周围邻近的区域也具有相似的高值,形成了一个高值聚类。
高-低离群值
  • High-Low Outlier(高-低离群值):用红色表示,这类区域的变量值较高,但是周围的邻近区域却具有较低的值,形成了一种高值离群的情况。
低-高离群值
  • Low-High Outlier(低-高离群值):用蓝色表示,这类区域的变量值较低,但是周围的邻近区域却具有较高的值,形成了一种低值离群的情况。
低-低聚类
  • Low-Low Cluster(低-低聚类):用浅蓝色表示,这类区域的变量值较低,并且周围邻近的区域也具有相似的低值,形成了一个低值聚类。

结论:

因为是异常值分析,这里我们关注的重点在哪些地方产生了异常值,我们先来看"低-高离群值"(蓝色)是指那些具有较高人口分布的区域,但周围的邻近区域却具有较低的人口网格分布。可能的原因有很多,比如这些区域可能是公园、自然保护区或者工业区等特殊功能区,或者是尚未开发的土地,使得该区域的人口值低于周围区域。再看一下''高-低离群值''(红色)是指那些具有较低人口分布的区域,但周围的邻近区域却具有较高的人口网格分布,可能的原因同样有很多,比如周边分布着比较集中的居民区或者宿舍区,有些地方因为历史、文化和宗教等原因,成为了特定人群聚居地或者村落等原因,使得该区域的人口值高于周围区域。

文章仅用于分享个人学习成果与个人存档之用,分享知识,如有侵权,请联系作者进行删除。所有信息均基于作者的个人理解和经验,不代表任何官方立场或权威解读。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2077519.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

wooyu漏洞库YYDS!!!入门之道:重现乌云漏洞库

目录 wooyun乌云漏洞库搭建 1、搭建资料 文件结构分析: ​编辑2、搭建过程 2.1、搭建wooyun网站 2.2、配置数据库 2.2.1、修改数据库配置文件conn.php 2.2.2、创建wooyun数据库,并解压数据库文件 2.2.3、连接数据库(数据库默认连接密…

信号与系统——定义与分类(1)

一、信号与系统 信号:信号是信息的表现形式或传送载体,例如电磁波。信号可以用一个函数 yx (t) 来表示。 系统:是指若干相互关联的事物组合而成,具有特定功能的整体。换句话说就是,系统就是对输入信号进行加工和处理&#xff0c…

Nginx: 反向代理和动静分离概述

反向代理 反向代理服务器介于用户和真实服务器之间,提供请求和响应的中转服务对于用户而言,访问反向代理服务器就是访问真实服务器反向代理可以有效降低服务器的负载消耗,提升效率 1 )反向代理的模型 现在我们有一个用户和真实服…

新版cubemx生成CMake工程浮点数打印问题记录

问题现象 解决方案 set(CMAKE_C_LINK_FLAGS "${CMAKE_C_LINK_FLAGS} --specsnano.specs -u _printf_float")参考Cortex-M4权威指南 重新下载和测试

[Algorithm][综合训练][打怪][判断是不是平衡二叉树][最大子矩阵]详细讲解

目录 1.打怪1.题目链接2.算法原理详解 && 代码实现 2.判断是不是平衡二叉树1.题目链接2.算法原理详解 && 代码实现 3.最大子矩阵1.题目链接2.算法原理详解 && 代码实现 1.打怪 1.题目链接 打怪 2.算法原理详解 && 代码实现 自己的版本&…

C++ 设计模式——代理模式

C 设计模式——代理模式 C 设计模式——代理模式1. 主要组成成分2. 逐步构建代理模式2.1 抽象主题类定义2.2 真实主题类实现2.3 代理类实现2.4 主函数 3. 代理模式 UML 图代理模式 UML 图解析 4. 代理模式的优点5. 代理模式的缺点6. 代理模式的分类7. 代理模式和装饰者模式比较…

MybatisPlus:实现分页效果并解决错误:cant found IPage for args

我们在做开发使用mybatisplus 做分页查询的时候遇到了个问题: 继承 IPage拦截没有作用会默认分页,这个时候报了cant found IPage for args 错误~~~ 我们分析了下,其实这个问题很简单,是因为没有给默认值赋值,因为查询…

日撸Java三百行(day35:图的m着色问题)

目录 一、问题描述 二、思路分析 三、代码实现 总结 一、问题描述 在高中学习排列组合的时候,有一个非常经典的问题,就是涂色问题,即用m种颜色给n块区域涂色,要求每块区域只能涂同一种颜色且相邻区域的颜色不能相同&#xff…

pyinstaller将python程序打包成exe文件

将python代码打包成exe文件可以在不安装python环境的情况下直接运行python代码,譬如自己在自己的电脑上写好了代码,想发给其他人使用,可以用下述方法将python程序打包成exe文件,其他人直接执行exe文件即可使用该程序。 1.安装pyi…

二叉搜索树:数据结构之美

目录 引言基础知识 定义性质操作详解 插入节点删除节点查找节点遍历 前序遍历中序遍历后序遍历高级主题 平衡问题AVL树简介应用案例总结 引言 二叉搜索树(Binary Search Tree, BST)是一种特殊的二叉树,它的每个节点具有以下性质:左子树上的所有节点的键…

Python数据采集与网络爬虫技术实训室解决方案

在大数据与人工智能时代,数据采集与分析已成为企业决策、市场洞察、产品创新等领域不可或缺的一环。而Python,作为一门高效、易学的编程语言,凭借其强大的库支持和广泛的应用场景,在数据采集与网络爬虫领域展现出了非凡的潜力。唯…

Mysql重要参数

1、是否开启慢SQL日志 show VARIABLES like slow_query_log%; 2、慢SQL日志保存位置 show VARIABLES like slow_query_log_file%; 3、慢SQL的阈值,超过则是慢SQL,单位秒,默认10s show VARIABLES like long_query_time%;

小阿轩yx-Kubernetes存储入门

小阿轩yx-Kubernetes存储入门 前言 数据是一个企业的发展核心,它涉及到数据存储和数据交换的内容。在生产环境中尤为重要的一部分在 Kubernetes 中另一个重要的概念就是数据持久化 Volume。 Volume 的概念 对多数项目而言 数据文件的存储是非常常见的 在 Kube…

计算机的错误计算(七十四 )

摘要 回复网友的疑问:用错数解释计算机的错误计算(六十四)中的错误计算原因。 计算机的错误计算(六十四)到(六十九),以及(七十一)与(七十三&…

攻防世界 1000次点击

做题笔记。 下载解压 查壳。 32位ida打开。 查找字符串。 winmain函数写的,程序运行如下: 一开始思路是想着分析找到关键代码然后去od进行调试。 后来,额,不想看代码了。吐了。 尝试去字符串搜索flag样式,确实一发现…

高效恢复,无忧存储:2024年数据恢复工具大搜罗

不知道你是否了解过电子存储设备,我们的设备往往都存储在一个小小的芯片里,它为我们提供了数据携带的便捷性,当然也为我们带来了数据意外丢失的风险。为了我们的数据安全,我们来探讨一下有什么数据恢复工具能为我们的资料保驾护航…

Ruo-Yi 前后端分离如何不使用注解@DataSource的方式而是使用Mybatis插件技术实现多数据源的切换【可以根据配置文件进行开启/关闭】

Ruo-Yi 前后端分离如何不使用注解DataSource的方式而是使用Mybatis插件技术实现多数据源的切换【可以根据配置文件进行开启/关闭】 1、首先 配置文件: # 数据源配置 spring:datasource:type: com.alibaba.druid.pool.DruidDataSourcedriverClassName: com.mysql.c…

ZooKeeper--基于Kubernetes部署ZooKeeper

ZooKeeper 服务 服务类型: 无头服务(clusterIP: None),这是 StatefulSet(有状态集)必需的配置。 端口: 2181 (客户端): 用于客户端连接。 2888 (跟随者): 用于 ZooKeeper 服务器之间的连接。 3888 (领导者): 用于领导者…

邮政快递批量查询解决方案:提升业务运营效率

邮政快递批量查询:固乔快递查询助手的高效体验 在电商行业日益繁荣的今天,快递物流成为了连接商家与消费者的关键纽带。而对于需要处理大量订单的电商企业或个人而言,如何高效、准确地查询和跟踪快递物流信息显得尤为重要。幸运的是&#xf…

linux 云主机下载压缩包安装配置 maven 实录(华为云 EulerOS)

本想通过 yum install maven 直接安装的, 方便省事, 但报错说没找到, 于是只能手动安装了, 把整个过程记录了一下, 包括下载, 解压, 配置及验证的全过程, 并对用到的命令及参数作了详细说明, 需要的同学可以参考. maven 官网找到下载链接 首先要去到 maven 的官网, https://m…