ArcGIS pro中的回归分析浅析(加更)关于广义线性回归工具的补充内容

news2024/11/27 8:05:32

 在回归分析浅析中篇的文章中,

有人问了一个问题:

案例里的calls数据貌似离散,更符合泊松模型,为啥不采用泊松而采用高斯呢?

确实,在中篇中写道:

在这个例子中我们为了更好地解释变量,使用高斯模型代替更适合的泊松模型。

这句话该怎么理解呢?

一般情况下,拿到研究数据之后,如果我们计划使用GLR工具,首先需要判断使用哪个模型,使用哪个模型是由数据来确定的,当数据都是整数时,究竟是用高斯还是泊松呢?

我们知道,高斯模型需要满足数据正态分布。在Pro中如何看数据是否正态分布呢?

打开Pro,在内容列表中选择包含因变量的原始图层,选择创建图表,点击直方图就可以查看数据的分布形态了。

在图表属性中选择数值变量为Calls

存在变换三种形式,无变换、对数变换以及平方根变换。默认情况下选择无变换。

其中横轴是Calls值,纵轴为Calls的数量。

很显然,当前数据是偏斜的,并不是正态分布的。这种情况下是不建议选择高斯模型,更推荐使用泊松的。

但是很多情况下,高斯的性能或者说拟合度都要好于泊松。(大家可以尝试使用本例中的数据,再结合GLR工具中的泊松模型得出该模型的拟合度)

所以为了向高斯模型靠拢,提高模型精度,会尝试将数据进行变换。

你可以理解为在某种程度上,变换可以认为并非在调整数据,而是换个角度看数据,比如说圆柱体完全水平的看截面是正方形,而从顶上垂直俯视是圆形。怎么看(变换),都不会改变数据的最终表现,只是让我们从某个角度更容易的理解它而已。

god xia,公众号:虾神说D[虾答]莫兰指数计算时只能用原始数据还是也能用取对数后的数据?

以上内容引自虾神卢(下一篇会附上他的公众号)关于变换内容的说明

将数据进行变换,也就是尝试使用对数变换以及平方根变换,再来确定数据是不是正态分布的。如果变换后数据是正态分布的,我们仍然可以选择高斯模型来对变量之间的线性关系进行建模。

在这里我们尝试使用平方根变换。

很不幸。仍然不是正态分布。

但是上述这种,数据变换之后呈现正态分布的情况确实存在。例如这里我们使用了房价数据进行比较。

房价无变换       房价对数变换

非正态分布        呈正态分布

所以,严格来说,本例中使用高斯模型来进行数据的分析和预测是存在问题的。(同学们千万注意)

本例中,我们的本意是想讲清楚高斯模型中的众多的结果指标,并得出GLR工具在本例中并不平稳的结论。大家可以理解其方法和思路。

同一数据泊松分布的结果如下

地图视图结果展示

地图视图中增加了GLRPossionData911Calls图层。并使用偏差残差(非标准化残差)来进行渲染。

内容列表中的GLRData911Calls图层

同时增加了3个图表。图表与结果是相互印证的,因此在这里我们主要分析GLRPossionData911Calls图层的内容以及结果运行出来之后的详细信息。

与原始的ObsData911Calls相比较,保留了全部要素的Calls、Pop, Jobs, LowEduc, Dst2UrbCen也就是因变量和解释变量属性,增加了Raw Predicted(CALLS)、Predicted(CALLS)字段也就是因变量的预测值,以及Deviance Residual(偏差残差)这三个字段。

其中偏差残差也反应了预测值与实际值之间的差异,这个与标准残差不同,没有大于2.5或者小于-2.5的限制。

再来看泊松模型的GLR结果

可以发现结果与高斯模型的结果类似,都包含了系数、概率和VIF。这些要求比如概率带星号,VIF不能大于7.5的要求都是相同的。

GLR的诊断中已解释偏差表明因变量中有多少变化可以由模型解释,也叫作模型拟合优度,类似高斯模型中的R方。

从这里我们也能看出,本例中,泊松的拟合结果比高斯的要低。

本例中,我们提供的数据不是特别理想,导致模型的选择容易混淆。在云盘连接中,我们还补充了房产数据,符合高斯模型,大家可以尝试一下。链接: 

链接:https://pan.baidu.com/s/17KFw8l5PeBQMAgtAjKU80Q?pwd=1vsl 
提取码:1vsl 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2248295.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

第R4周:LSTM-火灾温度预测(TensorFlow版)

>- **🍨 本文为[🔗365天深度学习训练营]中的学习记录博客** >- **🍖 原作者:[K同学啊]** 往期文章可查阅: 深度学习总结 任务说明:数据集中提供了火灾温度(Tem1)、一氧化碳浓度…

《操作系统 - 清华大学》5 -4:虚拟技术

文章目录 0. 虚拟存储的定义1. 目标2.局部性原理3. 虚拟存储的思路与规则4. 虚拟存储的基本特征5. 虚拟页式存储管理5.1 页表表项5.2 示例 0. 虚拟存储的定义 1. 目标 虚拟内存管理技术,简称虚存技术。那为什么要虚存技术?在于前面覆盖和交换技术&#…

MYSQL 表的增删改查(上)

目录 1.新增数据 2.查询数据 一般查询 去重查询 排序查询 关于NULL 条件查询 分页查询 1.新增数据 语法:insert into 表名[(字段1,字段2...)] values (值,值....); 插入一条新数据行,前面指定的列,要与后面v…

OSPTrack:一个包含多个生态系统中软件包执行时生成的静态和动态特征的标记数据集,用于识别开源软件中的恶意行为。

2024-11-22 ,由格拉斯哥大学创建的OSPTrack数据集,目的是通过捕获在隔离环境中执行包和库时生成的特征,包括静态和动态特征,来识别开源软件(OSS)中的恶意指标,特别是在源代码访问受限时&#xf…

[Docker-显示所有容器IP] 显示docker-compose.yml中所有容器IP的方法

本文由Markdown语法编辑器编辑完成。 1. 需求背景: 最近在启动一个服务时,突然发现它的一个接口,被另一个服务ip频繁的请求。 按理说,之前设置的是,每隔1分钟请求一次接口。但从日志来看,则是1秒钟请求一次&#xff…

如何寻找适合的HTTP代理IP资源?

一、怎么找代理IP资源? 在选择代理IP资源的时候,很多小伙伴往往将可用率作为首要的参考指标。事实上,市面上的住宅IP或拨号VPS代理IP资源,其可用率普遍在95%以上,因此IP可用率并不是唯一的评判标准 其实更应该关注的…

idea_卸载与安装

卸载与安装 卸载1、设置 -> 应用2、查找到应用,点击卸载3、把删除记录和设置都勾选上4、删除其它几个位置的残留 安装1、下载安装包2、欢迎安装 -> Next3、选择安装目录 -> Next4、创建快捷图标和添加到环境变量5、确认文件夹的名称 -> Install6、完成安…

【Axure高保真原型】天气模板

今天和大家分享天气模板的原型模板,里面包括晴天、多云、阴天、小雨、大雨、暴雨、强雷阵雨、小雪、中雪、大雪、暴雪、雨夹雪、微风、强风、狂风、龙卷风、轻雾、大雾等,后续也可以自行添加。 这个模板是用中继器制作的,所以使用也很方便&a…

深度学习模型:循环神经网络(RNN)

一、引言 在深度学习的浩瀚海洋里,循环神经网络(RNN)宛如一颗独特的明珠,专门用于剖析序列数据,如文本、语音、时间序列等。无论是预测股票走势,还是理解自然语言,RNN 都发挥着举足轻重的作用。…

Prometheus告警带图完美解决方案

需求背景 告警分析处理流程 通常我们收到 Prometheus 告警事件通知后,往往都需要登录 Alertmanager 页面查看当前激活的告警,如果需要分析告警历史数据信息,还需要登录 Prometheus 页面的在 Alerts 中查询告警 promQL 表达式,然…

深入理解 Java 基本语法之运算符

(一)研究背景 在 Java 编程中,运算符是处理数据和变量的基本工具,掌握各种运算符的使用方法对于提高编程效率至关重要。 (二)研究目的 深入理解 Java 基础运算符的概念、分类和作用,通过具体…

iOS 17.4 Not Installed

0x00 系统警告 没有安装 17.4 的模拟器,任何操作都无法进行! 点击 OK 去下载,完成之后,依旧是原样! 0x01 解决办法 1、先去官网下载对应的模拟器: https://developer.apple.com/download/all/?q17.4 …

Flink细粒度的资源管理

Apache Flink致力于为所有应用程序自动导出合理的默认资源需求。对于希望根据其特定场景微调其资源消耗的用户,Flink提供了细粒度的资源管理。这里我们就来看下细粒度的资源管理如何使用。(注意该功能目前仅对DataStream API有用) 1. 适用场景 使用细粒度的资源管理的可能…

Ubuntu20.04运行msckf_vio

文章目录 环境配置修改编译项目运行MSCKF_VIO运行 Launch 文件运行 rviz播放 ROSBAG 数据集 运行结果修改mskcf 保存轨迹EVO轨迹评价EVO轨迹评估流程实操先把euroc的真值转换为tum,保存为data.tum正式评估 报错1问题描述 报错2问题描述问题分析问题解决 参考 环境配…

计算机网络 第4章 网络层

计算机网络 (第八版)谢希仁 第 4 章 网络层4.2.2 IP地址**无分类编址CIDR**IP地址的特点 4.2.3 IP地址与MAC地址4.2.4 ARP 地址解析协议4.2.5 IP数据报的格式题目2:IP数据报分片与重组题目:计算IP数据报的首部校验和(不正确未改) …

Angular面试题汇总系列一

1. 如何理解Angular Signal Angular Signals is a system that granularly tracks how and where your state is used throughout an application, allowing the framework to optimize rendering updates. 什么是信号 信号是一个值的包装器,可以在该值发生变化时…

SAR ADC系列15:基于Vcm-Base的开关切换策略

VCM-Based开关切换策略:采样~第一次比较 简单说明: 电容上下极板分别接Vcm(一般Vcm1/2Vref)。采样断开瞬间电荷锁定,进行第一次比较。 当VIP > VIN 时,同时 减小VIP 并 增大VIN 。P阵列最高权重电容从Vcm(1/2Vref)…

实现Excel文件和其他文件导出为压缩包,并导入

导出 后端&#xff1a; PostMapping("/exportExcelData")public void exportExcelData(HttpServletRequest request, HttpServletResponse response, RequestBody ResData resData) throws IOException {List<Long> menuIds resData.getMenuIds();List<Co…

某车企ASW面试笔试题

01--背景 去年由于工作岗位的动荡&#xff0c;于是面试了一家知名车企&#xff0c;上来进行了一番简单的介绍之后&#xff0c;被告知需要进入笔试环节&#xff0c;以往单位面试都是简单聊聊技术问题&#xff0c;比如对软件开发的流程或者使用的工具等待问题的交流&#xff0c;…