关于折线回归

news2024/9/28 21:20:24

一、说明

        今天的帖子主要是关于使用折线回归找到最佳值。即将某条曲线分解成包络线段,然后用分段回归方式优化。但它也涉及使用 SAS 和 R 的剂量反应研究和样条曲线。这不是第一篇关于这些主题的文章,但我确实想在其中添加折线。只是因为它还在使用。

二、药物剂量的应用

        寻找最佳值并不是什么新鲜事。为了找到最佳值,您通常会进行剂量反应研究。剂量反应研究旨在找出物质的数量或接触量之间的关系(剂量)及其对动物的总体影响(反应)。要有效地设计剂量反应研究,您需要了解生物系统并提出一个有针对性的问题:

  1. 有剂量效应的生物学证据吗?
  2. 最佳剂量是多少?
  3. 需要什么剂量才能产生不同于对照/零反应的反应?
  4. 剂量关系的本质是什么?

        不同的变量可以通过不同的方式建立不同的关系。下面是示例(最大值、最小值、山脊和鞍点)。这些内容之前已在此处进行了展示和解释。

剂量反应关系(顺时针):最大、最小、鞍形和脊形。

        剂量反应最好以 3D 而不是 2D 方式探索,并且最好使用不同的视角来显示。正如您所看到的,两个或三个变量是可行的,但想象一下必须以图形方式表示 6 因素交互作用。如果没有某种形式的聚类,几乎不可能做到这一点。

响应面示例,在 SAS 中进行分析。

        每种剂量反应设计成功的关键是了解生物学。这听起来可能是一个悖论——如果您已经对剂量反应曲线有了很好的了解,为什么还要进行剂量反应设计呢?这是因为许多物质都遵循给定的化学式。因此,如果您已经了解了曲线,则可以最大化研究设计。这也带来了一个问题,因为方程的微小变化可能会导致剂量反应曲线的大幅波动。

        从 2D 到 3D。从剂量反应(左)到反应面(右)。响应面是一个山脊,这意味着我们无法看到整个关系,但它暗示着最小值。

有大量关于如何进行剂量反应研究的材料。

总之,如果您想找到最佳值,您需要以这样的方式设计和分析研究,以便您可以找到最佳值(如果它确实存在)。这意味着:

  1. 了解所包含变量的生物学。
  2. 了解他们是否以及如何相互作用。
  3. 创造一个可以实现最佳效果的机会之窗。
  4. 为一项研究提供动力,使机会之窗(如果它确实存在)变得可见。

三、样条曲线:别担心,我会保持简短

        这不会是我关于样条线的第一段文字,也不会是我的最后一段,但我将主要使用图形来保持简短。下面,您可以看到样条线基本上是如何由连接件组成的。该图还将帮助您理解什么是折线回归。这是一条分段线性线。

        样条曲线已经超越了许多形式的旧回归方法,例如折线或多项式回归,可以找到最佳值。这就是为什么我们在解决折线回归之前显示样条线的原因。虽然样条建模有更多的建模自由度,但它也有更多的自由度来创建一些非常奇怪的关系。

        以上三种回归形式:线性、样条、LOESS。执行样条或 LOESS 回归很容易,但过度拟合的危险是真实存在的。

        这里又举了两个例子,其中制作没有实际意义的曲线的危险是很容易完成的。请记住:我从一开始就说过,生物学、物理学、化学或任何潜在的因果机制都是至关重要的。并且优于无意识的统计拟合。

四、折线回归:以及为什么我们应该将其称为分段回归

折线回归有多个名称,其中包括:

1.分段回归

2.分段回归

3.断棍回归

4.曲棍球棒回归

也许,与其称之为折线,分段回归是一个更能说明问题的名称,因为它是该方法的核心。分段回归模型具有两个或多个子模型,每个子模型在解释变量的单独域上定义。最简单的分段回归模型假设:

  1. 当 X 小于某一阈值时,响应由一个参数模型建模。
  2. 当 X 大于阈值时,响应由一个参数模型建模。

阈值也称为断点、分割点、连接点或结点。

分段建模意味着分解数据。

        但是,正如我之前所说,还有更高级的数据建模方法。尽管如此,这不应消除使用折线回归或分段回归(或分段回归——无论你怎么称呼它)的需要。

        如今,建模变得相当容易。通过使用自动化,我们可以让算法找到最佳的切点。这种情况发生在各种回归中:多项式、分段、样条、LOESS、GAM 等。每次都会评估结果的可能性,直到找到最小值。

        但是,我们也可以手动完成。它所需要的只是了解底层数据,并寻找断点有意义的点。最后,断点是回归线最好采取不同路线以维持最小 RMSE 的点。

        您可以在下面看到,无论是在理论上还是在 SAS 中,如何使用不同的函数来拟合非线性曲线。折线是有道理的,但很多时候并不是最佳解决方案。

        正如您所看到的,折线模型包含这样的假设:末端部件遵循一条不同的路径到达末端。这就是为什么单个断点很少是不够的,并且需要添加更多断点。添加足够的量,最终会得到一条样条线。

综上所述,折线回归应该称为分段回归。分段回归只不过是:

  1. 分解数据
  2. 分别分析一下
  3. 连接数据
  4. 迭代该过程

记住!折线通常不能提供模型的最佳拟合。

五、SAS 和 SAS 中的折线回归R:为什么软件并不重要

数据并不总是适合任何形式的分段建模。明智地选择了模特。

尝试在此类数据上拟合折线是没有意义的。

        然而,这并不意味着不可能,正如您从下面的结果中看到的那样。不过,说实话,我宁愿符合大均值。

在SAS

        我们也可以在 R 中使用用于分析分段模型的包来执行相同的操作。

        在 R 中,您可以看到断点 (9.8) 和系数。

SAS 和 R 之间的结果比较。

正如您所看到的,数据来自随机块设计,因此我们可以添加随机组件 - 每个块 (ID) 一条折线。

每个 ID 的分段回归

        最后,我上面所做的大部分工作都是由 SAS 或 R 等程序自动完成的。请记住,简单的部分是建模,困难的部分是首先选择为什么要建模。如果一条断线真的有意义的话。

@marc.jacobs012

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1323322.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Axure中继器完成表格的增删改查的自定义元件(三列表格与十列表格)

目录 一、中继器 1.1 定义 1.2 特点 1.3 适用场景 二、三列表格增删改查 2.1 实现思路 2.2 效果演示 三、十列表格增删改查 3.1 实现思路 3.2 效果演示 一、中继器 1.1 定义 在Axure中,"中继器"通常指的是界面设计中的一个元素,用…

Redis 6 性能大揭秘:如何优化缓存命中率?

Redis 6的性能优化,特别是关于如何优化缓存命中率。 这篇文章会包含10个代码示例,帮助深入理解和应用相关的技巧 1、 监控缓存命中率 在优化之前,首先要了解当前的缓存命中率。Redis提供了INFO命令来查看性能指标,包括命中率。…

深度学习中的张量维度

1 深度学习中的张量 在深度学习框架中,Tensor(张量)是一种数据结构,用于存储和操作多维数组。张量可以被视为一种扩展的矩阵,它可以具有任意数量的维度。 在深度学习中,张量通常被用来表示神经网络的输入…

easylogging 的笔记

学习总结 应用在c的工程里 easylog是一个用于记录日志的工具,其中分出了7种级别:分别是INFO;DEBUG;WARNING;TRACE;VERBOSE;ERROR;FATAL。其中FATAL这个log的输出会导致程序运行的退…

剑指 Offer(第2版)面试题 41:数据流的中位数

剑指 Offer(第2版)面试题 41:数据流的中位数 剑指 Offer(第2版)面试题 41:数据流的中位数解法1:优先队列解法2:有序集合 双指针 剑指 Offer(第2版)面试题 41…

控制理论simulink+matlab

这里写目录标题 根轨迹二级目录三级目录 根轨迹 z [-1]; %开环传递函数的零点 p [0 -2 -3 -4]; %开环传递函数的系统极点 k 1; %开环传递函数的系数,反映在比例上 g zpk(z,p,k); %生成开环传递函数%生成的传递函数如下 % (s1) % -------------…

【HarmonyOS开发】ArkUI中的自定义弹窗

弹窗是一种模态窗口,通常用来展示用户当前需要的或用户必须关注的信息或操作。在弹出框消失之前,用户无法操作其他界面内容。ArkUI 为我们提供了丰富的弹窗功能,弹窗按照功能可以分为以下两类: 确认类:例如警告弹窗 Al…

GitBook安装及使用——使用 Markdown 创建你自己的博客网站和电子书

目录 前言一、依赖环境二、gitbook安装使用1.安装 gitbook-cli2.安装 gitbook3.Gitbook初始化4.创建你的文章5.修改 SUMMARY.md 和 README.md6.编译生成静态网页7.运行以便在浏览器预览8.运行效果 前言 GitBook是一个命令行工具,用于使用 Markdown 构建漂亮的博客网…

npm login报错:Public registration is not allowed

npm login报错:Public registration is not allowed 1.出现场景2.解决 1.出现场景 npm login登录时,出现 2.解决 将自己的npm镜像源改为npm的https://registry.npmjs.org/这个,解决!

鸿蒙4.0核心技术-WebGL开发

场景介绍 WebGL主要帮助开发者在前端开发中完成图形图像的相关处理,比如绘制彩色图形等。 接口说明 表1 WebGL主要接口列表 接口名描述canvas.getContext获取canvas对象上下文。webgl.createBuffer(): WebGLBuffernullwebgl.bindBuffer(target: GLenum, buffer: …

服务器数据恢复-EMC存储raid5磁盘物理故障离线的数据恢复案例

服务器数据恢复环境&故障: 一台emc某型号存储服务器,存储服务器上组建了一组raid5磁盘阵列,阵列中有两块磁盘作为热备盘使用。存储服务器在运行过程中有两块磁盘出现故障离线,但是只有一块热备盘激活,最终导致该ra…

Gin之GORM多表关联查询(多对多;自定义预加载SQL)

数据库三个,如下: 注意:配置中间表的时候,表设计层面最好和配置的其他两张表契合,例如其他两张表为fate内的master和slave;要整合其对应关系的话,设计中间表的结构为master_id和slave_id最好(不然会涉及重写外键的操作) 重写外键(介绍) 对于 many2many 关系,连接表…

智能优化算法应用:基于黑寡妇算法3D无线传感器网络(WSN)覆盖优化 - 附代码

智能优化算法应用:基于黑寡妇算法3D无线传感器网络(WSN)覆盖优化 - 附代码 文章目录 智能优化算法应用:基于黑寡妇算法3D无线传感器网络(WSN)覆盖优化 - 附代码1.无线传感网络节点模型2.覆盖数学模型及分析3.黑寡妇算法4.实验参数设定5.算法结果6.参考文…

Jenkins Docker Cloud在Linux应用开发CI中的实践

Jenkins Docker Cloud在Linux应用开发CI中的实践 背景 通过代码提交自动触发CI自动构建、编译、打包是任何软件开发组织必不可少的基建,可以最大程度保证产物的一致性,方便跨组跨部门协作,代码MR等。 Docker在流水线中越来越重要&#xff…

iPhone手机开启地震预警功能

iPhone手机开启地震预警功能 地震预警告警开启方式 地震预警 版权:成都高新减灾研究所 告警开启方式

蜘点云原生之 KubeSphere 落地实践过程

作者:池晓东,蜘点商业网络服务有限公司技术总监,从事软件开发设计 10 多年,喜欢研究各类新技术,分享技术。 来源:本文由 11 月 25 日广州站 meetup 中讲师池晓东整理,整理于该活动中池老师所分享…

YOLOv8改进 | 主干篇 | 轻量级网络ShuffleNetV2(附代码+修改教程)

一、本文内容 本文给大家带来的改进内容是ShuffleNetV2,这是一种为移动设备设计的高效CNN架构。其在ShuffleNetV1的基础上强调除了FLOPs之外,还应考虑速度、内存访问成本和平台特性。(我在YOLOv8n上修改该主干降低了GFLOPs,但是参数量还是有一定上涨&am…

【Docker】基础篇

文章目录 Docker为什么出现容器和虚拟机关于虚拟机关于Docker二者区别: Docker的基本组成相关概念-镜像,容器,仓库安装Docker卸载docker阿里云镜像加速docker run的原理**为什么容器比虚拟机快**Docker的常用命令1.帮助命令2.镜像相关命令3.容…

C语言—每日选择题—Day51

第一题 1. 对于函数void f(int x);,下面调用正确的是() A:int y f(9); B:f(9); C:f( f(9) ); D:xf(); 答案及解析 B 函数调用要看返回值和传参是否正确; A:错误&#xf…

【ArcGIS微课1000例】0081:ArcGIS指北针乱码解决方案

问题描述: ArcGIS软件在作图模式下插入指北针,出现指北针乱码,如下图所示: 问题解决 下载并安装字体(配套实验数据包0081.rar中获取)即可解决该问题。 正常的指北针选择器: 专栏介绍&#xff…