【小白学机器学习20】单变量分析 / 0因子分析 (只分析1个变量本身的数据)

news2024/10/25 13:09:01

目录

1 什么是单变量分析(就是只分析数据本身)

1.1 不同的名字

1.2 《戏说统计》这本书里很多概念和一般的书不一样

1.3 具体来说,各种概率分布都属于单变量分析

2 一维的数据分析的几个层次

2.1 数据分析的层次

2.2 一维的数据为什么可以画成二维,但不是二维的?

2.2.1 什么是一维数据,什么是二维的数据?

2.2.2 具体

3 多维数据分析

3.1 一维的数据分析

3.2 二维的数据分析

3.3 3维的面

4  典型的单变量分析

4.1 正态分布

5 多变量分析

5.1 分析方法分类

5.2 自变量的个数

5.3 为什么又了单因素分析,还需要多因素分析呢?


1 什么是单变量分析(就是只分析1个变量数据本身)

  • 本质:就是只分析1个变量数据本身
  • 就是只分析一个变量的数据,就是单变量分析。
  • 如果非要,统一说成是那种回归模型/因果分析模型/相关分析的话,这个就算是0因子分析。

1.1 不同的名字

  • 单变量分析:模型里只有1个变量,只分析这一个变量的数据
  • 纯单个变量分析
  • 0因子分析 :如果一定要把所有分析都看成是因果分析,那么单变量分析,就是没有因子的因变量分析,或者是0因子的单个因变量分布

1.2 《戏说统计》这本书里很多概念和一般的书不一样

书里说的(和一般的说法不一样,但是可以对应起来)

  • 单变量分析,由点到线-------→一般书里没有这个说法
  • 双变量分析,由线到面 ------→单变量回归
  • 多变量分析,由面到体-------→多变量回归

1.3 具体来说,各种概率分布都属于单变量分析

因为这些概率分布,只分析这个概率序列的内部情况,和其他因素无关。

  • 0-1分布
  • 几何分布
  • 二项分布
  • 超几何分布
  • 正态分布
  • 泊松分布等

2 一维的数据分析的几个层次

2.1 数据分析的层次

  • 层次1:看到一群数据,散点堆在一起,注意到数据有不同差异
  1. 完全散在一群,但是堆起来并不好看
  • 层次2:看到一群数据,注意到这些数据的数值是不同的,可分类的
  1. 有序的整理起来,比如每个数值的堆在一起可以数数量,分堆分类,生活里常见,
  • 层次3:定类:进行分类:
  1. 对数据进行分类,具体相同特征的在一起分堆。
  2. 本质上,这个类别只有数据本身序列的话,这个分类一定是不同数值/数值区间出现的次数,就是频度。
  3. (而频度本质就是概率)
  • 层次4:定类且组合图形为1维:
  1. 为了连续性,分类数据,类别全部首位相接,就是统计和机器学习里,都有的数据条
  2. 有序的排起来,比如动动脑筋,把这些首尾相接起来,这就是一条直线,且按区间划分,且区间也是按从小到大排列的
  3. 一根线,数据分类条,每个类别的长度代表频度,全部首位相接,可以比较了
  4. 定距数据。可比较互相的长度。
  • 层次5:把一维的数据,展开为2维进行展示
  1. 把频度展开为直方图:把一维的数据,展开为2维进行展示。
  2. 注意,因为只有一种数据,还是一维的,
  3. 是看起来形式展开像2维一样。
  4. 更巧妙的是把这一根直线,切分,切成多根直线,并着放. 这个是什么呢?不是正态分布啊,至少不一定是.,这个其实更通用的说是频度图
  5. 频度图,算是分布图吗?现在看起来就很像整体分布曲线了,看起来像也不一定就是,如果能代表概率,才是概率分布曲线(频度约等于权重,概率)
  6. 横轴,值的区间划分
  7. 纵轴,不同值的频度(频度就是概率)

2.2 一维的数据为什么可以画成二维,但不是二维的?

2.2.1 什么是一维数据,什么是二维的数据?

一维数据图:图上无论是画成1条轴,或者2条轴,实际只有1个变量的数据

二维数据图:有2条轴,且实际确实有2个变量!

2.2.2 具体

一维的线,也是可以画出2个维度的轴,比如一个变量的数据

  • 前面的数据分类条,从一根线变成一个二维表现形式的坐标轴
  • 横轴,不同的数据值(可以是离散的点,或者离散区间段,甚至连续的点组成的线)
  • 纵轴,每个数据值的发生次数/出现次数=频度
  • 频度的这个二维坐标,可以想象就是把 一根线的数据分类条,分别截断后,按左右的顺序摆在一起,且下面因为是地面,地面相当于一根起点相同的轴,X轴。

3 多维数据分析

3.1 一维的数据分析

  • 模型中只有一个变量
  • 单变量分析-----可以认为是0因素分析,只分析因变量本身,没有自变量。
  • 就是个体数据,扩展到样本数据,从1个到多个。但都还是属于同一个变量!

3.2 二维的数据分析

2维的线,直接是2个明确的轴,轴1,轴2,两个轴都有实际意义

  • 横轴:一般是自变量
  • 纵轴:一般是因变量Y

3.3 3维的面

  •    横轴:自变量1
  •    纵轴:自变量2
  •    Z轴:因变量
     

4  典型的单变量分析

4.1 正态分布

  • 1 第1层次,元素数据按频度展开,展示自然分布
  • 2 多次抽样的平均值符合
  • 3 正态分布,标准化后就是概率图,并且是100% 无限逼近两边的
     

5 多变量分析

就是至少包含了2个变量的分析

5.1 分析方法分类

  • 可能是相关性分析,不分因果
  • 可能是回归分析,有前因后果,有1个因子,2个因子等等。

5.2 自变量的个数

  • 也就是只分析1因1果,多因1果,而不直接分析1果多因的情况
  • 自变量1,因变量1
  • 自变量N,因变量1
  • 自变量1,因变量N---错误!
  • 实际上,1果多因不符合函数
  • 实际上,集合和函数的映射关系,也是这个规律
  • 单设,满射都满足才是双射
  • 而不能是一因多果,这也函数都不是,也不能有得因,果,缺乏映射关系。

5.3 为什么又了单因素分析,还需要多因素分析呢?

  • 自变量N,因变量1
  • 自变量1,因变量1
  • 已经有了自变量1,因变量1这种单变量分析了,理论上,即使有多个因素都可以拆成,多个:1个自变量--对应因变量,这样的关系,分别去分析,为什么还要搞多因素分析呢?
  • 因为虽然自变量1,因变量1,这种线性回归,有截距,斜率, 也可以列出函数表达式/方程。 但是这个是单个的。
  • 单因素分析(双变量分析),得出的公式只是一个变量的。这个无法预测结果。因为预测结果,大多数情况下是多因素的,我们已知多因素都影响因变量。所以,只知道一个因素的影响,不足于列出完整方程/建模来预测。
  • 只有多变量分析,才能出一个多自变量的综合方程,可以体现多变量一起变化的影响。虽然每个自变量系数,都是在假设其他变量不变时求出来的(也只能这么求出来),然后获得统一的包含多因子在场的表达式,这也才能求总公式

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2223291.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

关于VSCode 一运行终端显示一行以后就剩光标的情况

在配置VSCode C的时候,我发现我每次点击运行,终端那显示: 终端被任务重用,按任意键关闭。 然后,后面终端就什么都没有了剩下一个终端在那里瑟瑟发抖: 然后紧接着弹出一个框: 这段说实话&…

Cursor零基础小白教程系列「技巧」 - Cursor 白嫖方案

最适合小白零基础的Cursor教程 网站lookai.top相同作者,最新文章会在网站更新,欢迎收藏书签 Cursor 白嫖方案 - 低调行事 Cursor简介及定价 前面我们提到了cursor 账户有三种性质 Hobby:免费计划,包括两周 Pro 试用期、每月 200…

室内地图制作-电子地图管理系统源代码公开-室内地图 开源-SDK调用指南(二)

一、室内外电子地图可视化制图项目需求 室内外地图开发需满足开发者可以在Android、iOs、web应用中加入地图相关的功能,包括:地图展示、地图交互、在地图上绘制路线、POI点、搜索、AR导航、蓝牙点位、离线地图等功能。 在开源室内地图编辑-电子地图管理…

003:无人机概述

摘要:本文介绍无人机的定义和分类、无人机系统定义、民用无人机驾驶员分类和应用领域。 一、无人机的定义和分类 1.无人机定义 无人机是一种能够在无人驾驶的条件下完成复杂空中飞行任务和各种负载任务的飞行器,可以被视为“空中机器人”。它利用先进的…

在3D Slicer中使用 Monai Bundle 和 Model Zoo 标注医学影像数据-分割肾子结构:皮质髓质和集合系统

文章持续更新,可以关注微公【医学图像人工智能实战营】获取最新动态。人手有限,文中涉及的链接前往微公对应文章查看。关注Tina姐,一起学习进步~ 在3D Slicer中使用 Monai Bundle 和 Model Zoo 标注医学影像数据-分割肾子结构:皮质…

git安装-Tortoise git 安装汉化教程

1. 安装git 2. 安装git图形化工具Tortoise git 3. 汉化 Tortoise git 汉化安装包

架构师知识梳理(十):系统架构设计与评估

架构基本概念 软件架构:从需求分析到软件设计之间的过渡过程称为软件架构,软件架构为软件系统提供了一个结构、行为和属性的高级抽象,由构件的描述、构件的相互作用(连接件)、指导构件集成的模式以及这些模式的约束组成…

iOS 18.2 可让欧盟用户删除App Store、Safari、信息、相机和照片应用

升级到 iOS 18.2 之后,欧盟的 iPhone 用户可以完全删除一些核心应用程序,包括 App Store、Safari、信息、相机和 Photos 。苹果在 8 月份表示,计划对其在欧盟的数字市场法案合规性进行更多修改,其中一项更新包括欧盟用户删除系统应…

WebGL编程指南 - 高级变换与动画基础

学习使用一个矩阵变换库,该库封装了矩阵运算的数学细节。快速上手使用该矩阵库,对图形进行复合变换。在该矩阵库的帮助下,实现简单的动画效果。 矩阵变换库:cuon-matrix.js OpenGL中的函数: 书中 cuon-matrix.js 函数…

华为配置BFD状态与接口状态联动实验

组网图形 图1 配置BFD状态与接口状态联动组网图 BFD简介配置注意事项组网需求配置思路操作步骤配置文件 BFD简介 为了减小设备故障对业务的影响,提高网络的可靠性,网络设备需要能够尽快检测到与相邻设备间的通信故障,以便及时采取措施&…

机器学习中的图像处理与计算机视觉

引言 在现代计算机科学中,图像处理和计算机视觉已成为最活跃的研究领域之一,这得益于机器学习和深度学习的发展。本文将深入探讨图像处理与计算机视觉的基础概念、常见应用、关键技术、常用工具,以及在这些领域中的代码示例。通过本篇文章&a…

pytorch 交叉熵损失函数 BCELoss

BCE Loss 交叉熵损失函数计算公式: BCE Loss - 1/n*(y_actual * log(y_pred) (1 - y_actual) * log(1 - y_pred)) t[i]为标签值:0或者1 o[i]是经过sigmoid后的概率值 BCEWithLogitsLoss 这个损失将Sigmoid层和BCELoss合并在一个类中。 BCEWithLog…

OSPF特殊区域及其他特性

不用的链路这状态信息没必要一直保存,要不路由器承受不了。用OSPF 特殊区域解决 1. Stub区域和Totally Stub区域 R1作为ASBR引入多个外部网段,如果Area 2是普通区域,则R3将向该区域注入5类和4类LSA。 当把Area 2配置为Stub区域后&#xff1a…

Qt项目实战:汉中转拼音(大写字母,首字母)

目录 一.汉字转换 1.加载拼音数据 2.初始化简拼数组 3.汉字转换拼音 4.汉字转简拼 5.首字母 二.效果 1.汉字转拼音 2.汉字转简拼 3.首字母 三.代码 1.h 2.cpp 汉字转拼音的小程序不仅在教育和日常生活中发挥着重要作用,还促进了跨文化交流与信息传播。…

【ubuntu18.04】ubuntu18.04安装vmware-tools之后立即适应窗口为灰色,窗口不会自适应

问题描述 ubuntu18.04安装vmware-tools 点击查看,看到立即适应窗口为灰色 解决方案 关闭虚拟机 编辑此虚拟机 设置 注意 取消勾选拉伸模式 查看可以看到所有选项可选择 注意: 不要全屏的时候查看,全屏看到的立即适应窗口就会显示…

Web,RESTful API 在微服务中的作用是什么?

大家好,我是锋哥。今天分享关于【Web,RESTful API 在微服务中的作用是什么?】面试题?希望对大家有帮助; Web,RESTful API 在微服务中的作用是什么? 在微服务架构中,Web 和 RESTful …

秦时明月2搭建笔记

1.具体配置 数据库不修改,如果修改了,gm那边也要 2.数据库 3.上传配置文件出现问题 参考:对于测试时,错误信息 Caused by: com.mysql.jdbc.PacketTooBigException: Packet for query is too large-CSDN博客 4.启动tomcat&#x…

技术成神之路:设计模式(二十三)解释器模式

相关文章:技术成神之路:二十三种设计模式(导航页) 介绍 解释器模式(Interpreter Pattern)是一种行为设计模式,用于定义一种语言的文法表示,并提供一个解释器来处理这种文法。它用于处理具有特定语法或表达…

【资深码农】环境搭建篇

导航 MockingBird仿生环境搭建seleniumchrome爬虫环境搭建1.1 安装selenium1.2 安装chrome driver1.3 测试1.4 常见问题驱动不一致原因解决办法最新版本获取 自动下载驱动 NLTK环境搭建opencv环境搭建pytorch环境搭建pyspark环境搭建1 安装环境1.1 jdk下载安装1.2 Scala下载安装…

零售行业 Web EDI 解决方案——知行之云LIP系统操作详解

通过浏览器,用户可以轻松访问知行之云LIP系统,便捷管理订单、发货等操作。如何低成本、高效地实现与主流电商平台的EDI对接?用户对接不同的交易伙伴,可能会遇到不同的EDI需求,这时就需要做个性化定制。本文将以零售行业…