【小白学机器学习16】 概率论的世界观2: 从正态分布去认识世界

news2024/10/28 17:29:15

目录

1 从正态分布说起 

1.1 正态分布的定义

1.2 正态分布的名字

1.3 正态分布的广泛,和基础性

2 正态分布的公式和图形

2.1 正态分布

2.2 标准正态分布

3 正态分布的认识的3个层次

3.1 第1层次:个体的某个属性的样本值,服从正态分布

3.2 第2层次:抽样的误差,服从正态分布

3.3 第3层次:从标准正态分布去看,正态分布曲线就是概率曲线!

正态分布的本质就是概率

4 正态分布的特点

4.1 正态分布是客观的

4.2 万物不齐(从结果上看)

4.3 公平只是过程上的公平,而不能保证结果上的公平

4.4 钟形曲线,无限延申和逼近

4.5 中庸

4.6 动态平衡

4.7 规律是可用的,顺规律办事

4.7.1 不同的规律

4.7.2 使用规律

5 正态分布与标准值 ,概率

5.1 正态分布

5.2 正态分布的核心参数(所谓的6δ六西格玛)

5.3 关于标准值

5.4 关于标准正态分布

5.5 标准化数值得目的


正态分布,概率论都是一种世界观

1 从正态分布说起 

1.1 正态分布的定义

正态分布(Normal distribution),又称为常态分布或高斯分布,通常记作。其中, 是正态分布的数学期望(均值), 是正态分布的方差。μ = 0,σ = 1的正态分布被称为标准正态分布 [1]。

1.2 正态分布的名字

  • 正态分布 :Normal distribution
  • 自然分布
  • 常态分布
  • 高斯分布

1.3 正态分布的广泛,和基础性

  • 正态分布,在自然界广泛存在
  • 无论是宏观的世界,还是很多微观的研究
  • 因此,正态分布也称为了大家心里对概率估计的一个基础。
  • 比如
  1. 我们假设一个我们不知道的事件:包含2个基本事件,我们默认为是1:1,也就是50%概率
  2. 我们对于一个我们不知道的随机变量 ,我们会默认这个随机变量是符合正态分布的规律的

2 正态分布的公式和图形

2.1 正态分布

2.2 标准正态分布

  • 期望值μ=0,即曲线图象对称轴为Y轴,标准差σ=1条件下的正态分布,记为N(0,1)。

3 正态分布的认识的3个层次

3.1 第1层次:个体的某个属性的样本值,服从正态分布

  • 比如某个属性,
  • 按照样本的数据,横轴全部展开,为数值/数值区间
  • 根据不同的数值/数值区间,统计其频度,作为Y坐标
  • 可以看到,这个属性的频度图,就符合正态分布的曲线形状

3.2 第2层次:抽样的误差,服从正态分布

  • 比如某个属性,每次抽样100个数据,统计每次抽样的平均值
  • 连续抽样50次,
  • 横轴是这50次的平均值
  • 纵轴是这些平均值的频度/出现次数
  • 也是符合正态分布的

3.3 第3层次:从标准正态分布去看,正态分布曲线就是概率曲线!

正态分布的本质就是概率

  • 标准正态分布曲线
  • 在 -1标准差,+1标准差内,发生的概率是68%
  • 在 -2标准差,+2标准差内,发生的概率是95%
  • 在 -3标准差,+3标准差内,发生的概率是99%

4 正态分布的特点

4.1 正态分布是客观的

  • 世界是客观的,是不以人们的意志想法为转移的
  • 大地与山川,喷泉也是一个钟形曲线
  • 世界观是多样的,且可能在不同的情境下有用,比如地心说在日常的小范围围观环境下很实用。但是研究宇宙得用日心说。但是正态分布是我们遇到很多随机的对象都符合的一种分布类型。

4.2 万物不齐(从结果上看)

  • 万物不齐
  • 万物应该是按正态分布/自然分布的居多,所以一定是钟形曲线,大地也是平地+山峦
  • 喷泉也是一个钟形曲线
  • 因为万物不齐,所以需要单独的去认识每个事物。
  • 反之,否则之需要单独认识1个事物就可以认识整体了,这对于现实认知,显然是荒谬的。
  • 庄子:理想? 希望万物齐一
  • 孟子:事实求是,认为万物不齐。
  • 万物不齐天地事,大道之行是中庸。

4.3 公平只是过程上的公平,而不能保证结果上的公平

  • 结果的正确/正义无法保证
  • 只能从过程的正确/正义上去保证
  • 反而从辩证的角度看,正是因为,过程是公平的随机,结果才是不公平的

4.4 钟形曲线,无限延申和逼近

  • 正态分布/自然分布也说了这个问题,一定是中间大,两头小。
  • 从标准正态分布曲线上看,而且钟形曲线是无限的,趋近两边的极限无限接近但是永远无限延申下去,理论上可以覆盖所有情况。但是概率确是无限小。
  • 中间的比例是最高的,这个是基于正态分布来说
  • 越到两边,占比越少,只至长尾

4.5 中庸

  • 中间的比例是最高的,这个是基于正态分布来说
  • 中间这个值,很可能就是均值,且因为占比高,更具有代表性,
  • 越道两边,占比越少,只至长尾
  • 同样的X轴宽度下/标准差长度下,中间的聚集目的更高,面积大/概率高。两边概率低。
  • 而且如果不引入其他变量,那么正态分布的均值,就是预测将来发生值最好的值!

4.6 动态平衡

  • 钟形曲线,从顶上到两边,都是曲线,是不稳定的,不是静态平衡,只能是动态平衡。
  • 逆水行舟,不进则退。

4.7 规律是可用的,顺规律办事

4.7.1 不同的规律

  • 天之道,损有余而补不足
  • 人之道,损不足而补有余
  • 这是两种规律,规律是相对客观的,不变的,需要遵循,且可以利用模仿的。
  • 人们自发的,都是按照人之道而行事的。
  • 而人们也可以行天道,按天道的规律做事。从而对抗人之道的规律和结果。

4.7.2 使用规律

  • 从使用规律上来说,人定胜天,是人可以利用规律,我是这么理解的

5 正态分布与标准值 ,概率

5.1 正态分布

正态分布(Normal distribution),又称为常态分布或高斯分布,通常记作。其中, 是正态分布的数学期望(均值), 是正态分布的方差。μ = 0,σ = 1的正态分布被称为标准正态分布 [1]。

5.2 正态分布的核心参数(所谓的6δ六西格玛)

  • 第1: 均值
  • 第2: 标准差(sqrt-方差)
  • 第3: 隐藏参数:概率
  1. 概率就是把属于正态分布的样本值标准化后的图形了
  2. 隐藏的面积就是概率,和面积一一对应。
  3. 第3个概率,也被称为3δ原则,或者什么六西格玛原则:就是6δ。(听起来很高大上,实际就是正态分布)

5.3 关于标准值

  • 标准值=( x-u)/sd ,即以sd为量纲
  • 标准值,其实就是概率了,或者可以一一对应为概率了
  • 标准值,就是用 标准差来横向每个数值与 均值得距离,是n个多少个标准差。

5.4 关于标准正态分布

  • 标准正态分布,其实就是上面说的标准值的分布曲线。


5.5 标准化数值得目的

  • 是为了去除量纲得影响。
  • 标准值也是
  • 通过这种标准值得公式操作
  • 所有的数值,最后都是相关一套坐标系:标准正态分布的相同的量纲比较。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2225566.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

四、大模型(LLMS)langchain面

本文精心汇总了多家顶尖互联网公司在大模型进阶知识考核中的核心考点,并针对这些考点提供了详尽的解答。并提供电子版本,见于文末百度云盘链接中,供读者查阅。 一、大模型langchainmian • 一、什么是 LangChain? • 二、LangChain 包含哪些…

kafka 如何减少数据丢失?

大家好,我是锋哥。今天分享关于【kafka 如何减少数据丢失?】面试题?希望对大家有帮助; kafka 如何减少数据丢失? 1000道 互联网大厂Java工程师 精选面试题-Java资源分享网 Apache Kafka 是一个高吞吐量的分布式消息队列,广泛用…

FPGA第 13 篇,使用 Xilinx Vivado 创建项目,点亮 LED 灯,Vivado 的基本使用(点亮ZYNQ-7010开发板的LED灯)

前言 在FPGA设计中,Xilinx Vivado软件是一款功能强大的设计工具,它不仅支持硬件描述语言(HDL)的开发,还提供了丰富的图形化设计界面,方便用户进行硬件设计、调试和测试。这里我们将详细介绍,如…

Error in eval(family$initialize): y值必需满足0 <= y <= 1解决

今天在使用R语言对Weekly进行交叉验证时&#xff0c;发生如下报错&#xff1a; 错误于eval(family$initialize): y值必需满足0 < y < 1 错误代码为&#xff1a; Weekly<-read.csv("Weekly.csv") set.seed(1) attach(Weekly) glm.fit1 glm(Direction~Lag…

App测试环境部署

一.JDK安装 参考以下AndroidDevTools - Android开发工具 Android SDK下载 Android Studio下载 Gradle下载 SDK Tools下载 二.SDK安装 安装地址&#xff1a;https://www.androiddevtools.cn/ 解压 环境变量配置 变量名&#xff1a;ANDROID_SDK_HOME 参考步骤&#xff1a; A…

图---java---黑马

图 概念 图是由顶点(vertex)和边(edge)组成的数据结构&#xff0c;例如 该图有四个顶点&#xff1a;A&#xff0c;B&#xff0c;C&#xff0c;D以及四条有向边&#xff0c;有向图中&#xff0c;边是单向的。 有向 vs 无向 如果是无向图&#xff0c;那么边是双向的&#x…

汽车电子工厂中的防静电监控系统,你了解多少?

在汽车电子制造领域&#xff0c;静电放电(ESD)带来的危害不容忽视。微小的静电放电都可能导致电子元器件损坏&#xff0c;进而引发昂贵的返工、产品召回甚至安全事故。因此&#xff0c;有效的防静电监控系统成为汽车电子工厂保障产品质量和安全生产的关键。 传统的防静电措施主…

全面解释人工智能LLM模型的真实工作原理(三)

前一篇&#xff1a;《全面解释人工智能LLM模型的真实工作原理&#xff08;二&#xff09;》 序言&#xff1a;前面两节中&#xff0c;我们介绍了大语言模型的设计图和实现了一个能够生成自然语言的神经网络。这正是现代先进人工智能语言模型的雏形。不过&#xff0c;目前市面上…

深入分析梧桐数据库SQL查询之挖掘季度销售冠军

在现代商业环境中&#xff0c;对销售数据的深入分析是企业决策过程中不可或缺的一部分。通过分析销售数据&#xff0c;企业可以识别出表现最佳的员工&#xff0c;从而激励团队&#xff0c;优化销售策略&#xff0c;并提高整体业绩。本文将详细介绍如何使用SQL查询来识别每个季度…

Navicat导入Excel数据时数据被截断问题分析与解决方案

目录 前言1. 问题分析1.1 默认字段类型的影响1.2 MySQL诊断机制的限制 2. 解决方案2.1 修改字段长度2.2 修改Excel数据以影响推断2.3 检查导入工具的设置 3. 其他注意事项3.1 注册表的修改3.2 增加自增ID 4. 结语 前言 在数据库的日常操作中&#xff0c;将Excel数据导入MySQL是…

基于Python和OpenCV的疲劳检测系统设计与实现

项目运行 需要先安装Python的相关依赖&#xff1a;pymysql&#xff0c;Django3.2.8&#xff0c;pillow 使用pip install 安装 第一步&#xff1a;创建数据库 第二步&#xff1a;执行SQL语句&#xff0c;.sql文件&#xff0c;运行该文件中的SQL语句 第三步&#xff1a;修改源…

JVM(HotSpot):GC之G1垃圾回收器

文章目录 一、简介二、工作原理三、Young Collection 跨代引用四、大对象问题 一、简介 1、适用场景 同时注重吞吐量&#xff08;Throughput&#xff09;和低延迟&#xff08;Low latency&#xff09;&#xff0c;默认的暂停目标是 200 ms超大堆内存&#xff0c;会将堆划分为…

Unreal Engine5安装Niagara UI Renderer插件

系列文章目录 文章目录 系列文章目录前言一、如何下载安装Niagara UI Renderer插件 前言 在2024.10.24号的今天发现unreal engine官网已经没有虚幻商城了&#xff0c;取而代之的是FAB ‌虚幻商城已经停止运营&#xff0c;Epic Games推出了新的数字资产商店FAB。‌ Epic Games…

vue mysql 直连

最近又搞了个小项目&#xff0c;单机版本的内部考勤管理系统&#xff0c;直接部署在对方的工作电脑上&#xff0c;不需要在云端部署&#xff0c;因为项目本身就小&#xff0c;我就没配置后端同事进行开发&#xff0c;而是通过VUE直连mysql进行业务开发及保存。后期再通过PM2来守…

灵动AI:艺术与科技的融合

灵动AI视频官网地址&#xff1a;https://aigc.genceai.com/ 灵动AI 科技与艺术的完美融合之作。它代表着当下最前沿的影像技术&#xff0c;为我们带来前所未有的视觉盛宴。 AI 视频以强大的人工智能算法为基石&#xff0c;能够自动分析和理解各种场景与主题。无论是壮丽的自然…

快速搭建SpringBoot3+Prometheus+Grafana

快速搭建SpringBoot3PrometheusGrafana 一、搭建SpringBoot项目 1.1 创建SpringBoot项目 1.2 修改pom文件配置 <?xml version"1.0" encoding"UTF-8"?> <project xmlns"http://maven.apache.org/POM/4.0.0" xmlns:xsi"http://…

MySQL之数据库设计

前文我们了解了数据库中库、表等的操作&#xff0c;今天我们来学习如何设计数据库&#xff1f;&#xff1f; 在设计数据库前&#xff0c;我们先来了解什么是范式&#xff1f;&#xff1f; 1. 范式 数据库的范式是一组规则&#xff0c;在设计关系数据库时&#xff0c;遵从不同…

Elasticsearch 解析:倒排索引机制/字段类型/语法/常见问题

Elasticsearch 是一个分布式的开源搜索引擎&#xff0c;广泛用于全文搜索、分析和数据存储。它基于 Apache Lucene 构建&#xff0c;支持 RESTful 风格的 API&#xff0c;使得开发者能够高效地存储和检索数据。本文将详细讲解 Elasticsearch 的基本原理&#xff0c;特别是其倒排…

ctfshow(66->70)--RCE/命令执行漏洞--禁用命令执行函数

Web66 源代码&#xff1a; if(isset($_POST[c])){$c $_POST[c];eval($c); }else{highlight_file(__FILE__); }代码审计&#xff1a; POST传参c&#xff0c;eval进行代码执行。 思路&#xff1a; 由于题目过滤了命令执行函数&#xff0c;所以使用其他方法进行RCE。 先使用c…

一文讲明白大模型分布式逻辑(从GPU通信原语到Megatron、Deepspeed)

1. 背景介绍 如果你拿到了两台8卡A100的机器&#xff08;做梦&#xff09;&#xff0c;你的导师让你学习部署并且训练不同尺寸的大模型&#xff0c;并且写一个说明文档。你意识到&#xff0c;你最需要学习的就是关于分布式训练的知识&#xff0c;因为你可是第一次接触这么多卡…