从抛硬币试验看概率论的基本内容及统计方法

news2024/11/17 13:39:47

一般说到概率,就喜欢拿抛硬币做例子。大多数时候,会简单认为硬币正背面的概率各为二分之一,其实事情远没有这么简单。这篇文章会以抛硬币试验为例子并贯穿全文,引出一系列概率论和数理统计的基本内容。这篇文章会涉及的有古典概型、公理化概率、二项分布、正态分布、最大似然估计和假设检验等一系列内容。主要目的是以抛硬币试验为例说明现代数学观点下的概率是什么样子以及以概率论为基础的一些基本数理统计方法。

概率的存在性

好吧,首先我们要回答一个基本问题就是概率为什么是存在的。其实这不是个数学问题,而是哲学问题(貌似一般存在不存在啥的都是哲学问题)。之所以要先讨论这个问题,是因为任何数学活动都是在一定哲学观点前提下进行的,如果不明确哲学前提,数学活动就无法进行了(例如如果在你的哲学观点下概率根本不存在,那还讨论啥概率论啊)。

概率的存在是在一定哲学观点前提下的,我不想用哲学术语拽文,简单来说,就是你首先得承认事物是客观存在的,并可以通过大量的观察和实践被抽象总结。举个例子,我们经常会讨论“身高”,为什么我们都认为身高是存在的?因为我们经过长期的观察实践发现一个人身体的高度在短期内不会出现大幅度的变动,因此我们可以用一个有单位的数字来描述一个人的身体在一段不算长的时间内相对稳定的高度。这就是“身高”作为被普遍承认存在的哲学前提。

与此相似,人们在长期的生活中,发现世界上有一些事情的结果是无法预料的,例如抛硬币得到正面还是背面,但是,后来有些人发现,虽然单次的结果不可预料,但是如果我不断抛,抛很多次,正面结果占全部抛硬币次数的比率是趋于稳定的,而且次数越多越接近某个固定的数值。换句话说,抛硬币这件事,单次结果不可预料,但是多次试验的结果却在总体上是有规律可循的(术语叫统计规律)。

下面是历史上一些著名的抛硬币试验的数据记录:

试验者试验次数正面次数正面占比
德摩根4092204850.05%
蒲丰4040204850.69%
费勒10000497949.79%
皮尔逊240001201250.05%
罗曼洛夫斯基806403969949.23%

可以看到,虽然这些试验在不同时间、不同地点由不同的人完成,但是冥冥中似乎有一股力量将正面的占比固定在50%附近。

后来,人们发现还有很多其它不可预测的事情都与抛硬币类似,例如掷骰子、买六合彩等等,甚至渐渐发现不只这些简单的事情,人类社会方方面面从简单到复杂的很多不可预测的事情宏观上看都具有统计规律。于是人们推测,在某些条件下的一些不可预测事件,都是有统计规律的,或者直观说很多不可预测结果的试验在多次进行后总体上看结果会趋近于一些常数(这个现象后来被严格定义为大数定律,成为概率论最基础的定理之一,下文会提到)。这种可观测现象,成为概率存在的哲学基础,而这些常数就是概率在朴素观点下的定义。

概率模型

在认识到上述事实后,人们希望将这种规律加以利用(人类文明的发展不就是发现和利用规律么,呵呵),但是想要利用就首先要对概率进行严格的形式化定义,也就是要建立数学模型。比较知名的数学模型有古典概型、几何概率模型和公理化概率,本文将会讨论古典概型和公理化概率。

古典概型

古典概型是人类对概率和统计规律最早的建模尝试,表达了朴素的数学原则下人们对概率的认识。在表述古典概型之前,需要先定义一些概念。

首先是随机试验。

如果一个同时试验满足下面三条原则,则这个试验称为随机试验:

1、可在相同条件下(相对来说)重复进行。

2、可能出现的结果不止一个,但事先明确知道所有可能的结果(可以是无限个,例如所有自然数,但必须事先明确知道结果的取值范围)。

3、事先无法预测在一次试验中哪一个结果会出现。

显然上面的抛硬币试验是一个随机试验。

然后需要定义样本空间和样本点。一个随机试验的样本空间是这个试验所有可能结果组成的集合,而其中每个元素是一个样本点。例如,抛硬币试验中,样本空间为({F, B}),其中F表示正面,B表示背面,而F、B就是两个样本点。

另一个非常重要的概念就是随机事件(简称事件):样本空间的一个子集称为一个事件。例如,抛硬币试验有四个不同的事件:(\emptyset),({F}),({B}),({F, B}),分别表示“既不出现正面也不出现反面”,“出现正面”,“出现反面”和“出现正面或反面”。在不考虑硬币立起来等特殊情况时,第一个事件不可能出现,但它确实是一个合乎定义的事件,叫不可能事件;而最后一个事件必然出现,叫必然事件。

有了上面概念,就可以定义古典概型了:

如果一个概率模型满足 1)样本空间是一个有限集合,2)每一个基本事件(只包含一个样本点的事件)出现的概率相同,则这是一个古典概型。例如,在上面的抛硬币试验中,再定义({F}),({B})的概率均为0.5,则就构成了一个古典概型。

古典概型简单、直观,在早期的概率研究中广泛被使用。但是这个模型太朴素太不严格了,在这种不完善的定义下,根本没有办法做严格的数学推理,而且有限样本空间和等可能性在很多现实随机试验中并不满足,甚至对等可能不同定义会导致不同结论。因此必须使用一个更严格的定义,以符合现代数学公理化推导的要求,这就是公理化概率。

公理化概率

公理化概率对概率做如下定义:

概率是事件集合到实数域的一个函数,设事件集合为E,则如若(A\in E\overset{p}{\rightarrow}P(A)\in \mathbb{R})满足:

对于任意事件A,(P(A)\geq 0)。

对于必然事件S,(P(S)=1)。

对于两两互斥的事件,有(P(A_1\cup A_2\cup\cdots \cup A_n) = P(A_1)+P(A_2)+\cdots +P(A_n))。

公理化概率对概率做了严格的数学定义,可以较好的基于公理系统进行推导和证明。但是,概率模型只是给出了概率“是什么”(定性),没有回答“是多少”(定量)这个问题。也就是说,仅有概率模型,是不能定量回答抛硬币问题的。下面介绍对概率进行定量分析的方法。

度量与估计概率

从公理化概率的角度,我们可以这样定义抛硬币试验的概率:设(N)是全部抛硬币的次数,而(C_F)是正面向上的次数,则如下函数定义了这个概率:

(P(A)=\left{

\right.)

 

容易验证,这个定义完全符合公理化概率的所有条件。下面就是确定(N)和(C_F)。不幸的是,显然N是无法穷尽的,因为理论上你不可能抛无数次硬币。由于不能精确度量这个概率,因此你必须通过某个可以精确度量的值去估计这个概率,而且还要从数学上证明这个估计方法是靠谱的,最好能定量给出这个估计量的可信程度。而对不可直接观测概率的一个估计度量值就是频率。

频率估计

频率是这样定义的:事件A的频率是在相同条件下重复一个实验n次,事件A发生的次数在n次实验中的占比。一种简单的估计概率的方法就是用频率当做概率的估计。

例如,我刚刚抛完十次硬币,其中六次正面,四次背面,因此根据此次实验,我估计我这枚硬币出现正面的概率为0.6。这就是频率估计。

不过你一定有疑惑,为什么可以使用频率估计概率?有上面理论依据?如何对估计的准确性做出定理的分析?下面解答这些问题。

大数定律

频率估计的理论基础是大数定律。毫不夸张的说,大数定律是整个现代概率论和统计学的最重要基石,几乎一切统计方法的正确性都依赖于大数定律的正确,因此大数定律被有些人称为概率论的首要定律。

大数定律直观来看表述了这样一种事实:在相同条件下,随着随机试验次数的增多,频率越来越接近于概率。注意大数定律陈述的是一个随着n趋向于无穷大时频率对真实概率的一种无限接近的趋势。

下面给出大数定律的数理表述,大数定律有多重数学表述,这里取伯努利大数定律:

(\lim_n \to \infty}{P{\left{ \left\frac{n_xn} - p \right< \varepsilon \right}} = 1)

其中(n_x)表述在n次试验中事件x出现的次数。伯努利大数定律代表的意义是,当试验次数越来越多,频率与概率相差较大的可能性变得很小。大数定律从数学上严格证明了频率对概率的收敛性以及稳定性。这就是频率估计的理论基础。在后面关于中心极限定理的部分,还将定量给出估计的置信度(表示这个估计有多可靠)。

最大似然估计

下面给出另一种估计概率的方法,就是最大似然估计。最大似然估计是参数估计的一种方法,用于在已知概率分布的情况下对分布函数的参数进行估计。而这里分布函数的参数刚好是要估计的概率。

最大似然估计基于这样一个朴素的思想:如果已经得到一组试验数据,在概率分布已知的情况下,可以将出现这组试验数据的概率表述为分布函数参数的函数。

看到上面的话很多人肯定又晕了,我还是举个具体的例子吧(非数学严格的例子,但思想一致)。我来到一所陌生的大学门口,想知道这所大学男生多还是女生多,我蹲在校门口数了走出校门的100名同学,发现80个男生20个女生,如果我认为这所学校每个学生这段时间内出校门的概率都是差不多的,那么我会推断男生多。因为男生多的学校更大可能性产生我观察的结果。所以,最大似然估计的核心思想就是:知道了结果,但不知道结果所在总体的情况,然后计算在总体在每种可能下产生这个结果的概率,哪种情况下产生已知结果的概率最大,就认为这种情况是总体的情况。

下面正式使用这个方法估计硬币正面出现的概率。

还是上面的实验,我已经得到“抛了十次,六次正面”这个结果,下面我想知道正面向上的概率。由于这个概率是一定存在的(第一节已经说明了哈,在既定哲学观点下),而且这个概率的取值范围应该是0到1的开区间(正面背面都出现过,所以不可能是0或1):

(p\in (0,1))

由一些背景知识知道,每抛十次硬币,正面出现的次数服从二项分布:

(C_n^kp^k(1-p)^{n-k})

由于已知n=10,k=6,将其带入,得到一个函数:

(L(p)=C_{10}^6p^6(1-p)^{10-6})

其中p的定义域为(p\in (0,1))。这个函数表示的是,当出现正面的真实概率为p时,“抛十次六次正面”这个事件出现的概率。我们希望估计的p让这个函数取值最大,以下是求解过程:

因为在(0,1)区间,ln(x)是x的单调递增函数,所以最大化lnL(p)就等于最大化L(p)。这样做主要是取对数可以让连乘变成连加,方便后面求导。

由微积分知识可知:

(\frac{dlnF(p)}{dp}=C_{10}^6(\frac{6}{p}+\frac{4}{p-1})=C_{10}^6(\frac{10p-6}{p^2-p}))

让这个导数为0,解得p为0.6,这就是我们对概率的最大似然估计,与概率估计的结果一致。

显著性及假设检验

到此为止,我们已经说明了概率是存在的、建立了概率的数学模型,并能对不可直接观测的概率进行估计。但似乎还缺点什么。

大数定律只说明了理论上我们的估计是靠谱的,但是到底有多靠谱,却无法通过大数定律定量计算。这一节,我们就来解决这个问题:定量计算出估计的可靠性(术语叫显著性)。

评估显著性

还是上面我抛那十次硬币的试验。根据最优的频率估计和最大似然估计,均估计p(出现正面的概率)为0.6。但是如果有人提出异议,说我的估计可能是错的,p实际是0.5,我那个出现六次正面是因为只是偶然性的结果。这时我需要找证据反驳他,由于不能做无数次试验,我只能给出一个较高可信度的证据,例如,我想证明至少95%的可能性出现六次正面是因为p不等于0.5,也就是说,证明如果p为0.5,则偶然出现我这个结果的可能性不超过5%(5%称作显著水平)。

中心极限定理

要评估显著性,首先要借助于中心极限定理。中心极限定理也是统计学的基石定理之一,它的一种表述是:

设随机变量(X_1, X_2, \cdots ,X_n)独立同分布,且数学期望为(\mu),方差为(\sigma^2 \neq 0)。则其均值(\bar{X}=\frac{1}{n}\sum_{i=1}^{n}X_{i})近似服从期望为(\mu),方差为(\sigma/n)的正态分布。等价的,(\zeta_n=\frac{\bar{X} -\mu}{\sigma/\sqrt{n}})近似服从标准正态分布。

中心极限定理的直观意义是,随便一个服从什么的总体中,你独立随机的抽取一组样本,那么样本的均值服从正态分布,并且可以根据总体的期望和方差推导出这个均值服从的正态分布的期望和方差,然后简单变换一下就可以得到一个服从标准正态分布的随机量。由于标准正态分布的概率密度函数是已知的,那么就可以得到这个量出现的概率。

这样说貌似太抽象了,我们下面还是看这个定理的应用实例吧。

假设检验

上面说过,我要反驳的是抛硬币得到正面的实际概率是0.5,那么我就要证明如果p是0.5,则得到这组结果的概率是很小的(上面要求小于5%)。

设正面取值为1,背面取值为0。如果p是0.5,则每一次抛硬币的取值服从一个p为0.5的0-1分布。由期望及方差的定义可知,这个分布的期望和方差分别为:

(\mu = p\times 1 + (1-p)\times 0 = 0.5\times 1 + (1-0.5)\times 0=0.5)

(\sigma^2= (1-\mu)^2\times 0.5 + (0-\mu)^2\times 0.5 = 0.25\times 0.5 + 0.25\times 0.5 = 0.25)

由中心极限定理(\frac{\bar{X}-0.5}{\sqrt{0.25/10}})近似服从标准正态分布。

而我抛的十次硬币可以看做十个独立随机抽样,它们的均值是0.6,变换后的值为(\frac{0.6-0.5}{\sqrt{0.25/10}}\approx 0.632)。

标准正态分布的概率密度公式为:

(f(x) = {1 \over \sigma\sqrt{2\pi} },e^{- {{(x-\mu )^2 \over 2\sigma^2}}})

上面说过,我们希望显著水平是5%,所以,我需要找到x=z,使得此概率密度函数从-z到z的定积分为0.95,然后看0.632在不在[-z, z]内,如果在的话,我会认为我确实错了,至少我没有95%以上的把握说p不等于0.5,而如果0.632不再这个范围内,则我可以拍着胸脯说,我已经从理论上证明我有95%以上的把握,p不是0.5(换句话说,如果p是0.5,抛十次六次正面的可能性不足5%)。

坦白说这个z不是很好算,不过还好由于这东西特别常用,任何一本概率课本后面都可以找到标准正态分布表(或者很多工具如R语言可以直接计算分位点),下面就是我在网上找到的一个(来源http://www.mathsisfun.com/data/standard-normal-distribution-table.html):

 

9e4348baf8ced23551714f73545ccd5f.png

img

这是一个单侧表,要保证显著水平为5%,则单侧积分上限不能低于0.475,通过查上表,可知0.475对应的z是1.96,远大于我们算出的0.632。很不幸,我在5%的显著水平下无法拒绝p=0.5的假设。同时通过上表可以看到,0.63对应的单侧概率是0.2357,也就是说,通过抛十次得到六次正面,我们只有约50%的把握说出现正面的概率不是0.5。换句话说,抛十次硬币来做频率估计是不太合适的,于是,我们需要增加试验次数。

假如,我又做了100次实验,抛出了60次正面,40次背面。那么这个试验结果可以显著的认为p不是0.5吗?用同样的方法算出(\frac{0.6-0.5}{\sqrt{0.25/100}} = 2.0)。很显然,2.0大于1.96,所以这个试验结果可以充分(超过95%的可能)说明这枚硬币正面朝上的概率确实不是0.5。通过查表可以看到,2.0的显著水平约为0.046,换句话说,这次试验结果95.4%以上表明硬币正面出现的概率不是0.5。当然,也有可能结论是错误的,因为毕竟还有4.6%的可能这是在p=0.5的情况下偶然出现的。

通过假设检验理论,可以通过增加试验次数,将犯错的概率缩小到任意小的值。

总结

这篇文章以抛硬币试验为引子引出了一系列现代数学中概率的基本模型、定理及基本的估计及显著性检验方法。写这篇文章是我无聊抛硬币时一时兴起,其中对很多东西只是给出一个轮廓,没有处处给出严格的定义和证明,不过大约说明了常用的一些统计方法及其理论基础,限于篇幅不能面面俱到,例如一个假设检验如果展开写可以单独写一篇文章。目前随着大数据概念的热炒,基于互联网的数据挖掘和机器学习也变得火热,其实很多数据挖掘和机器学习都是基于概率和统计理论的,很多方法甚至只是传统统计方法的应用。因此如果准备在这方面深入学习,不妨考虑先在概率论和数理统计方面打好基础。

原文地址:从抛硬币试验看概率论的基本内容及统计方法

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1541949.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Java实现JDBC编程

1 数据库编程的必备条件 编程语言&#xff0c;如Java&#xff0c;C、C、Python等 数据库&#xff0c;如Oracle&#xff0c;MySQL&#xff0c;SQL Server等 数据库驱动包&#xff1a;不同的数据库&#xff0c;对应不同的编程语言提供了不同的数据库驱动包&#xff0c;如&#x…

【Linux】对进程地址空间的理解

一、关于进程地址空间的简单理解 进程地址空间其实是分了很多个区域的&#xff0c;区域划分的本质就是区域内的各个地址都是可以使用的。如同下面这个图所示&#xff1a; 无论是环境变量的地址还是环境变量表的地址&#xff0c;所存放的地址都在栈的上部。这里的已初始化数据和…

java多线程编程面试题总结

一些最基本的基础知识就不总结了&#xff0c;参考之前写的如下几篇博客&#xff0c;阅读顺序从上到下&#xff0c;依次递进。 java 多线程 多线程概述及其三种创建方式 线程的常用方法 java 线程安全问题 三种线程同步方案 线程通信&#xff08;了解&#xff09; java 线程池…

JavaEE企业级分布式高级架构师课程

教程介绍 本课程主要面向1-5年及以上工作经验的Java工程师&#xff0c;大纲由IT界知名大牛 — 廖雪峰老师亲自打造&#xff0c;由来自一线大型互联网公司架构师、技术总监授课&#xff0c;内容涵盖深入spring5设计模式/高级web MVC开发/高级数据库设计与开发/高级响应式web开发…

arm作业3

key_inc.c #include"key_inc.h"void key1_it_config(){//使能GPIOF外设时钟RCC->MP_AHB4ENSETR | (0x1<<5);//将PF9设置为输入模式GPIOF->MODER & (~(0x3<<18));//设置由PF9管脚产生EXTI9事件EXTI->EXTICR3 & (~(0XFF<<8));EXTI-…

微服务(基础篇-002-Ribbon)

目录 Ribbon负载均衡&#xff08;1&#xff09; 负载均衡的原理&#xff08;1.1&#xff09; 负载均衡策略&#xff08;1.2&#xff09; Ribbon-IRule(1.2.1) 修改负载均衡的方法&#xff08;1.2.2&#xff09; 懒加载&#xff08;1.3&#xff09; 饥饿加载&#xff08;1…

【Linux】模拟实现shell(bash)

目录 常见的与shell互动场景 实现代码 全部代码 homepath()接口 const char *getUsername()接口 const char *getHostname()接口 const char *getCwd()接口 int getUserCommand(char *command, int num)接口 void commandSplit(char *in, char *out[])接口 int execut…

python每日可视化分析:从过去到现代数据分析的演进

分析目标 本文旨在探索数据分析发展历程中的关键时刻&#xff0c;包括重要人物的贡献和大事件的发生。通过对比不同年代的数据分析技术和方法&#xff0c;我们可以更好地理解数据分析如何成为今天决策制定不可或缺的一部分。 分析步骤 收集数据&#xff1a;搜集关于数据分析历…

【Redis】优惠券秒杀

全局唯一ID 全局唯一ID生成策略&#xff1a; UUIDRedis自增snowflake算法数据库自增 Redis自增ID策略&#xff1a;每天一个key&#xff0c;方便统计订单量ID构造是 时间戳 计数器 Component public class RedisIdWorker {// 2024的第一时刻private static final long BEGIN…

微服务(基础篇-001-介绍、Eureka)

目录 认识微服务&#xff08;1&#xff09; 服务架构演变&#xff08;1.1&#xff09; 单体架构&#xff08;1.1.1&#xff09; 分布式架构&#xff08;1.1.2&#xff09; 微服务&#xff08;1.1.3&#xff09; 微服务结构 微服务技术对比 企业需求 SpringCloud(1.2) …

[BIT]智慧社区综合管理云平台需求文档

智慧社区综合管理云平台需求文档 目录: 智慧社区综合管理云平台需求文档一、 项目前景和范围文档1.业务需求1.1 项目前景1.2 主要特性1.2.1 安全监控1.2.2 社区服务1.2.3 电子化档案 1.3 假设与依赖 2.项目范围2.1 功能实现2.2 验收标准2.3 可交付成果2.4 项目的除外责任2.5 制…

基于SpringBoot+Vue+Mybatis的408刷题小程序管理端

简介 原始数据&#xff1a;书目信息、章节信息、题目信息、系统菜单、系统角色、系统用户。 主要任务&#xff1a;系统主要采用spring boot作为后端框架&#xff0c;前端使用vueelementUI&#xff0c;为408刷题小程序提供一个方面的管理和维护的任务&#xff0c;主要功能包括…

centos glibc 升级导致系统崩溃

centos 7.9默认的glibc为2.17&#xff0c;因为要安装一些软件&#xff0c;需要升级到glibc 2.18&#xff0c;而从源码进行编译和安装&#xff0c;安装失败&#xff0c;导致系统崩溃。 系统崩溃首先想到的是利用启动盘进行救援&#xff0c;而利用centos 7.9的启动盘始终无法挂载…

AI:152- 利用深度学习进行手势识别与控制

本文收录于专栏:精通AI实战千例专栏合集 从基础到实践,深入学习。无论你是初学者还是经验丰富的老手,对于本专栏案例和项目实践都有参考学习意义。 每一个案例都附带关键代码,详细讲解供大家学习,希望可以帮到大家。正在不断更新中~ 一. 利用深度学习进行手势识别与控制 …

jetcache 2级缓存模式实现批量清除

需求 希望能够实现清理指定对象缓存的方法&#xff0c;例如缓存了User表&#xff0c;当User表巨大时&#xff0c;通过id全量去清理不现实&#xff0c;耗费资源也巨大。因此需要能够支持清理指定本地和远程缓存的批量方法。 分析 查看jetcache生成的cache接口&#xff0c;并没…

nodejs+vue高校失物招领平台python-flask-django-php

时代在飞速进步&#xff0c;每个行业都在努力发展现在先进技术&#xff0c;通过这些先进的技术来提高自己的水平和优势&#xff0c;高校失物招领平台当然不能排除在外。高校失物招领平台是在实际应用和软件工程的开发原理之上&#xff0c;运用nodejs语言以及express框架进行开发…

如何在 Django 中使用 pyecharts

为项目新建一个目录&#xff0c;将其命名为django_pyecharts_demo, 在终端中切换到这个目录&#xff0c;并创建一个虚拟环境。 python -m venv django_pyecharts激活虚拟环境 django_pyecharts\Scripts\activate要停止使用虚拟环境&#xff0c;可执行命令 deactivate创建并激…

音视频领域首个,阿里云推出华为鸿蒙 HarmonyOS NEXT 版音视频 SDK

近日&#xff0c;阿里云在官网音视频终端 SDK 栏目发布适配 HarmonyOS NEXT 的操作文档和 SDK&#xff0c;官宣 MediaBox 音视频终端 SDK 全面适配 HarmonyOS NEXT。 此外&#xff0c;阿里云播放器 SDK 也在华为开发者联盟官网鸿蒙生态伙伴 SDK 专区同步上线&#xff0c;面向所…

Docker进阶:Docker-cpmpose 实现服务弹性伸缩

Docker进阶&#xff1a;Docker-cpmpose 实现服务弹性伸缩 一、Docker Compose基础概念1.1 Docker Compose简介1.2 Docker Compose文件结构 二、弹性伸缩的原理和实现步骤2.1 弹性伸缩原理2.2 实现步骤 三、技术实践案例3.1 场景描述3.2 配置Docker Compose文件3.3 使用 docker-…

6.4 Dropout正则化

1、Dropout Dropout是一种正则化技术&#xff0c;通过防止特征的协同适应&#xff0c;可用于减少神经网络中的过拟合。 Dropout的效果非常好&#xff0c;实现简单且不会降低网络速度&#xff0c;被广泛使用。 特征的协同适应指的是在训练模型时&#xff0c;共同训练的神经元…