概率统计与计算机技术的联系及在生活当中的应用研究

news2024/11/25 14:42:19

title: 概率统计与计算机技术的联系及在生活当中的应用研究
date: 2023-05-16 11:42:26
tags:


题目:概率统计与计算机技术的联系及在生活当中的应用研究

摘 要

概率论与数理统计是研究随机现象统计规律性的一门学科,是理工科各专业的一门重要的基础课程,一方面,它有别开生面的研究课题,有自己独特的概念和方法,内容丰富,结果深刻;其理论方法独特、抽象,既有严密的数学基础,又与众多学科有着密切的联系。随着科学技术,尤其是计算机的迅速发展,它已广泛应用于经济管理、工程技术、金融、生物、环境、国防等领域。

**关键词:**概率统计;日常生活;应用;统计规律;数学;计算机技术;

**
**

一、引言

概率统计以自然界的随机现象为研究对象,它与人们的日常生活有着密切的联系.结合具体生活实际,对概率统计的应用进行全面分析,有利于增强人们行动的自觉性,防止上当受骗.文章主要结合具体实例,通过计算分析得出相应的结论,以更好地指导人们的日常行动.

二、概率统计

概率统计是一种研究自然界中随机事件统计规律的数学方法,它包括概率论和统计学。概率是概率论的基本概念,又可以称作或然率、机会率、机率(几率)或可能性。概率是对随机事件发生的可能性的一种估量。一般情况下,在0到1之间的实数代表着一个事件发生的可能性大小。该事件越接近1越有可能发生;越接近0越不可能发生。比如一个没有复习到位的人能有百分之多少的把握能顺利通过考试,或者抛硬币等这些都是属于概率问题。统计是一门以概率论为理论基础与数据有关的学问,它是一种通过描述数据特征从而探索数据规律的方法。一个学校的升学和就业情况、学生体能测试结果、公司的经营成本和收益等都是与统计有关系的。生活和工作中处处充满着概率数据,概率统计与人们的实际生活有着密切的联系,并对日常生活生产和科学研究等起着越来越重要的作用。生活中的概率统计问题有时出乎人们的预料,但了解概率统计在----实际生活中的应用,根据概率统计透过事情现象看到本质,我们就可以简单地去解决生活中的一些问题。

三、随机数与伪随机数的生成

3.1在生活中,最困扰人们的一个问题就是如何做出一个无关痛痒、随意的选择―-随机数。随机数最重要的特性是它在产生时后面的那个数与前面的那个数毫无关系,因而可以给人们一种下一状态不可测的感觉,广泛地应用于抽奖、密码学中。真正的随机数是使用物理现象产生的:比如掷钱币、骰子、转轮、使用电子元件的噪音、核裂变等等。在真正关键性的应用中,比如在密码学中,人们一般使用真正的随机数,这样的随机数生成器属于物理性随机数生成器,但是对技术的要求比较高。所以在实际应用中往往使用伪随机数就足够了。这些数列是“似乎”随机的数,实际上它们是通过一个固定的、可以重复的计算方法产生的。它们并不真正地随机,因为它们实际上是可以计算出来的,但是它们具有类似于随机数的统计特征。这就是伪随机数生成器,按一定的算法和种子值生成。

3.2而在计算机中, 还可以通过梅森旋转算法快速产生高质量的伪随机数。通常使用两个相近的变体,不同之处在于使用了不同的梅森素数。一个更新的和更常用的是MT19937,32位字长。还有一个变种是64位版的MT19937-64。对于一个k位的长度,梅森旋转算法会在[0,2k-1]的区间之间生成离散型均匀分布的随机数。伪随机数的一个特别大的优点是它们的计算不需要外部的特殊硬件的支持,因此在计算机科学中伪随机数依然被使用。真正的随机数必须使用专门的设备,比如热噪讯号、量子力学的效应、放射性元素的衰退辐射,或使用无法预测的现象,譬如用户按键盘的位置与速度、用户运动鼠标的路径坐标等来产生。

3.3蒙特卡罗方法的计算机实现

蒙特卡罗方法, 是一种使用随机数, 或更常见的伪随机数来解决很多计算问题的方法,也称统计模拟方法,是二十世纪四十年代中期由于科学技术的发展和电子计算机的发明,而被提出的一种以概率统计理论为指导的一类非常重要的数值计算方法。蒙特卡罗方法在金融工程学,宏观经济学,生物医学,计算物理学(如粒子输运计算、量子热力学计算、空气动力学计算)等领域应用广泛。

当所求解的问题本身具有内在的随机性,借助计算机的运算能力可以直接模拟这种随机的过程,例如在核物理研究中,分析中子在反应堆中的传输过程。而当所求解问题可以转化为某种随机分布的特征数,比如随机事件出现的概率,或者随机变量的期望值。通过随机抽样的方法,以随机事件出现的频率估计其概率,或者以抽样的数字特征估算随机变量的数字特征,并将其作为问题的解。这种方法多用于求解复杂的多维积分问题。

假设我们要计算一个不规则图形的面积,那么图形的不规则程度和分析性计算(比如积分)的复杂程度是成正比的。蒙特卡罗方法基于这样的思想:假想你有一袋豆子,把豆子均匀地朝这个图形上撒,然后数这个图形之中有多少颗豆子,这个豆子的数目就是图形的面积。当你的豆子越小,撒的越多的时候,结果就越精确。借助计算机程序可以生成大量均匀分布坐标点,然后统计出图形内的点数,通过它们占总点数的比例和坐标点生成范围的面积就可以求出图形面积。通过一些数学上的关系和计算公式,可以计算出一些特殊常数、参数的数值。

此外对一些难以直接计算出的积分也可以使用此方法来估算,对被积函数变量区间进行随机均匀抽样,然后对被抽样点的函数值求平均,从而可以得到函数积分的近似值。此种方法的正确性是基于概率论的中心极限定理。当抽样点数为m时,使用此种方法所得近似解的统计误差只与m有关,不随积分维数的改变而改变。因此当积分维度较高时,蒙特卡罗方法相对于其他数值解法更优。

四、计算机数学软件与数理统计

在回归分析中,两个随机变量X,Y之间存在着某种相关关系,尤其在物理实验中,常常通过作图法得到一条直线,其斜率的值是一个包含所测物理常量的表达式,从而得出所测物理量。常见的就是一种线性关系,通过最小二乘法来逼近和拟合,可以近似的得到X,Y之间的线性关系。

而通常的作图由于人眼本身的局限性,较难十分准确的做出最小二乘下的拟合直线,存在偏差,而直接使用最小二乘法计算有十分繁杂,从而有了数学软件的使用, 如MATLAB等, 可以十分方便地得出拟合曲线方程的各个参数。极大地减少了人的工作量,并且精确性也较高。

**五、**计算机技术对概率论和数理统计的贡献具体例子

计算机科学与技术的发展极大地促进了概率论、数理统计方面工作的进步,大大提高了解决此类问题的效率与准确度,减少了计算上的复杂度。并且人们可以利用计算机程序来模拟现实生活中难以进行或者重复性较高的试验,(如模拟演示投掷硬币的试验)从而得出一个可以接受的结果,作为实验的数据,得出一个较为可靠的结论。

计算机模拟演示DeMovire-Laplace中心极限定理。通过选取不同的参数n,演示随机序列前n项和的分布逐步趋向正态分布的过程。若随机变量X~B(n,p),(0<p<1)的二项分布,则随着n的增大,X近似服从参数为np和np(1-p)的正态分布;以及局部极限定理的结论,即X在某一点的概率近似等于在该点的正态分布的密度函数值。

中心极限定理中,对于独立同分布的随机变量X1,X2,X3…Xn,E(Xi)=μ,D(Xi)=σ2,i=1,2,⋯有

img

即这些随机样本的均值总是围绕在总体均值周围,且分布近似呈正太分布

则可以利用PYTHON采用对中心极限定理进行简单验证具体实例过程如下:

文本框: import matplotlib.pyplot as plt import math import random as rd n=30  ##单次试验的样本数量 epoch=1000  ##试验次数 res=[0]*(n+1) for i in range(epoch):     average=0     for j in range(n):         average+=math.sin(rd.random()*math.pi/2)     res[round(average)]+=1   # 显示高度 def autolabel(rects):     for rect in rects:         height = rect.get_height()         plt.text(rect.get_x()+rect.get_width()/2.- 0.2, 1.03*height, '%s' % int(height))   name_list = range(0,n+1) num_list = res autolabel(plt.bar(range(len(num_list)), num_list, color='rgb', tick_label=name_list)) plt.show()

得到下图

IMG_256

从上图的运行结果来看当前结果已经和理论值非常接近了,能够做到简单验证中心极限定理

可见,计算机能够使得概率论的试验更为简便,并且能够演示一些较为抽象概念和理论,加深我们的理解,为理论证明提供了强有力的工具和方法。

**六、**概率统计在计算机技术中的具体应用例子

计算机中的模式识别,是通过计算机用数学技术方法来研究模式的自动处理和判读。

而在这其中应用到的贝叶斯决策,就是在贝叶斯公式计算出后验概率的基础上,进一步做归属的决定——分类,根据观测对样本做出应该归属于哪一类的决策。

其中所利用到贝叶斯公式的思想和理论:

img
代表样本X在某一类别ωi 中出现的概率,该样本也可能出现在其它的类别中,记作条件概率,是在特定类别这个条件下出现的概率。

当根据经验及有关材料推测出主观概率后,对其是否准确没有充分把握时,可采用概率论中的贝叶斯公式进行修正,修正前的概率称为先验概率,修正后的概率称为后验概率

· 后验概率:
img

· img

· 其中P(X)表示样本X在所有类别中出现的概率之和最大

·

贝叶斯决策其中主要包括两种决策方式,即最小错误贝叶斯决策,和最小风险贝叶斯决策。前者是在比较理想或者各类类别地位均等的情况下的决策,而后者则要考虑决策本身带来的代价和各类别地位的不均等。

最小错误贝叶斯决策:

在一般的模式识别问题中,人们往往希望尽量减少分类的错误,即目标是追求最小错误率。从最小错误率的要求出发,利用概率论中的贝叶斯公式,就能得出使错误率最小的分类决策,称之为最小错误率贝叶斯决策。

将损失定义为0-1损失

                         ![img](https://farsblog.oss-cn-beijing.aliyuncs.com/PicGo/202305161136655.gif)

化简条件风险

img

选择后验概率最大的分组或者类,则判断正确的可能性就是最大的,进而犯错的概率就是最小的,即最小错误贝叶斯决策 = 最大后验贝叶斯决策。由于概率非负,如果每一次决策错误率都最小,那么总的错误率也是最小的。

最小风险贝叶斯决策:

据具体的场合不同,我们应关心的有可能并不仅仅是错误率,而是错误所带来的损失,同样,在癌细胞识别的例子中,我们不但应该关心所作的决策是否错误,更应该关心决策错误所带来的损失或风险。比如,如果把正常细胞误判为癌细胞,会给病人带来精神上的负担和不必要的进一步检查,这是一种损失﹔反之,如果把癌细胞误判为正常细胞,则损失更大,因为这可能会导致病人丧失了宝贵的早期发现癌症的机会,可能会造成影响病人生命的严重后果。将这两种类型的错误一视同仁来对待,在很多情况下是不恰当的。

设对于实际状态为wj的向量x采取决策αi所带来的损失为

img

计算出条件风险:

img

选择风险最小的决策:

img

选择决策风险最小的分组或者类,当不同的决策所带来的的代价不相同时,我们会为每个决策添加不同的权重

可见,概率统计在计算机技术中的应用有着至关重要的地位,在模式识别可以通过贝叶斯决策作为最优的决策,可以使决策的错误率达到最小,或者是其他设定规则下的最优结果。除此之外,概率统计还应用在计算机技术的其他方方面面。

七、研究概率统计在实际生活中的应用意义

概率统计与人们的日常行为有着密切的联系,人们在日常生活中随时随地都会与概率统计打交道.例如,保险行业、抽奖活动、生活游戏等等,都会出现概率统计的知识,而一些消费者如果缺乏概率统计的相关知识,往往会作出不理性的选择,对自己造成不利影响.事实上,在这些活动中,商家往往会利用概率统计的有关内容,再加上一些消费者抱有侥幸心理,认为通过概率统计的内容,自己会侥幸成为幸运者,而商家却获取巨大的利润.因此,结合具体的生活实际,探讨分析概率统计问题,有利于全面认识某些活动的本质现象,进而增强人们日常行为的自觉性,使人们在从事某种消费活动的时候作出更为理性的选择,从而维护自己的正当利益,避免发生不必要的损失.

八、总结

我们的日常生活生产和工作中处处充满着概率统计,与此同时概率统计理论与方法的应用也遍及计算机科学与技术领域。概率统计的应用范围是十分广泛的,它可以帮助我们提高彩票中奖率、计算考卷分数和面试通过率、了解体育比赛中的可能性和促进产品的促销等方方面面。虽然我们不能准确的预测一个事情在将来发展的情况,但利用概率统计,我们能更好地去处理不确定的因素与可能,为我们的生活生产和工作带来便利。因此我们要学好概率统计,对生活中的某些偶然事件做出理性的分析,从而充分发挥概率统计的指导作用,也为人类的发展做出自己的一份贡献。

参考文献

[1]论概率统计方法在教学中的应用[J]. 何林海. 湖北开放职业学院学报. 2019(03)

[2]分层教学为主的《概率论与数理统计》的教学研究[J]. 汤文菊,方成鸿,方小洪. 内江科技. 2020(03)

[3]概率统计方法在我国人口统计研究中的应用初探[J]. 刘珠. 当代经济科学. 1993(04)

[4]概率统计方法的应用案例研究[J]. 姜丽颖,张国林. 教育现代化. 2019(81)

[5]基于概率统计方法确定油滴电荷量[J]. 冯德军,鲁晓东,傅武伟,费玉良,黄孝肖. 科技资讯. 2011(01)

[6]客观现象的概率统计解释举例[J]. 苑延华,徐莹,陈洪海. 价值工程. 2011(15)

[7]模式识别(第三版)[M]. 张学工. 2010年8月第3版. 北京清华大学:清华大学出版社, 2010

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/534585.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

shell免交互

shell免交互 Here Document 免交互 使用I/O重定向的方式将命令列表提供给交互式程序或命令&#xff0c;比如 ftp、cat 或 read 命令。 是标准输入的一种替代品可以帮助脚本开发人员不必使用临时文件来构建输入信息&#xff0c;而是直接就地生产出一个“文件”并用作“命令”的…

Python 爬虫(四):Selenium 框架

Selenium 是一个用于测试 Web 应用程序的框架&#xff0c;该框架测试直接在浏览器中运行&#xff0c;就像真实用户操作一样。它支持多种平台&#xff1a;Windows、Linux、Mac&#xff0c;支持多种语言&#xff1a;Python、Perl、PHP、C# 等&#xff0c;支持多种浏览器&#xff…

Android中的IPC方式

Android中的IPC方式 1.Bundle 其中Intent就是用Bundle进行传播 四大组件间的进程间通信 2.使用文件共享 2.1文件共享的缺点 无并发&#xff0c;适用于交换简单的数据实时性不高的情景 使用文件共享容易出&#xff1a; 内容不一致&#xff1a;如果多个线程同时写入文件&…

【JavaWeb】-- Request和Response、JSP、会话技术

文章目录 Request和Response1.概述2.Request对象2.1 Request继承体系2.2Request获取请求数据2.3 IDEA创建Servlet2.4 请求参数中文乱码问题POST请求解决方案GET请求解决方案 2.5 Request请求转发 3.Response对象3.1 Response设置响应数据功能介绍3.2 Response请求重定向3.3 路径…

RabbitMQ养成记 (8. 消费者接受消息可靠性 consumer Ack)

Consumer Ack ack 指的是acknowledge 确认&#xff0c; 指的是消费端收到消息后的确认方式。 有三种确认方式&#xff1a; 自动确认手动确认 &#xff08;根据业务情况 手动确认是否成功发送&#xff09;根据异常情况确认 我们在消费端用代码实践一下&#xff1a; 首先我们定…

不会还有人不知道软件测试报告模板怎么写吧?

在测试岗位上&#xff0c;写报告是一项非常重要的软技能&#xff0c;写得好可以加分&#xff0c;写不好必然减分。 但在测试岗位上&#xff0c;提测“通过”和提测“不通过"的软件测试报告所包含的内容是不一样的&#xff08;这是个坑&#xff09;。但很多测试新人可能并…

LIO-SAM UBUNTU16.04.7 ROS-KINETIC 环境 编译 安装

简单记录一下 VMWARE workstation15UBUNTU16.04.7ros-kineticgtsam4.0.0 &#xff08;默认16.04比较老旧&#xff0c;不好用&#xff0c;vmtools也都没有&#xff0c;选了一个.7&#xff09; 选16.04版本的理由也简单&#xff0c;只是为了参考一个博客&#xff0c;单独建的环…

C语言-易错点汇总

易错点汇总 指针数组和数组指针(*p).astruct stdent和typedef struct stdentF5和CtrlF5const的位置全局变量和局部变量两个相同的常量字符串数组名和&数组名数组指针定义的解读int (*arr[10])[5]数组传参(* (void (*)())0)();关于数组名是否表示整个数组和数组首元素的地址…

Java位运算

Java >>和>>>的区别 | 或&#xff1a; 有1得1&#xff0c; 全0得0 int temp a|c;System.out.println(Integer.toBinaryString(a));System.out.println(Integer.toBinaryString(c));System.out.println(Integer.toBinaryString(temp));/*** 结果输出* * 01* …

对比SQL学Python:筛选|条件判断

SQL里筛选数据主要用到了where、and、in等语句。而在Python里实现筛选的方式比较多样&#xff0c;用到了 与&或|非~ 逻辑运算符&#xff0c;和isin()函数等。我们感受一下二者的区别吧&#xff1a; 汇总&#xff1a; 类型Python语句参考单条件筛选 data[data[shop_type]A…

Python复制目录及其子目录下的所有文件到指定新目录并重命名

Python复制目录及其子目录下的所有文件到指定新目录并重命名 前言前提条件相关介绍实验环境Python复制目录及其子目录下的所有文件到指定新目录并重命名代码实现输出结果 前言 本文是个人使用Python处理文件的电子笔记&#xff0c;由于水平有限&#xff0c;难免出现错漏&#x…

最常用的界线矢量数据大合集(文末有附下载方法)

最近收集了挺多比较常用的矢量界线数据&#xff0c;例如地理分区、气候分区等界线数据&#xff0c;在日常制图、学习、科研等方面使用频率比较高。废话不多说&#xff0c;这里给大家分享一下&#xff01;&#xff01; 1、中国农业熟制区划矢量数据 2、黄土高原空间范围矢量数据…

【Leetcode -509.斐波那契数 -520.检测大写字母】

Leetcode Leetcode - 509.斐波那契数Leetcode - 520.检测大写字母 Leetcode - 509.斐波那契数 题目&#xff1a;斐波那契数 &#xff08;通常用 F(n) 表示&#xff09;形成的序列称为 斐波那契数列 。 该数列由 0 和 1 开始&#xff0c;后面的每一项数字都是前面两项数字的和。…

node笔记_koa框架是什么?

文章目录 ⭐前言⭐ koa框架是如何发展而来的&#xff1f;⭐ koa框架的基本使用&#x1f496; 安装 koa&#x1f496; koa的Middleware示例&#x1f496; 支持xml ⭐ 结束 ⭐前言 大家好&#xff0c;我是yma16&#xff0c;本文介绍node的一个web框架koa。 往期文章 node_window…

第三章: Mybatis-Plus 的通用CRUD API 练习使用

目录 1. Insert 操作 -> Create 1.1: TableId 的 id策略 1.2: TableField 2. Update 操作 -> Update 2.1: 根据 ID 更新 2.2: 根据条件更新 3. Delete 操作 -> Delete 3.1: deleteById 3.2: deleteByMap 3.3: delete 3.4: deleteBatchIds 4. Select 操作 -&g…

Redis修炼 (15. redis的持久化-RDB)

RDB 就是 redis database backup file 数据备份文件 就是把内存中的所有数据都保存在磁盘中。 save 注意这个保存过程是主进程在做 因为redis 是单线程 所有其他所有请求都会被卡死。 bgsave 这个稍微友好一点 是子进程 执行&#xff0c;避免主进程收到影响。 redis在服务停机…

【JavaWeb】-- Maven基础、MyBatis

文章目录 Maven基础1.Maven简介1.1 Maven模型1.2 仓库 2.Maven安装3.Maven基本使用3.1 Maven常用命令3.2 Maven生命周期 4.IDEA使用Maven4.1 IDEA配置Maven环境4.2 Maven坐标4.3 IDEA 创建Maven项目 5.依赖管理5.1 使用坐标引入jar包5.2 依赖范围 MyBatis1.MyBatis概述1.1JDBC的…

JDK、JRE和JVM三者的区别和联系

一、JDK、JRE、JVM分别是什么 &#xff08;一&#xff09;JDK JDK&#xff0c;全称Java Development Kit&#xff0c;是 Java 语言的软件开发工具包&#xff0c;主要用于移动设备、嵌入式设备上的Java应用程序。JDK是整个Java开发的核心。 &#xff08;二&#xff09;JRE J…

Day970.数据库表解耦 -遗留系统现代化实战

数据库表解耦 Hi&#xff0c;我是阿昌&#xff0c;今天学习记录的是关于数据库表解耦的内容。 微服务拆分之初&#xff0c;需要搭建好的两个基础设施&#xff0c;一个是基于开关的反向代理&#xff0c;另一个是数据同步机制。 有了这两个设施做保障&#xff0c;接下来就可以…

Python合并同名Labelme标注文件内容

Python合并同名Labelme标注文件内容 前言前提条件相关介绍实验环境Python合并同名Labelme标注文件内容Json文件代码实现输出结果json文件 前言 本文是个人使用Python处理文件的电子笔记&#xff0c;由于水平有限&#xff0c;难免出现错漏&#xff0c;敬请批评改正。 (https://b…