建模杂谈系列249 增量数据的正态分布拟合

news2025/3/12 13:06:40

说明

从分布开始,分布又要从正态开始

假设有一批数据,只有通过在线的方式增量获得。

内容

1 生成

先通过numpy生成一堆随机数据,从3个正态分布生成,然后拼接起来。

import numpy as np
import matplotlib.pyplot as plt
from sklearn.mixture import GaussianMixture

# 生成示例数据
np.random.seed(0)
data1 = np.random.normal(loc=20, scale=5, size=300)
data2 = np.random.normal(loc=50, scale=10, size=700)
data3 = np.random.normal(loc=70, scale=30, size=500)
data = np.concatenate([data1, data2,data3])

array([28.82026173, 22.00078604, 24.89368992, 31.204466  , 29.33778995,
       15.1136106 , 24.75044209, 19.24321396, 19.48390574, 22.05299251
       ...

接下来,我们看算法对这些数据的拟合结果。

2 拟合

增量计算方差的算法是基于Welford的在线算法,它是一种被广泛接受的用于在线统计的稳定算法。

class IncrementalStats:
    def __init__(self):
        self.n = 0
        self.mean = 0.0
        self.m2 = 0.0

    def add_data(self, x):
        self.n += 1
        delta = x - self.mean
        self.mean += delta / self.n
        delta2 = x - self.mean
        self.m2 += delta * delta2

    def get_mean(self):
        return self.mean

    def get_variance(self):
        if self.n < 2:
            return 0.0
        return self.m2 / (self.n - 1)

    def get_std(self):
        return self.get_variance() ** 0.5

# 初始化增量统计对象
stats = IncrementalStats()

# 逐条添加数据并更新统计量
for i,x in enumerate(data):
    if i +1== 300:
        print('>>>>>>>>>>>>>>>>>>>>>>>>>',i)
    if i +1  == 1000:
        print('>>>>>>>>>>>>>>>>>>>>>>>>>',i)
    stats.add_data(x)
    print(f"After adding {x}: Mean = {stats.get_mean():.2f}, Variance = {stats.get_variance():.2f}, Std={stats.get_std():.2f}")

print(f"Final Mean = {stats.get_mean():.2f}, Final Variance = {stats.get_variance():.2f}, Final Std={stats.get_std():.2f}")

第一段:刚开始拟合,在一阵波动之后,很快就接近真相了
在这里插入图片描述
第二段:在第一波结束的时候,已经非常接近真相了

在这里插入图片描述
第三段:在混入了两个正态时候,已经远远偏离了上一波的稳定状态(mean=20,std=5)。方差还有点像两个分布的方差和,均值就不是了。

在这里插入图片描述
第四段:结束时,全部都混在一起,分不出来了。
在这里插入图片描述

3 结论

  • 1 证明了方法是有效的,如果只有一个正态,可以稳定下来
  • 2 可以用来判别之前的正态在复杂环境下已经变化了(均值和方差偏移)
  • 3 如果叠加贝叶斯推断,我们可以发现在哪里发生转变了,从而开始重新拟合

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2089796.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【智能算法改进】路径规划问题的多策略改进樽海鞘群算法研究

目录 1.算法原理2.改进点3.结果展示4.参考文献5.代码获取 1.算法原理 【智能算法】樽海鞘群算法&#xff08;SSA)原理及实现 2.改进点 无标度网络策略 复杂网络在图论中可以用边和节点表示&#xff0c; Barabasi 等于1999年通过分析大量的数据提出了无标度网络模型. 该网络…

框架 +【Mybatis】概述 以及 基础环境搭建

目录 什么是框架&#xff1f; java后端框架包括 Mybatis概述 1、背景介绍 2、mybatis介绍 Mybatis环境搭建 1.创建一个maven项目 2.导入mysql数据库驱动包 导入mybatis依赖的jar包 3.创建一个全局的mybatis配置文件 4.创建数据库,创建表,准备数据 5.创建一个访问接口…

单图生成 2D 和 3D 人物,高质量图像处理模型 CharacterGen来啦!

CharacterGen引入了一个简化的生成流程和一个图像条件的多视图扩散模型。该模型有效地将输入姿态校准到规范形式&#xff0c;同时保留输入图像的关键属性&#xff0c;从而解决了多样化姿态带来的挑战。 CharacterGen的另一个核心组成部分是基于Transformer的、可泛化的稀疏视图…

httpx:一个神奇的 Python HTTP客户端

文章目录 httpx&#xff1a;一个神奇的 Python HTTP客户端1. 背景&#xff1a;为什么选择 httpx&#xff1f;2. httpx 是什么&#xff1f;3. 如何安装 httpx&#xff1f;4. 简单的库函数使用方法5. 场景应用6. 常见问题及解决方案7. 总结 httpx&#xff1a;一个神奇的 Python H…

第 8 章 数据的家——MySQL的数据目录

8.1 数据库和文件系统的关系 数据库把表存储在文件系统上。当我们读取数据时&#xff0c;存储引擎会从文件系统中把数据读出来返回给我们&#xff1b;当我们写入数据时&#xff0c;存储引擎会把这些数据写回文件系统。 8.2 MySQL数据目录 8.2.1 数据目录和安装目录的区别 数…

C++从入门到起飞之——list模拟实现 全方位剖析!

​ ​ ​ &#x1f308;个人主页&#xff1a;秋风起&#xff0c;再归来~&#x1f525;系列专栏&#xff1a;C从入门到起飞 &#x1f516;克心守己&#xff0c;律己则安 目录 ​ ​1、list的整体框架 2、list迭代器 >整体分析 >整体框架 >成员函数 >运…

操作系统:实验六文件操作实验

一、实验目的 1、了解文件系统功能及实现原理。 2、掌握LINUX下文件操作的有关系统调用。 3、熟悉main函数带参数运行的有关操作过程。 4、通过模拟程序实现简单的一级文件系统或二级文件系统。 二、实验内容 1、编程显示文件自身。&#xff08;1分&#xff09; #includ…

分享两个方法分析python打包exe

在Python开发中&#xff0c;常常需要将Python脚本打包成独立的可执行文件&#xff0c;以便在没有Python环境的电脑上运行。你是否曾为此感到困惑&#xff0c;不知道该选择哪种工具来实现这一目标&#xff1f;其实&#xff0c;打包Python脚本并不难&#xff0c;关键在于选择合适…

Mybatis框架——缓存(一级缓存,二级缓存)

本章将简单介绍Mybatis框架中的缓存&#xff0c;欢迎大家点赞➕收藏&#xff0c;蟹蟹&#xff01;&#xff01;&#xff01;&#x1f495; &#x1f308;个人主页&#xff1a;404_NOT_FOUND &#x1f308;MyBatis环境搭建步骤&#xff08;超全解析&#xff01;&#xff01;&am…

AI写论文真的可靠吗?免费推荐6款AI论文写作助手

在当今的学术研究和写作领域&#xff0c;AI论文写作助手已经成为不可或缺的工具。这些工具不仅能够提高写作效率&#xff0c;还能帮助研究者生成高质量的论文。以下是六款免费推荐的AI论文写作助手&#xff0c;包括千笔-aipasspaper&#xff0c;它们各自具有独特的功能和优势。…

【hot100篇-python刷题记录】【最小路径和】

R6-多维动态规划篇 好经典的dp题&#xff0c;纯粹的题。 多维动态规划无论是二维还是三维&#xff0c;无非是创建dp表&#xff0c;dp[][][][][][]即可 动态规划式子 dp[i][j]当前值min(dp[i][j-1],dp[i-1][j]) 边界问题处理&#xff1a;是否存在即可。哦对了好像不用这样&a…

探索异步之美:aiohttp库的魔力与奥秘

文章目录 探索异步之美&#xff1a;aiohttp库的魔力与奥秘背景&#xff1a;为何选择aiohttp&#xff1f;什么是aiohttp&#xff1f;如何安装aiohttp&#xff1f;简单函数使用方法场景应用常见Bug及解决方案总结 探索异步之美&#xff1a;aiohttp库的魔力与奥秘 背景&#xff1…

Linux教程七:文件目录类命令ls、cd(图文详解)

默认登录出现一个[用户localhost ~] 代表时登陆用户的家目录 1、 Linux ls命令 基本用法 ls&#xff1a;列出当前目录下的文件和目录&#xff08;不包括以.开头的隐藏文件&#xff09;。ls 目录名&#xff1a;列出指定目录下的文件和目录。 常用选项 -l&#xff1a;以长格式列出…

【Python 报错已解决】`TypeError: ‘method‘ object is not subscriptable`

&#x1f3ac; 鸽芷咕&#xff1a;个人主页 &#x1f525; 个人专栏: 《C干货基地》《粉丝福利》 ⛺️生活的理想&#xff0c;就是为了理想的生活! 引言 在编程的世界里&#xff0c;我们经常会遇到各种报错&#xff0c;它们像隐藏在代码中的小怪兽&#xff0c;时不时跳出来给…

Java项目:基于SpringBoot+mysql在线拍卖系统(含源码+数据库+答辩PPT+毕业论文)

一、项目简介 本项目是一套基于SSM框架mysql在线拍卖系统 包含&#xff1a;项目源码、数据库脚本等&#xff0c;该项目附带全部源码可作为毕设使用。 项目都经过严格调试&#xff0c;eclipse或者idea 确保可以运行&#xff01; 该系统功能完善、界面美观、操作简单、功能齐全、…

常见的性能测试方法!

前言 性能测试划分有很多种&#xff0c;测试方法也有很多种&#xff0c;更确切的说是由于测试方法的不同决定了测试划分的情况&#xff0c;但在测试过程中性能测试的划分没有绝对的界限&#xff0c;常用的有压力测试、负载测试和并发用户测试等。 性能测试的方法主要包括以下…

划分字母区间

划分字母区间 思路&#xff1a; 我觉得这道题最关键的一个思路就是&#xff0c;对于没一个字母&#xff0c;你一定要找到他的最后一次出现的位置&#xff0c;每一个片段必须要比这个大&#xff0c;然后该字符到这个end中其他的字符&#xff0c;也都要找到最后一次出现的位置&…

net6 core 接入nacos 实现服务注册入门使用,心跳检测和负载均衡

net6 core 接入nacos 实现服务注册入门使用&#xff0c;心跳检测和负载均衡 配置中心比较Apollo与Nacos_appollo 和 nacos-CSDN博客 一&#xff1a;安装nacos Release 2.2.3 (May 25th, 2023) alibaba/nacos GitHub 二、配置Nacos 注*Nacos 是使用的mysql 数据库&#x…

谷粒商城实战笔记-282~283-商城业务-订单服务-提交订单的问题

文章目录 一&#xff0c;282-商城业务-订单服务-提交订单的问题调试过程中出现的问题services面板介绍什么是 Services Panel&#xff1f;主要作用解决的痛点使用方法 二&#xff0c;283-商城业务-分布式事务-本地事务在分布式下的问题分布式事务问题解决方案分布式事务处理流程…

Hubspot AI 工具| 使用 6 款 HubSpot AI 工具,提升初创团队海外营销与销售效率

看看 HubSpot AI 工具如何完美助力中国出海与外贸企业加速落地全球 GTM 策略吧~ 在日益竞争激烈的全球市场中&#xff0c;初创企业想要获得成功&#xff0c;必须有效将产品推向市场&#xff0c;并建立客户基础&#xff0c;与竞争对手一较高下。 这需要精心策划的进入市场&…