Acceptance-Rejection Sampling

news2024/9/20 8:52:41

Acceptance-Rejection Sampling

文章目录

  • Acceptance-Rejection Sampling
    • @[toc]
      • 1 接受拒绝采样
      • 2 Acceptance-Rejection 采样实现

1 接受拒绝采样

给定随机变量 X X X服从pdf为 f ( x ) f(x) f(x)的分布,例如 f ( x ) f(x) f(x)为正态概率密度函数,我们可以通过相关统计软件自动生成满足特定分布的样本数据。假如 f ( x ) f(x) f(x)不服从正态分布,而是服从如下这种比较复杂的分布该如何进行观测采样呢?
X ∼ f ( x ) = s i n ( x 2 ) + c o s ( x ) + 2 ∫ a b s i n ( x 2 ) + c o s ( x ) + 2 d x , x ∈ [ a , b ] X\sim f(x) = \dfrac{sin(x^2)+cos(x)+2}{\int_{a}^{b}sin(x^2)+cos(x)+2 dx},x\in[a,b] Xf(x)=absin(x2)+cos(x)+2dxsin(x2)+cos(x)+2,x[a,b]
此外,我们还要基于所采样的样本计算相关统计量,例如一阶矩、二阶矩等,这需要计算更为复杂的函数积分,又该如何计算?针对上述一系列问题,数学中衍生出接受拒绝采样(Acceptance-Rejection Sampling),该方法采用了Monte Carlo思想。

已知存在如下概率密度函数 f ( x ) f(x) f(x),随机变量 X ∼ f ( x ) X\sim f(x) Xf(x) x ∈ [ a , b ] x\in[a,b] x[a,b]
在这里插入图片描述

为了获得服从 f ( x ) f(x) f(x)的随机样本,引入一个均匀分布,随机变量 Y ∼ U ( a , b ) Y\sim U(a,b) YU(a,b),对应的概率密度函数为 g ( y ) = 1 b − a g(y) = \dfrac{1}{b-a} g(y)=ba1

在这里插入图片描述

将概率密度曲线 g ( y ) g(y) g(y)向上平移,直至存在最小的常数 c c c,使得对于任意来源于 g ( x ) g(x) g(x)的样本值 x x x都有
c g ( x ) = c b − a ≥ f ( x ) cg(x) = \dfrac{c}{b-a}\ge f(x) cg(x)=bacf(x)
在这里插入图片描述

现在假设已经获得来源于 g ( x ) g(x) g(x)的一个样本值 x ∗ x^* x,构建如下比例
z = f ( x ∗ ) c g ( x ∗ ) ∈ [ 0 , 1 ] z = \dfrac{f(x^*)}{cg(x^*)}\in[0,1] z=cg(x)f(x)[0,1]
在这里插入图片描述

z z z值越大,表明目标分布 f ( x ∗ ) f(x^*) f(x)与均匀分布 g ( x ) g(x) g(x)越靠近,此时选择或承认 x ∗ x^* x(来源于均匀分布 g ( x ) g(x) g(x))这个样本值作为目标分布 f ( x ) f(x) f(x)的一个采样的概率就越大。如果选择承认 x ∗ x^* x f ( x ) f(x) f(x)的一个样本采集,那就接受 x ∗ x^* x

那么,给定一个 z z z值,如何判断对应的 x ∗ x^* x是否接受呢?再引入随机变量 u ∼ U ( 0 , 1 ) u\sim U(0,1) uU(0,1),并从该均匀分布获得一个样本值 u ∈ [ 0 , 1 ] u\in[0,1] u[0,1],如果 z z z值较大,那么 z > u z>u z>u的概率也较大。显然,如果 x ∗ x^* x越接近0(上图中),那么选择接受 x ∗ x^* x附近的观测频率就越高。通过对 g ( x ) g(x) g(x)大量的样本观测采集,将 z z z值与 u u u值进行比较,就可得到目标分布函数的样本近似观测。

上述 g ( x ) g(x) g(x)又称为建议分布(proposal distribution),顾名思义就是从 g ( x ) g(x) g(x)中获得一个样本观测 x ∗ x^* x,建议 f ( x ) f(x) f(x)的样本是否采用 x ∗ x^* x,如果建议,则接受,反之拒绝。上文说的建议分布 g ( x ) g(x) g(x)服从均匀分布,事实上,可以选择其他分布, g ( x ) g(x) g(x)满足接近 f ( x ) f(x) f(x)且覆盖 f ( x ) f(x) f(x)区域,Acceptance-Rejection Sampling效率越高。


强行总结下,实现Acceptance-Rejection Sampling步骤如下:

1)目的:已知较为复杂的目标分布 f ( x ) f(x) f(x),需要从 f ( x ) f(x) f(x)进行样本采集;

2)构建建议分布G,选择密度函数为均匀分布的 g ( x ) = 1 b − a g(x) =\dfrac{1}{b-a} g(x)=ba1

3)寻找最小常数 c c c,使得 c g ( x ) = c b − a ≥ f ( x ) cg(x) = \dfrac{c}{b-a}\ge f(x) cg(x)=bacf(x);

4)再获得一个随机变量 u ∼ U ( 0 , 1 ) u\sim U(0,1) uU(0,1);在计算机模拟中就是获得一个在(0,1)上的随机数;

5)从 g ( x ) g(x) g(x)中获得 x ∗ x^* x,并计算 z = f ( x ∗ ) c g ( x ∗ ) z = \dfrac{f(x^*)}{cg(x^*)} z=cg(x)f(x)

6)if z > u z>u z>u则接受 x ∗ x^* x;else 拒绝

7)重复步骤4-6,直至得到预期样本量 n n n


2 Acceptance-Rejection 采样实现

给定如下概率密度函数,对其进行样本采样
f ( x ) = s i n ( x 2 ) + c o s ( x ) + 2 ∫ a b s i n ( x 2 ) + c o s ( x ) + 2 d x , x ∈ [ a , b ] f(x) = \dfrac{sin(x^2)+cos(x)+2}{\int_{a}^{b}sin(x^2)+cos(x)+2 dx},x\in[a,b] f(x)=absin(x2)+cos(x)+2dxsin(x2)+cos(x)+2,x[a,b]
假设 a = − 10 , b = 10 a=-10,b=10 a=10,b=10。对该密度函数可视化,由于分母是常数,只需看分子的图像即可。

g = function(x) sin(x^2)+cos(x)+2
par(mfrow = c(1,1))
curve(g,n=1000,from = -10,to = 10)
# 这里的int即为最小常数c
int = integrate(g,-10,10)$value

该密度函数是对称函数,具有多峰性。下面分别采集100,1000,10000和20000样本量

n = c(100,1000,10000,20000)   
par(mfrow = c(2,2))
for(i in 1:4){
  k = 0
  x = numeric() 
  while(k < n[i]){
    # 均匀分布
    u = runif(1) 
    # 从建议分布获得x*
    y = runif(1,-10,10) 
    # 判断
    if((sin(y^2)+cos(y)+2)/int > u){  
      cat('Accept',k,'\n')
      k = k + 1  
      x[k] = y  
    }else{
      cat('Reject',k,'\n')
    }
    cat('=====😁=====',k,'=====😁=====\n')
  }
  
  # 绘制直方图
  hist(x,prob=T,col = 'red',breaks = seq(-10,10,0.1),
       main = paste('n=',n[i]))  
  X = seq(-10,10,0.01)
  # 真实密度曲线
  Y = (sin(X^2)+cos(X)+2)/int  
  lines(X,Y,lwd = 3)
}

在这里插入图片描述

上图可以发现随着样本采集次数越多,对目标分布的近似采集效果越好。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/512480.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

js 字符串拼接的4种方法

一、使用连接符 把想要连接的字符串串起来 let shy 帅哥 let a 我是 shy console.log(a) // 我是帅哥 二、模板字符串 模板字符串&#xff08;template string&#xff09;是增强版的字符串&#xff0c;用反引号&#xff08;&#xff09;标识&#xff0c;特点&#xff1a…

【C++】-6- 模板初阶

文章目录 引入——泛型编程一、函数模板1.函数模板格式2.函数模板原理3.模板的实例化4.模板参数的匹配原则 二、类模板0.引入1.类模板的定义格式2.类模板的实例化 引入——泛型编程 如果我们需要实现不同数据类型的Swap函数&#xff0c;需要手写很多内容类似的结构。如下。 v…

【Gragph Data Mining】VF2算法 — 图同构匹配的算法

VF2算法是一种用于图同构匹配的算法&#xff0c;可以判断两个图是否同构。VF2算法最初由L. P. Cordella等人在1981年提出&#xff0c;后经过多次改进和优化&#xff0c;已成为常用的图同构匹配算法之一。VF2算法的基本思想是通过递归地搜索两个图的节点匹配&#xff0c;从而判断…

总结847

学习目标&#xff1a; 月目标&#xff1a;5月&#xff08;张宇强化前10讲&#xff0c;背诵15篇短文&#xff0c;熟词僻义300词基础词&#xff09; 周目标&#xff1a;张宇强化前3讲并完成相应的习题并记录&#xff0c;英语背3篇文章并回诵 每日必复习&#xff08;5分钟&#…

概率密度函数可视化

概率密度函数可视化 文章目录 概率密度函数可视化[toc]1 一维随机变量情形2 二维随机变量情形 1 一维随机变量情形 以正态概率密度函数为例&#xff0c;其中位置参数为 μ \mu μ&#xff0c;尺度参数为 σ \sigma σ&#xff0c; f ( x ) 1 2 π σ e − ( x − μ ) 2 2 σ…

ChatGPT聊天新玩意:如何让AI成为你的聊天好友?

目录 引言&#xff1a; 案例&#xff1a; 淄博旅游第一版本&#xff1a; 分析&#xff1a; 淄博旅游第二版本&#xff1a; 分析&#xff1a; 总结&#xff1a; 万能公式&#xff1a; 引言&#xff1a; ChatGPT是什么&#xff1f;今天用一句话概括&#xff0c;它就是新…

翻译: 面向开发人员的GPT提示工程 GPT Prompt Engineering for Developers

1. 提示指南Guidelines for Prompting 在本课中&#xff0c;您将练习两个提示原则及其相关策略&#xff0c;以便为大型语言模型编写有效的提示。 In this lesson, you’ll practice two prompting principles and their related tactics in order to write effective prompts …

7搜索管理

7搜索管理 7.1 准备环境 7.1.1 创建映射 创建xc_course索引库。 创建如下映射 post&#xff1a;http://localhost:9200/xc_course/doc/_mapping 参考 “资料”–》搜索测试-初始化数据.txt { "properties": { "description": { "type": &…

C语言操作符详解

该内容全部代码请看&#xff1a;gitee仓库 第一部分&#xff1a; 板书部分&#xff1a; 1、操作符的分类&#xff1a; 注意&#xff1a; 移位操作符和位操作符 单目操作符中有sizeof 逗号表达式 2、算术操作符&#xff1a; 注意&#xff1a; 除法的使用 取模运算 3、移位操…

485接口的温湿度传感器和RJ45接口的温湿度传感器选择分析

工业以太网RJ45接口 网口温湿度传感器和RS485信号输出温湿度传感器的分析对比 主要适用场合&#xff1a;大型厂房、跨区域机房、多机房、机柜、数据机房、服务器机房、大数据中心、户外电站等 主要区别&#xff1a;以太网温湿度传感器输出信号RJ45&#xff0c;RS485温湿度传…

【JAVA面试】缓存穿透、缓存击穿、缓存雪崩

提示&#xff1a;文章先作为初版&#xff0c;等后续时间充足后&#xff0c;补充更深的内容 文章目录 缓存穿透、缓存击穿、缓存雪崩一、区别二、线程安全问题 缓存穿透、缓存击穿、缓存雪崩 一、区别 缓存穿透&#xff08;Cache Penetration&#xff09;&#xff1a; 缓存穿…

展会邀请丨虹科诚邀您5月12日于北京参与制药行业质量控制技术论坛

2023年上半年&#xff0c;虹科圆满举办了成都CPQC与杭州药安大会&#xff0c;在两场顺利进行的展会上&#xff0c;虹科的产品广受青睐&#xff0c;也获得了许多客户的认可与信赖&#xff0c;虹科也将继续以优质的产品和解决方案解决您的问题。 5月12-5月13日&#xff0c;虹科将…

卷积神经网络(CNN):基于PyTorch的遥感影像、无人机影像的地物分类、目标检测、语义分割和点云分类

我国高分辨率对地观测系统重大专项已全面启动&#xff0c;高空间、高光谱、高时间分辨率和宽地面覆盖于一体的全球天空地一体化立体对地观测网逐步形成&#xff0c;将成为保障国家安全的基础性和战略性资源。随着小卫星星座的普及&#xff0c;对地观测已具备多次以上的全球覆盖…

arm安装pyrealsense

arm安装pyrealsense – Step 1 – conda install numba pip install opencv-python pip install scipy – Step 2 pyrealsense2 – 参考 https://github.com/35selim/RealSense-Jetson 编译安装pyrealsense2 git clone -b v2.50.0 --depth1 https://github.com/IntelRealSens…

【Java】哈希冲突(哈希碰撞)

文章目录 为什么发生哈希冲突&#xff08;哈希碰撞&#xff09;能否完全避免哈希冲突常用处理哈希冲突的方法1.开放地址法1.1线性探测再散列缺点&#xff1a;二次聚集 1.2二次探测再散列1.3伪随机探测再散列 2.再哈希地址法3.链地址法4.建立公共溢出区 为什么发生哈希冲突&…

2C 兼容和小技巧 合集

这里写自定义目录标题 2C 兼容小技巧 合集修改input date默认框的小图标 2C 兼容小技巧 合集 以前一直是2b端没遇到过啥兼容性 或者 奇奇怪怪改UI的地方&#xff0c;现在换成C端业务&#xff0c;就在这里记录下遇到的奇奇怪怪的需求以及解决办法吧。 这篇文章争取 长久更新&am…

Kali-linux枚举服务

枚举是一类程序&#xff0c;它允许用户从一个网络中收集某一类的所有相关信息。本节将介绍DNS枚举和SNMP枚举技术。DNS枚举可以收集本地所有DNS服务和相关条目。DNS枚举可以帮助用户收集目标组织的关键信息&#xff0c;如用户名、计算机名和IP地址等&#xff0c;为了获取这些信…

Redis持久化:RDB和AOF

Redis持久化&#xff1a;RDB和AOF Redis 数据存储在内存中&#xff0c;如果不想办法将数据保存到硬盘上&#xff0c;一旦Redis重启(退出/故障)&#xff0c;内存的数据将会全部丢失。我们肯定不想 Redis 里的数据由于某些故障全部丢失(导致所有请求都走 MySQL)&#xff0c;即便发…

软考A计划-重点考点-专题九(数据结构知识)

点击跳转专栏>Unity3D特效百例点击跳转专栏>案例项目实战源码点击跳转专栏>游戏脚本-辅助自动化点击跳转专栏>Android控件全解手册点击跳转专栏>Scratch编程案例 &#x1f449;关于作者 专注于Android/Unity和各种游戏开发技巧&#xff0c;以及各种资源分享&am…

解决报错‘cross-env‘ is not recognized as an internal...

目录 一、问题 1.1 问题描述 二、解决 2.1 解决 2.2 其它启动报错问题 一、问题 1.1 问题描述 今天在安装Ant Design Pro的后&#xff0c;执行 yarn start 时意外报错 cross-env is not recognized as an internal or external comman 报错后自然项目也就无法启动&…