贝叶斯优化分步指南:基于 Python 的方法

news2024/11/16 22:34:35
图片
奥坎·耶尼贡

一、说明

        对于存在隐含变量的模型,有卡尔曼、隐马尔可夫、混合高斯模型、EM算法,这些模型都是建立在一种理论,贝叶斯推断理论,本篇讲授典型的贝叶斯推断原理。

二、原理综述

      贝叶斯优化是一种用于黑盒函数全局(最优)优化的技术。

        黑匣子是观察者不知道其内部运作的系统。她只能访问系统的输入和输出,但不知道系统如何根据输入得出输出。在优化的背景下,黑盒函数指的是目标函数。

 黑盒子。 来源

        为了说明这一点,请考虑我们无法访问的函数f 。我们无法直接访问f或计算其梯度。我们唯一可用的信息是提供输入x并接收真实输出的噪声估计(或没有任何噪声)。

        我们的目标是根据我们的目的优化黑盒函数f内的潜在价值,例如最大化它。

        在传统的优化方法中,例如网格搜索或随机搜索,目标函数是在一组预定义的点处评估的。然而,在处理高维或噪声函数时,这些方法可能计算成本昂贵且效率低下。

 (a)网格搜索之间的比较;(b) 随机搜索超参数调整。来源

        贝叶斯优化与传统方法相比具有多种优势。首先,它通过构建概率代理模型来有效处理昂贵且嘈杂的函数评估,该模型捕获不确定性并智能地指导搜索过程。

        它结合了有关目标函数的先验知识或信念,从而能够做出更明智的决策。

        它还平衡了探索和利用。探索允许对搜索空间进行更广泛的探索,有可能发现更好的解决方案,而利用则侧重于利用已知的有前途的领域来优化当前的最佳解决方案。平衡这两方面对于寻找更好的解决方案和完善最佳解决方案至关重要。

利用与探索。来源

        经典老虎机算法利用频率界限来对未知函数进行建模。Bandit 问题是一类顺序决策问题,涉及在一系列步骤或时间段内从一组选项(臂)中选择操作。每个手臂都有一个与之相关的未知奖励分布,目标是通过策略性选择手臂来最大化获得的累积奖励。

        在所描绘的立方体形状中,沿着三个轴表示三个指标,提供了在更广泛的层面上对心态变化的理解。

        

强盗 vs 贝叶斯。来源

绩效指标是关于后悔设置的。遗憾设置是一个用于分析和量化决策算法或策略在顺序决策问题中的性能的框架。它衡量所选政策的绩效与事后可能选择的最佳政策之间的累积差异。

后悔。来源

  • 离线性能指标:离线性能指标使用事后信息评估算法或策略。它衡量如果算法从一开始就能够访问完整的数据集或信息,算法的执行效果如何。换句话说,它根据尽可能最好的事后知识来衡量绩效。
  • 在线性能指标:另一方面,在线性能指标在更现实的场景中评估算法或策略,在该场景中,决策是使用有限的信息顺序做出的。它根据所做的实际决策及其结果来衡量绩效,而无需获取未来信息。在线性能指标反映了算法在动态和不确定环境中的真实性能。

立方体的 X 轴显示建模技术,可以是贝叶斯或频率论。在 Z 轴上,立方体表示变量之间的关系,特别是一个变量是否提供有关另一变量的信息或见解。

三、算法

给定:函数f(x) 我们想要最大化它。我们有一些f的数据。

步骤

  1. 初始样本:首先随机选择一组有限的样本点。
  2. 初始化模型:利用这些点来计算代理函数。
  3. 迭代

3.1. 获取函数:使用获取函数并获取下一个点。

3.2. 更新模型:重新评估代理函数。

3.3. 验证点:验证代理函数是否保持稳定,或者方差是否低于预定阈值,或者f是否已用尽,具体取决于您的具体设计目标。

四、给定函数

例如,让我们创建一个黑盒函数,它将正弦和余弦函数组合起来生成输出。

import numpy as np
import matplotlib.pyplot as plt
np.random.seed(42)

def black_box_function(x):
    y = np.sin(x) + np.cos(2*x)
    return y

# range of x values
x_range = np.linspace(-2*np.pi, 2*np.pi, 100)

# output for each x value
black_box_output = black_box_function(x_range)

# plot
plt.plot(x_range, black_box_output)
plt.xlabel('x')
plt.ylabel('y')
plt.title('Black Box Function Output')
plt.show()

x_range使用 计算每个 x 值 ( ) 的函数值black_box_function,然后绘制输出。

黑盒函数输出图。图片由作者提供。

五、初始样本

函数f的输出示例。

# random x values for sampling
num_samples = 10
sample_x = np.random.choice(x_range, size=num_samples)

# output for each sampled x value
sample_y = black_box_function(sample_x)

# plot
plt.plot(x_range, black_box_function(x_range), label='Black Box Function')
plt.scatter(sample_x, sample_y, color='red', label='Samples')
plt.xlabel('x')
plt.ylabel('Black Box Output')
plt.title('Sampled Points')
plt.legend()
plt.show()

采样。图片由作者提供。

六、造型

贝叶斯优化中的代理模型充当真实目标函数的代理。它们捕获函数行为的不确定性,并提供搜索空间内未观察点处函数值的预测或估计。通过基于观察到的函数评估迭代更新代理模型,贝叶斯优化指导搜索可能包含最佳解决方案的搜索空间区域。

我们的目标是开发一个模型,表示为M,它不仅能够提供预测,还能够保留与这些预测相关的不确定性度量。为此,我们将采用以下预定义接口:

  • 观察(M,x,y):记录观察结果->全部
  • 预测( M, x ): 进行后验预测 -> 全部
  • 样本(M,x):样本潜在函数值 - > Thompson
  • getTail( M, v, x ):超过x -> PI的概率
  • getImprovement( M, v, x ): v -> EI上面的积分
  • getQuantile( M, q, x ):第q个分位数 -> UCB
  • getEntropy( M, x ): 预测熵 -> P(ES)

执行各种过程的能力指示了可以在模型类中使用的方法和采集功能的类型。前两者适用于所有贝叶斯优化模型。此外,例如,如果您可以访问尾部概率,则可以利用改进概率 (PI) 方法。

七、高斯过程

高斯过程 (GP) 通常用作贝叶斯优化中的代理模型。高斯过程定义了函数的分布,其中任何有限的函数值集都遵循多元高斯分布。在贝叶斯优化的背景下,GP 用于对未知目标函数进行建模,并提供给定观测数据的函数值的后验分布。

高斯过程由估计函数和不确定性函数指定。来源

GP 完全由其均值函数和协方差函数(也称为核函数)指定。均值函数表示函数在每个输入点的期望值,而协方差函数则表征不同输入点之间的关系并控制生成函数的平滑度和行为。

给定一组观测数据,GP 可用于预测未观测点的函数值。这些预测基于观测数据以及均值和协方差函数中编码的基本假设。重要的是,GP 提供了与这些预测相关的不确定性度量,允许对预测中的不确定性进行有原则的处理。

一维高斯过程回归的图示。来源

在先验知识有限的领域中,高斯过程特别有用,因为它们依赖于相似输入导致相似输出的假设。这使得高斯过程非常适合在没有太多先验信息的情况下检测数据中的模式和趋势。

在构建我们的模型时,我们假设它表现出随机过程,是平稳的,并且遵循高斯分布。随机过程是指描述系统或现象随时间演变的数学模型,其结果具有不确定性或随机性。在随机过程的背景下,平稳性意味着过程的统计特性随着时间的推移保持不变。具体来说,这意味着过程的均值、方差和自协方差不随时间或时间原点的变化而变化。

平稳性原理。来源

我们拥有一个数组f,表示其所有元素的黑盒函数的值。我们假设这个数组服从正态分布。

概率密度函数将采用高斯密度函数的形式。

由于我们假设平稳性,因此联合概率分布随时间保持恒定,这意味着它是时不变的。函数的平均值是m。协方差预计呈现高斯形状,并且可以使用径向基函数 (RBF) 核进行近似。

接下来,我们需要一个预测函数,旨在根据我们手头的可用数据估计函数f (x)的概率。

具有 0 均值和 ~C 协方差的正态分布优于具有 0 均值和 C 协方差的正态分布。

现在,我们可以简化它。

k是 RBF 核的数组。C 是协方差矩阵。

使用此预测函数,我们可以推断,平均而言,未知函数将在 x 处取值 μ,并伴有方差 σ。

因此,代理函数的算法或多或少是:

  1. 迭代我们希望执行评估的输入 x 的每个样本值。
  • 使用 RBF 内核构建kf向量。
  • 构建矩阵CC~。
  • 计算μσ
  • 将μ附加到预测的Mu 数组,将 σ附加到预测的 Sigma数组。

2. 计算Omega作为采样点的黑盒函数的平均值。

3.计算Kappa=预测Mu+Omega

4、退货:

  • Kappa,替代函数的平均估计
  • PredictedSigma,代理函数的方差估计。
from sklearn.gaussian_process import GaussianProcessRegressor
from sklearn.gaussian_process.kernels import RBF

# Gaussian process regressor with an RBF kernel
kernel = RBF(length_scale=1.0)
gp_model = GaussianProcessRegressor(kernel=kernel)

# Fit the Gaussian process model to the sampled points
gp_model.fit(sample_x.reshape(-1, 1), sample_y)

# Generate predictions using the Gaussian process model
y_pred, y_std = gp_model.predict(x_range.reshape(-1, 1), return_std=True)

# Plot 
plt.figure(figsize=(10, 6))
plt.plot(x_range, black_box_function(x_range), label='Black Box Function')
plt.scatter(sample_x, sample_y, color='red', label='Samples')
plt.plot(x_range, y_pred, color='blue', label='Gaussian Process')
plt.fill_between(x_range, y_pred - 2*y_std, y_pred + 2*y_std, color='blue', alpha=0.2)
plt.xlabel('x')
plt.ylabel('Black Box Output')
plt.title('Black Box Function with Gaussian Process Surrogate Model')
plt.legend()
plt.show()

高斯过程图。图片由作者提供。

八、采集功能

我们如何选择代理函数的下一个点?

采集函数确定要在搜索空间中评估的下一个点或一组点。它根据优化过程的当前状态量化对特定点进行采样的潜在效用或可取性。获取函数的目的是平衡探索和开发。

它考虑了替代模型的预测值以及与这些预测相关的不确定性。它结合了这两个方面来识别预​​计具有高目标函数值和(或)高不确定性的点,表明有改进的潜力。

用于选择下一个评估点的获取函数。来源

贝叶斯优化中使用了几种采集函数:

  • 预期改进 (EI) 选择有可能改进最佳观察值的点。它量化了相对于当前最佳值的预期改进,并考虑了替代模型的平均预测及其不确定性。
from scipy.stats import norm

def expected_improvement(x, gp_model, best_y):
    y_pred, y_std = gp_model.predict(x.reshape(-1, 1), return_std=True)
    z = (y_pred - best_y) / y_std
    ei = (y_pred - best_y) * norm.cdf(z) + y_std * norm.pdf(z)
    return ei

# Determine the point with the highest observed function value
best_idx = np.argmax(sample_y)
best_x = sample_x[best_idx]
best_y = sample_y[best_idx]

ei = expected_improvement(x_range, gp_model, best_y)

# Plot the expected improvement
plt.figure(figsize=(10, 6))
plt.plot(x_range, ei, color='green', label='Expected Improvement')
plt.xlabel('x')
plt.ylabel('Expected Improvement')
plt.title('Expected Improvement')
plt.legend()
plt.show()

预期改善。图片由作者提供。

  • 置信上限 (UCB) 通过平衡替代模型的平均预测和与不确定性成比例的探索项来权衡探索和利用。它选择在预测高值和探索不确定区域之间提供良好平衡的点。
def upper_confidence_bound(x, gp_model, beta):
    y_pred, y_std = gp_model.predict(x.reshape(-1, 1), return_std=True)
    ucb = y_pred + beta * y_std
    return ucb

beta = 2.0

# UCB
ucb = upper_confidence_bound(x_range, gp_model, beta)

plt.figure(figsize=(10, 6))
plt.plot(x_range, ucb, color='green', label='UCB')
plt.xlabel('x')
plt.ylabel('UCB')
plt.title('UCB')
plt.legend()
plt.show()

UCB。图片由作者提供。

  • 改进概率 (PI) 估计某个点在当前最佳值基础上改进的概率。它考虑平均预测与当前最佳值之间的差异,并考虑替代模型中的不确定性。
def probability_of_improvement(x, gp_model, best_y):
    y_pred, y_std = gp_model.predict(x.reshape(-1, 1), return_std=True)
    z = (y_pred - best_y) / y_std
    pi = norm.cdf(z)
    return pi

# Probability of Improvement
pi = probability_of_improvement(x_range, gp_model, best_y)


plt.figure(figsize=(10, 6))
plt.plot(x_range, pi, color='green', label='PI')
plt.xlabel('x')
plt.ylabel('PI')
plt.title('PI')
plt.legend()
plt.show()

PI。图片由作者提供。

无论使用哪种方法,我们都会选择 y 轴上具有最高值的点。

贝叶斯优化中的后验函数和采集函数。来源

num_iterations = 5

plt.figure(figsize=(10, 6))

for i in range(num_iterations):
    # Fit the Gaussian process model to the sampled points
    gp_model.fit(sample_x.reshape(-1, 1), sample_y)

    # Determine the point with the highest observed function value
    best_idx = np.argmax(sample_y)
    best_x = sample_x[best_idx]
    best_y = sample_y[best_idx]

    # Set the value of beta for the UCB acquisition function
    beta = 2.0

    # Generate the Upper Confidence Bound (UCB) using the Gaussian process model
    ucb = upper_confidence_bound(x_range, gp_model, beta)

    # Plot the black box function, surrogate function, previous points, and new points
    plt.plot(x_range, black_box_function(x_range), color='black', label='Black Box Function')
    plt.plot(x_range, ucb, color='red', linestyle='dashed', label='Surrogate Function')
    plt.scatter(sample_x, sample_y, color='blue', label='Previous Points')
    if i < num_iterations - 1:
        new_x = x_range[np.argmax(ucb)]  # Select the next point based on UCB
        new_y = black_box_function(new_x)
        sample_x = np.append(sample_x, new_x)
        sample_y = np.append(sample_y, new_y)
        plt.scatter(new_x, new_y, color='green', label='New Points')

    plt.xlabel('x')
    plt.ylabel('y')
    plt.title(f"Iteration #{i+1}")
    plt.legend()
    plt.show()

迭代#1。图片由作者提供。

迭代#2。图片由作者提供。

迭代#3。图片由作者提供。

迭代#4。图片由作者提供。

迭代#5。图片由作者提供。

很酷,对吧?它在每次迭代中不断学习和改进。

贝叶斯优化提供了几个积极的方面。其主要优点之一是能够优化缺乏分析梯度或具有噪声评估的黑盒函数。采用代理模型(例如高斯过程)可以平衡探索和利用,以有效地搜索最佳解决方案。它提供了一种迭代选择点的原则方法,可以在探索未探索的区域和开发有前途的区域之间提供良好的权衡。

它在各个领域都有应用。它特别适合机器学习中的超参数调整。它可用于优化复杂的模拟、实验设计以及目标函数评估成本高昂或耗时的其他场景。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1133021.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【多线程】Java如何实现多线程?如何保证线程安全?如何自定义线程池?

个人简介&#xff1a;Java领域新星创作者&#xff1b;阿里云技术博主、星级博主、专家博主&#xff1b;正在Java学习的路上摸爬滚打&#xff0c;记录学习的过程~ 个人主页&#xff1a;.29.的博客 学习社区&#xff1a;进去逛一逛~ 多线程 Java多线程1. 进程与线程2. 多线程1&am…

Pytorch指定数据加载器使用子进程

torch.utils.data.DataLoader(train_dataset, batch_sizebatch_size, shuffleTrue,num_workers4, pin_memoryTrue) num_workers 参数是 DataLoader 类的一个参数&#xff0c;它指定了数据加载器使用的子进程数量。通过增加 num_workers 的数量&#xff0c;可以并行地读取和预处…

多伦多 Pwn2Own 大赛首日战报!三星 Galaxy S23 被黑两次

Bleeping Computer 网站披露&#xff0c;加拿大多伦多举行的 Pwn2Own 2023 黑客大赛的第一天&#xff0c;网络安全研究人员就成功两次攻破三星 Galaxy S23。 大会现场&#xff0c;研究人员还“演示"了针对小米 13 Pro 智能手机、打印机、智能扬声器、网络附加存储 (NAS) 设…

Ubuntu卸载或重置防火墙规则

Ubuntu卸载或重置防火墙规则 1、开启防火墙后查看对应规则编号&#xff0c;然后进行删除 sudo ufw status numbered ——查看所有规则编号id sudo ufw delete 2 ——删除对应id的规则&#xff08;比如删除2号规则&#xff09; 2、按规则来删除。 例如&#xff0c;如果你使用s…

Meetup 回顾|Data Infra 研究社第十六期(含资料发布)

本文整理于上周六&#xff08;10月21日&#xff09;Data Infra 第 16 期的活动内容。本次活动由 Databend 研发工程师-王旭东为大家带来了一场主题为《Databend hash join spill 设计与实现》的分享&#xff0c;让我们一起回顾一下吧~ 以下是本次活动的相关视频、资料及文字&a…

【算法】模拟退火算法(SAA,Simulated Annealing Algorithm)

模拟退火算法&#xff08;SAA&#xff09;简介 模拟退火算法&#xff08;SAA&#xff0c;Simulated Annealing Algorithm&#xff09;的灵感来源于工艺铸造流程中的退火处理&#xff0c;随着铸造温度升高&#xff0c;分子运动趋于无序&#xff0c;徐徐冷却后&#xff0c;分子运…

【数据分享】2014-2022年我国淘宝村点位数据(Excel格式/Shp格式)

电子商务是过去一二十年我国发展最快的行业&#xff0c;其中又以淘宝为代表&#xff0c;淘宝的发展壮大带动了一大批服务淘宝电子商务的村庄&#xff0c;这些村庄被称为淘宝村&#xff01; 截至到目前&#xff0c;阿里研究院梳理并公布了2014-2022年共9个年份的淘宝村名单&…

2.AUTOSAR SWC设计概述

1.SWC概述 SWC,全称Software Components,运行在RTE之上,属于应用算法逻辑这一层,如下图: 由1.AUTOSAR的架构及方法论中我们了解到该框架的提出就是为了减少平台移植成本、加快研发效率;这也就是说在AUTOSAR框架下,SWC作为组件是需要被重用的,意味着一个…

数据预处理(超详细)

import pandas as pd import numpy as np【例5-1】使用read_csv函数读取CSV文件。 df1 pd.read_csv("sunspots.csv")#读取CSV文件到DataFrame中 print(df1.sample(5))df2 pd.read_table("sunspots.csv",sep ",")#使用read_table&#xff0c;…

人工智能基础_机器学习003_有监督机器学习_sklearn中线性方程和正规方程的计算_使用sklearn解算八元一次方程---人工智能工作笔记0042

然后我们再来看看,如何使用sklearn,来进行正规方程的运算,当然这里 首先要安装sklearn,这里如何安装sklearn就不说了,自己查一下 首先我们还是来计算前面的八元一次方程的解,但是这次我们不用np.linalg.solve这个 解线性方程的方式,也不用 直接 解正规方程的方式: 也就是上面…

接口自动化测试实践

接口自动化概述 Python接口自动化测试零基础入门到精通&#xff08;2023最新版&#xff09; 众所周知&#xff0c;接口自动化测试有着如下特点&#xff1a; 低投入&#xff0c;高产出。 比较容易实现自动化。 和UI自动化测试相比更加稳定。 如何做好一个接口自动化测试项目呢…

华媒舍:怎样利用KOL出文营销推广打造出超级影响力?

利用KOL&#xff08;Key Opinion Leader&#xff09;出文营销推广已成为很多个人和企业提高影响力的重要方法。根据恰当的思路与技巧&#xff0c;你也能轻松吸引大批粉丝并打造无敌的存在影响力。下面我们就以科谱的形式详细介绍怎样利用KOL 出文营销推广&#xff0c;帮助自己做…

SD-WAN让跨境网络访问更快、更安全!

目前许多外贸企业都面临着跨境网络不稳定、不安全的问题&#xff0c;给业务合作带来了很多困扰。但是&#xff0c;现在有一个解决方案能够帮助您解决这些问题&#xff0c;让您的跨境网络访问更快、更安全&#xff0c;那就是SD-WAN&#xff01; 首先&#xff0c;让我们来看看SD-…

微机原理:逻辑运算指令、移位指令

文章目录 一、逻辑运算指令1、取反运算指令2、与运算指令3、或运算指令4、异或运算 二、移位指令1、开环移位指令算术左移&#xff1a;SHL、SAL算术右移&#xff1a;SAR逻辑右移&#xff1a;SHR 2、闭环移位指令含进位的循环左移&#xff1a;RCL含进位的循环右移&#xff1a;RC…

lunar-1.5.jar

公历农历转换包 https://mvnrepository.com/artifact/com.github.heqiao2010/lunar <!-- https://mvnrepository.com/artifact/com.github.heqiao2010/lunar --> <dependency> <groupId>com.github.heqiao2010</groupId> <artifactId>l…

使用文件附件

文件附件在peoplesoft中非常常见 This chapter provides an overview of the file attachment functions and discusses: Developing applications that use file attachment functions. Application development considerations. Application deployment and system configu…

基于 Appium 的 Android UI 自动化测试!

自动化测试是研发人员进行质量保障的重要一环&#xff0c;良好的自动化测试机制能够让开发者及早发现编码中的逻辑缺陷&#xff0c;将风险前置。日常研发中&#xff0c;由于快速迭代的原因&#xff0c;我们经常需要在各个业务线上进行主流程回归测试&#xff0c;目前这种测试大…

Kafka入门04——原理分析

目录 01理解Topic和Partition Topic(主题) Partition(分区) 02理解消息分发 消息发送到分区 消费者订阅和消费指定分区 总结 03再均衡(rebalance) 再均衡的触发 分区分配策略 RangeAssignor(范围分区) RoundRobinAssignor(轮询分区) StickyAssignor(粘性分区) Re…

软件测试面试1000问(含文档)

前前后后面试了有20多家的公司吧&#xff0c;最近抽空把当时的录音整理了下&#xff0c;然后给大家分享下 开头都是差不多&#xff0c;就让做一个自我介绍&#xff0c;这个不用再给大家普及了吧 同时&#xff0c;我也准备了一份软件测试视频教程&#xff08;含接口、自动化、…

进阶课4——随机森林

1.定义 随机森林是一种集成学习方法&#xff0c;它利用多棵树对样本进行训练并预测。 随机森林指的是利用多棵树对样本进行训练并预测的一种分类器&#xff0c;每棵树都由随机选择的一部分特征进行训练和构建。通过多棵树的集成&#xff0c;可以增加模型的多样性和泛化能力。…