贝叶斯学习方法:几种方法介绍

news2024/11/20 11:42:21

目录

  • 1 拉普拉斯还原-轻松贝叶斯深度学习
  • 2 具有归一化流的变分推理
  • 3 基于条件归一化流的多元概率时间序列预测

1 拉普拉斯还原-轻松贝叶斯深度学习

深度学习的贝叶斯公式已被证明具有令人信服的理论性质,并提供实用的功能优势,例如改进预测不确定性量化和模型选择。拉普拉斯近似(LA)是一个经典的,并且可以说是最简单的近似家族,用于深度神经网络的棘手后验。然而,尽管它很简单,但LA并不像变分贝叶斯(variational Bayes)或深度集成(deep ensembles)那样受欢迎。这可能是由于假设LA由于涉及Hessian计算而昂贵,难以实现,或者产生较差的结果。在这项工作中,我们表明这些是误解:我们(i)审查了LA的变体范围,包括成本开销最小的版本;(ii)引入“拉普拉斯”,一个易于使用的PyTorch软件库,提供对所有主要LA风格的用户友好访问;(iii)通过广泛的实验证明,LA在性能方面与更流行的替代方案具有竞争力,同时在计算成本方面表现出色。我们希望这项工作将成为LA在实际深度学习中更广泛采用的催化剂,包括在目前通常不考虑贝叶斯方法的领域。

作者:Daxberger E, Kristiadi A, Immer A, et al. 
论文:Laplace redux-effortless bayesian deep learning. 
出版:Advances in Neural Information Processing Systems, 2021.

关注微信公众号,获取更多资讯
在这里插入图片描述

2 具有归一化流的变分推理

近似后验分布的选择是变分推理中的核心问题之一。变分推理的大多数应用采用简单的后验近似族,以便进行有效的推理,重点放在平均场或其他简单的结构化近似上。这一限制对使用变分方法进行推断的质量有重大影响。我们介绍了一种新的方法来指定灵活的,任意复杂的和可扩展的近似后验分布。我们的近似是通过规范化流程构建的分布,通过应用一系列可逆变换,将简单的初始密度转换为更复杂的密度,直到达到所需的复杂性水平。我们使用这种归一化流的观点来发展有限和无穷小流的类别,并提供了构建丰富后验近似的统一观点。我们证明了具有更好地匹配真实后验的后验的理论优势,结合平摊变分方法的可扩展性,在变分推理的性能和适用性方面提供了明显的改进。

作者:Rezende D, Mohamed S.
论文:Variational inference with normalizing flows. 
出版:International conference on machine learning. PMLR, 2015.

3 基于条件归一化流的多元概率时间序列预测

时间序列预测通常是科学和工程问题的基础,并使决策成为可能。随着数据集规模的不断增加,扩大预测规模的一个简单解决方案是假设相互作用的时间序列之间的独立性。然而,对统计依赖性进行建模可以提高准确性,并支持对交互效果的分析。深度学习方法非常适合这个问题,但多元模型通常假设一个简单的参数分布,不能扩展到高维。在这项工作中,我们通过自回归深度学习模型对时间序列的多变量时间动态进行建模,其中数据分布由条件归一化流表示。这种组合保留了自回归模型的力量,例如外推到未来的良好性能,具有流作为通用高维分布模型的灵活性,同时保持计算上的可处理性。我们表明,它在具有数千个相互作用的时间序列的许多真实数据集上,比标准度量的最新技术有所改进。

作者:Rasul K, Sheikh A S, Schuster I, et al. 
论文:Multivariate probabilistic time series forecasting via conditioned normalizing flows.
出版: arXiv: 2002.06103.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1978969.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

多路I/O复用之select、poll、epoll

一、多进程/多线程模型的不足 为每个请求分配一个进程或线程的方式会带来较大的资源开销。创建和切换进程/线程需要消耗系统资源,包括内存、CPU 时间等。例如,在一个大规模的服务器环境中,如果同时有数千个请求到来,为每个请求创建…

C/C++烟花代码

目录 系列推荐 写在前面 烟花代码 代码分析 运行结果 写在后面 系列推荐 序号目录直达链接1爱心代码https://want595.blog.csdn.net/article/details/1363606842李峋同款跳动的爱心https://want595.blog.csdn.net/article/details/1397222493满屏飘字代码https://want59…

YOLOv8网络轻量化改进之ShuffleNetV2主干

目录 一、理论模型 二、代码修改 一、理论模型 首先是shuffleNet网络的理论介绍部分 论文地址:1807.11164 (arxiv.org) 这里是shufflenetv2网络的主要模块的结构,在网络结构中,通过步长来选择这两种不同的模块。步长为1的时候,对应模块c,步长为2的时候对应模块d。 二、…

Java 文件操作和 IO

1. 认识文件 狭义上的文件(file):针对硬盘这种持久化存储的 IO 设备,当我们想要进行数据保存时,往往不是保存成一个整体,而是独立成一个个的单位进行保存,这种独立的单位就被抽象成文件的概念 …

2024第五届华数杯数学建模竞赛C题思路+代码

目录 原题背景背景分析 问题一原题思路Step1:数据读取与处理Step2:计算最高评分(Best Score, BS)Step3:统计各城市的最高评分(BS)景点数量 程序读取数据数据预处理 问题二原题思路Step1: 定义评价指标Step2: 收集数据Step3: 标准化…

【linux深入剖析】初识线程---线程概念

🍁你好,我是 RO-BERRY 📗 致力于C、C、数据结构、TCP/IP、数据库等等一系列知识 🎄感谢你的陪伴与支持 ,故事既有了开头,就要画上一个完美的句号,让我们一起加油 目录 1. Linux线程概念什么是线…

RK3568笔记五十二:HC-SR04超声波模块驱动测试

若该文为原创文章,转载请注明原文出处。 一、HC-SR04简介 HC-SR04超声波模块是一种常用于距离测量和障碍物检测的模块。它通过发射超声波信号并接收回波来计算所测量物体与传感器之间的距离。 1、基本原理 TRIG引脚负责发送超声波脉冲串。此引脚应设置为高电平10…

4.指令系统

4.指令系统 指令系统概述—复习指导 一个好的框架是学习掌握知识的捷径,能够帮助我们更快的掌握所学知识,下面从王道计算机组成原理书本第四章-指令系统出发,讲解一下第四章的知识框架组成,下面是指令系统这一章节的思维导图和详…

【doghead】h264测试文件、读取、模拟采集时间戳及packtizer

使用原生代码但是原生仓库没有264文件使用绝对路径但是在wsl2的ubuntu22.04中构建添加264文件路径 clion IDE : 来自RtspServer 的测试264文件 PHZ76 提供的264文件读取264成功:按照帧读取 这里是模拟采集视频帧? 定时器:

【Rust练习】7.引用与借用

练习题来自:https://practice-zh.course.rs/ownership/borrowing.html 1 fn main() {let x 5;// 填写空白处let p __;println!("x 的内存地址是 {:p}", p); // output: 0x16fa3ac84 }其实Rust的借用,就类似C的指针和引用,如果你…

面对挫折和恶语 良好心态非常重要

你等年纪轻轻一遇挫折,便松散懈怠,日后怎成大器? 虽称满腹经纶,却是鸡肠鼠肚,连几句恶语都容它不下,你等要记住,为人者,有大度成大器也!夫处世之道,即应变之术, 岂可偏执一端? 【迷茫时,不妨听听司马仲达的人生格言】https://www.bilibili.com/video/BV1JF411i7…

React--》掌握styled-components重塑React样式管理

想象一下,如果你的React组件不仅能自描述其逻辑,还能直接声明自己的样式,这种“所见即所得”的编程体验是不是让人心动不已?styled-components正是这样一把钥匙,它彻底颠覆了我们对React样式管理的传统认知&#xff0c…

Python 中单例模式实现的几种方式

在设计模式中,单例模式是经常被提及和使用的一种模式。它保证一个类只有一个实例,并提供全局访问点。在Python中,有多种实现单例模式的方法。那么,如何选择合适的方法来实现单例模式呢? 单例模式在Python中的几种实现方…

软件设计师笔记-网络基础知识

计算机网络的发展 计算机网络(计算机技术通信技术)的发展是一个逐步演进的过程,从简单的具有通信功能的单机系统,到复杂的以局域网及因特网为支撑环境的分布式计算机系统,这一历程经历了多个关键阶段: #me…

大模型是否潜在地进行多跳推理?

人工智能咨询培训老师叶梓 转载标明出处 以往的研究表明,基于Transformer的LLMs能够在参数中存储和检索事实信息,以完成简单提示,例如“Stevie Wonder的母亲是谁”。此外,当必要信息明确给出时,LLMs表现出了显著的上下…

JS优化了4个自定义倒计时

<!DOCTYPE html> <html lang"zh-CN"><head><meta charset"UTF-8"><title>4个自定义倒计时</title><style>* {margin: 0;padding: 0;box-sizing: border-box;user-select: none;body {background: #0b1b2c;}}hea…

(javaweb)maven--Java项目的构建工具

目录 一.Maven概述 二.Idea导入maven项目 三.maven核心功能--依赖管理 四.依赖管理--依赖传递 五.依赖管理--依赖范围 六.依赖管理--生命周期 一.Maven概述 1.管理和构建Java项目的工具 2.Apache开源&#xff08;源代码开放&#xff09; 3. 4. Maven核心配置文件&#xff…

解题 - 左旋字符串的三种解法(思路)

文章目录 前言&#xff1a; 题干&#xff1a; 解题思路&#xff1a; 思路一&#xff1a; 思路二&#xff1a; 思路三&#xff1a; 小结 前言&#xff1a; 路漫漫其修远兮&#xff0c;吾将上下而求索。 题干&#xff1a; 解题思路&#xff1a; 创建变量k &#xff0c;用…

【知识专栏丨python数分实战】关于电商零售客户细分数据分析及可视化

今天这篇文章将给大家介绍关于电商零售客户细分数据分析及可视化的案例分析。 01 数据整理 导入数据 import pandas as pdimport numpy as npfrom pyecharts.charts import *import pyecharts.options as opts import warningswarnings.filterwarnings(ignore) 数据读取及预…