深度学习 Deep Learning 第3章 概率论与信息论

news2025/3/17 9:09:11

第三章 概率与信息论


概述

本章介绍了概率论和信息论的基本概念及其在人工智能和机器学习中的应用。概率论为处理不确定性提供了数学框架,使我们能够量化不确定性和推导新的不确定陈述。信息论则进一步帮助我们量化概率分布中的不确定性。在人工智能中,概率论被广泛应用于设计推理算法和分析AI系统的行为。信息论则在数据压缩、通信和特征选择等领域发挥重要作用。本章还探讨了概率论的两种解释——频率主义概率和贝叶斯概率,并讨论了它们在机器学习中的应用。此外,本章还介绍了概率图模型,包括有向图模型(贝叶斯网络)和无向图模型(马尔可夫随机场),这些模型用于表示变量之间的概率关系。
在这里插入图片描述


3.1 为何需要概率论?

不确定性的本质
  • 计算机科学的确定性传统
    传统软件工程基于确定性假设(如CPU指令执行),而机器学习必须处理不确定性。
  • 不确定性的三大来源
    1. 内在随机性(如量子力学现象);
    2. 不完全可观测性(如蒙提霍尔问题,信息缺失导致的不确定性);
    3. 不完全建模(简化模型时忽略的细节导致预测偏差)。
工程实践的哲学启示
  • 简单规则 vs 复杂规则
    • 案例对比
      • 简单规则:“大多数鸟会飞” —— 低成本、广泛适用但含不确定性(如Google垃圾邮件分类模型)。
      • 复杂规则:穷举所有飞行例外 —— 高维护成本且易失效(如硬编码业务规则引擎)。

3.2 概率论的两大流派

频率派概率(Frequentist Probability)
  • 定义:基于重复事件的频率(如抛硬币正面向上的长期比例)。
  • 适用场景:可重复实验(A/B测试结果分析、硬件故障率预测)。
贝叶斯概率(Bayesian Probability)
  • 定义:表示主观置信度(如患者患病的概率为40%)。

  • 核心公式
    在这里插入图片描述

  • 适用场景:不可重复事件(医学诊断、金融风险评估)。

统一性与工程实践
  • 数学一致性:两种概率均遵循相同公理(加法、乘法规则)。
  • Google应用
    • 频率派:大规模日志分析的异常检测(如服务器错误率统计);
    • 贝叶斯:搜索排序的动态调优(基于用户行为更新结果置信度)。

3.3 信息论的核心工具

信息熵(Entropy)
  • 定义:量化分布的不确定性,公式:

  • 应用场景

    • 数据压缩:熵越低,压缩效率越高(如Google的Zlib优化);
    • 特征选择:优先选择高熵特征(携带更多信息)。
交叉熵与KL散度
  • 交叉熵(Cross-Entropy)
    • 公式:

    • 用途:分类模型损失函数(如TensorFlow的CategoricalCrossentropy)。

  • KL散度(Kullback-Leibler Divergence)
    • 公式:
      在这里插入图片描述

    • 用途:模型分布对齐(如多语言翻译模型的一致性优化)。


3.4 工程实践中的应用

测试策略的优化
  • 左移测试(Shift-Left Testing)
    • 单元测试覆盖高风险路径(基于概率模型选择关键代码区域);
    • 避免脆弱测试:通过公共API而非内部状态验证(减少因实现细节变更导致的测试失败)。
分布式系统的可靠性
  • 容错设计
    • 概率化故障模型:预测部分节点宕机对系统的影响(如Google Borg调度器的冗余策略);
    • 信息论指导日志采样:高熵日志片段优先存储(如Cloud Logging的动态采样算法)。
机器学习系统的可解释性
  • 不确定性量化
    • 输出置信区间:搜索结果的排序分数附带概率解释(如“90%置信度匹配用户意图”);
    • 模型校准:使用交叉熵评估预测概率的准确性(防止过度自信/保守)。

3.5 经典案例解析

医学诊断系统 vs 扑克AI
  • 医学诊断
    • 贝叶斯更新:根据症状动态计算患病概率(如流感诊断结合季节因素);
    • 对比规则引擎:硬编码逻辑难以适应新病原体,概率模型可通过数据自动更新。
  • 扑克AI
    • 频率派分析:模拟大量牌局计算胜率(如AlphaGo的蒙特卡洛树搜索);
    • 信息论优化:通过熵最小化决策(减少对手信息增益)。
Google搜索的排序模型
  • 熵驱动排序
    • 高不确定性查询(如歧义词“Java”)优先展示多样化结果;
    • 交叉熵损失函数:训练模型最小化预测分布与点击数据的差异。

总结

本章深入探讨了概率论和信息论在人工智能和机器学习中的核心作用。通过介绍概率论的基本概念、公理和应用,我们了解到如何量化和处理不确定性,这是机器学习算法设计和分析的基础。信息论的引入进一步帮助我们理解和量化数据中的不确定性,对于优化模型和算法具有重要意义。此外,本章还详细讨论了概率图模型,展示了如何通过图结构表示变量之间的概率关系,为复杂系统建模提供了强大的工具。这些内容共同构成了深度学习和机器学习中处理不确定性和复杂数据的理论基础。

精彩语句

1.机器学习必须始终处理不确定性和随机性。
英文原文:Machine learning must always deal with uncertain quantities and sometimes stochastic (nondeterministic) quantities.
解释:机器学习的核心任务之一是处理不确定性和随机性,这是其与传统计算机科学的主要区别。
2.概率论最初是为了分析事件的频率而发展起来的,但它也可以用于表示信念的程度。
英文原文:Probability theory was originally developed to analyze the frequencies of events. It is easy to see how probability theory can be used to study events like drawing a certain hand of cards in a poker game. These kinds of events are often repeatable.
解释:概率论不仅适用于可重复事件的频率分析,还可以用于表示对不可重复事件的信念程度。
3.在许多情况下,使用简单但不确定的规则比使用复杂但确定的规则更为实用。
英文原文:In many cases, it is more practical to use a simple but uncertain rule rather than a complex but certain one.
解释:在实际应用中,简单但不确定的规则往往更具成本效益,尤其是在面对复杂的现实问题时。
4.贝叶斯概率与频率主义概率在数学上是等价的,但它们的解释和应用场景不同。
英文原文:If we list several properties that we expect common sense reasoning about uncertainty to have, then the only way to satisfy those properties is to treat Bayesian probabilities as behaving exactly the same as frequentist probabilities.
解释:贝叶斯概率和频率主义概率在数学上遵循相同的规则,但它们的哲学解释不同,适用于不同的问题。
5.概率论是许多科学和工程学科的基本工具。
英文原文:Probability theory is a fundamental tool of many disciplines of science and engineering.
解释:概率论不仅是机器学习的基础,也是许多其他领域(如统计学、物理学和工程学)的核心工具。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2316531.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

GStreamer —— 2.15、Windows下Qt加载GStreamer库后运行 - “播放教程 1:Playbin 使用“(附:完整源码)

运行效果 介绍 我们已经使用了这个元素,它能够构建一个完整的播放管道,而无需做太多工作。 本教程介绍如何进一步自定义,以防其默认值不适合我们的特定需求。将学习: • 如何确定文件包含多少个流,以及如何切换 其中。…

MYsql—1

1.mysql的安装 在windows下安装mysql,直接官网搜索即可:http://www.mysql.com/,自己找想要的版本进行download,官网长这样 安装路径需要是英文路径,设置默认即可,若安装执行内容时报错,则AltCt…

位运算(基础算法)

按位与AND( & ) 只有当两个位都为1时,结果才为1,否则为0。结果不会变大 按位或 OR( | ) 只有当两个位中有一个为1时,结果才为1,否则为0。结果不会变小 按位异或 XOR ( ^ ) 只…

硬件地址反序?用位操作为LED灯序“纠偏”。反转二进制数即可解决

特别有意思,LED的灯序与其硬件地址刚好相反,没办法直接通过加1实现二进制进位的亮灯操作,查了一些资料说用数组和switch实现,觉得太麻烦了,思索良久,就想到了反转二进制数解决这个问题。 reverse_bits( )是…

图解AUTOSAR_CP_BSWMulticoreLibrary

AUTOSAR BSW 多核库详解 AUTOSAR基础软件多核操作库详细解析 目录 架构概述 1.1. 组件架构 1.2. API结构 1.3. 错误处理流程详细设计 2.1. 基础数据类型 2.2. 接口说明 2.3. 错误处理机制使用指南 3.1. 配置说明 3.2. 典型应用场景 3.3. 注意事项 1. 架构概述 1.1. 组件架构 …

热key探测技术架构设计与实践

参考: 得物热点探测技术架构设计与实践 Redis数据倾斜与JD开源hotkey源码分析揭秘 京东热点检测 HotKey 学习笔记 hotkey: 京东App后台中间件,毫秒级探测热点数据,毫秒级推送至服务器集群内存,大幅降低热key对数据层查询压力 …

【微服务】java中http调用组件深入实战详解

目录 一、前言 二、http调用概述 2.1 什么是http调用 2.1.1 http调用步骤 2.2 HTTP调用特点 2.3 HTTP调用应用场景 三、微服务场景下http调用概述 3.1 微服务开发中http调用场景 3.2 微服务组件中http的应用 四、常用的http调用组件 4.1 java中常用的http组件介绍 4…

app.config.globalProperties

目录 一:基础使用 1、简介 2、使用 3、打印结果: 二:封装 1、创建一个.ts文件(utils/msg.ts) 2、在main.ts中全局注册 3、在页面中使用 4、打印结果 一:基础使用 1、简介 app.config.globalProperties 是 Vue 3 应用实例(app)的一个配置属性&…

Leetcode做题记录----3

1474、删除链表M个节点之后的N个节点 思路: 1、两个循环解决问题 第一个循环移动M个位置,第二个循环确定移动N个位置后的,然后将M位置的节点的next指向,N位置后的节点即可 2、注意边界条件和判空处理 代码实现: pub…

React(二):JSX语法解析+综合案例

事件绑定 this绑定方式 问题:在事件执行后,需获取当前类的对象中相关属性,此时需要this——当打印时,发现this为undefined,这又是为啥? 假设有一个btnClick函数,但它并不是我们主动调用的,而是…

Gitee重新远程连接仓库(Linux)

Gitee重新远程连接仓库(Linux) 因为虚拟机重新安装了一回,所以需要重新和远程仓库连接,在网上找了很久没有找到相关操作,自己实操成功,记录下本博客,帮助有需要的人 确保新虚拟机安装Git 在新虚…

Vitis HLS中的Array Partition与Array Reshape详解

Vitis HLS中的Array Partition与Array Reshape详解 引言 在高层次综合(HLS)设计中,数组是最常用的数据结构之一,但默认情况下,HLS会将数组映射到单个BRAM块,这会限制并行访问能力,成为性能瓶颈。为了克服这一限制&am…

Centos离线安装openssl

文章目录 Centos离线安装openssl1. openssl是什么?2. openssl下载地址3. openssl-devel安装4. 安装结果验证5. 版本查看 Centos离线安装openssl 1. openssl是什么? OpenSSL 是一个开源的、跨平台的 加密工具库 和 命令行工具集,广泛用于实现…

protobuf安装

安装 github官方链接 https://github.com/protocolbuffers/protobuf/ 以protobuf21为例 https://github.com/protocolbuffers/protobuf/releases/download/v21.11/protobuf-all-21.11.zip windows 解压好文件夹后,使用cmake,vs,qt creator等工具打开该项目,进行编译,编译需…

《基于超高频RFID的图书馆管理系统的设计与实现》开题报告

一、研究背景与意义 1.研究背景 随着信息化时代的到来,运用计算机科学技术实现图书馆的管理工作已成为优势。更加科学地管理图书馆会大大提高工作效率。我国的图书管理体系发展经历了三个阶段:传统图书管理模式、现代图书管理模式以及基于无线射频识别&…

小程序渲染之谜:如何解决“加载中...”不消失的 Bug(glass-easel)

🎉 小程序渲染之谜:如何解决“加载中…”不消失的 Bug 🎉 引言 在小程序开发中,渲染问题总能让人抓狂。😫 这次,我遇到了一个奇怪的 bug:产品详情页的内容已经正常显示,但页面却一…

网络原理之HTTPS(如果想知道网络原理中有关HTTPS的知识,那么只看这一篇就足够了!)

前言:随着互联网安全问题日益严重,HTTPS已成为保障数据传输安全的标准协议,通过加密技术和身份验证,HTTPS有效防止数据窃取、篡改和中间人攻击,确保通信双方的安全和信任。 ✨✨✨这里是秋刀鱼不做梦的BLOG ✨✨✨想要…

五子棋小游戏-简单开发版

一、需求分析 开发一个基于 Pygame 库的五子棋小游戏,允许两名玩家在棋盘上轮流落子,当有一方达成五子连珠时游戏结束,显示获胜信息,并提供退出游戏和重新开始游戏的操作选项。 1.棋盘显示 : 显示一个 15x15 的五子棋…

2025中国科技大学少年班/创新试点班·初试备考测试卷(数学)

本卷考查内容:高中课程内容及拓展。 本卷考查形式:书面作答(客观题18小题解答题4题)。 卷首语:中科大少年班、创新班每年大规模招录在数理成绩优异的中学学生。其中初试数学题在高考基础上略有拓展,难度又低…

即时通讯平台测试报告

1.项目概述 项目名称:即时通讯平台 版本号:V1.0.0 测试周期:2025年2月25日--2025年3月15日 测试目标:验证核心功能(登录、注册、消息收发、用户管理、群组功能等)的稳定性和性能指标。 2. 测试范围 功…