【深度学习】日常笔记3

news2025/1/13 2:55:11

如果分类问题具有预测这样带有自然顺序的问题,如{婴⼉, ⼉童, ⻘少年, ⻘年⼈, 中年⼈, ⽼年⼈},那么可以把分类问题转变为回归问题了。不过可以使用独热编码one-hot encoding

类别对应的分量设置为1,其他所有分量设置为0。在我们的例⼦中,标签y将是⼀个三维向量,其中(1, 0, 0)对应于 “猫”、(0, 1, 0)对应于“鸡”、(0, 0, 1)对应于“狗”: y ∈ {(1, 0, 0),(0, 1, 0),(0, 0, 1)}.

因为分类时,全连接层的输出时存在⼀些问题:⼀⽅⾯,我们没有限制这些输出数字的总和为1。另⼀⽅⾯,根据输⼊的不同,它们可以为负值。这些违反了的概率基本公理。

对“预测求幂”的解释:指数运算等于求幂运算。这里是底数e的oj次幂。

“尽管softmax是⼀个⾮线性函数,但softmax回归的输出仍然由输⼊特征的仿射变换决定。因此,softmax回归是⼀个线性模型(linear model)。”解释:因为模型的非线性表现主要来自于其激活函数,而不是从输入到输出的变换过程。简而言之,在回归模型中,我们使用了一个非线性函数来处理线性模型的输出,以得到更好的结果

需要指出的是,softmax 回归模型之所以被称为线性模型,是因为它对每个类别的判别都是线性的。

广播机制(broadcasting)是一种在不同形状的张量之间进行计算的方式,它使用了一些规则来确定如何将这些张量扩展到相同的形状,从而进行计算。

交叉熵损失函数的公式为: l(y, yˆ) = − ∑j yj log yˆj,该损失函数是分类问题最常用的损失之一

交叉熵损失函数的公式中,y表示真实标签,而yˆ表示模型预测的概率分布。因此,当模型的预测接近真实标签时,即y和yˆ的差异越小,交叉熵损失函数的值就会越小。

具体来说,如果模型的预测结果越接近真实标签,也就是y和yˆ的差异越小,那么在计算交叉熵损失函数时,log yˆj的取值就会越大(因为yˆj的取值范围在0到1之间,log函数的取值范围为负无穷到0,yˆj是预测的概率),从而导致l(y, yˆ)的值变小。反之,如果模型的预测结果与真实标签差距较大,那么log yˆj的取值就会越小,从而导致l(y, yˆ)的值变大。因此,当模型的预测结果更准确时,交叉熵损失函数的值就会变小。

log_e(2) 表示 1 纳特的原因是,纳特是以自然对数 e 为底的单位,它用于度量信息熵。信息熵是一个随机变量不确定性的度量,也可以理解为对信源进行编码所需的最短平均码长。如果我们使用以 2 为底的对数,则单位就成了比特(bit),即log_2(2)。对于一个概率分布 P,它的信息熵 H(P) 定义为:

H(P) = - Σ p(x) log_e(p(x))

其中,x 是随机变量取值,p(x) x 发生的概率。在这个式子中,log_e 表示以自然对数 e 为底的对数,因此单位是纳特(nat)。具体而言,log_2(p(x)) 表示对信源进行二进制编码时,第 x 种符号需要的码长(通常会向上取整)。

另一方面,log_2(2) 可以表示一比特,因为比特是信息的最小单位,可以是 0 1。在一个只有两种可能输出的系统(例如,一个二进制系统)中,一个单一的比特可以有两种不同的状态,即 0 1。因此,我们需要使用以 2 为底的对数来度量比特数,而一个单独的比特可以被表示为 log_2(2)

总之,log_e(2) 表示 1 纳特,因为它在信息熵的定义中扮演了重要角色。而 log_2(2) 表示一比特,因为它用于度量信息的最小单位。

接着解释下1 nat = 1/loge(2) bit ≈ 1.44 bi这个式子的由来:

换底公式:log_a(c) = log_b(c) / log_b(a)

在这个问题中,我们需要将以 2 为底的比特数转换为以 e 为底的纳特数,因此我们使用自然对数 e 作为新的底数,并应用上述公式。

具体地,我们可以将 1 比特表示为以 2 为底的对数(即 log_2(2)),并应用换底公式,得到:

log_e(2) = log_2(2) / log_2(e)

由于 log_2(2) 等于 1,而 log_2(e) 约等于 1.44,因此我们可以将上式简化为:

log_e(2) ≈ 1 / 1.44

从而得到:

1 nat = 1/log_e(2) bit ≈ 1.44 bit

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/636768.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Cadence原理图快速查找元器件的方法

1.Cadence原理图快速查找元器件的方法 ①在红框中输入元器件编号,点击望远镜的图标在底下的状态栏可看到查找到的相关元器件,点击元器件可自动定位当前元器件的位置。 ②点击hierarchy(层)可自主查找,找到后点击序号即…

【项目实战】一、Spring boot整合JWT、Vue案例展示用户鉴权

前言 案例整合了Spring boot、Spring Cloud alibaba、Gateway、Nacos discovery、Nacos config、openFeign、JWT、Vue3、Router、Axios等;通过JWT和登录、查询(带用户信息)接口,验证了上述工具以及鉴权功能。 1、若无公共模块&a…

学好Java爬虫需要什么技巧

Java爬虫是一种利用Java编程语言编写的网络爬虫程序,它可以自动化地浏览和抓取互联网上的数据,并将数据进行处理和保存。Java爬虫通常使用HTTP协议模拟浏览器请求来获取网页内容,并通过解析HTML网页标签和属性等信息来提取有用的数据。Java爬…

PPT处理控件Aspose.Slides入门教程:在 C# 中加密和解密 PPT

Aspose API支持流行文件格式处理,控件覆盖 word、excel、PDF、条码、OCR、CAD、HTML、email、ppt、等各个文档管理领域 是一款 PowerPoint管理API,用于读取,编写,操作和转换PowerPoint幻灯片的独立API,可将PowerPoint…

【网页设计】第 2 课 - 网页设计规范

欢迎来到博主 Apeiron 的博客,祝您旅程愉快 ! 时止则止,时行则行。动静不失其时,其道光明。 目录 1、缘起 2、网页规范 3、设计规范 4、banner 简介 4.1、Banner 的定义 4.2、Banner 的类型 4.3、Banner 构图 4.4、…

chatgpt赋能python:Python学习笔记:如何合并元组

Python学习笔记:如何合并元组 在Python中,元组是一种不可变的数据结构。当我们需要组合不同的元组时,我们可以使用元组合并的方法来实现。在本文中,我们将学习如何使用Python语言来合并元组。 什么是元组 在Python语言中&#…

windows 服务程序和桌面程序集成(六)集成安装、启动、卸载功能

系列文章目录链接: windows 服务程序和桌面程序集成(一)概念介绍windows 服务程序和桌面程序集成(二)服务程序windows 服务程序和桌面程序集成(三)UDP监控工具windows 服务程序和桌面程序集成&…

AntDesign——TableAPI学习

table表格用于展示数据 https://ant.design/components/table-cn#table 1.bordered false不显示每一个小表格的边框,true反之 2.columns 列名及列数据,接受columns数组 2.1 colums中必须声明的属性 title(列标题) dataInde…

为什么会被扣小红书品牌违规分,原因是什么

小红书在2022年经过一次较大点的规则变动,其中小红书品牌违规分就是其中亮点名词之一。很多人对此都不甚了解,今天为大家分享下为什么会被扣小红书品牌违规分,原因是什么? 一、什么是品牌违规分 品牌违规分是小红书在2022年4月20日…

工厂模式~

核心本质 ① 实例化对象不使用new,用工厂方法代替 ② 将选择实现类,创建对象统一管理和控制,从而将调用者跟我们的实现类解耦 简单工厂 public interface Car {void name(); }public class Tesla implements Car{Overridepublic void name()…

基于 opencv 的人脸识别上课考勤系统,附源码,可作为毕业设计

一、简介 这个人脸识别考勤签到系统是基于大佬的人脸识别陌生人报警系统二次开发的。 项目使用Python实现,基于OpenCV框架进行人脸识别和摄像头硬件调用,同时也用OpenCV工具包处理图片。交互界面使用pyqt5实现。 该系统实现了从学生信息输入、人脸数据…

ps复制图层警告 (不能从选区建立新图层,因为所选区域是空的。)解决方法

有时我们选完选区 按 CtrlJ 复制图层 会出现这种情况 问题出在你当前选的图层 因为 我选择的这块选区在第二个图层上 但很明显 选择的是一大个图层 简单说 你操作的选区必须在你当前选择的图层上才行 也就是 我现在要将选择区换成第二个图层才行 再按 CtrlJ 图层就出来了

AssetStudio工程导入VS各种报错解决

AssetStudio下载地址:https://github.com/Perfare/AssetStudio 工程导入,生成解决方案,然后报了一堆错。让我们来一个一个的解决 这个错误,是缺少System.Runtime.InteropServices.RuntimeInformation.dll文件,下载并添…

“爱心助考 为梦护航”雷锋志愿者在行动

为确保我市高考、学考工作顺利进行,为考生营造安全温馨的考试环境保驾护航,共青团怀化市委、市教育局、共青团鹤城区委、区教育局联合怀化市青少年关爱协会党支部,开展2023“爱心助考 为梦护航”雷锋志愿者服务活动。 6月7-9日高考三天&#…

开发新项目看过来,这3款基于 Vue 的免费开源的 admin 管理后台框架非常好用

三款 admin 框架,分别基于热门的前端 UI 组件库 ElementPlus / Ant Design / Naive UI 打造,开箱即用。 新项目的开始,一般是搭建 admin 系统,今天盘点一下3个好的选择。 Vue vben admin 了解详细:https://www.thos…

C型标准气动阀线圈插头安装距8mm

8mm针脚距气动阀插头、C型DIN标准电气插头。这些插头通常用于工业自动化、机械控制等领域。 工业标准,C型,DIN43650 / EN175301-803,插针中心距 8mm、3针脚、4针脚,额定电压 250V,工作电流 6A,最大接线 0.75mm2,电缆锁紧口 PG7,电缆外径 4-6…

Beyond Compare 4 无法打开

解决办法: 1.修改注册表。WINR呼出开始菜单,在搜索栏中输入 regedit,点击确定。 2.删除项目:\HKEY_CURRENT_USER\Software\ScooterSoftware\Beyond Compare 4\CacheId 根据这个路径找到cacheid 右击删除掉就可以

Allegro Design Entry CIS导出原理图BOM方法

1.Allegro Design Entry CIS导出原理图BOM方法 Tools->Bill of Materials 填入项分别为: Header:项次\t名称\t位号\t值\t封装\t数量 Combined property string: {Item}\t{PartName}\t{Reference}\t{Value}\t{PCB footprint}\t{Quantity} 点击OK生成如下表格

服务架构的进化之路:探索服务架构的演进之路

1、引言 服务架构是一种以服务为中心的软件设计模式,将应用程序拆分为一组小而自治的服务单元。随着互联网和信息技术的快速发展,软件系统变得越来越复杂。为了应对这种变化,服务架构也在不断地演变和发展。本文将简要介绍服务架构的发展史&…

基于BG/NBD概率模型的用户CLV预测

基于BG/NBD概率模型的用户CLV预测 小P:小H,我们最近想预测下用户的生命周期价值,有没有什么好的方法啊? 小H:简单啊, C L V 用户每月平均花费 ∗ 用户平均寿命 CLV用户每月平均花费*用户平均寿命 CLV用户每…