交叉熵(crossentropy)损失

news2024/12/31 5:00:18

1 神经网络分类问题

分类问题,通常分为二分类问题与多分类问题(大于2类)。

2 二分类问题

2.1 网络设计

神经网络的最后一层(输出层),为一个神经元,使用激活函数sigmoid。

tf.keras.layers.Dense(1,activation="sigmoid")

使用sigmoid激活函数将输出压缩到0-1的范围,其输出值为1类的概率。

2.2 损失函数

在神经网络训练过程中,若某样本的标签为1,神经网络的输出0.9(表示1类的概率为90%),尽管此时可认为输出的类别为1类(通常以0.5为边界,大于0.5为1类,小于0.5为0类);但神经网络并没有100%确定(输出1)是1类,存在损失,需要进一步优化参数,使输出接近于1。

此时定义损失函数binary_crossentropy交叉熵损失:

其中yi为样本真实的标签,p(yi)为模型输出值(样本为1类的概率)。

当样本真实标签为1,样本为1类的概率为1,求和项的前后均为0,损失为0;

当样本真实标签为0,样本为1类的概率为0,同样求和项的前后均为0,损失为0;

而当样本为1类或者0类,而概率不为1或0时,存在损失>0,对batch中样本的损失求平均,得到平均损失,进一步的优化网络参数。

model.compile(...,
              loss=tf.keras.metrics.binary_crossentropy,

              ...)

3 多分类问题

3.1 网络设计

神经网络的最后一层(输出层),为N个神经元(N分类问题,N>2),使用激活函数softmax。

tf.keras.layers.Dense(N,activation="softmax")

使用softmax激活函数将多输出求和,然后计算每个输出的占比(可以理解为对应类别的概率),作为模型的输出,占比最高的输出神经元的位置为模型确定的类别(np.argmax())。

3.2 损失函数

在神经网络训练过程中,若某样本的标签为3,神经网络的输出第3神经元的输出0.5(表示3类的概率为50%,所有输出神经元的输出的最大值),尽管此时可认为输出的类别为3类(最大值所在的神经元位置);但神经网络并没有100%确定(输出3)是3类,存在损失,需要进一步优化参数,使神经元3的输出接近于1。此时定义损失函数

其中yi为样本one-hot标签第i位的值,p(yi)为网络输出层第i个神经元的输出。由于标签one-hot编码中只有一位为1,其它为0,本质上此时交叉熵损失只关注真实标签中1对应的一个神经元的输出。

常用categorical_crossentropy和sparse_categorical_crossentropy交叉熵。

当数据集标签为1维时(如,样本类别为5时,标签为5),采用sparse_categorical_crossentropy计算损失。此时输出为N维,标签为1维。

model.compile(...,
              loss=tf.keras.metrics.sparse_categorical_crossentropy,

              ...)

当数据集标签为N维时(标签采用one-hot编码,或者tf.keras.utils.to_categorical编码。如,样本类别为5时,标签为(0,0,0,0,1,0,...)N维)。采用categorical_crossentropy计算损失。此时模型输出为N维,标签为N维。

model.compile(...,
              loss=tf.keras.metrics.categorical_crossentropy,

              ...)

4 其他

“sparse_categorical_crossentropy ” 等同tf.keras.metrics.sparse_categorical_crossentropy

“categorical_crossentropy ” 等同tf.keras.metrics.categorical_crossentropy

...

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1116780.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

如何测试WordPress能否成功发送邮件

如果你的WordPress网站没有连接到SMTP服务器,就发不了邮件。 修改管理员密码,发不了邮件。 用户提交表单,你收不到邮件提醒。 确定真的需要配置SMTP 有的服务器在一键安装WordPress的时候,已经帮你配置好了(比如Sit…

windos默认输入法开机无法使用,需要手动执行ctfmon.exe

windos默认输入法开机无法使用,需要手动执行ctfmon.exe 系统:win10专业版 第一种方法 以管理员身份运行cmd 执行 sfc /scannow 1.右键点击此电脑,点击管理,打开如图所示服务选项卡,找到如图所示服务点击启动&#…

数据结构与算法(十):动态规划与贪心算法

参考引用 Hello 算法 Github:hello-algo 1. 动态规划算法 动态规划将一个问题分解为一系列更小的子问题,并通过存储子问题的解来避免重复计算,从而大幅提升时间效率 问题:给定一个共有 n 阶的楼梯,你每步可以上 1 阶或…

Django和jQuery,实现Ajax表格数据分页展示

1.需求描述 当存在重新请求接口才能返回数据的功能时,若页面的内容很长,每次点击一个功能,页面又回到了顶部,对于用户的体验感不太友好,我们希望当用户点击这类的功能时,能直接加载到数据,请求…

C#,数值计算——分类与推理Phylagglomnode的计算方法与源程序

1 文本格式 using System; using System.Collections.Generic; namespace Legalsoft.Truffer { public class Phylagglomnode { public int mo { get; set; } public int ldau { get; set; } public int rdau { get; set; } public …

# 用acme.sh申请证书(含泛域名)

用acme.sh申请证书(含泛域名) 文章目录 用acme.sh申请证书(含泛域名)1 申请证书:1.1 使用dns api方式申请证书(以阿里云dns为例)1.2 附加:也可以用其他方式申请证书 2 续签证书&…

跨域方案的抉择

前言 遇到跨域问题的时候,到底是使用CORS来解决,还是使用代理呢? 判断依据不是技术层面,而是你的生产环境。 首先要关注的是生产环境里面到底是一种什么样的情况,到底有没有跨域,然后根据生产环境的情况&a…

yjs demo: 多人在线协作画板

基于 yjs 实现实时在线多人协作的绘画功能 支持多客户端实时共享编辑自动同步&#xff0c;离线支持自动合并&#xff0c;自动冲突处理 1. 客户端代码&#xff08;基于Vue3&#xff09; 实现绘画功能 <template><div style"{width: 100vw; height: 100vh; over…

Matlab遗传算法工具箱——一个例子搞懂遗传算法

解决问题 我们一般使用遗传算法是用来处理最优解问题的&#xff0c;下面是一个最优解问题的例子 打开遗传算法工具箱 ①在Matlab界面找到应用程序选项&#xff0c;点击应用程序(英文版的Matlab可以点击App选项) ②找到Optimization工具箱&#xff0c;点击打开 创建所需要…

[SQL开发笔记]INSERT INTO 语句:将新记录插入到数据库表中

目前&#xff0c;向数据库插入数据是数据管理的重要环节&#xff0c;它可以将数据长期保存、共享访问、保证数据的完整性和安全性&#xff0c;同时也是进行数据检索和分析的基础。其中&#xff0c;INSERT INTO 语句是SQL&#xff08;结构化查询语言&#xff09;中用于向数据库表…

【王道代码】【2.3链表】d1

关键字&#xff1a; 递归删除x&#xff1b;删除所有x&#xff1b;递归反向输出&#xff1b;删除最小结点&#xff08;2组指针&#xff09;&#xff1b;原地逆置&#xff1b;使递增有序

代码随想录二刷 Day 44

01背包问题二维做法先遍历背包或者物品都可以&#xff0c;然后是前序遍历&#xff1b; 一维做法一定先遍历物品然后遍历背包&#xff0c;遍历背包的时候是后序遍历&#xff1b;一维做法还是有点难理解&#xff0c;其实就是后面的数字还是要从前面的推导出来&#xff0c;但是如…

全球3小时气象数据集GLDAS Noah Land Surface Model L4 3 hourly 0.25 x 0.25 degree V2.1

简介 全球3小时气象数据集&#xff08;GLDAS Noah Land Surface Model L4 3 hourly 0.25 x 0.25 degree V2.1&#xff0c;简称GLDAS_NOAH025_3H 2.1&#xff09;&#xff0c;时空分辨率分别为3小时、0.25度。该数据产品于2020年1月重新处理&#xff0c;代替之前版本。前言 – …

RunnerGo 支持UI自动化的测试平台

RunnerGo提供从API管理到API性能再到可视化的API自动化、UI自动化测试功能模块&#xff0c;覆盖了整个产品测试周期。 RunnerGo UI自动化基于Selenium浏览器自动化方案构建&#xff0c;内嵌高度可复用的测试脚本&#xff0c;测试团队无需复杂的代码编写即可开展低代码的自动化…

基于侏儒猫鼬优化的BP神经网络(分类应用) - 附代码

基于侏儒猫鼬优化的BP神经网络&#xff08;分类应用&#xff09; - 附代码 文章目录 基于侏儒猫鼬优化的BP神经网络&#xff08;分类应用&#xff09; - 附代码1.鸢尾花iris数据介绍2.数据集整理3.侏儒猫鼬优化BP神经网络3.1 BP神经网络参数设置3.2 侏儒猫鼬算法应用 4.测试结果…

Oracle监听服务启动后停止

问题 解决办法 找到listener.ora文件,箭头指的地方&#xff0c;host改为localhost 如何找到listener.ora 其中1522端口&#xff0c;是我新增的监听服务。之前这个host是一个固定的ip地址&#xff0c;我更换网络环境后&#xff0c;ip地址变了&#xff0c;所以导致监听启动失败。…

基于白鲸优化的BP神经网络(分类应用) - 附代码

基于白鲸优化的BP神经网络&#xff08;分类应用&#xff09; - 附代码 文章目录 基于白鲸优化的BP神经网络&#xff08;分类应用&#xff09; - 附代码1.鸢尾花iris数据介绍2.数据集整理3.白鲸优化BP神经网络3.1 BP神经网络参数设置3.2 白鲸算法应用 4.测试结果&#xff1a;5.M…

【Python Numpy教程】numpy数据类型

文章目录 前言一、安装numpy包二、numpy的数据类型2.1 NumPy数据类型概述类型类型字符代码 三、创建数据类型对象3.1 numpy.dtype介绍3.2 示例代码&#xff1a; 总结 前言 NumPy是Python中最常用的科学计算库之一&#xff0c;它提供了高性能的多维数组对象&#xff08;ndarray…

CSS 滚动驱动动画 timeline-scope

timeline-scope 语法兼容性 timeline-scope 看到 scope 就知道这个属性是和范围有关, 没错, timeline-scope 就是用来修改一个具名时间线(named animation timeline)的范围. 我们介绍过的两种时间线 scroll progress timeline 和 view progress timeline, 使用这两种时间线(通…

BAT034:批处理打开电脑常用功能面板

引言&#xff1a;编写批处理程序&#xff0c;输入相应功能序号&#xff0c;实现打开打开百度搜索、启动磁盘清理、启动注册表编辑器、启动系统配置、启动控制面板、启动画图程序、启动计算器程序、启动DirectX诊断工具、启动服务、启动计算机管理、启动系统信息、启动更改适配器…