动手学深度学习（三）线性神经网络—softmax回归

news2025/7/12 12:12:01

分类任务是对离散变量预测，通过比较分类的概率来判断预测的结果。

softmax回归和线性回归一样也是将输入特征与权重做线性叠加，但是softmax回归的输出值个数等于标签中的类别数，这样就可以用于预测分类问题。

分类问题和线性回归的区别：分类任务通常有多个输出，作为不同类别的置信度。

一、softmax回归

1.1 网络架构

为了解决线性模型的分类问题，我们需要和输出一样多的仿射函数，每个输出对应它自己的仿射函数。

与线性回归一样，softmax回归也是一个单层神经网络。

在softmax回归中，输出层的输出值大小就代表其所属类别的置信度大小，置信度最大的那个类别我们将其作为预测。

1.2 softmax运算

首先，分类任务的目标是通过比较每个类别的置信度大小来判断预测的结果。但是，我们不能选择未规范化的最大输出值的 $o_i$ 的类别作为我们的预测，原因有两点：

1. 输出值 $o_i$ 的总和不一定为1

2. 输出值 $o_i$ 有可能为负数。

这违反了概率论基本公理，很难判断所预测的类别是否真符合真实值。

softmax函数通过如下公式，解决了以上问题：

softmax函数确保了输出值的非负，和为1，这一种规范手段。

1.3 交叉熵损失函数

交叉熵损失常用来衡量两个概率之间的差别。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/855851.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

《24海南大学835软件工程考研经验贴》

《24海南大学835软件工程考研经验贴》

1.经验之谈首先，我是一个二战的考生，一战给我带来的经验有几点。第一，数学、专业课这两门越早复习越好，越拖到后面你就会发现来不及了，这学不完，那学不完的。第二、我认为是比较关键的一点，一定…

阅读更多...

WebRTC基础知识

WebRTC基础知识

文章目录基础概念NAT (Network Address Translation) 打洞STUN（Session Traversal Utilities for NAT）基于STUN协议的DDoS反射攻击 # TODO TURN（Traversal Using Relays around NAT）ICE（Interactive Connectivity Est…

阅读更多...

Java版企业电子招标采购系统源码Spring Cloud + Spring Boot +二次开发+ MybatisPlus + Redis tbms

Java版企业电子招标采购系统源码Spring Cloud + Spring Boot +二次开发+ MybatisPlus + Redis tbms

功能描述 1、门户管理：所有用户可在门户页面查看所有的公告信息及相关的通知信息。主要板块包含：招标公告、非招标公告、系统通知、政策法规。 2、立项管理：企业用户可对需要采购的项目进行立项申请，并提交审批，查…

阅读更多...

[C#] 简单的俄罗斯方块实现

[C#] 简单的俄罗斯方块实现

一个控制台俄罗斯方块游戏的简单实现. 已在 github.com/SlimeNull/Tetris 开源. 思路很简单, 一个二维数组存储当前游戏的方块地图, 用 bool 即可, true 表示当前块被填充, false 表示没有. 然后, 抽一个 “形状” 类, 形状表示当前玩家正在操作的一个形状, 例如方块, 直线…

阅读更多...

力扣 474. 一和零

力扣 474. 一和零

题目来源：https://leetcode.cn/problems/ones-and-zeroes/description/ C题解：本题其实是01背包问题！只不过这个背包有两个维度，一个是m 一个是n，而不同长度的字符串就是不同大小的待装物品。动规五部曲： …

阅读更多...

Java并发 | 常见线程安全容器

Java并发 | 常见线程安全容器

文章目录简介一、Hash表🚣1、ConcurrentHashMap1.1 内部实现原理1.2 并发操作方法1.3 ConcurrentHashMap与Hashtable的比较二、集合🚣2、CopyOnWriteArrayList2.1 内部实现原理2.2 Copy-On-Write(COW)设计思想2.3 实操三、Map🚣3、Concurr…

阅读更多...

C语言第十课----------------扫雷----------数组的经典练手题

C语言第十课----------------扫雷----------数组的经典练手题

作者前言 🎂 ✨✨✨✨✨✨🍧🍧🍧🍧🍧🍧🍧🎂 🎂 作者介绍： 🎂🎂 🎂…

阅读更多...

力扣120.三角形最小路径和（动态规划）

力扣120.三角形最小路径和（动态规划）

/*** author Limg* date 2022/08/09* 给定一个三角形 triangle ，找出自顶向下的最小路径和。* 每一步只能移动到下一行中相邻的结点上。* 相邻的结点在这里指的是下标与上一层结点下标相同或者等于上一层结点下标 1 的两个结点。* 也就是说，如果正位于当…

阅读更多...

（MVC）SpringBoot+Mybatis+Mapper.xml

（MVC）SpringBoot+Mybatis+Mapper.xml

前言：本篇博客主要对MVC架构、Mybatis工程加深下理解，前面写过一篇博客：SprintBoothtml/css/jsmybatis的demo，里面涉及到了Mybatis的应用，此篇博客主要介绍一种将sql语句写到了配置文件里的方法，即Mybatis里…

阅读更多...

AVL树（二叉搜索树）

AVL树（二叉搜索树）

AVL树 1.1 AVL树的概念1.2 AVL树节点的定义1.3 AVL树的旋转1.3.1 右旋（右单旋）1.3.2 左旋（左单旋）1.3.3 左右双旋（先左单旋再右单旋）1.3.4 右左双旋（先右单旋再左单旋） 1.4 AVL树的插…

阅读更多...

进程的初识

进程的初识

程序和进程有什么区别程序是静态的概念，gcc xxx.c -o pro 磁盘中生成的文件，叫做程序。进程是程序的一次运行活动，通俗点的意思就是程序跑起来了，系统中就多了一个进程。如何查看系统中有哪些进程使用 ps 指令（完整…

阅读更多...

❤ vue组件的生命周期

❤ vue组件的生命周期

❤ vue组件的生命周期介绍在vue组件中，生命周期指的是从组件创建开始，到组件销毁，所经历的整个过程；在这个过程中的一些不同的阶段，vue会调用指定的一些组件方法。基本生命周期函数有下面几个阶段：创建…

阅读更多...

Python中的dataclass：简化数据类的创建

Python中的dataclass：简化数据类的创建

Python中的dataclass是一个装饰器，用于自动添加一些常见的方法，如构造函数、__repr__、__eq__等。它简化了创建数据类的过程，减少了样板代码，提高了代码的可读性和可维护性。有点类似java里面的Java Bean。让我们看一个简单的例子…

阅读更多...

将.doc文档的默认打开方式从WPS修改为word office打开方式的具体方法（以win 10 操作系统为例）

将.doc文档的默认打开方式从WPS修改为word office打开方式的具体方法（以win 10 操作系统为例）

将.doc文档的默认打开方式从WPS修改为word office打开方式的具体方法（以win 10 操作系统为例） 随着近几年WPS软件的不断完善和丰富，在某些方面取得了具有特色的优势。在平时编辑.doc文档时候也常常用到wps软件，不过WPS文献也存在…

阅读更多...

【分布式技术专题】RocketMQ延迟消息实现原理和源码分析

【分布式技术专题】RocketMQ延迟消息实现原理和源码分析

痛点背景业务场景假设有这么一个需求，用户下单后如果30分钟未支付，则该订单需要被关闭。你会怎么做？ 之前方案最简单的做法，可以服务端启动个定时器，隔个几秒扫描数据库中待支付的订单，如果(当前时间-订…

阅读更多...

EasyPoi导出导入(带校验)简单示例 EasyExcel

EasyPoi导出导入(带校验)简单示例 EasyExcel

官方文档 : http://doc.wupaas.com/docs/easypoi pom的引入: <dependency><groupId>cn.afterturn</groupId><artifactId>easypoi-spring-boot-starter</artifactId><version>4.0.0</version></dep…

阅读更多...

分布式协调组件Zookeeper

分布式协调组件Zookeeper

Zookeeper介绍什么是Zookeeper ZooKeeper 是⼀种分布式协调组件，用于管理大型主机。在分布式环境中协调和管理服务是一个复杂的过程。ZooKeeper 通过其简单的架构和 API 解决了这个问题。ZooKeeper 允许开发人员专注于核心应用程序逻辑，而不必担心应用…

阅读更多...

【Linux】多线程——线程引入 | 线程控制

【Linux】多线程——线程引入 | 线程控制

文章目录一、Linux多线程1. 线程概念2. 线程创建3. 线程和进程4. 线程的优缺点二、线程控制1. 线程创建2. 线程终止3. 线程等待4. 线程分离5. 线程局部存储三、线程封装一、Linux多线程一级页表和二级页表都是key/val模型，一级页表的key是第一份的10个比特位&a…

阅读更多...

（统计学习方法|李航）第一章统计学习方法概论——四五六节模型评估与模型选择，正则化与交叉验证，泛化能力

（统计学习方法|李航）第一章统计学习方法概论——四五六节模型评估与模型选择，正则化与交叉验证，泛化能力

一，模型评估与模型选择 1.训练误差与测试误差假如我们有100个数据。80条记录给训练集，10条记录给测试集，10条记录给验证集先在训练集中训练模型， 再在验证集上测试看哪种模型更拟合最后用测试集算出成绩表示决策函数模型…

阅读更多...

数据清理在数据科学中的重要性

数据清理在数据科学中的重要性

什么是数据清理？ 推荐：使用 NSDT场景编辑器助你快速搭建可编辑的3D应用场景在数据科学中，数据清理是识别不正确数据并修复错误的过程，以便最终数据集可供使用。错误可能包括重复字段、格式不正确、字段不完整、数据不相关或不准…

阅读更多...

推荐文章

最新文章