深度学习--softmax回归

news2025/4/17 21:27:24

回归可以用于预测多少问题预测房屋出售价格棒球可能获胜常数或者患者住院天数

事实我们也对分类问题感兴趣不是 多少而是哪一个

1 某个电子邮件是否属于垃圾邮件

2 某个用户可能注册还是不注册订阅服务

3 某张图像描绘还是

4 某人接下来最有可能哪部电影

通常机器学习实践者用分类问题描述两个有微妙差别问题如果我们支队样本硬性类别感兴趣就属于某个类别如果我们希望得到类别就属于某个类别概率 这两者界限往往很模糊其中一个原因即使我们只关心类别我们仍然使用类别模型

3.4.1 分类问题

从一个图像分类问题开始每次输入一个2像素x2灰度图像每张图像对应4特征x1,x2,x3,x4.此外假设每张图像属于类别一个

接下来我们选择如何表示标签, 我们有两个明显选择最直接选择y 属于{1,2,3}其中整数分别对应 这是计算机上存储此类信息有效方法如果类别有一定自然顺序假如我们试图预测{婴儿,儿童,青少年,中年人,老年人}那么这个问题可以转变为回归问题并且保留这种格式是有意义

但是一般分类问题并不与类别之间自然顺序有关幸运统计学家很早以前一种表示分类简单方法独热编码独热编码是一个向量它的分量类别一样多类别对应分量设置为1其他所有分量设置0我们例子中标签y将是一个三维向量其中(1,0,0)对应(0,1,0)对应,(0,0,1)对应

3.4.2 网络架构

为了估计所有可能类别条件概率我们需要一个由多个输出模型每个类别对应一个输出为了解决现行模型分类问题我们需要输出一个放射函数每个输出对应自己的放射函数我们例子中由于我们4特征3可能输出类别我们将需要12标量来表示权重(带下标的w)3标量表示偏置(带下标的b)下面我们每个输入计算3规范预测logit

:O1,..On

O1 = x1w11 + x2W12 + x3w13 +b1

O1 = x1w21 + x2W22 + x3w23 +b2

O1 = x1w31 + x2W32 + x3w33 +b3

我们可以用神经网络图像描述这个计算过程如图3-4所示线性回归一样softmax回归也是一个单层神经网络由于计算每个输出o1,o2o1取决于所有输入x1,x2,.x3x4 因此softmax回归输出也是全连接

为了更简洁表达模型使用线性代数符号通过向量形式表示O = WX + b这是一适合数学编写代码形式由此我们已经所有权重放到一个3x4矩阵对于给定数据样本的特征x我们输出权重输入特征进行局长-向量 乘法加上偏置b得到

3.4.3 全链路层的参数开销

正如我们将在后续章节中看到的在深度学习中全连接无处不在然而顾名思义全连接层完全连接可能有很多学习参数具体来说对于任何具有d输入q输出全连接参数开销O(dq)这个数字实践中可能令人望而却步幸运d输入转换为q输出成本可以减少O(dq/n)其中超参数n可以我们灵活指定实际应用中在参数节省模型有效性之间进行权衡

3.4.4 softmax运算

现在我们优化参数最大观测数据概率为了得到预测结果我们设置一个阈值选择具有最大概率标签

我们希望模型输出Yi可以视为属于j概率然后选择具有最大输出类别argmaxxi,yi作为我们预测例如如果yi,y2,y3分别0.1,0.80.1 那么我们预测类别2我们例子中代表

然而我们能否规范预测O直接视作我们感兴趣输出答案是否定因为现行输出直接视为概率存在一些问题一方面我们没有限制这些输出数值1线性输出直接视为概率存在一些问题一方面我们没有限制这些输出数值总和1另一方面根据输入不同输出可以负值这些违反2.6所述概率论基本公里

要将输出视为概率我们必须保证任何数据上输出都是非负总和1此外我们需要一个训练目标函数激励模型精准估计概率例如分类器输出0.5所有样本中我们希望这些样本中刚好有一半实际属于预测这个属性叫作校准

在社会科学家1959奶奶选择模型理论基础上发明softmax函数正是这样做的softmax函数能够将规范预测变换为负数并且总和1,同时模型保持可导性质为了实现这一目标我们首先对每个未规范化概率这样可以确保输出非负值为了确保最终输出概率纵隔1,我们每个求幂结果除以结果总和

Y^ = softmax(a),其中Yi^ = exp(Oj)/sigma exp(Oi)

这里对于所有J总有0 <= Yj^ <=1因此,y^可以视为一个正确概率分布softmax运算不会改变规范化的预测O之间大小次序只会确定分配每个类别概率因此预测过程中我们仍然可以用下选择最优可能类别

argmax Y^j = argmax Oj

尽管softmax是一个非线性函数softmax回归输出仍然输入特征放射变换决定因此softmax回归是一个线性模型

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2326645.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【计算机网络】记录一次校园网无法上网的解决方法

问题现象 环境&#xff1a;实训室教室内时间&#xff1a;近期突然出现 &#xff08;推测是学校在施工&#xff0c;部分设备可能出现问题&#xff09;症状&#xff1a; 连接校园网 SWXY-WIFI 后&#xff1a; 连接速度极慢偶发无 IP 分配&#xff08;DHCP 失败&#xff09;即使分…

第二十一章:Python-Plotly库实现数据动态可视化

Plotly是一个强大的Python可视化库&#xff0c;支持创建高质量的静态、动态和交互式图表。它特别擅长于绘制三维图形&#xff0c;能够直观地展示复杂的数据关系。本文将介绍如何使用Plotly库实现函数的二维和三维可视化&#xff0c;并提供一些优美的三维函数示例。资源绑定附上…

系统思考反馈

最近交付的都是一些持续性的项目&#xff0c;越来越感觉到&#xff0c;系统思考和第五项修炼不只是简单的一门课程&#xff0c;它们能真正融入到我们的日常工作和业务中&#xff0c;帮助我们用更清晰的思维方式解决复杂问题&#xff0c;推动团队协作&#xff0c;激发创新。 特…

【C++】vector常用方法总结

&#x1f4dd;前言&#xff1a; 在C中string常用方法总结中我们讲述了string的常见用法&#xff0c;vector中许多接口与string类似&#xff0c;作者水平有限&#xff0c;所以这篇文章我们主要通过读vector官方文档的方式来学习vector中一些较为常见的重要用法。 &#x1f3ac;个…

2025年数智化电商产业带发展研究报告260+份汇总解读|附PDF下载

原文链接&#xff1a;https://tecdat.cn/?p41286 在数字技术与实体经济深度融合的当下&#xff0c;数智化产业带正成为经济发展的关键引擎。 从云南鲜花产业带的直播热销到深圳3C数码的智能转型&#xff0c;数智化正重塑产业格局。2023年数字经济规模突破53.9万亿元&#xff…

Linux中常用服务器监测命令(性能测试监控服务器实用指令)

1.查看进程 ps -ef|grep 进程名以下指令需要先安装:sysstat,安装指令: yum install sysstat2.查看CPU使用情况(间隔1s打印一个,打印6次) sar -u 1 63.#查看内存使用(间隔1s打印一个,打印6次) sar -r 1 6

基于 GEE 的区域降水数据可视化:从数据处理到等值线绘制

目录 1 引言 2 代码功能概述 3 代码详细解析 3.1 几何对象处理与地图显示 3.2 加载 CHIRPS 降水数据 3.3 筛选不同时间段的降水数据 3.4 绘制降水时间序列图 3.5 计算并可视化短期和长期降水总量 3.6 绘制降水等值线图 4 总结 5 完整代码 6 运行结果 1 引言 在气象…

曲线拟合 | Matlab基于贝叶斯多项式的曲线拟合

效果一览 代码功能 代码功能简述 目标&#xff1a;实现贝叶斯多项式曲线拟合&#xff0c;动态展示随着数据点逐步增加&#xff0c;模型后验分布的更新过程。 核心步骤&#xff1a; 数据生成&#xff1a;在区间[0,1]生成带噪声的正弦曲线作为训练数据。 参数设置&#xff1a…

Qt6调试项目找不到Bluetooth Component蓝牙组件

错误如图所示 Failed to find required Qt component "Bluetooth" 解决方法&#xff1a;搜索打开Qt maintenance tool 工具 打开后&#xff0c;找到这个Qt Connectivity&#xff0c;勾选上就能解决该错误

JAVA- 锁机制介绍 进程锁

进程锁 基于文件的锁基于Socket的锁数据库锁分布式锁基于Redis的分布式锁基于ZooKeeper的分布式锁 实际工作中都是集群部署&#xff0c;通过负载均衡多台服务器工作&#xff0c;所以存在多个进程并发执行情况&#xff0c;而在每台服务器中又存在多个线程并发的情况&#xff0c;…

Java Spring Boot 与前端结合打造图书管理系统:技术剖析与实现

目录 运行展示引言系统整体架构后端技术实现后端代码文件前端代码文件1. 项目启动与配置2. 实体类设计3. 控制器设计4. 异常处理 前端技术实现1. 页面布局与样式2. 交互逻辑 系统功能亮点1. 分页功能2. 搜索与筛选功能3. 图书操作功能 总结 运行展示 引言 本文将详细剖析一个基…

深入剖析JavaScript多态:从原理到高性能实践

摘要 JavaScript多态作为面向对象编程的核心特性&#xff0c;在动态类型系统的支持下展现了独特的实现范式。本文深入解析多态的三大实现路径&#xff1a;参数多态、子类型多态与鸭子类型&#xff0c;详细揭示它们在动态类型系统中的理论基础与实践意义。结合V8引擎的优化机制…

GalTransl开源程序支持GPT-4/Claude/Deepseek/Sakura等大语言模型的Galgame自动化翻译解决方案

一、软件介绍 文末提供程序和源码下载 GalTransl是一套将数个基础功能上的微小创新与对GPT提示工程&#xff08;Prompt Engineering&#xff09;的深度利用相结合的Galgame自动化翻译工具&#xff0c;用于制作内嵌式翻译补丁。支持GPT-4/Claude/Deepseek/Sakura等大语言模型的…

TGES 2024 | 基于空间先验融合的任意尺度高光谱图像超分辨率

Arbitrary-Scale Hyperspectral Image Super-Resolution From a Fusion Perspective With Spatial Priors TGES 2024 10.1109/TGRS.2024.3481041 摘要&#xff1a;高分辨率高光谱图像&#xff08;HR-HSI&#xff09;在遥感应用中起着至关重要的作用。单HSI超分辨率&#xff…

算法基础_基础算法【高精度 + 前缀和 + 差分 + 双指针】

算法基础_基础算法【高精度 前缀和 差分 双指针】 ---------------高精度---------------791.高精度加法题目介绍方法一&#xff1a;代码片段解释片段一&#xff1a; 解题思路分析 792. 高精度减法题目介绍方法一&#xff1a;代码片段解释片段一&#xff1a; 解题思路分析 7…

Python数据类型-list

列表(List)是Python中最常用的数据类型之一&#xff0c;它是一个有序、可变的元素集合。 1. 列表基础 创建列表 empty_list [] # 空列表 numbers [1, 2, 3, 4, 5] # 数字列表 fruits [apple, banana, orange] # 字符串列表 mixed [1, hello, 3.14, True] # 混合类型…

如何使用cpp操作香橙派GPIO --使用<wiringPi.h>

香橙派是国产SBC &#xff0c;对标树莓派。不过国内的开发环境确实挺惨的&#xff0c;没多少帖子讨论。楼主决定从今天起&#xff0c;不定期更新香橙派的教程。 今天的教程是如何使用香橙派下载wiringOP 并使用CPP操作GPIO 操作GPIO 下载wiringPi 检查git 版本克隆wiringPi…

nacos-sdk-go v2.29 中一个拼写错误,我定位了3个小时 ……

文章目录 问题背景问题现象问题定位解决方案经验总结 问题背景 今天在给项目增加服务注册和发现功能时,选择了 nacos 作为服务注册中心。在使用 nacos-sdk-go v2.29 版本进行开发时,遇到了一个令人啼笑皆非的问题,足足花了3个小时才找到原因。 问题现象 在实现服务订阅通知功…

Linux中的文件寻址

Linux的层级结构 在Linux中一切皆文件 其中 要注意在命令行中看实际选择写哪一种路径 相对路径 绝对路径名称的简写&#xff0c;省略了用户当前所在的系统位置此名称只有在管理当前所在系统目录中子文件时才能使用系统中不以/开有的文件名称都为相对路径在程序操作时会自动…

静态时序分析:时钟标记(作为数据使用的时钟)及其分析方式

相关阅读 静态时序分析https://blog.csdn.net/weixin_45791458/category_12567571.html?spm1001.2014.3001.5482 引言 一般情况下&#xff0c;设计中的时钟路径和数据路径是严格区分开的&#xff1a;时钟路径即从时钟源对象&#xff08;时钟定义点&#xff09;到触发器的时钟…