Softmax 回归 + 损失函数 + 图片分类数据集【动手学深度学习v2】李沐动手学深度学习课程笔记

news2024/11/15 22:20:58

目录

Softmax回归

损失函数

图片分类数据集

Softmax回归从零开始实现

Softmax回归简洁实现


Softmax回归

回归和分类的区别

回归问题举例上节课的预测房价问题,分类问题就是对样本进行分类

回归和分类的具体区别

假设真实的类别为第i个类别(值为1),其他类别都是假的(值为0),选择i最大化置信度

置信度的规则

选择i使得置信度远大于其他的类别的置信度

置信度相当于概率

y hat是一个长为n的向量 下面那个公式的操作是使得和为1,也就是说yi hat可以作为概率,两个Y的区别就可以作为损失

softmax的损失函数

softmax回归总结

损失函数

均方损失

蓝色:Y=0时,变化预测值Y’的函数(二次函数)

绿色:似然函数(高斯分布)

橙色:损失函数的梯度(穿过原点的一次函数),决定了如何更新参数

梯度和预测值的相对关系决定了参数更新的变化程度

L1损失函数

蓝色:预测值、绿色:似然函数、橙色:导数

好处:稳定

不好:零点处不可导

综合以上两种损失函数,自己造的完美损失函数

梯度和实际值的相对关系


图片分类数据集

Fashion-MNIST数据集

下载数据集到内存

transforms.totensor() 将图像数据转化为浮点数格式

train=true 下载训练数据集 download=true默认在网上下载

第一张图片的形状 1表示Channel 28x28

打标签、输出图像函数

输出

画两行,每行有九张图片

读取数据

shuffle 决定是否要打乱数据集的顺序

timer用来测试速度(读取数据的速度通常要比模型速度快很多)

下载数据集

resize可以选择把图片变得更大


Softmax回归从零开始实现

softmax是所有深度学习的基础

iter 训练集和测试集的迭代器

拉成向量(会损失信息,可以用卷积神经网络恢复)

矩阵求和

keepdim=true 表示还是二维矩阵 X是一个矩阵

实现softmax

一个实例

实现softmax回归模型

-1表示自动计算(实际表示批量大小)

举个例子

y_hat是预测值

y_hat [ [0,1], y] 拿出对真实标号那个类的预测值

实现交叉熵损失函数

预测类别与真实元素进行比较

评估任意模型的准确率

Accumulator

softmax回归训练

可视化

训练函数

优化损失函数

训练模型

对图片进行分类预测

Softmax回归简洁实现

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1491022.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

掌握WhatsApp手机号质量评分:增加信息可达性

WhatsApp手机号质量评分是用于衡量用户手机号与平台互动的健康度,确保用户通讯时的合规性和安全性。在实掌握WhatsApp手机号质量评分实际应用中,这个评分会影响用户的消息发送的可达性。高质量的评分意味着用户的账户被视为可信赖的,其发送的…

知识点碎片一,物联网通信协议和技术

loT通信协议 1. 前言 本文属于老吴个人对物联网研发学习的路线整理,属于个人对物流网产品研发的知识碎片的学习,文章没有先后顺序,随笔记录。文章如果有错误,希望各位读者指出问题所在,老吴将不胜感激。 2. 名称概述…

动网格学习:如何系统学习,案例及相关学习内容目录-学习材料

一、学习文章及相关案例 动网格(Moving Mesh)是一种在数值模拟中用于处理流动区域随时间变化的技术。在流体动力学模拟中,当物理模型或某些区域的网格需要随着流动的进行而动态改变时,就会采用动网格技术。例如,在模…

设计师必备!8款在线原型图工具分享

在线原型图的核心功能是可视化需求,因此一个易于使用的在线原型图工具对原型图设计至关重要。使用熟悉的Photoshop 对于Illustrator来说,虽然它们功能强大,但界面太复杂,初学者很难快速上手,面对批量调整的在线原型图还…

PostgreSQL restartpoint 原理详解

背景 大部分人对 PG 的 checkpoint 机制会熟悉一点,但是对 restartpoint 却不太熟悉,网上介绍这方面的文章也比较少。因此,本文将以 PG 14.7 的社区代码为基础,介绍 PG 中的 restartpoint 机制。 原理介绍 什么是 restartpoint…

VR 全景模式OpenGL原理

VR 全景模式OpenGL原理 VR 全景模式原理 VR 全景模式原理将画面渲染到球面上,相当于从球心去观察内部球面,观察到的画面 360 度无死角,与普通播平面渲染的本质区别在渲染图像部分,画面渲染到一个矩形平面上,而全景需…

稀碎从零算法笔记Day4-LeetCode:交替合并字符串

前言:今天妹有深夜档,因为8点有个飞机 题型:字符串、双指针(笔者没用这个思路) 链接:1768. 交替合并字符串 - 力扣(LeetCode) 来源:LeetCode 著作权归作者所有。商业转…

Linux 文件系列:深入理解文件描述符fd,重定向,自定义shell当中重定向的模拟实现

Linux 文件系列:深入理解文件fd,重定向,自定义shell当中重定向的模拟实现 一.预备知识二.回顾C语言中常见的文件接口跟重定向建立联系1.fopen函数的介绍2.fclose函数的介绍3.代码演示1.以"w"(写)的方式打开2.跟输出重定向的联系3.以 "a"(追加)的方式打开4.…

Vue3 配置 vite.config.js 解决跨域问题

Vue3 配置 vite.config.js 解决跨域问题 问题再现 Access to XMLHttpRequest at ‘http://localhost:8080/user/register’ from origin ‘http://localhost:5173’ has been blocked by CORS policy: No ‘Access-Control-Allow-Origin’ header is present on the requested…

JS数组,if等结构语序

目录 浏览器的断点调试: 流程控制: 顺序流程控制:流程代码会逐行向下进行。 分支流程控制: IF语句: Switch语句: Switch和if的区别: 三元表达式: 循环: for循环…

麻省理工最新开发AI模型,让机器人实现自主规划路线

文 | BFT机器人 麻省理工学院的研究人员独具匠心地应用了人工智能来解决仓库中的机器人路径规划问题,以此缓解交通拥堵的难题。据该学院介绍,他们的团队开发了一种深度学习模型,其效率比传统的强随机搜索方法高出近四倍,极大地提…

设计模式:策略模式 ⑥

一、策略模式思想 简介 策略模式(Strategy Pattern)属于对象的行为模式。其用意是针对一组算法,将每一个算法封装到具有共同接口的独立的类中,从而使得它们可以相互替换。策略模式使得算法可以在不影响到客户端的情况下发生变化。…

关于V5版本的echarts的引导线标签文字存在描边问题

1.如果存在描边:(如图所示,炒鸡难受好吧,也不知道官方为什么这样初始化) 2.只需在series的label中配置color:#FFF即可

Crossbar阵列的电路结构及其基本原理

忆阻器Crossbar阵列是一种先进的神经网络硬件实现技术,它利用忆阻器的物理特性来模拟神经网络中的突触连接,为人工智能和机器学习应用提供了一种高效、低能耗的计算平台。本文将深入探讨忆阻器Crossbar阵列的基本原理及其在Read(读取&#xf…

YOLOv9独家原创改进|加入幽灵卷积Ghost Convolution模块,轻量化!

专栏介绍:YOLOv9改进系列 | 包含深度学习最新创新,主力高效涨点!!! 一、论文摘要 由于内存和计算资源有限,在嵌入式设备上部署卷积神经网络是困难的。特征图中的冗余是那些成功的细胞神经网络的一个重要特征…

机器人顶刊IJRR近期国人新作(2024)

一、IJRR简介 The International Journal of Robotics Research(IJRR)是机器人领域的高水平学术期刊,专注于发布关于机器人技术和相关领域的最新研究成果。IJRR创刊于1982年,是该领域的第一本学术刊物,2022-2023最新影…

MP2494图纸 国产替代型号SC72001宽工作输入电压范围:4.5V 至 80V

MP2494 是一款单片降压开关变换器。它在宽输入范围内可实现 2A 连续输出电流,具有出色的负载和线性调整率。其控制良好的开关沿降低了 EMI 干扰。故障保护功能包括逐周期限流保护和过温关断保护。MP2494 最大限度地减少了现有标准外部元器件的使用。MP2494采用SOIC8…

力扣每日一题 用栈实现队列

Problem: 232. 用栈实现队列 文章目录 思路复杂度💖 朴素版💖 优化版 思路 👨‍🏫 路飞题解 复杂度 时间复杂度: 添加时间复杂度, 示例: O ( n ) O(n) O(n) 空间复杂度: 添加空间复杂度, 示例: O ( …

非常优秀的一个开源库Gradio,几行代码完成部署快速搭建AI算法可视化部署演示,直接启动零配置实现微信分享、公网分享、内网穿透,包含项目搭建和案例分享

非常优秀的一个开源库Gradio,几行代码完成部署快速搭建AI算法可视化部署演示,直接启动零配置实现微信分享、公网分享、内网穿透,包含项目搭建和案例分享。 Gradio是一个功能丰富的Python库,可以让您轻松创建和共享自己的交互式机器…

【JAVA】Tomcat集成到IDEA

目录 1.在IDEA中安装插件:Smart Tomcat。 2.配置smart tomcat 浏览器显示中文出现乱码 我们可以借助IDEA的插件,把tomcat集成IDEA中,然后我们就可以通过IDEA一键式的重新打包部署了。 1.在IDEA中安装插件:Smart Tomcat。 1&a…