DeepLearning_Note

news2024/12/27 12:29:21

这里写目录标题

  • 深度学习框架
  • 深度学习开发万能公式
  • 模型的网络设计和开发:
  • 激活函数:
  • 几个数据参数:
  • 神经网络的输出
  • 零碎知识点:

深度学习框架

在这里插入图片描述

深度学习开发万能公式

在这里插入图片描述

① 问题定义
② Paddle.vision.datasets(内置数据集)
③ 模型的网络设计和开发
④ 模型封装+模型配置+fit
⑤ Evaluate+predict
⑥ Save 保存+使用预测引擎部署 paddleSlim

模型的网络设计和开发:

在这里插入图片描述

激活函数:

作用:
神经元权重和偏差部分计算得到线性函数+激活函数=非线性函数(任意函数)
激活函数(线性函数)=非线性函数
如果神经网络只有线性,那么不论有多少隐层,有多少神经元,最终还是线性的。
多层神经网络也就可以转化为一层了,多层和一层的表达能力是一致的
在这里插入图片描述

任何复杂的函数都可以由一个常量加一堆sigmoid函数模拟出来
更复杂的函数就会对应更多的隐层和神经元
Sigmoid、Relu、Tanh:
(1) Sigmoid:任何复杂的函数都可以由一个常量加一堆sigmoid函数模拟出来,大多用在当输入数据的特征相差不明显的时候,梯度消失或梯度爆炸
(2)Tanh:大多用在当输入数据的特征相差明显的时候,梯度消失或梯度爆炸
(3)Relu: 优点:得到的SGD(梯度下降)的收敛速度会比 sigmoid/tanh 快很多。ReLU梯度为1,只有一边有饱和的问题,因此其梯度能在深度网络中传递。解决梯度消失(每次求导的值都相同)和梯度爆炸的问题,被广泛应用在深度学习中。ReLU同时引入了稀疏的特性(人类在判断问题时,往往会直接去掉一大部分的无用信息),ReLU完全把小于0的项全部取0。ReLU并非线性,它是分段函数,效果类似于划分和折叠空间。当网络层数少的时候,几根线肯定只能线性分割,但是当网络深了以后,就出现了很多很多分割线,曲线可以近似多段直线,因此,网络深的时候,直线也可以进行曲线分割。
缺点:ReLU的输入值为负的时候,输出始终为0,其一阶导数也始终为0,这样会导致神经元不能更新参数,也就是神经元不学习了,这种现象叫做“Dead Neuron”。假如learning rate 很大,很有可能网络中的40%的神经元都”dead”了。

学习博文:https://blog.csdn.net/zhaohongfei_358/article/details/123056206
https://blog.csdn.net/a6333230/article/details/80887062
激活函数是对向量中的每一个值进行计算,得到的结果再组装成向量

几个数据参数:

batch_size、enpochs
假设训练集一共60000个样本
batch_size=64 每一步step扔进去64个数据,60000个样本就需要执行至少938步,
enpochs=10 一个enpochs代表完成一次前向计算和反向传播,等于10代表执行10次前向计算和反向传播,每个enpochs里要完成938步的输入数据计算
enpochs太少会导致欠拟合,太多会导致过拟合
验证一下,多个enpoch的前面是不是跟少的是重复的?
不可能,肯定会有一些差距,loss从一开始就会不一样

神经网络的输出

  • Linear output
    y = wTh+b
    线性的输出层,通常用于回归问题,输出一个连续的具体的一个值
    在这里插入图片描述
  • Sigmoid
    y = f(wT+b)
    For binary classification
    y for one class
    1-y for another
    利用sigmoid将输出的那个值压到0-1这个区间内
  • Softmax
    解决多分类的问题,判断有多少个分类就有多少个输出
    先用指数函数将每个输出的值映射为一个正数,最后除以所有输出值的和,使得所有输出层的值加起来为1,得到的就类似于一个概率分布

零碎知识点:

  1. 对于cv的图像处理Paddlepaddle等框架由自带的数据增强API
  2. 大数据或者分布较散的数据要事先进行归一化处理,目的:归一化后在进行梯度优化时候比较有意义,梯度图会更规整一些,梯度下降会更快
  3. Y=w*x+b,在cnn中卷积核就是w,相当于将常数w变成了一个复杂的权重卷积核w,卷积核中的参数也是通过后续学习
  4. 网络中的全连接层其实就是线性层Lineary=w*x+b
  5. 平均池化层更适合提取背景普遍信息,最大池化层更易于提取显著特征,提取特征的效果更好一些

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/111445.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【ROS参数服务器】

参数服务器是以共享方式实现不同节点间数据交互的通信方式。主要用于存储多节点共享的数据,类似于全局变量。ROS中的参数服务器主要包含三个角色,分别是ROS Master(节点管理者)、Talker(参数设置者)、Listener(参数使用者),其中Talker和Liste…

创新京东T7开创“新算法宝典”,图文并茂,全新演绎,太酷了

导言 算法是一门学问,但却总遭到一些程序员的冷落。现在的开发人员,更热衷于编程语言的修炼,以应付面试需求时的需要,所以对算法的学习,稍许忽略了些。实际上,近些年来,各互联网公司对于算法的…

【知识梳理】前端路由的两种模式

一、概述 这是几年前写的的一篇文章,发在了简书上面,现在看来仍然有一些不足,所以再次整理一下发在掘金。 二、什么是单页面应用(SPA)? 首先我们需要了解一下前置的基础知识————SPA(单页面…

S3 #DooTrader 经典组冠军以良好盘感,创下近 900% 收益率摘得桂冠

本届 S3 #DooTrader 慈善杯全球交易大赛现已经进入白热化阶段,第二轮赛事冲刺在即,各位选手摩拳擦掌争取赢得最终的丰厚奖金。目前,领先的选手调整策略和仓位,以保持排位优势。我们看到现阶段经典组 TOP 1 选手已经创造了 1,300% …

WMS类图分析-android12

为什么要分析类图? WMS是一个复杂的模块,就像一个很大的家族,里面有各种角色,认识类图就像是认识WMS模块中的各个角色,不先把人认清楚了,怎么更好的理解他们之间的交互? 我觉得,这…

vue+antd搭建后台管理界面模版(PC端),适配中文、英文、日文 mock数据,开箱即用

vueantd搭建后台管理界面模版(PC端) 完整代码下载地址:vueantd搭建后台管理界面模版(PC端) 技术栈 vue2 vuex vue-router webpack ES6/7 axios antd 阿里图标iconfont 项目预览 http://nmgwap.gitee.io/vue…

【软件工程】实验4:校园二手物品交易过程的UI设计

文章目录校园二手物品交易过程的UI设计通过“用户画像”对用户群体进行分析校园二手物品交易过程UI设计(Figma)校园二手物品交易过程的UI设计 通过“用户画像”对用户群体进行分析 大学校园交易市场特点: 容量大。随着我国高等教育近年来的连…

Kubernetes部署_使用kubernetes部署Mysql主从结构(Kubernetes工作实践类)

文章目录一、前言二、实际操作步骤1:编写namespace脚本步骤2:编写configmap脚本步骤3:编写secret脚本(用来存放mysql密码)步骤4:编写initContainer脚本步骤5:编写StorageClass相关脚本1)权限设置&#xff1…

干货分享 | To B业务的用户运营五要点

随着产业互联网格局的逐渐深化,近年来,To B业务逐渐被互联网改变和赋能。为了更高效地获客和服务,更多的运营手段逐渐被运用在To B业务之中,而To B运营也变得越来越重要。 作为一家To B企业,AdBright常常收到网友的提问…

YOLOV3论文学习

YOLOv3论文链接:https://pjreddie.com/media/files/papers/YOLOv3.pdf 综述 一、摘要 1、320*320的YOLOv3推理时间22ms,准确率28.2mAP,达到了SSD的精确度,推理速度却快了三倍。 2、基于.5mAp Iou 的YOLOv3的检测效果还比较不错&a…

Python使用Pandas导入数据库sql

Python使用Pandas导入数据库sql一、前言二、准备工作三、从数据库导入数据到Pandas一、前言 对于关系数据库的访问,Python社区已经制定出一个标准,称为Python Database API Specification。Mysql,Oracal等特定数据库模块都遵从这一规范&…

QT 学习笔记(十一)

文章目录一、绘图设备1. QPixmap1.1 QPixmap 简介1.2 QPixmap 演示2. QBitmap2.1 QBitmap 简介2.2 QBitmap 演示见 QPixmap 和 QBitmap 的区别。3. QImage3.1 QImage 简介3.2 QImage 演示4. QPicture4.1 QPicture 简介4.2 QPicture 演示二、QPixmap 和 QBitmap 的区别1. widget…

Python正在消亡?致命弱点是否会让Python被新语言取代?

被业界称为“瑞士军刀”的编程语言,可能会被更适合该任务的其他语言取代吗? 自从1990年代初Python发布以来,它引起了很多热议。当然,编程社区花了至少20年的时间才逐渐注意到它的存在,而当它一旦开始流行起来&#xf…

Web入门开发【一】- Web开发介绍

欢迎来到霍大侠的小院,我们来学习Web入门开发的系列课程。 首先我们来了解下这个课程能学到什么? 1、你将可以掌握Web网站的开发全过程。 2、了解基础的HTML,CSS,JavaScript语言。 3、开发自己的第一个网站。 4、认识很多对编…

UML类关系

1、聚合关系(aggregation) 用空心菱形箭头表示,整体和部分有各自的生命周期。部分可以属于多个整体对象! class Student; class Class { private: Student s; public: void set_student(Student s) { this.s s; } }; student() { print(“c…

电脑商城网站

开发工具(eclipse/idea/vscode等): 数据库(sqlite/mysql/sqlserver等): 功能模块(请用文字描述,至少200字): 作为一个网上商城系统,就应该做到能提供强大的业务支持功能,系统能实现用户的注册功能、登录 功…

整理各种Vue项目在IE浏览器白屏报错 SCRIPT1002:语法错误

目录 一、关于 sockjs-client 依赖包 二、关于 highlight 依赖包 三、关于 swiper 依赖包 四、IE 不支持 ES6 语法 五、第三方插件引入导致 六、本地环境正常,生产环境仍旧白屏 这篇文章主要介绍了 Vue 项目在 IE 浏览器显示白屏并报错 SCRIPT1002: 语法错误 …

【数字信号处理】卷积和乘法系列3之傅里叶变换对III

“傅里叶”家族 引言 虽然你知道傅里叶级数和变换,但看看它们之间的关系是很有趣的。本节的目的是展示各种基于傅立叶的变换如何相互关联。 要做到这一点,有必要认识到存在一个具有四个成员的傅里叶“家族”,如图 30 所示。有四个是因为除了具有系列与变换选项(行)外,…

转行的35岁程序员们

“大龄程序员去哪儿了”,10月24日程序员节当天,这成为了社交媒体上最火的话题之一。根据澎湃新闻统计,在知乎、豆瓣上关于“大龄程序员”的369个有效提问里,大龄程序员的职场成长问题最受关注,一共有242个,…

给刚入职场的年轻人八条建议

年轻人刚入职场时,总会碰到各种各样的难题,作为过来人,很多新人的难处我也深有体会。想要快速融入职场是没有捷径的,但是如果处理得当,还是可以少走很多弯路,以下就是我总结的给刚入职场的年轻人的八条建议…