关于学习神经网络的一些感悟

news2024/11/21 1:24:44

      intro

  本文主要是笔者学习神经网络时一些思考的感悟,由于本人对人工智能方向了解甚浅,所以记录的理解会有不正确的地方,欢迎批评指正!

        深度学习与传统机器学习算法的一个显著区别:对于传统的机器学习算法,可以感受到其中还是有很多人为的因素在。比如对于SVM我们需要人为的去调整软间隔的参数来避免过拟合,对于一些决策树算法,我们调整人为的剪枝策略。并且在一个机器学习项目里边,我们经常需要花费时间去思考和实验与有关特征工程的问题,毕竟这与我们实验结果直接相关。但是对于一些深度学习算法模型,对于特征工程的处理就变得自动化起来,比如对于一个神经网络,其对应的特征参数数量可以非常之大,它一定程度能够学习什么样的特征是重要的,怎么组合和处理是最合适的,我们有时候并不需要考虑太多特征工程的问题。但是参数与神经网络的复杂性也决定了它的黑盒的特性,也就是可解释性差,并且资源开销很高。

        可以说,数据特征决定了模型的上限,我们选取什么样的算法只是怎么去逼近这个上限。

关于全连接神经网络

       What:神经网络在做什么事?可以理解为计算得分函数。比如我们有一堆动物图片,通过训练,我们能够让这个模型告诉我们个label的得分,从而区别出这个图片是属于牛,还是属于兔子等等。就像下图,W就代表的是权重参数矩阵(我更愿意理解为抽象的处理矩阵)。当然很多时候我们会用softmax去放大区别然后归一化为概率值(对于分类任务)。

        How:我们要怎么去训练这个神经网络变或者怎么去训练这么多参数呢?其实如果我们只有一个W,这个问题就会有点像个线性回归模型的感觉,但是神经网络实际上有很多层,也就是我们有很多个W,做很多次变换和操作,这些处理我们也叫做隐层,通过多次的操作来更好的拟合我们的输入。我们在更新这些W的时候其实也和线性回归的更新方法很像,就是对损失函数的梯度下降但是由于我们有很多层,我们计算梯度的时候就要像剥洋葱一样从外到内一层一层计算(其实就是求偏导的链式法则),在神经网络里就是从后向前,很多教程说的反向传播就是这个意思。剩下的操作就和正常梯度下降是差不多的,只不过我们需要处理的参数变多了。

        Why:为什么神经网络长成这个样子?在我的理解中,神经网络的结构其实映射到数据结构层面本质上是矩阵的各种操作,只不过如果我们把这些操作用一根一根线表示一下,连接一下数据就会变成神经网络的模样了,也就是说神经网络并不是像他长得那样是一个图的数据结构,而是矩阵操作的一种抽象。

        优化对于神经网络的优化有很多方法。比如在每一层时候使用激活函数,就是每层之后做一个非线性处理。常见的激活函数有sigmod,relu。现在大部分适用relu函数,因为sigmoid函数在后面可能会出现梯度消失的情况,而且在计算机上计算其梯度的时候也非常耗时。但是relu函数就不会有这种情况

        正则化处理也是重要方法。正则化惩罚就是在损失函数末尾加上正则化惩罚项来防止W的参数过于剧烈的波动,比如加上W的平方项(W越平稳这个值就会越小)。

        DROPOUT:就是在训练的时候每次迭代随机杀死一些神经元。来减少模型的复杂程度

关于卷积神经网络

        学习的时候顺便了解了一下卷积神经网络,因为笔者也不是做计算机视觉方向的,所以认知较浅,请见谅。

        在我的理解中,卷积神经网络其实和神经网络的区别就是对神经网络中的处理做了一种针对性的定义和约束。我们的W并不是完全抽象而没有意义的了,而是归结为了卷积或者池化的操作。卷积是一种很常用的图像处理方式,用一个卷积核去在原图蠕动,越符合特征的部分得到的值就会越大。当然在这个过程中我们的中间层会越来越胖,因为用于处理的卷积核并不止一个。

        为什么说CNN是局部连接权值共享的?在上面说到。我们给W赋予了卷积的意义,或者我们用卷积这个操作去充当W。卷积核在计算的时候是不变的,映射到矩阵上就是很多w参数值是共享的!而且试想一下,每次卷积的时候实际上我们只会覆盖一小片区域,所以映射到神经网络上会发现,每个神经元就不会和所有神经元都有连线,毕竟左上角的像素点和右下角的像素点不可能同时被一个卷积核完全覆盖。这样卷积神经网络就能大幅度减少计算量,增加了可理解性。

        池化层可以理解为对特征图的进一步特征抽样,并且可以很大程度上减少中间层的大小,为什么要池化?因为发现在卷积的时候一个像素点周围的卷积值都非常近似。

        Padding操作就是扩充了我们的数据矩阵,因为卷积操作会导致边缘信息的获取丢失,并且有时候我们的数据也不是完全尺寸一致的。Stride也就是步幅就是卷积核蠕动的距离,距离越大,处理的越粗糙,花费的时间越少。距离越少,过拟合风险越大,拟合效果越好,时间成越高。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2199521.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Sealos Devbox 发布,珍爱生命,远离 CI/CD

水滴攻击太阳系用的是最原始的攻击方式:撞击!却又如此有效率。 当我们搞了一堆容器、编排、CI/CD、DevOps,发明了一大堆没什么用的名词之后,最终发现这些操作都是花里胡哨,让开发者越陷越深。 最终你会发现一个真理&…

2句话说通 一体化模型与矢量模型的不同

有人说:一个人从1岁活到80岁很平凡,但如果从80岁倒着活,那么一半以上的人都可能不凡。 生活没有捷径,我们踩过的坑都成为了生活的经验,这些经验越早知道࿰

Mendix 创客访谈录|平台造平台真的可以吗?– 记西门子自由流业务系统的实战

本期创客 瞿凯歌 北京无尖科技有限公司 实施部技术负责人 大家好,我叫瞿凯歌,毕业于计算机科学技术,7年软件开发经验。目前任职于北京无尖科技有限公司,担任实施部技术负责人。 我们公司专注于企业数字化转型业务,利用…

Java8新特性, 函数式编程及Stream流用法大全

用了多少年的java8了,Lambda表达式和stream流也经常用,但是也仅限于某些用法比较熟练,看见了 Function、Consumer 等函数式接口还是一脸懵逼,现在来全面总结一下java8这些新特性,也为自己后续查找做个备忘。如果你只是…

体系指南|如何从0到1建设一套软件测试CMA体系

软件测试实验室在申请CMA测试认证时,需要根据CMA的要求,建立一套质量管理体系,还需要参照相关标准建立一套技术体系。本文我们重点介绍质量管理体系的建设。这部分内容我们可以参照《检验检测机构资质认定能力评价 检验检测机构通用要求》中&…

Python神仙级思维导图+入门教程(非常详细,入门从这篇开始)

入门 Python 绝非难事,但如何让自己坚持学下去是如今很多学习者面对的一大难题。为了避免像背单词永远停留在 abandon 一样,积极展开自救的小编在尝试过一些入门方法后,终于找到了一个超级棒的一份思维导图视频教程 这是我刚开始学习python时…

谷歌发布建筑数据,高度误差达惊人的1.5米

建筑数据对规划人口增长、应对危机和深入了解城市化带来的影响有很大的帮助,这里为大家分享谷歌全球南方带高度的建筑数据集。 数据介绍 到2050年,全球城市人口预计将增加25亿,其中近90%的增幅将出现在亚洲和非洲的城市。 但恰巧是这些地方…

World of Warcraft [WeakAuras](WA)

https://addons.wago.io/addons/weakauras WeakAuras-5.13.1 复制到自己游戏的AddOns目录 D:\Battle.net\World of Warcraft\_classic_\Interface\AddOns 启动命令 /wa

职场基本功:击退欺凌

文章目录 引言I 什么是职场欺凌?不友好行动确认对方是不是真的有敌意II 反击欺凌信任领导找到敌营里的薄弱点,击溃打手,各个击破。别急着跟欺凌者和解III 应对特殊情况的欺凌引言 面对职场欺凌,有明确敌意的。这时候需要你反击,千万别认怂。 但不是所有的欺凌行为都值得我…

HTML5实现古典音乐网站源码模板1

文章目录 1.设计来源1.1 网站首页1.2 古典音乐界面1.3 著名人物界面1.4 古典乐器界面1.5 历史起源界面2.效果和源码2.1 动态效果2.2 源代码源码下载万套模板,程序开发,在线开发,在线沟通作者:xcLeigh 文章地址:https://blog.csdn.net/weixin_43151418/article/details/142…

一键升级 Win10 22H2 19045.5011 正式版:含9项改进和修复!

今日,系统之家小编给您分享2024年10月最新更新的Windows10 22H2正式版系统下载,该版本系统基于微软官方最新Windows10 22H2 19045.5011 64位专业版进行离线制作,安全无毒,集成万能驱动,且本次更新包含了9项改进和修复&…

粤港澳脑病中医药科创大会召开,助力脑病相关中药研发、转化

9月28日,由广州粤港澳脑病中医药产学研技术创新联盟、广州市脑病中医药大健康产学研促进会与暨南大学联合主办,暨南大学中医学院及中医药调控脑-外周稳态与大健康粤港澳联合实验室承办,中国生理学会中医药与脑稳态调控专委会、生物活性分子与…

【含开题报告+文档+PPT+源码】基于springboot的迎新系统

开题报告 大学迎新系统是为了满足大学在新生入学时的信息化处理需求而开发的系统。在传统方式下,我们新生接待工作是需要新生报名表,就使得我们需要耗费大量的纸张,这将造成资源浪费。在接待新生的时候需要让新生勾选、填写大量的表格&#…

电源管理芯片PMIC

一、简介 电源管理芯片(Power Management Integrated Circuits,简称PMIC)是一种集成电路,它的主要功能是在电子设备系统中对电能进行管理和控制,包括但不限于以下几点: 电压转换:将电源电压转换…

软件工程师必备技能:掌握Postman接口自动化测试

Postman 是一款功能强大的API开发工具,它允许用户轻松地发送HTTP请求,管理、测试和记录APIs。在当今的软件开发中,API的测试是一个至关重要的环节,因为它确保了不同软件模块之间的正确交互。Postman的接口自动化测试功能&#xff…

ultralytics yolo segmentation 分割 示例:加载官方segmentation 模型进行推理

Ultralytics YOLO 是计算机视觉和 ML 领域专业人士的高效工具。 安装 ultralytics 库: pip install ultralytics 该示例的模型地址:ultralyticsyolosegmentation分割模型资源-CSDN文库 大家也可以在官方连接下载,因为有时下载容易断开链…

【python实操】python小程序之魔法方法(__init__方法、__str__方法、__del__方法)

引言 python小程序之魔法方法(__init__方法、__str__方法、__del__方法) 文章目录 引言一、__init__方法1.1 题目1.2 代码1.3 代码解释1.3.1 逐行注释1.3.2 代码执行过程 二、__str__方法2.1 题目2.2 代码2.3 代码解释 三、__del__方法3.1 题目3.2 代码3…

C# HttpClient请求URL重定向后丢失Authorization认证头信息 .Net Core Web Api

问题: 使用.Net 入库Doris请求FE端口后,FE响应重定向到其他BE节点出现的认证失败问题。 搜查官方文档后发现: HttpWebRequest.AllowAutoRedirect Property (System.Net) | Microsoft Learn 微软提供的http类库HttpClient (HttpWebRequest\WebClient已不…

springboot校园交友平台

基于springbootvue实现的校园交友平台 (源码L文ppt)4-082 第四章 系统设计 4.1 系统总体设计 系统的建设可以为校园交友管理提供帮助,通过对一些基础信息管理实现针对性的安排,可以按照用户的角色权限使不同用户角色看…

鲁大师2024年电动车Q3季报:九号E150 MK2刷新榜单,小牛极核发力智能驾辅赛道

鲁大师2024年Q3季报正式发布,本次季报包含电动车智能排行,测试的车型为市面上主流品牌的主流车型,共计18款,全部按照评测维度更广、更专业的鲁大师电动车智慧评测2.0进行评分,测试的成绩均来自于鲁大师智慧硬件实验室。…