神经网络的基本知识

news2025/3/16 22:18:56

感知机

  • 输入:来自其他 n 个神经元传递过来的输入信号

  • 处理:输入信号通过带权重的连接进行传递, 神经元接受到总输入值将与神经元的阈值进行比较

  • 输出:通过激活函数的处理以得到输出

感知机由两层神经元组成, 输入层接受外界输入信号传递给输出层, 输出层是M-P神经元(阈值逻辑单元) 

 

若感知机对训练样例 (x,y) 预测正确,则感知机不发生变化;否则根据错误程度进行权重的调整。

若两类模式线性可分, 则感知机的学习过程一定会收敛;否则感知机的学习过程将会发生震荡,单层感知机的学习能力非常有限, 只能解决线性可分问题。 


 多层感知机

输出层与输入层之间的一层神经元, 被称之为隐层或隐含层, 隐含层和输出层神经元都是具有激活函数的功能神经元。

感知机-多层前馈神经网络


误差逆传播算法(Error BackPropagation, 简称BP)

 

 

 参数个数:d个输入神经元连接q个隐层神经元 d*q,q个隐层神经元连接l个输出神经元 q*l,再加 q+ l个阈值,最终结果是(d+l+q)*q+l。

工作流程:

(1)将输入示例提供给输入层神经元,逐层将信号前传,直到产生输出结果

(2)计算输出层与真实值的误差,将误差使用BP算法传播到整个网络,对连接权重及阈值进行调整。

(3) 该迭代过程循环进行,直到达到某些停止条件为止。(例如训练误差达到了很小的值,或者整个数据集运行了20轮)

多层前馈网络表示能力 :只需要一个包含足够多神经元的隐层, 多层前馈神经网络就能以任意精度逼近任意复杂度的连续函数 。

多层前馈网络局限 :神经网络由于强大的表示能力, 经常遭遇过拟合。表现为:训练误差持续降低, 但测试误差却可能上升 。如何设置隐层神经元的个数仍然是个未决问题.。

实际应用中通常使用“试错法”调整 缓解过拟合的策略 。

早停:在训练过程中, 若训练误差降低, 但验证误差升高, 则停止训练 。

正则化:在误差目标函数中增加一项描述网络复杂程度的部分, 例如连接权值与阈值的平方和。


卷积神经网络

卷积:平移不变模式,提取局部特征。

池化:对图像进行缩放。

卷积网络一般框架:卷积层+激活函数+池化层+全连接层。

卷积+激活+池化:出现多次,用于提取特征。

全连接层:最后一次出现,用于分类。

 

输入层 

输入层:输入层是对数据进行预处理的阶段,将输入的数据(图像/文字)转换成网络能够计算的数字。

 卷积层

卷积层(Convolutional layer),卷积神经网络中每层卷积层由若干卷积单元(卷积核)组成,每个卷积单元的参数都是通过反向传播算法优化得到的。

卷积运算的目的是提取输入的不同特征,第一层卷积层可能只能提取一些低级的特征如边缘、线条和角等层级,更多层的网络能从低级特征中迭代提取更复杂的特征。

  • 卷积核(filter/kernel):用于对输入图像进行共享权值的遍历
  • 步长(stride):卷积核在图片上移动的大小
  • 填充(padding):满足输出的图像的维度要求

激活层

往模型中加入非线性元素,可以更好地解决复杂的问题。

池化层

 池化层的主要的作用是压缩数据和参数的量(保持最显著的特征),通过去掉上一层的输出中不重要的信息,进一步减少参数数量。Pooling的方法很多,常用方法有最大池化与均值池化。

全连接层(Fully Connected Layer,简称FC层)

  • 特征整合:全连接层将前一层的所有输出与当前层的每个神经元连接,能够整合前一层的局部或全局特征,生成新的特征表示。【将多层的特征映射成一个一维的向量】
  • 非线性变换:通过激活函数(如ReLU、Sigmoid等),全连接层引入非线性,增强模型的表达能力,使其能够拟合更复杂的函数。
  • 输出转换:在分类任务中,全连接层通常作为最后的输出层,将高维特征映射到类别空间。【对卷积层获得的不同的特征进行加权,最终目的是得到一个可以对不同类别进行区分的得分】【输出层就是获得对应每个类别的得分】
  • 参数学习:全连接层通过大量可训练参数(权重和偏置)学习数据的内在规律,提升模型的性能。
  • 输入:前一层的所有输出。

  • 输出:每个神经元的加权和经过激活函数后的结果。

  • 参数:权重矩阵 WW和偏置向量 b,通过反向传播优化。

 卷积网络在本质上是一种输入到输出的映射,它能够学习大量的输入与输出之间的映射关系,而不需要任何输入和输出之间的精确的数学表达式,只要用已知的模式对卷积网络加以训练,网络就具有输入输出对之间的映射能力。卷积神经网络的训练过程与传统神经网络类似,也是参照了反向传播算法。



循环神经网络

循环神经网络是一种对序列数据建模的神经网络。

RNN不同于前向神经网络,它的层内、层与层之间的信息可以双向传递,更高效地存储信息,通常用于处理信息序列的任务。

RNN主要用来处理序列数据,在传统的神经网络模型中,每层内的节点之间无连接,但是循环神经网络中当前神经元的输出与前面的输出也有关,网络会对前面的信息进行记忆并用于当前神经元的计算中。

...


LSTM

这里包含两个部分。首先,sigmoid 层称 “输入门层” 决定将要存放在细胞状态的信息量的大小。然后,一个 tanh 层创建一个新的候选值向量会被加入到状态中。下一步,我们会将这两个信息来产生对状态的更新。


 激活函数


Softmax

Softmax 是一种常用的激活函数,主要用于多分类任务中,将神经网络的输出转换为概率分布。

它的核心作用是将一组任意实数转换为概率值,这些概率值的总和为 1,便于表示每个类别的预测概率。

Softmax 的特性:

  1. 输出为概率分布

    • Softmax 的输出是一个概率分布,每个类别的概率值在 [0,1] 之间,且所有类别的概率之和为 1。

    • 例如,对于 3 个类别,Softmax 的输出可能是[0.2,0.7,0.1]。

  2. 放大差异

    • Softmax 通过指数运算放大高分值的类别,抑制低分值的类别,使得高分值的类别概率更接近 1,低分值的类别概率更接近 0。

  3. 可导性

    • Softmax 是连续可导的,便于通过梯度下降法优化模型。

Softmax 的应用场景

  1. 多分类任务

    • 在神经网络的最后一层使用 Softmax,将输出转换为类别概率分布。

    • 例如,图像分类任务中,Softmax 可以将卷积神经网络的特征映射为每个类别的概率。

  2. 损失函数结合

    • Softmax 通常与交叉熵损失函数(Cross-Entropy Loss)结合使用,用于衡量预测概率分布与真实标签之间的差异。

它通过指数运算和归一化,将原始得分映射为概率值,便于模型训练和预测。

我们希望模型输出y(j)可以视为属于类j的概率,然后选择具有最大输出值的类别argmaxy(j)作为我们的预测。softmax:最大概率的标签,能够将未规范化的预测变换为非负数,并且总和为1,同时能够让模型保持可导。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2316277.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

PostgreSQL技术内幕26:PG聚合算子实现分析

文章目录 0.简介1.概念说明2.朴素聚集3.Group by聚集3.1 哈希聚集3.2 分组聚集 0.简介 聚合算子在聚合函数在数据分析、报告生成和统计计算中扮演着重要角色,通过对多行数据进行计算,将多个输入值压缩为单一输出值,如求和、平均值、计数等。…

【RS】OneRec快手-生成式推荐模型

note 本文提出了一种名为 OneRec 的统一生成式推荐框架,旨在替代传统的多阶段排序策略,通过一个端到端的生成模型直接生成推荐结果。OneRec 的主要贡献包括: 编码器-解码器结构:采用稀疏混合专家(MoE)架构…

mac安装navicat及使用

0.删除旧的 sudo rm -Rf /Applications/Navicat\ Premium.app sudo rm -Rf /private/var/db/BootCaches/CB6F12B3-2C14-461E-B5A7-A8621B7FF130/app.com.prect.NavicatPremium.playlist sudo rm -Rf ~/Library/Caches/com.apple.helpd/SDMHelpData/Other/English/HelpSDMIndexF…

【HTML】二、列表、表格

文章目录 1、列表1.1 无序列表1.2 有序列表1.3 定义列表 2、表格2.1 定义2.2 表格结构标签2.3 合并单元格 1、列表 列表分为: 无序列表有序列表定义列表:一个标题下有多个小分类 1.1 无序列表 ul嵌套li,ul是无序列表,li是列表…

​​​​​​​大语言模型安全风险分析及相关解决方案

大语言模型的安全风险可以从多个维度进行分类。 从输入输出的角度来看,存在提示注入、不安全输出处理、恶意内容生成和幻觉错误等风险; 从数据层面来看,训练数据中毒、敏感信息泄露和模型反演攻击是主要威胁; 模型自身则面临拒绝服务和盗窃的风险; 供应链和插件的不安全引…

windows平台的ffmpeg编译使用

windows平台的ffmpeg编译使用 一、现状 本人使用libgdx开发galGame,发现扩展包gdx-video不支持mp4,不能忍,正好看到官网有支持自定义编译的文档,所以操作一下,自定义编译。本文重点在于操作windows平台,linux平台太简单了。 整个过程包括如下几个步骤。 二、代码下载…

FFMPEG录制远程监控摄像头MP4

手绘效果图 上图是录制功能的HTML前端页面,录制功能和解码视频放在一起。录制功能关键是录制(开始录制按钮)、停止录像按钮。当点击“录制”的时候则会开始录制MP4文件, 当点击停止的时候就会停止录制MP4。经过录制后,则会生成MP4,并放到我的RV1126的/tm…

centos操作系统上传和下载百度网盘内容

探序基因 整理 进入百度网盘官网百度网盘 客户端下载 下载linux的rpm格式的安装包 在linux命令行中输入:rpm -ivh baidunetdisk_4.17.7_x86_64.rpm 出现报错: 错误:依赖检测失败: libXScrnSaver 被 baidunetdisk-4.17.7-1.x8…

Rubick:基于 Electron 的开源插件化桌面效率工具箱

Rubick 是一款基于 Electron 构建的开源桌面工具箱,专为追求高效办公和个性化体验的用户设计。它通过自由集成丰富的插件,让用户能够根据自己的需求打造极致的桌面端效率工具。 软件命名由来Rubick 的名字来源于《DOTA2》中的英雄 Rubick(拉…

ruoyi-vue部署

ruoyi源码类型 Ruoyi源码 编译打包后,直接部署tomcat服务器 Ruoyi-vue 前后端分离版 前端部署到nginx 后端部署到tomcat RuoYi-Cloud 微服务版 RuoYi-app 移动端版 RuoYi-vue 前后端分离版 环境 JDK>=1.8 MySQL >= 5.7 Maven >= 3.0 Node >= 12 Redis…

LLM论文笔记 23: Meta Reasoning for Large Language Models

Arxiv日期:2024.6.17机构:THU / MSRA 关键词 meta-reasoning推理方法prompt engineering 核心结论 1. 提出Meta Reasoning prompting,MRP是一种系统提示方法,能够帮助LLM动态选择最合适的推理方法,从而提升其灵活性和…

【最后203篇系列】015 几种消息队列的思考

背景 队列还是非常重要的中间件,可以帮助我们:提高处理效率、完成更复杂的处理流程 最初,我觉得只要掌握一种消息队列就够了,现在想想挺好笑的。 过去的探索 因为我用python,而rabbitmq比较贴合快速和复杂的数据处…

学习springboot 的自动配置原理

前言 为什么要学习springboot 的自动配置原理? 1学习 自定义成starter 的前提 实际开发中,我们如果定义公共的组件给团队使用,为了让他们使用方便就自定义成starter。而想要学习starter ,就要先了解springboot 的自动配置原理 2 面试需要 了…

排错 -- FISCO BCOS区块链网络 -- 3. 编译智能合约

文章为FISCO BCOS2.0搭建区块链平台中发现的问题与总结,出错原因不唯一 ,解决办法不唯一 目前社区缺少完整,稳定的搭建平台和教程 ,欢迎各位及时补充,如有错误请及时评论纠正! 感谢各位搜索到这里&#…

ffmpeg 添加毫秒时间戳

网上有好多添加时间水印的,默认是到秒,而我需要到毫秒,查了一下,没有找到更好的方案,下面是自己实现的方案,可以显示到毫秒。如果有更好的方案,欢迎讨论 ffmpeg -i video.mp4 -vf "drawte…

centos7上安装Docker

文章目录 **1. 使用华为云镜像源替换Docker仓库****2. 安装Docker CE****3.更换docker镜像源-使用华为云的docker镜像源****4.补充:docker的使用****5.补充:删除docker的步骤** 1. 使用华为云镜像源替换Docker仓库 步骤: 删除无效的Docker仓…

【Linux内核系列】:文件系统收尾以及软硬链接详解

🔥 本文专栏:Linux 🌸作者主页:努力努力再努力wz 💪 今日博客励志语录: 世界上只有一种个人英雄主义,那么就是面对生活的种种失败却依然热爱着生活 内容回顾 那么在之前的学习中,我们…

视频理解之Actionclip(论文宏观解读)

配合解读代码解读 1.研究背景 1. 视频行为识别的重要性 视频行为识别是视频理解领域的核心任务之一,旨在通过分析视频内容来识别和分类其中的人物行为或活动。这一任务在多个领域具有重要的应用价值,例如智能监控、人机交互、自动驾驶、医疗健康等。随…

navicat16 升级到 navicat17 之后原来的连接找不到了 mac用户

版本16的路径 注意把对应的路径改成自己的用户名 /Users/自己的用户名/Library/Application Support/PremiumSoft CyberTech/Navicat CC/Common/Settings 版本17的路径 /Users/自己的用户名/Library/Containers/com.navicat.NavicatPremium/Data/Library/Application Suppor…

Altium Designer——CHIP类元器件PCB封装绘制

文章目录 PCB封装组成元素:焊盘的属性 SS34肖特基二极管SMA(DO-214AC)封装绘制资料:步骤:1.绘制焊盘:用到的快捷键:资料: 2.绘制丝印:用到的快捷键:资料: PCB封装组成元素…