二、AI知识(神经网络)

news2025/1/5 20:01:21

二、AI知识(神经网络)

1.常用算法

  1. FNN

  2. CNN

  3. RNN

  4. LSTM

  5. DNN

  6. GRU

2.深度学习中概念及算法

1. 感知机

  • 感知机(Perceptron)是一种最早的人工神经网络模型之一,通常用来解决二分类问题。它由弗兰克·罗森布拉特(Frank Rosenblatt)于1958年提出,是单层的线性分类模型,也是深度学习和神经网络发展的起点之一。

2. 激活函数(如Sigmoid、ReLU、Softmax)

一、Sigmoid
  • Sigmoid函数(也叫逻辑斯蒂函数或S型函数)是一种常用的数学函数,它的输出值总是介于0和1之间。
二、ReLU
  • ReLU(Rectified Linear Unit)函数是一种常用的激活函数,尤其在深度学习神经网络中应用广泛。它将输入值小于0的部分“修剪”掉,并且对输入值大于或等于0的部分保持不变。
三、Softmax
  • Softmax 函数(也称为归一化指数函数)是一个常用于分类任务,尤其是多类别分类问题中的激活函数。它的作用是将一个向量转换为一个概率分布,每个输出值介于 0 和 1 之间,且所有输出值的和为 1。

3. 损失函数(如回归损失:MSE、MAE;分类损失:交叉熵损失Cross Entropy Loss、二元交叉熵BCE、Dice Loss)

一、MSE
  • MSE损失函数(Mean Squared Error Loss Function)是一种常用的回归问题中的损失函数,用于衡量模型预测值与真实值之间的误差。它计算预测值与实际值之间差异的平方的平均值,因此常用于衡量模型预测的准确性。
二、MAE
  • MAE损失函数(Mean Absolute Error Loss Function,平均绝对误差)是回归问题中另一种常见的损失函数,用于衡量模型预测值与真实值之间的差异。与MSE(均方误差)不同,MAE计算的是误差的绝对值的平均值,因此它对异常值的敏感度较低。
三、交叉熵损失Cross Entropy Loss
  • 交叉熵损失(Cross Entropy Loss) 是一种广泛用于分类问题,尤其是多分类 和二分类闵比方法的损失函数。它衡量的是模型输出的概率分布与实际标签之间的差异,尤其是在分类问题中经常使用。
四、二元交叉熵BCE
  • 二元交叉熵(Binary Cross-Entropy, BCE),又称二分类交叉熵损失函数,是用于二分类问题的常见损失函数。它用于衡量模型预测的概率与实际标签之间的差异,尤其是在目标是二分类(0或1)问题时。二元交叉熵损失非常适合用于输出为概率值的模型(如使用 Sigmoid 激活函数的模型)。
五、Dice Loss
  • Dice Loss 是一种常用于 图像分割(特别是医学图像分割)任务中的损失函数。它基于 Dice 相似系数(Dice Similarity Coefficient, DSC),一种衡量两个样本相似度的指标,常用来评估两个集合的重叠程度。Dice Loss 主要用于处理 类别不平衡 或 小目标检测 的问题,因为它能够对小区域的预测更加敏感。

4. 前向传播/反向传播(深度学习框架,如TensorFlow、PyTorch)

一、TensorFlow
  1. 原理
  • TensorFlow 是一个开源的机器学习框架,最初由 Google Brain 团队开发,并于2015年发布。它广泛用于深度学习模型的构建、训练和部署,支持从小型实验到大规模生产环境的各类机器学习任务。TensorFlow 提供了丰富的 API,支持各种机器学习任务,尤其在深度学习、神经网络和深度强化学习方面表现突出。它支持多种计算平台,包括 CPU、GPU 和 TPU(Google 的专用硬件加速器),并可以运行在多个操作系统和设备上,如 Linux、Windows、macOS、Android 和 iOS。
  1. 优点
  • 强大的功能:TensorFlow 提供了丰富的功能,支持从研究到生产的全流程。
  • 支持多种平台:支持 CPU、GPU、TPU 的加速,并且支持不同平台(如移动端、嵌入式设备、Web 等)。
  • 良好的社区支持:拥有一个活跃的开发者社区,丰富的文档和教程资源。
  • 灵活性和可扩展性:适用于小规模的实验,也能支持大规模的分布式计算任务。
  1. 缺点
  • 学习曲线较陡:TensorFlow 的学习曲线较陡,尤其是对初学者来说,理解计算图和低级 API 可能较为困难。
  • 调试不方便:相比于 PyTorch 等框架,TensorFlow 的动态图调试相对较为复杂。
  • 开发速度较慢:TensorFlow 2.0 虽然改进了易用性,但相比其他一些框架(如 PyTorch),开发速度可能略显缓慢。
二、PyTorch

1.原理

  • PyTorch 是一个广泛使用的开源深度学习框架,由 Facebook 的人工智能研究实验室(FAIR)开发。它提供了灵活的接口来构建和训练深度学习模型,特别适用于神经网络和大规模数据处理任务。PyTorch 的设计原则强调易用性、动态计算图和强大的 GPU 支持。

2.优点

  • 易于学习和使用:PyTorch 提供了非常直观和简洁的 API,适合初学者和研究人员。尤其对于 Python 程序员来说,PyTorch 是“更 Pythonic”的,语法和结构更符合 Python 编程习惯。
  • 动态计算图:动态计算图的设计允许在运行时定义模型结构,这对复杂、动态变化的模型(如循环神经网络 RNN)尤其有用。在调试时,你可以像调试普通 Python 程序一样调试模型,灵活性极高。
  • 强大的自动微分功能:PyTorch 的 autograd 使得反向传播计算变得非常简单,只需要在模型中定义 forward() 方法,自动微分将处理其他所有操作。
  • 深度学习社区和生态系统:PyTorch 在学术界的应用广泛,许多前沿研究和论文都采用了 PyTorch。PyTorch 也有强大的生态系统,包括 torchvision、torchtext、torchaudio 等模块,可以快速构建计算机视觉、自然语言处理等任务的模型。
  • 灵活性:由于其动态计算图和灵活的接口,PyTorch 能够更容易地处理那些需要动态计算图的任务(如变长序列处理、条件计算等)。
  • 良好的 GPU 加速支持:PyTorch 可以轻松利用 GPU 进行加速计算,且支持多 GPU 训练(如通过 torch.nn.DataParallel 或 torch.nn.parallel.DistributedDataParallel)。

3.缺点

  • 生产环境部署不如 TensorFlow:相比 TensorFlow,PyTorch 在生产环境中的部署和优化工具相对较弱。TensorFlow 提供了强大的生产部署工具,如 TensorFlow Serving、TensorFlow Lite 和 TensorFlow.js,而 PyTorch 在这方面的支持相对较少,尽管通过 TorchServe 和 ONNX,这一差距逐步在缩小。
  • 不如 TensorFlow 对跨平台的支持全面:TensorFlow 提供了更多的跨平台支持,例如 TensorFlow.js(用于在浏览器中运行深度学习模型)、TensorFlow Lite(用于移动设备)等。而 PyTorch 在这一领域的工具相对较少。
  • 学习曲线相对较高(在某些方面):尽管 PyTorch 在很多情况下很易于使用,但当你开始进行更复杂的分布式训练、大规模数据处理等操作时,可能会遇到一些挑战,尤其是涉及到多节点、多 GPU 等复杂配置时。
  • 不如 TensorFlow 的文档和教程丰富:虽然 PyTorch 的文档相当好,但 TensorFlow 在社区支持、文档、教程等方面有更广泛的覆盖,特别是在企业和大规模生产系统中。

5. 梯度下降(如BGD、SGD、MBGD)

一、BGD
  • 批量梯度下降(Batch Gradient Descent,简称BGD)是梯度下降算法的一种形式。在批量梯度下降中,整个训练数据集都会被用来计算损失函数的梯度,然后更新模型的参数。也就是说,BGD 在每次迭代时使用所有的训练数据来计算梯度,并根据该梯度更新参数。
二、SGD
  • 随机梯度下降(Stochastic Gradient Descent,简称 SGD) 是梯度下降算法的一种变种。与批量梯度下降(BGD)不同,SGD 每次迭代只使用单个样本来计算梯度并更新参数。这个过程相比于批量梯度下降计算更高效,并且能够在更短的时间内开始优化,但也有一些波动。
三、MBGD
  • MBGD(Mini-Batch Gradient Descent,迷你批量梯度下降)是梯度下降方法的一个变种。它结合了批量梯度下降(BGD)和随机梯度下降(SGD)的优点,常用于优化机器学习算法,尤其是在处理大量数据时。

6. 梯度消失、梯度爆炸(产生原因、缓解策略)

一、梯度消失
  1. 产生原因
  • 梯度消失主要由不适合的激活函数、深度网络结构和不良的权重初始化引起。
  1. 缓解策略
  • 为了解决这个问题,可以采用如ReLU激活函数、合适的权重初始化、批归一化、残差网络等多种策略。这些方法通过使梯度在深层网络中更稳定,从而确保网络能够有效地训练。
二、梯度爆炸
  1. 产生原因
  • 梯度爆炸是深度学习训练中可能出现的一个问题,通常由不当的权重初始化、过大的学习率、深层网络架构等因素引起。
  1. 缓解策略
  • 常用的缓解策略包括权重初始化方法的选择、梯度裁剪、学习率调整、优化算法选择、批归一化、网络结构优化和正则化等。这些策略可以有效地避免梯度爆炸,使得训练过程更加稳定,最终得到一个更为健壮的模型。

7. 优化器(如:梯度下降系列(批量梯度下降BGD、随机梯度下降SGD、小批量梯度下降MBGD)、动量法、NAG、Adagrad、RMSprop、Adam)

一、动量法
二、NAG
三、Adagrad
四、RMSprop
五、Adam

8. 超参数(概念、调优算法)

1.概念

2.调优算法

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2270487.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

设计模式の状态策略责任链模式

文章目录 前言一、状态模式二、策略模式三、责任链模式 前言 本篇是关于设计模式中的状态模式、策略模式、以及责任链模式的学习笔记。 一、状态模式 状态模式是一种行为设计模式,核心思想在于,使某个对象在其内部状态改变时,改变该对象的行为…

【网络协议】路由信息协议 (RIP)

未经许可,不得转载。 路由信息协议(Routing Information Protocol,简称 RIP)是一种使用跳数(hop count)作为路由度量标准的路由协议,用于确定源网络和目标网络之间的最佳路径。 文章目录 什么是…

linux下安装达梦数据库v8详解

目录 操作系统、数据库 1、下载达梦数据库 2、安装前准备 2.1、建立数据库用户和组 2.2、修改文件打开最大数 2.3、挂载镜像 2.4、新建安装目录 3、数据库安装 4、配置环境变量 5、初始化数据库实例 6、注册服务 7、使用数据库 8、卸载数据库 9、多实例管理 10、…

小程序租赁系统的优势与应用探索

内容概要 小程序租赁系统,听起来很高大上,但实际上它比你想象的要实用得多!设想一下,几乎所有的租赁需求都能通过手机轻松解决。这种系统的便捷性体现在让用户随时随地都能发起租赁请求,而不再受制于传统繁琐的手续。…

(leetcode算法题)​122. 买卖股票的最佳时机 II​ 和 123. 买卖股票的最佳时机 III

这两个题都可以进行转化,转换成等价问题求解 对于122的等价转换 求出所有能够赚钱的区间,这些区间满足一下特点 1. 首尾相接, 2. 区间末尾的值大于区间开头的值 3. 每个区间尽可能的小 新的问题只要用贪心的思想就能求得问题的解 只要求出上…

oceanbase集群访问异常问题处理

1.报错现象 2.问题排查 检查obproxy状态发现为不可用状态 重启obproxy 依次重启Obproxy集群 观察任务状态 重启完成 Obproxy状态正常 3.验证登录 登录成功

WeNet:面向生产的流式和非流式端到端语音识别工具包

这篇文章介绍了WeNet,一个面向生产的开源端到端(E2E)语音识别工具包。WeNet的主要特点和贡献如下: 统一流式和非流式识别:提出了一种名为U2的两阶段框架,能够在单一模型中同时支持流式和非流式语音识别&…

ArcGIS计算矢量要素集中每一个面的遥感影像平均值、最大值等统计指标

本文介绍在ArcMap软件中,基于矢量面要素集,计算在其中每一个面区域内,遥感影像的像元个数、平均值、总和等统计值,并将统计信息附加到矢量图层的属性表中的方法。 首先,明确一下本文的需求。现在有一个矢量面要素集&am…

Wallpaper壁纸制作学习记录13

骨骼物理模拟 Wallpaper Engine还允许您为人偶变形骨骼配置某些物理模拟。选择骨骼时,点击编辑约束来配置骨骼这些属性。 警告 请记住,物理模拟可能会根据用户的最大FPS设置略微改变其行为。 Wallpaper Engine编辑器将始终以高帧速率渲染。您可以将壁纸…

CertiK《Hack3d:2024年度安全报告》(附报告全文链接)

CertiK《Hack3d:2024年度安全报告》现已发布,本次报告深入分析了2024年Web3.0领域的安全状况。2024年损失总额超过23亿美元,同比增幅高达31.61%;其中,12月的损失金额最少。过去一年,网络钓鱼攻击和私钥泄露…

SpiderFlow平台v0.5.0之数据库连接

一、寻找lib目录安装方式 在 SpiderFlow 平台中,连接数据库时需要指定数据库的 DriverClassName,并确保正确配置数据库驱动。通常,驱动文件(JAR 文件)需要放置在指定的文件夹中,以便 SpiderFlow 可以找到并…

如何在notepad++里面,修改注释颜色

问题:我使用notepad加载.bib格式的文件,我想把第一行的GSA弄成紫色的,并且注释的格式是:%注释% 实现以后得效果展示: 接下来进行一步步讲解。 1. 不同的文件使用的语言不同,于是需要自己创建一个语言。如…

生态碳汇涡度相关监测与通量数据分析实践技术应用

1.以涡度通量塔的高频观测数据为例,基于MATLAB开展上机操作: 2.涡度通量观测基本概况:观测技术方法、数据获取与预处理等 3.涡度通量数据质量控制:通量数据异常值识别与剔除等 4.涡度通量数据缺失插补:结合气象数据…

[QT]控件的核心属性

一、控件的核心属性 1.enable属性 表示一个控件是否可用,可以用isEnabled()接口获取到当前控件的可用状态,同时来提供了setEnabled()接口设置控件是否可用,传递的参数为true和false。 isEnabled(); setEnabled(bool); Demo:通过一…

Vue 3 slot/插槽继承使用方法示例(基于 Ant Design Vue)

目录 Vue 3 插槽继承使用方法示例(基于 Ant Design Vue) 实例演示 背景 问题 解决方案:插槽继承 如何解决 插槽继承的原理 实现步骤 1. 子组件:封装 EaAutoComplete.vue 说明: 2. 父组件:自定义插…

成立一家无人机培训机构需要哪些基础配置

成立一家无人机培训机构,需要一系列基础配置来确保教学质量、学员安全以及机构的正常运营。以下是根据公开发布的信息整理出的关键基础配置: 一、场地配置 1. 飞行场:提供一个安全、宽敞的室外飞行环境,面积最好大于三千平米&…

【ACCSS】2024年亚信安全云认证专家题库

文件包含: 亚信安全ACCSS认证2019年真题(1) 亚信安全ACCSS认证2019年真题(2) 亚信安全ACCSS认证2019年真题(3) 亚信安全ACCSS认证2020年真题(1) 亚信安全ACCSS认证2020年…

探索 JMeter While Controller:循环测试的奇妙世界

嘿,宝子们!今天咱们就来聊聊 JMeter 里超级厉害的 While 控制器,它就像是一把神奇的钥匙,能帮我们打开循环测试的大门,模拟出各种各样复杂又有趣的场景哦! 一、While 控制器初印象 想象一下,你…

麒麟信安云在长沙某银行的应用入选“云建设与应用领航计划(2024)”,打造湖湘金融云化升级优质范本

12月26日,2024云计算产业和标准应用大会在北京成功召开。大会汇集政产学研用各方专家学者,共同探讨云计算产业发展方向和未来机遇,展示云计算标准化工作重要成果。 会上,云建设与应用领航计划(2024)建云用…

LeetCode算法题——螺旋矩阵ll

题目描述 给你一个正整数n,生成一个包含1到n2所有元素,且元素按顺时针顺序螺旋排列的n x n正方形矩阵matrix 。 示例 输入:n 3 输出:[[1,2,3],[8,9,4],[7,6,5]]题解 思路: 将整个过程分解为逐圈填充的过程&#xf…