《Python深度学习》阅读笔记

news2024/11/15 18:00:12

以下是《Python深度学习》一书中学习过程中记录的一些重要的专属名词和概念:

一、概念

  1. 深度学习(Deep Learning):指使用多层神经网络进行机器学习的技术。
  2. 神经网络(Neural Network):一种模仿生物神经网络工作原理的机器学习模型。
  3. 前向传播(Forward Propagation):在神经网络中,输入数据从输入层通过隐藏层,最终到达输出层的过程。
  4. 反向传播(Backpropagation):在神经网络中,根据输出层的错误来调整网络中权重的过程。
  5. 激活函数(Activation Function):用于引入非线性特性到神经网络中的函数,如ReLU、Sigmoid和Tanh等。
  6. 批量标准化(Batch Normalization):一种加速神经网络训练的方法,通过对每一批数据进行归一化处理来改善网络的性能。
  7. 损失函数(Loss Function):用于衡量模型预测结果与真实结果之间的差距。
  8. 优化器(Optimizer):用于调整模型中的权重和偏置,以最小化损失函数。
  9. 学习率(Learning Rate):优化器在调整权重和偏置时的步长。
  10. Dropout(Dropout):一种正则化技术,通过随机忽略部分神经元来防止过拟合。
  11. 过拟合(Overfitting):模型在训练数据上表现很好,但在测试数据上表现不佳的现象。
  12. 欠拟合(Underfitting):模型在训练数据和测试数据上都表现不佳的现象。
  13. 卷积神经网络(Convolutional Neural Network,CNN):一种专门用于处理图像数据的神经网络。
  14. 循环神经网络(Recurrent Neural Network,RNN):一种能够处理序列数据的神经网络,如文本和时间序列数据。
  15. 长短期记忆网络(Long Short-Term Memory,LSTM):一种特殊的循环神经网络,用于处理需要理解序列中长距离依赖关系的问题。
  16. 转化器(Transformer):一种基于自注意力机制的深度学习模型,被广泛应用于自然语言处理任务。
  17. 自注意力机制(Self-Attention Mechanism):一种让神经网络关注输入序列中不同位置的信息,从而更好地理解序列数据的技术。
  18. 验证集(Validation Set):从原始数据中划分出来的一组数据,用于调整模型的超参数和防止过拟合。
  19. 测试集(Test Set):从原始数据中划分出来的一组数据,用于评估模型的性能。
  20. 梯度消失问题(Vanishing Gradient Problem):在深度神经网络中,梯度在反向传播过程中会逐渐变小,导致网络中的早期层无法从训练过程中学习到有用的信息。
  21. 梯度爆炸问题(Exploding Gradient Problem):与梯度消失问题相反,梯度在反向传播过程中可能会变得非常大,导致模型训练不稳定甚至崩溃。
  22. 特征工程(Feature Engineering):通过对数据进行预处理、转换和特征选择等操作,提高机器学习模型性能的过程。
  23. 迁移学习(Transfer Learning):利用在大规模数据集上预训练的模型来帮助解决类似问题的技术。
  24. Keras:一个高级神经网络API,支持多种深度学习框架,包括TensorFlow、CNTK和Theano等。
  25. TensorFlow:一个流行的深度学习框架,由Google开发并维护。
  26. PyTorch:另一个流行的深度学习框架,由Facebook AI Research开发并维护。
  27. Keract:Keras的CPU和GPU张量操作库,提供更高效的张量操作功能。
  28. Jupyter Notebook:一个Web应用程序,允许创建和共享包含实时代码、注释和输出在内的文档。
  29. Colab:Google开发的免费Jupyter notebook服务,提供GPU加速功能。
  30. Docker:一个开源容器化平台,允许打包、分发和运行应用程序及其依赖项。
  31. TensorBoard:TensorFlow的可视化工具,用于监视训练过程、可视化和理解模型。
  32. ONNX:开放神经网络交换格式,用于表示深度学习模型。它支持多种深度学习框架的模型转换,包括TensorFlow、PyTorch和其他框架。
  33. NVIDIA GPU:专为深度学习应用设计的图形处理器,提供强大的计算能力和高内存带宽。
  34. TPU(Tensor Processing Unit):Google专为机器学习任务设计的处理器,具有高吞吐量、低延迟和节能等特性。
  35. GPU Cloud Provider:提供GPU云服务以支持深度学习应用的云服务提供商,如Google Cloud、Amazon Web Services(AWS)和Microsoft Azure等。
  36. OpenAI API:OpenAI是一家提供人工智能模型的机构,其API允许用户通过简单的接口访问其强大的深度学习模型。
  37. GPT(Generative Pre-trained Transformer):一种基于Transformer模型的自回归语言模型,被用于生成文本和回答自然语言问题。
  38. BERT(Bidirectional Encoder Representations from Transformers):一种基于Transformer模型的预训练语言模型,被用于理解自然语言文本的含义和上下文。
  39. Transformer模型:一种基于自注意力机制的深度学习模型,被广泛应用于自然语言处理任务。
  40. 自动编码器(Autoencoder):一种神经网络架构,用于将输入数据编码成低维空间表示,然后再从低维空间表示还原成原始数据。
  41. 生成对抗网络(Generative Adversarial Networks,GAN):一种神经网络架构,由一个生成器网络和一个判别器网络组成,通过竞争来提高双方的生成和判别能力。
  42. 变分自编码器(Variational Autoencoder,VAE):一种结合了潜变量模型的神经网络架构,用于生成数据和重构数据。
  43. 强化学习(Reinforcement Learning):一种通过与环境的交互来学习最优行为的机器学习方法。
  44. Q-Learning:一种用于解决强化学习问题的算法,通过学习动作的价值来选择最优动作。
  45. TensorFlow Serving:TensorFlow的模型部署框架,用于将训练好的模型转换成服务部署到生产环境。
  46. TensorFlow Lite:TensorFlow的移动端和嵌入式设备支持框架,用于在这些设备上运行TensorFlow模型。
  47. TensorFlow.js:TensorFlow的JavaScript库,用于在浏览器和Node.js环境中运行TensorFlow模型。
  48. TensorBoardX:使用TensorFlow 1.x API的TensorBoard替代方案,支持Keras 2.x和PyTorch。
  49. ONNX Runtime:ONNX的模型运行时,支持在多种设备上运行ONNX格式的模型。

二、详解

2.1 深度学习

在这里插入图片描述

深度学习是机器学习的一个分支领域:它是从数据中学习表示的一种新方法,强调从连续的层中学习,这些层对应于越来越有意义的表示。

深度学习之“深度”并不是说这种方法能够获取更深层次的理解,而是指一系列连续的表示层。数据模型所包含的层数被称为该模型的深度( depth)。

2.2 神经网络

在深度学习中,这些分层表示是通过叫作神经网络( neural network)的模型学习得到的。
神经网络的结构是逐层堆叠。“神经网络”这一术语来自于神经生物学,然而,虽然深度学习的
一些核心概念是从人们对大脑(特别是视觉皮层)的理解中汲取部分灵感而形成的,但深度学
习模型并不是大脑模型。没有证据表明大脑的学习机制与现代深度学习模型的学习机制相同。
你可能读过一些科普文章,这些文章宣称深度学习的工作原理与大脑相似或者是在模拟大脑,
但事实并非如此。对于这一领域的新人来说,如果认为深度学习与神经生物学存在任何关系,
那将使人困惑,只会起到反作用。

2.3 前向传播

在这里插入图片描述

我们为图中的“输入节点”(输入 x、目标 y_true、 w 和 b)赋值。我们将这些值传入图中
所有节点,从上到下,直到 loss_val。这就是前向传播过程

2.4 反向传播

在这里插入图片描述

下面我们“反过来”看这张图。对于图中从 A 到 B 的每条边,我们都画一条从 B 到 A 的反向边,
并提出问题:如果 A 发生变化,那么 B 会怎么变?也就是说, grad(B, A) 是多少?我们在每
条反向边上标出这个值。这个反向图表示的是反向传播过程

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1518243.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

常用SQL语句大全

目录 目录 一.SQL概念 二.数据库操作 2.0.连接数据库 2.1创建数据库 2.2使用数据库 2.3切换数据库 2.4删除数据库(慎用!!) 2.5查询数据库 三.表操作 3.0了解数据类型和数据约束 3.1创建表 3.2查询表 3.3修改表 3.4删除表 四.数据操作 4…

【PTA】L1-032 L1-033(c)第六天

L1-032 Left-pad 分数 20 作者 陈越 单位 浙江大学 根据新浪微博上的消息,有一位开发者不满NPM(Node Package Manager)的做法,收回了自己的开源代码,其中包括一个叫left-pad的模块,就是这个模块把javas…

【开源-土拨鼠充电系统】鸿蒙 HarmonyOS 4.0+微信小程序+云平台

本人自己开发的开源项目:土拨鼠充电系统 ✍GitHub开源项目地址👉:https://github.com/cheinlu/groundhog-charging-system ✍Gitee开源项目地址👉:https://gitee.com/cheinlu/groundhog-charging-system ✨踩坑不易&am…

集合系列(一) -集合框架简介

一、集合类简介 Java集合就像一种容器,可以把多个对象(实际上是对象的引用,但习惯上都称对象)“丢进”该容器中。从Java 5 增加了泛型以后,Java集合可以记住容器中对象的数据类型,使得编码更加简洁、健壮。…

使用点链云管家创建瑜伽约课小程序

点链云管家 点链云管家是由上海点链科技开发的门店管理系统,为线下门店商家提供一站式门店运营服务平台解决方案,适用于瑜伽健身、美业、新零售会员制电商、母婴店、宠物店、按摩养生、服装、美容、美甲、汽车服务、商超零售、餐饮、KTV娱乐、干洗等18个…

如何在Linux使用docker部署Swagger Editor并实现无公网IP远程协同编辑API文档

目录 前言 Swagger Editor本地接口文档公网远程访问 1. 部署Swagger Editor 2. Linux安装Cpolar 3. 配置Swagger Editor公网地址 4. 远程访问Swagger Editor 5. 固定Swagger Editor公网地址 结语 前言 作者简介: 懒大王敲代码,计算机专业应届生 …

Linux的一些常用指令

一、文件中 r w x - 的含义 r(read)是只读权限, w(write)是写的权限, x(execute)是可执行权限, -是没有任何权限。 二、一些指令 # 解压压缩包 tar [-zxvf] 压缩包名…

springboot+ssm基于vue.js的客户关系Crm管理系统

系统包含两种角色:管理员、用户,主要功能如下。 ide工具:IDEA 或者eclipse 编程语言: java 数据库: mysql5.7 框架:ssmspringboot都有 前端:vue.jsElementUI 详细技术:springbootSSMvueMYSQLMAVEN 数据库…

揭秘动态住宅代理:如何合法获取全球数据洞察

文章目录 写在前面代理网络的崛起什么是代理网络?动态住宅代理的革命为什么选择亮数据动态代理 如何利用采集工具获取全球亮数据写在最后 写在前面 随着互联网技术的发展,数据已经成为企业生存和发展的不可或缺的资源。尤其在商业世界里,如何…

使用 ChatGPT 写高考作文

写作文,很简单,但写一篇好的作文,是非常有难度的。 想要写一篇高分作文,需要对作文题目有正确的理解,需要展现独到的观点和深入的思考,需要具备清晰的逻辑结构,需要准确而得体的语言表达。 正…

租个阿里云的服务器多少钱?30元、61元、99元、165元、199元

2024年租个阿里云的服务器多少钱?很便宜,云服务器2核2G3M固定带宽99元一年、2核4G服务器30元3个月、199元一年,轻量应用服务器2核2G3M配置61元一年、2核4G4M带宽165元一年,可以在阿里云CLUB中心查看 aliyun.club 当前最新的优惠券…

Elastic Agent 的安装及使用

概述 Elastic Agent是Elastic Stack中的一个全新组件,旨在简化和统一监控和集成管理流程。它是一个轻量级的代理,可以部署到各种不同类型的主机和容器中,用于收集系统指标、日志和事件数据,并将其发送到Elasticsearch进行存储和分…

【Qt】QListView 显示富文本,设置文本内容颜色

【Qt】QListView 显示富文本,设置文本内容颜色 文章目录 I - 控件使用II - 显示富文本III - 注意事项 I - 控件使用 Qt 的 MVC 架构为 MV ,Controller 部分继承到了 View 里,View(视图) 设置 Model(模型),Model 设置数据 这里使用…

新鲜出炉!界面控件DevExpress WinForms 2024产品路线图预览(三)

DevExpress WinForm拥有180组件和UI库,能为Windows Forms平台创建具有影响力的业务解决方案。DevExpress WinForm能完美构建流畅、美观且易于使用的应用程序,无论是Office风格的界面,还是分析处理大批量的业务数据,它都能轻松胜任…

专业140+总400+重庆邮电大学801信号与系统考研经验重邮电子信息与通信工程,真题,大纲,参考书。

今年报考重庆邮电大学研究生,初试专业课801信号与系统140总分400,总结一下自己去年的复习经验,希望对大家复习有帮助。 专业课: 重邮专业801信号与系统难度中等,今年140算是正常发挥,没有达到Jenny老师要求…

【经验分享】Windows10无法通过SSHFS连接服务器

【经验分享】Windows10如何通过SSHFS连接服务器 前言问题分析解决方法 前言 现在很多公司出于成本考虑,不会为每一台电脑都提供高配置,所以需要通过访问云服务器来进行编译等操作。程序员如果配备的是一台windows电脑,那么需要访问linux服务…

Java复习04 注解和反射

Java复习04 注解和反射 初学 注解和反射的时候 我的问题是 什么是注解? 什么是反射?单例模式 Stream ForkJoin有什么区别? 注解的分类有哪些?怎么区分?反射的分类有哪些?怎么区分? 反射里面Con…

视频水印如何去除?看看这三款工具!

在处理视频内容时,经常会遇到带有水印的视频素材。这些水印有时会遮挡重要的视觉信息,或者影响视频的美观性。为了保持视频内容的完整性和专业性,一个高效的视频去水印工具就显得尤为重要。下面我为大家推荐三款能够轻松去除视频水印的工具。…

Qt+FFmpeg+opengl从零制作视频播放器-3.解封装

解封装:如下图所示,就是将FLV、MKV、MP4等文件解封装为视频H.264或H.265压缩数据,音频MP3或AAC的压缩数据,下图为常用的基本操作。 ffmpeg使用解封装的基本流程如下: 在使用FFmpeg API之前,需要先注册API&a…

离线安装数据库 mysql 5.7 linux

离线安装数据库 mysql 5.7 linux 方法一 参考链接Linux(Debian10.2)安装MySQL5.7.24环境 赋予文件执行权限chmod x 文件名 使用root用户sudo su解压文件tar xvf mysql-5.7.42-linux-glibc2.12-x86_64.tar.gz重命名mv mysql-5.7.42-linux-glibc2.12-x86_64 mysql将桌面的mys…