深度学习与神经网络阅读笔记(持续更新)

news2025/1/4 18:38:59

深度学习与神经网络阅读笔记(持续更新)

  • 机器学习基础
    • 绪论
      • 人工智能主要领域可分为如下:
      • 人工智能的发展史:
      • 机器学习
      • 表示学习
      • 深度学习
    • 线性模型
      • Logistic回归
      • Softmax回归
      • 感知器
      • 支持向量机
      • 总结对比
  • 基础模型
    • 循环神经网络
      • 应用到机器学习
        • 序列到类别模式
      • 同步的序列到序列模式
      • 异步的序列到序列模式
    • 基于门控的循环神经网络
      • LSTM

本书的知识体系
在这里插入图片描述

机器学习基础

绪论

人工智能主要领域可分为如下:

  1. 感知:模拟人的感知能力,对外部刺激信息(视觉和语音等)进行感知和加工.主要研究领域包括语音信息处理和计算机视觉等.
  2. 学习:模拟人的学习能力,主要研究如何从样例或从与环境的交互中进行学习.主要研究领域包括监督学习、无监督学习和强化学习等.
  3. 认知:模拟人的认知能力,主要研究领域包括知识表示、自然语言理解、推理、规划、决策等.

人工智能的发展史:

在这里插入图片描述

机器学习

机器学习(Machine Learning,ML)是指从有限的观测数据中学习(或“猜测”)出具有一般性的规律,并利用这些规律对未知数据进行预测的方法。
由于数据的多样性,在实际任务中使用机器学习模型一般会包含以下几个步骤:

  1. 数据预处理:经过数据的预处理,如去除噪声等.比如在文本分类中,去除停用词等.
  2. 特征提取:从原始数据中提取一些有效的特征.比如在图像分类中,提取边缘、尺度不变特征变换(Scale Invariant Feature Transform,SIFT)特征等.
  3. 特征转换:对特征进行一定的加工,比如降维和升维.降维包括特征抽取(Feature Extraction)和特征选择(Feature Selection)两种途径.常用的特征转换方法有主成分分析(Principal Components Analysis,PCA)、 线性判别分析(Linear Discriminant Analysis,LDA)等.
  4. 预测:机器学习的核心部分,学习一个函数并进行预测.
    在这里插入图片描述
    机器学习的重要工作量都在前三步的特征处理上,这决定了最终系统的准确性,统称为的特征工程

表示学习

为了提高机器学习系统的准确率,我们就需要将输入信息转换为有效的特征,或者更一般性地称为表示(Representation).如果有一种算法可以自动地学习出有效的特征,并提高最终机器学习模型的性能,那么这种学习就可以叫作表示学习(Representation Learning).

语义鸿沟: 表示学习的关键是解决语义鸿沟(Semantic Gap)问题.语义鸿沟问题是指输入数据的底层特征和高层语义信息之间的不一致性和差异性

如果可以有一个好的表示在某种程度上能够反映出数据的高层语义特征,那么我们就能相对容易地构建后续的机器学习模型.

两种方式来表示特征:局部表示(Local-Representation)和分布式表示(Distributed Representation)

局部表示,也称为离散表示或符号表示.局部表示通常可以表示为one-hot 向量的形式,例如要表示不同的颜色:假设所有颜色的名字构成一个词表 v v v ,词表大小为 ∣ v ∣ |v| v.我们可以用一个 ∣ v ∣ |v| v维的one-hot向量来表示每一种颜色.在第 i i i种颜色对应的one-hot向量中,第 i i i维的值为1,其他都为0.

优点

  1. 这种离散的表示方式具有很好的解释性,有利于人工归纳和总结特征,并通过特征组合进行高效的特征工程;
  2. 通过多种特征组合得到的表示向量通常是稀疏的二值向量,当用于线性模型时计算效率非常

缺点

  1. one-hot向量的维数很高,且不能扩展.如果有一种新的颜色,我们就需要增加一维来表示;
  2. 不同颜色之间的相似度都为0,即我们无法知道“红色”和“中国红”的相似度要高于“红色”和“黑色”的相似度.

分布式表示:可以理解为分散式表示,即一种颜色的语义分散到语义空间中的不同基向量上。对于表示不同颜色的例子则为:用RGB值来表示颜色,不同颜色对应到R、G、B三维空间中一个点。

嵌入:嵌入通常指将一个度量空间中的一些对象映射到另一个低维的度量空间中,并尽可保持不同对象之间的拓扑关系.比如自然语言中词的分布式表示,也经常叫作词嵌入。

深度学习

构建具有一定“深度”的模型,并通过学习算法来让模型自动学习出好的特征表示(从底层特征,到中层特征,再到高层特征),从而最终提升预测模型的准确率.所谓“深度”是指原始数据进行非线性特征转换的次数.如果把一个表示学习系统看作一个有向图结构,深度也可以看作从输入节点到输出节点所经过的最长路径的长度.
在这里插入图片描述

深度学习是将原始的数据特征通过多步的特征转换得到一种特征表示,并进一步输入到预测函数得到最终结果.和“浅层学习”不同,深度学习需要解决的关键问题是贡献度分配问题(Credit Assignment Problem,CAP)[Minsky,1961],即一个系统中不同的组件(component)或其参数对最终系统输出结果的贡献或影响。

(深度学习可以看作一种强化学习(Reinforcement Learning,RL),每个内部组件并不能直接得到监督信息,需要通过整个模型的最终监督信息(奖励)得到,并且有一定的延时性.)

端到端学习(End-to-End Learning):在学习中不划分模块,训练数据为“输入-输出”对的形式,没有其他额外数据。同深度学习一样解决贡献度分配问题,目前,大部分采用神经网络模型的深度学习也可以看作一种端到端的学习

区别于端到端学习,传统机器学习方法需要将一个任务的输入和输出之间人为地切割成很多子模块(或多个阶段),每个子模块分开学习比。如一个自然语言理解任务,一般需要分词、词性标注、句法分析、语义分析、语义推理等步骤.这种学习方式有两个问题:一是每一个模块都需要单独优化,并且其优化目标和任务总体目标并不能保证一致;二是错误传播,即前一步的错误会对后续的模型造成很大的影响.这样就增加了机器学习方法在实际应用中的难度.

线性模型

一个线性分类模型(Linear Classification Model)或线
性分类器(Linear Classifier),是由一个(或多个)线性的判别函数 f ( x , w ) = w T x + b f(x,w)=w^Tx+b f(x,w)=wTx+b和非线性的决策函数 g ( ⋅ ) g(⋅) g() 组成

这里主要介绍四种线性模型,其区别在于损失函数的不同

Logistic回归

Logistic 回归(Logistic Regression,LR)是一种常用的处理二分类问题的线性模型
Logistic 回归采用交叉熵作为损失函数,并使用梯度下降法来对参数进行优化.

Softmax回归

Softmax 回归(Softmax Regression),也称为多项(Multinomial)或多类(Multi-Class)的Logistic回归,是Logistic回归在多分类问题上的推广.
Softmax回归使用交叉熵损失函数来学习最优的参数矩阵 w w w.
W = [ w 1 . . w C ] W = [w_1 .. w_C] W=[w1..wC]是由 C C C个类的权重向量组成的矩阵, 1 C 1_C 1C为C维的全1向量, 第 C C C维的值是第 C C C类的预测条件概率.
要注意的是,Softmax回归中使用的 C C C个权重向量是冗余的,即对所有的权重向量都减去一个同样的向量 v v v,不改变其输出结果.因此,Softmax回归往往需要使用正则化来约束其参数.此外,我们还可以利用这个特性来避免计算Softmax函数时在数值计算上溢出问题.

感知器

就是一个单神经元

支持向量机

存在一个超平面能够划分所有数据在这里插入图片描述
支持向量机的目标是寻找一个超平面使得所有样本到分割超平面的最短距离最大。

总结对比

在这里插入图片描述
在这里插入图片描述

基础模型

循环神经网络

应用到机器学习

序列到类别模式

文本分类
将一个序列的最后一个时刻的隐藏状态 h t h_t ht作为序列的特征表示,输入到分类器 g ( . ) g(.) g(.)中.
其中 g ( ⋅ ) g(⋅) g()可以是简单的线性分类器(比如Logistic回归)或复杂的分类器(比如多层前馈神经网络)
除了将最后时刻的状态作为整个序列的表示之外,我们还可以对整个序列的所有状态进行平均,并用这个平均状态来作为整个序列的表示,即Alt

同步的序列到序列模式

同步的序列到序列模式主要用于序列标注(Sequence Labeling)任务,即每一时刻都有输入和输出,输入序列和输出序列的长度相同.比如在词性标注(Part-of-Speech Tagging)中,每一个单词都需要标注其对应的词性标签.
在这里插入图片描述

异步的序列到序列模式

异步的序列到序列模式也称为编码器-解码器(Encoder-Decoder)模型,即输入序列和输出序列不需要有严格的对应关系,也不需要保持相同的长度.比如在机器翻译中,输入为源语言的单词序列,输出为目标语言的单词序列.
在这里插入图片描述

基于门控的循环神经网络

LSTM

在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/709363.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

MongoTemplate手动动态创建(简版)

1、背景 最近遇到一个需求,就是动态获取springboot中MongoTemplate,有哪些mongo数据库在项目启动的时候不确定,运行过程中有可能会增加,也有可能减少。只能通过一个接口获取所有mongo数据库的地址。但是springboot本身提供的mong…

panda3d 模型转换命令复习学习

在此学习了把maya模型转换为panda3d的egg格式; 在Panda3d中转换Maya模型为egg格式并使用pview查看_panda3d egg文件浏览器_bcbobo21cn的博客-CSDN博客 下面继续看一下模型转换命令;列出带 egg 字符串的命令; 先复习一下,可以把m…

Java -- XXL-JOB分布式任务调度平台

XXL-JOB是一个分布式任务调度平台,其核心设计目标是开发迅速、学习简单、轻量级、易扩展。现已开放源代码并接入多家公司线上产品线,开箱即用 xxl是xxl-job的开发者大众点评的【许雪里】名称的拼音开头 官网地址 分布式任务调度平台XXL-JOB 文档地址…

响应数据加密解决方案

需求分析 响应数据加密是一种很重要的安全措施,可以保护数据在传输过程中不被未经授权的用户拦截、窃取或篡改。以下是响应数据加密需求分析: 响应数据必须进行加密: 所有响应数据必须进行加密,以保证数据在传输过程中的安全性。服务器可以采用HTTPS协议对响应数据进行加密…

剑指 Offer 46: 把数字翻译成字符串

这道题先画模型 假设3个数,第一个第二个可以组,第二个第三个可以组。所以有3种 123 && 字母3 && 1字母 当发现有两种操作方法,说明当前方法出错误了,必须立即想别的办法! 除了使用一直除外&#xff…

ad18报错:net antennae:track

画了板子之后发现有这个错误提示,看了图,发现是在一个焊盘下面有2根残留的线,而且线边上出现了天线标志 net antennae的含义是网络天线,这里可以理解为板卡上某个网络的布线形成了天线,但是没有特别标注这一部分是天线…

【Mysql】MySQL体系结构,InnoDB、MyISAM存储引擎,索引结构、分类、语法、性能分析

1. MySQL体系结构 连接层 主要完成一些类似于连接处理、授权认证、及相关的安全方案。在该层上引入了线程池的概念,为通过认证安全接入的客户端提供线程。同样在该层上可以实现基于SSL的安全链接。服务器也会为安全接入的每个客户端验证它所具有的操作权限。 服务层…

(五)Web_Server+网页可视化展示

第一步:先使用nodeJS获取mqtt转发的数据:添加链接描述 第二步:使用fs库,将数据存入txt文件(接上一步,这里没处理数据格式,只是测试) var fsrequire("fs");const mqtt require(mqtt) //存储订阅的消息 var …

Android ConstrainLayout布局中View位置的介绍与使用

一、介绍 ConstrainLayout是一款布局View,再Design库中,现已被大家广泛接受并使用。ConstrainLayout的布局采用的方式和其他都不同,他的对其方式是类似RelativeLayout,但是和RelativeLayout有明显的区别。 在布局渲染的时候&#…

获取Xilinx FPGA芯片IDCODE的4种方法(支持任何FPGA型号)

文章目录 方式1:官方文档方式2:一个头文件方式3:BSDL文件方法4:芯片IDCODE在线搜索网站Xilinx FPGA部分型号IDCODE汇总 方式1:官方文档 对于常用的Spartan-6系列可以在UG380文档中找到对应的IDCODE,Sparta…

CM+CDH 构建企业大数据平台

📢📢📢📣📣📣 哈喽!大家好,我是【IT邦德】,江湖人称jeames007,10余年DBA及大数据工作经验 一位上进心十足的【大数据领域博主】!😜&am…

电磁阀位、通、开/闭原理精髓

一、引用 电磁阀在液/气路系统中,用来实现液路的通断或液流方向的改变,它一般具有一个可以在线圈电磁力驱动下滑动的阀芯,阀芯在不同的位置时,电磁阀的通路也就不同。 阀芯在线圈不通电时处在甲位置,在线圈通电时处在…

ChatGPT助力校招----面试问题分享(八)

1 ChatGPT每日一题:有源和无源滤波器 问题:有源和无源滤波器的区别 ChatGPT:有源滤波器和无源滤波器是指使用不同的电路元件来实现滤波功能的电路 有源滤波器使用了一个或多个有源元件,例如晶体管、运算放大器等,以…

浅浅总结一下雅思听力技巧

1. 地图题 读题步骤要明确 (1)看图,要看看题目中是否有东南西北的标志,如果有的话,那么大概率题目中就会用到。同时也标记好左右的标志,防止考试的时候太紧张分不清。 弄清楚个元素的相对位置&#xff0…

华为OD机试真题 Python 实现【开心消消乐】【2023 B卷 100分】,附详细解题思路

目录 一、题目描述二、输入描述三、输出描述四、Python算法源码五、效果展示1、输入2、输出3、说明 一、题目描述 给定一个N行M列的二维矩阵,矩阵中每个位置的数字取值为0或1。矩阵示例如: 1 1 0 0 0 0 0 1 0 0 1 1 1 1 1 1 现需要将矩阵中所有的1进行…

卷积神经网络--猫狗系列之构建模型【ResNet50】

在上一期:卷积神经网络--猫狗系列之下载、导入数据集,如果测试成功就说明对数据的预处理工作已经完成,接下来就是构建模型阶段了: 据说建立一个神经网络模型比较简单,只要了解了各层的含义、不同层之间参数的传递等等&…

leetcode 1232. 缀点成线

题目描述解题思路执行结果 leetcode 1232. 缀点成线 题目描述 缀点成线 给定一个数组 coordinates ,其中 coordinates[i] [x, y] , [x, y] 表示横坐标为 x、纵坐标为 y 的点。请你来判断,这些点是否在该坐标系中属于同一条直线上。 示例 1&a…

进程的调度常用算法

目录 先来先服务(FCFS)调度算法 短作业优先(SJF)的调度算法 基于时间片的轮转调度(RR)算法 先来先服务(FCFS)调度算法 系统将按照作业到达的先后次序来进行作业调度,或…

RT-Thread 5.0.1 qemu-virt64-aarch64 解决网络问题

参考文章 qemu 源码编译 qemu-system-aarch64 的方法 RT-Thread 5.0.1 qemu-virt64-aarch64 解决编译问题 前言 最近需要使用 RT-Thread qemu-virt64-aarch64,验证 aarch64 平台,也就是 ARM64 平台的一些网络功能,需要开启 qemu-virt64-aa…

UE4/5用贴图和GeneratedDynamicMeshActor曲面细分与贴图位移制作模型

目录 制作逻辑: ​编辑 曲面细分函数: 添加贴图逻辑: 代码: 制作逻辑: 在之前的文章中,我们使用了网格细分,而这一次我们将使用曲面细分函数,使用方法和之前是一样的&#xff1a…