【高级人工智能】国科大《高级人工智能》联结主义 笔记 + 考试回忆

news2025/1/13 13:41:53

国科大《高级人工智能》吴老师部分——联结主义笔记

  • 吴老师上课dddd,上课东西太多太杂,听不太懂比较煎熬,但是课后花点时间理解理解,还是挺有帮助的
  • 考试按照重点复习即可,虽然答疑时提到的传教士野人没考😅,但是知识点基本都在最后一节ppt里
  • 听说下一届就不会用原题了

文章目录

  • 一、搜索
    • 1.概念
      • 形式化描述
      • 野人与传教士问题
      • 搜索算法特性
    • 2.树搜索
    • 深度优先DFS
    • 广度优先BFS
    • 3.启发式搜索
    • 4.图搜索
    • 5.局部搜索
  • 二、人工神经网络
    • 1.神经网络
    • 2.感知机
    • 3.深度神经网络
    • 4.CNN卷积网络
    • 5.RNN
    • 6.GAN生成式对抗网络
  • 考试回忆

一、搜索

1.概念

形式化描述

搜索问题的形式化描述:

  • 状态空间
  • 后继函数
  • 初始状态
  • 目标测试
  • => 解:一个行动序列,将初始状态转换成目标状态

野人与传教士问题

  • 状态空间:{(左岸传教士数量, 左岸野人数量, 船状态[1在左岸,0在右岸])}
  • 后继函数:{ P01, P10, P02, P20, P11, Q01, Q10,Q02, Q20, Q11}(船向左/右, 船上传教士数量, 船上野人数量)
  • 耗散函数:当前状态下船从一侧划到另外一侧耗散值为1个单位
  • 初始状态:(3, 3, 1)
  • 目标状态:(0, 0, 0)
    在这里插入图片描述

搜索算法特性

  • 完备性(问题有解且能找到一个)
  • 最优性(保证找到最优解[最小损耗])
  • 时间、空间复杂度

2.树搜索

扩展出潜在行动,维护行动的边缘节点,扩展尽可能少的树节点。

深度优先DFS

  • 描述:回溯,每次从边缘集合选最深的[栈]
  • 不保证完备性(有环层数无限大)与最优性(无视深度损失)
  • m层b叉:时O(bm) 空O(bm)
  • 迭代深入搜索:结合DFS空间优势+BFS时间优势

广度优先BFS

  • 描述:对每个相邻节点再访问其相邻但是未被访问过的节点[队列]
  • 保证完备性+最优性
  • m层b叉:时O(bm) 空O(bm)
  • 代价一致搜索:总是扩展路径消耗最小的节点

3.启发式搜索

  • 描述:利用问题拥有的启发信息引导搜索
  • 启发策略:估计一个状态到目标距离的函数
  • 贪婪搜索:扩展离目标最近的节点,不具完备性、最优性
    • 评价节点:启发函数f(n)=h(n)(当前节点到终点的开销)
  • A*搜索:代价一致搜索 + Greedy,
    • 评价:f(n)=代价函数g(n) +启发函数h(n) 启发函数可采纳->最优性

4.图搜索

  • 描述:避免重复状态,不扩展一个状态两次:树搜索+扩展过的状态集(closed set)
  • A*图搜索:启发式的一致性 => A*图最优
    • 一致性:沿路径的节点估计耗散 f 值单调递增:h(A) ≤ cost(A to C) + h©

5.局部搜索

  • 描述:改进单一选项直到不能再改善为止;新的后继函数: 局部改变;不完备,不最优
  • 爬山法:任意位置起始,重复直到移动到最好的相邻状态(可能局部最优解)
  • 模拟退火搜索:引入随机因素,避免局部极大(允许向山下移动)
  • 遗传算法:适应度函数,每步保留N个最好状态

二、人工神经网络

1.神经网络

  • 神经元模型:二值神经元模型、模拟神经元模型、二值随机神经元
  • 网络结构:前馈结构、反馈/循环结构
  • 学习方法:通过神经网络所在环境的模拟过程,调整网络中的自由参数

2.感知机

单层感知机:

  • 二值神经元模型+单神经元网络
  • 基于超平面判别分类,不能处理非线性分类问题

多层感知机:

  • 模拟神经元模型+三层前馈网络
  • BP算法:链式规则,从前往后计算结果,从后往前误差反传调整参数(梯度求导),结果评价:最小二乘法
  • 梯度消失:BP网络中,由于激活函数的原因,误差反向传播时,样本梯度越来越小,基本上接近于0,意味着初始层的权重和偏差不会在训练中得到有效更新,可能导致网络整体不准确,得不到良好的解

3.深度神经网络

  • 学习方法:自下向上的非监督学习 or 自顶向下的监督学习
  • 自动编码器:非监督方法得到每层神经元的结果累加,通过端对端的训练调参
  • 深度玻尔兹曼机DBM:浅层网络是双向的,最小化能量函数
  • 受限玻尔兹曼机RBM:层间全连接,层内无连接,随机神经元,限定模型为二分图,学习目标是极大似然
  • 深度置信网络DBN:非监督的预学习+监督微调,多个RBM堆叠
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

4.CNN卷积网络

  • 特点:局部链接、参数共享、子采样(选择题)
  • BP算法
    • 输出层:代价函数的确定及求导
    • Pooling:数据的下采样及残差的上采样,降低数据空间尺寸,减少网络参数
    • 卷积层:数据的卷积运算及残差的反卷积运算,对输入图像降维和特征抽取
    • 全连接层:整个网络分类器的作用
  • 举例:
    • GoogleLeNet:模块叠加实现深层网络搭建
    • 残差网络:解决深度网络退化问题,深层网络的后面若干层学习成恒等映射,模型就退化成浅层网络
  • 图像数据应用
    • 目标检测:卷积的滑动窗口实现+人像识别

5.RNN

  • 描述:对序列数据建模,存储过去信息+非线性动态更新隐藏状态
  • 结构:隐层有时回有连向下一时间Hidden Layer的边
  • 学习算法BPTT:实现权值一致,前向网络,所有时刻损失相加=总损失
  • 长序列神经网络:解决梯度膨胀或消散问题
    • GRU:重置门、更新门(计算速度快、容易创建较大的网络)
    • LSTM:遗忘门、信息增加门和输出门
    • BRNN:双向
    • DRNN:深层循环神经网络
      在这里插入图片描述
      在这里插入图片描述
      序列模型:
  • 机器翻译:条件语言模型 — 集束搜索
    • 例子:Encoder、Decoder为RNN:
      • Encoder:每个输入的词向量会经过线性变换
      • Decoder:可以是预先训练好的语言模型,能预测合理的English短语
      • 训练encoder、decoder的weights,使所有单词的交叉熵达到最小,每次得到一个最有可能的翻译结果
  • 注意力模型:在生成每个翻译结果时只考虑部分提取到的特征
    在这里插入图片描述

6.GAN生成式对抗网络

  • 描述:生成器C(生成一个数据,会被判定结果优化)+判别器(判断是否是生成器生成的)

  • 核心思想:纳什均衡
    - 生成器:尽量学习真实的数据分布。把噪声数据Z通过生成模型G,伪装成真实数据x
    - 判别器:尽量正确判别输入数据是真实数据还是来自生成器数据
    - 各自提高自己生成能力和判别能力,这个学习优化的过程是寻找生成器和判别器之间的纳什均衡
    在这里插入图片描述

  • 训练过程:

      1. 固定G,训练D,D希望V(G,D)越大越好,所以需要加上梯度(判断能力越来越好)
      1. 固定D,训练G,G希望V(G,D)越小越好,所以要减去梯度(让判别模糊,生成欺骗能力越来越好)
      1. 整个训练过程由上面两步交替进行,直至两者平衡
  • 类型:

    • 普通GAN:生成real的图像
    • 条件GAN:生成符合条件的数据/图像,判断是否real + match
    • 非监督条件GAN:产生相同风格的图像

考试回忆

  • 选择题:
    • A*树搜索最优条件
    • tanh函数图像
    • CNN特点
    • 神经网络在哪一项引入非线性
    • 感知机特点
    • GAN特点
  • 简答题:
    • 启发式算法:什么时候算法保证完备 or 保证最优?
  • 应用题:
    • 感知机实现布尔函数
    • 卷积神经网络的各层神经元数量和可训练参数数量
    • RNN设计翻译器

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/156395.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

神经网络、激活函数

目录1.双层神经网络计算神经网络层数的时候不包括输入层。2.逻辑回归的神经网络如何实现隐藏单元如何计算?,3x1矩阵,3x1矩阵,上标[1]表示第一层向量化(单个训练样本):隐藏层:,,为4x3矩阵,x为3x1…

spring cloud gateway 整合sentinel使用过程使用遇到的问题

最近在进行spring cloud gateway 整合 sentinel 在此过程中遇到的问题进行汇总 1. spring gateway 整合sentinel gateway的路由会自动加一个前缀 效果如下 问题原因 代码在 org.springframework.cloud.gateway.discovery.DiscoveryClientRouteDefinitionLocator#DiscoveryClie…

【迅为iMX6Q】开发板 Linux 5.15.71 RTL8211E 以太网驱动适配

相关参考 【迅为iMX6Q】开发板 u-boot 2022.04 SD卡 启动 【迅为iMX6Q】开发板 u-boot 2020.04 RTL8211E 以太网驱动适配 【迅为iMX6Q】开发板 Linux 5.15.71 SD卡 启动 开发环境 win10 64位 VMware Workstation Pro 16 ubuntu 22.04 -【迅为imx6q】开发板,…

【学习笔记】【Pytorch】三、常用的Transforms

【学习笔记】【Pytorch】三、常用的Transforms学习地址主要内容一、Transforms模块介绍二、transforms.ToTensor类的使用1.使用说明2.代码实现三、transforms.Normalize类的使用1.使用说明2.代码实现四、transforms.Resize类的使用1.使用说明2.代码实现五、transforms.Compose类…

IIC协议初识及OLED写入指令、数据和显示的代码实现

目录 一、IIC协议概述 二、IIC协议起始和终止信号 三、应答信号 四、数据发送的时序 五、OLED写入指令和数据 六、OLED显示一个点的思路 七、OLED显示一个点的代码 八、OLED列地址 九、OLED显示图片 一、IIC协议概述 1、IIC概述 IIC(集成电路总线&#…

UI设计师与UE设计师有什么区别?

设计在我们的生活中扮演着重要的角色,但是面对越来越多的专业术语和相近的岗位职责,人们总是困惑:明明是差不多的岗位,为什么要整那么多的词?其实,在它们神似的外表下,潜藏着巨大的差异&#xf…

虹科分享 | 实时操作系统INtime RTOS第7版功能更新介绍

INtime简介 INtime是专为基于PC的嵌入式解决方案而设计的可扩展实时操作系统,功能包括动态控制多个主机上多个节点(核心)上的进程,以及系统所有节点之间的丰富进程间通信,可应用于多核x86兼容处理器的非对称多处理(AM…

【阶段三】Python机器学习17篇:机器学习项目实战:随机森林回归模型

本篇的思维导图: 项目实战(随机森林回归模型) 项目背景 作为国家的支柱产业,房地产的稳定发展关乎国际民生。近几年,房地产价格飞速上涨,连创新高。在这种情况下研究房价的影响因素,具有重要的理论和现实意义。弄清影响房价的主要经济因素,探究我国房地产投资是…

calc()方法的使用

calc实现css中动态计算 环境 根据元素高度的变化,动态控制padding值 <marquee:name"up index"behavior"scroll"scrolldelay"30"direction"up"v-else-if"item.scrollPocition 3 ? true : false":style"{--positi…

核心乐理---五线谱基础

音符 音符的长度 音符的长度都是相对的定义 一般来说讲全音符设为一拍&#xff0c;但如果将二分音符设为一拍的话&#xff0c;全音符就是两拍 附点音符 可以在音符后跟上一个小点来改变音符的长度&#xff0c;如果一个音符后面跟了n个原点&#xff0c;它的长度就会变为原来的…

【学习记录】阿里云服务器+宝塔

环境&#xff1a;阿里云服务器&#xff0c;linux Centos系统 一、安装宝塔 参考链接&#xff1a;阿里云 ECS 服务器入门使用宝塔安装使用 1、进入云服务器控制台&#xff0c;打开远程连接 2、初次使用&#xff0c;可重置登录密码和连接密码 这是远程连接时需要输入的密码 这…

测试开发基础 | 计算机网络篇(二):物理层与数据链路层

计算机网络知识是自动化测试等技术基础&#xff0c;也是测试面试必考题目。霍格沃兹测试学院特别策划了本系列文章&#xff0c;将带大家一步步夯实计算机网络的基础知识。一、物理层由于物理层知识在互联网软件研发工作中用到的并不多&#xff0c;所以可以仅做一个简单的了解。…

Prompt: No !!!

Prompt is Not Good. Prompt 这个方法实际上并不是很好 Prompt 可以是in-context learning的一种。prompt-based learning has taken NLP by storm!! prompt-based的方法在NLP中引起风暴。但&#xff0c;Prompt-based的方法实际上不太行&#xff1a; 1. Inefficiency: The pro…

基于python的企业编码生成系统 (完整的代码+项目说明)

《企业编码生成系统》程序使用说明 在PyCharm中运行《企业编码生成系统》即可进入如图1所示的系统主界面。在该界面中可以选择要使用功能对应的菜单进行不同的操作。在选择功能菜单时&#xff0c;只需要输入对应的数字即可。 图1 系统主界面 具体的操作步骤如下&#xff1a;…

匿名内部类的理解(java + Android)

是不是有同学跟我一样学了知识&#xff0c;不使用&#xff0c;一段时间就忘了&#xff1f; 今天说说java的匿名内部类这个东西&#xff0c;今天就因为这个东西被程序媛欺负了&#xff0c;我心里难受啊。 匿名内部类的官方说法特别不容易理解&#xff0c;是从"有没有名字…

全网惟一面向软件测试人员的Python基础教程-在Python中如何把列表当成队列来进行使用?

全网惟一面向软件测试人员的Python基础教程 起点&#xff1a;《python软件测试实战宝典》介绍 第一章 为什么软件测试人员要学习Python 第二章 学Python之前要搞懂的道理 第三章 你知道Python代码是怎样运行的吗&#xff1f; 第四章 Python数据类型中有那些故事呢&#xff1f;…

Linux的SOCKET编程详解(转载)

Linux的SOCKET编程详解1. 网络中进程之间如何通信进 程通信的概念最初来源于单机系统。由于每个进程都在自己的地址范围内运行&#xff0c;为保证两个相互通信的进程之间既互不干扰又协调一致工作&#xff0c;操作系统为进程通信提供了相应设施&#xff0c;如UNIX BSD有&#x…

大漠插件最新版7.2302

工具名称:大漠插件最新版7.2302工具简介:/大漠插件v7.2302更新时间2023年1月9日更新内容1. 驱动支持win10(19045)和win11(22621)2. 综合工具增加功能,在定义文字输入框激活时,按下alt会输入最后一次输入的文字/【插件特色】1. 文字识别 领域&#xff0c;目前插件界&#xff0c;…

B. Gardener and the Array(贪心)

传送门题意&#xff1a;给你n个数&#xff0c;问你是否存在不同的两个子区间&#xff0c;使这两个子区间的或结果相同。注&#xff1a;因为数据范围太大&#xff0c;所以每个数都由他的二进制数表示&#xff1a;每一行第一个数m表示有几个二进制数&#xff0c;后面m个数代表2的…

陪诊小程序开发,谁更需要陪诊服务

我们去过医院的都很清楚&#xff0c;医院的看病流程是很繁琐&#xff0c;医院不仅大&#xff0c;科室还划分的又细又多。对于一些在外打拼整天忙的顾不得看病就医的打工人&#xff0c;还有一些跟随子女去异地生活养老就医的老年人&#xff0c;还有一些没人陪伴独居生活的年轻人…