机器学习和深度学习-- 李宏毅（笔记于个人理解）Day 21

机器学习和深度学习-- 李宏毅（笔记于个人理解）Day 21

news2025/2/25 0:30:43

Day 21 Self- Attention

选修部分

学完自适应再回来看看

Sequence Labling

假如我们现在有一个需要读完全部句子才能解的问题，那么red window 就需要变得是最大的（最长的句子）；

其实这里大家有没有想过，这个玩意儿就是个卷积网络CNN，所谓的window 就是卷积核

what is self Attention?

how self-attention work

主要考虑 Dot -product

实际操作自己也要做关联计算qk

如果b¹ 和 v² 比较接近的话，那么我们就说这a1 和a2 比较像

b1 --b4 是同时产生的

矩阵运算的角度

你也可以不做softmax（Relu 也行）

（小bug是 a_head 换成 '）

Multi-head -self-attention

Positional Encoding

hand - crafted (s to s 的规则使得不会超过位置信息)

can learned from data

这里感觉不到数学的巧妙，只是感到了工程的流水线的简洁和高效

Applicantions

Self -attention vs CNN

弹性较大，数据较小的时候容易过拟合

提问：

我们知道 fc 和cnn差不多(无非是fc更宽一些，如果你把cnn当初fc做的话有可能丢失位置信息，或可能需要postion encode)，那么问你为什么不把windows变得很大去卷积呢？
如果说像老师说的
无法得知最长的sequerence
参数量大（这里不太明白参数量大在什么地方）

Self-Attention vs RNN

这里和我理解的差不多，就是特征彼此离得太远有点记不住了
RNN 无法进行并行计算

Self - Attention for Graph

可以做智能知识图谱哎，相关性度量；this is one type of Graph Neural Network(GNN)

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1609158.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

Android Studio历史版本下载地址

Android Studio历史版本下载地址

https://developer.android.com/studio/archive?hlzh-cn https://blog.csdn.net/crasowas/article/details/130304836

阅读更多...

豆瓣影评信息爬取（爬虫）

豆瓣影评信息爬取（爬虫）

代码块： from lxml import etree import requestsheaders{User-Agent:Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/123.0.0.0 Safari/537.36 Edg/123.0.0.0 }url_list[] for i in range(0,5):i*20urlsf"https:…

阅读更多...

顺序表链表经典算法题

顺序表链表经典算法题

1.链表反转 typedef struct ListNode listnode; struct ListNode* reverseList(struct ListNode* head) {if(head NULL){return head;}listnode* p1 NULL;listnode* p2 head;listnode* p3 head->next;while(p2){p2->next p1;p1 p2;p2 p3;if(p3)p3 p3->next;}…

阅读更多...

ubuntu22.04 启用 root登录

ubuntu22.04 启用 root登录

1，设置 root密码普通用户输入如下命令给 root 设置密码 sudo passwd root 根据提示设置密码。 2，允许 root 登录 vim /etc/pam.d/gdm-password 以及 vim /etc/pam.d/gdm-autologin 注释两个文件中如下图所示的代码 3，允许 ssh 方式 ro…

阅读更多...

移动端适配之viewport

移动端适配之viewport

目录盒模型：widthcontent（padding border） class"content-box"内容盒模型（W3C盒） class"border-box"边框盒模型（IE 盒） scroll滚动 window浏览器视窗：包括…

阅读更多...

IP 和 TCP 抓包分析实验

IP 和 TCP 抓包分析实验

实验拓扑实验需求 1、配置IP地址，R1的g0/0口是1.1.1.1/24 ，R2的g0/0口是1.1.1.2/24 2、在该链路上开启抓包 3、在R1上ping R2 4、开启wireshark，查看抓取的ping包的内容 5、在R2上开启ftp服务 6、在R1上访问R2的FTP 7、在wireshark查…

阅读更多...

【游戏专区】贪吃蛇

【游戏专区】贪吃蛇

1，游戏背景贪吃蛇（Snake）是一款经典的电子游戏，最初在1976年由 Gremlin 公司开发。它的游戏背景相对简单，但具有高度的成瘾性。 1. **游戏场景**：通常在一个有界的矩形区域内进行，可以是一个…

阅读更多...

电磁炉原理笔记

电磁炉原理笔记

电磁炉加热原理【电磁炉工作原理，电涡流感应加热原理】 https://www.bilibili.com/video/BV11M411M7Wt/?share_sourcecopy_web&vd_source44c5c5fe44538189ece80f09460cf625 我是看的这个科普视频； 总结一下就是下图： 线圈的磁场影响…

阅读更多...

Spring Boot JNA 实现调用 DLL文件（清晰明了）

Spring Boot JNA 实现调用 DLL文件（清晰明了）

概述项目需要用到重采样算法，JAVA 没有现成的，只能通过 JNA 调用 C 的 DLL 实现，JNA中，它提供了一个动态的C语言编写的转发器，可以自动实现Java和C的数据类型映射。不再需要编写C动态链接库。实现需求根据一个…

阅读更多...

rc_visard 3D Stereo Senso

rc_visard 3D Stereo Senso

1 简介 rc_visard 3D立体视觉传感器支持的接口标准 GenICam Generic Interface for CamerasGigE Gigabit Ethernet 词汇表 SGM semi-global matching 半全局匹配 SLAM Simultaneous Localization and Mapping 即时定位与地图构建 2 安全 3 硬件规格坐标系 rc_visar…

阅读更多...

【云计算】云数据中心网络（三）：NAT 网关

【云计算】云数据中心网络（三）：NAT 网关

《云网络》系列，共包含以下文章： 云网络是未来的网络基础设施云网络产品体系概述云数据中心网络（一）：VPC云数据中心网络（二）：弹性公网 IP云数据中心网络（三）…

阅读更多...

MATLAB实现蚁群算法优化柔性车间调度(ACO-fjsp)

MATLAB实现蚁群算法优化柔性车间调度(ACO-fjsp)

蚁群算法优化车间调度的步骤可以分为以下几个主要阶段： 1.初始化阶段： 设置算法参数，如信息素浓度、启发式因子等。这些参数将影响蚂蚁在选择路径时的决策过程。确定车间调度的具体问题规模，包括工件数量、机器数量以及每个工件…

阅读更多...

k8s:通过nodeSelector将pod调度到含有指定标签的结点上

k8s:通过nodeSelector将pod调度到含有指定标签的结点上

一、查看node,并给node打标签二、在资源清单文件中配置nodeSelector来指定要往满足哪个标签条件的结点进行调度 apiVersion: v1 kind: Pod metadata:name: probe-tcp spec:containers:- name: nginximage: nginxlivenessProbe:initialDelaySeconds: 5timeoutSeconds: 5tcpSo…

阅读更多...

【基于Netty实现聊天室聊天业务学习】第4节.什么是BIO与NIO

【基于Netty实现聊天室聊天业务学习】第4节.什么是BIO与NIO

IO在读写的时候是阻塞的，无法做其他操作，并发处理能力的非常低，线程之间访问资源通信时候也是非常耗时久，依赖我们的网速，带宽。我们看一下他的白话原理我们来看一下这张图那么这张图的话它里面有一个server还有三个…

阅读更多...

基于SSM的学校在线考试系统的设计与实现

基于SSM的学校在线考试系统的设计与实现

功能需求管理员模块管理员模块是整个学校在线考试系统中最为重要的管理者，能够对网站内的各种信息进行管理，能够对教师、学生的个人资料进行管理，对于已经离校的学生将其剔除考试名单，将新入校的学生纳入到考试名单中。对于入…

阅读更多...

【Taro3踩坑日记】找不到sass的类型定义文件

【Taro3踩坑日记】找不到sass的类型定义文件

问题截图如下：找不到sass的类型定义文件解决办法： 1、npm i types/sass1.43.1 2、然后配置 TypeScript 编译选项：确保 TypeScript 编译器能够识别 Sass 文件，并正确处理它们。

阅读更多...

什么是IoT？

什么是IoT？

什么是IoT？ IoT，即物联网（Internet of Things），是通过信息传感设备和互联网将各种物品连接起来，实现智能化的识别、定位、跟踪、监控和管理的网络系统。以下是关于IOT的一些详细解释： 基本概…

阅读更多...

Linux驱动开发笔记（零）驱动基础知识及准备

Linux驱动开发笔记（零）驱动基础知识及准备

文章目录前言一、Liunx、MCU和FPGA编程的区别二、Linux内核模块1. 什么是内核模块2. 内核模块的代码架构3. 头文件4. 模块参数5. makefile说明三、驱动程序设计思路1. 基本步骤2. 设备号3. 数据结构3.1 file_operations3.2 file3.3 inode3.4 哈希表3.5 cdev结构体3.6 kobj_m…

阅读更多...

SpringMVC核心流程解析

SpringMVC核心流程解析

SpringMVC核心流程解析 DispatcherServlet的继承关系请求流程分析获取HandlerChain(ControllrtMethod拦截器)获取HandlerAdapter handlerMappings的初始化过程 DispatcherServlet的继承关系 DispatcherServlet本质是一个servlet，既然是servlet，一个请求…

阅读更多...

缓存的使用及常见问题的解决方案

缓存的使用及常见问题的解决方案

用户通过浏览器向我们发送请求，这个时候浏览器就会建立一个缓存，主要缓存一些静态资源（js、css、图片），这样做可以降低之后访问的网络延迟。然后我们可以在Tomcat里面添加一些应用缓存，将一些从数据库查询到…

阅读更多...

推荐文章

最新文章