【每日算法】理论:大模型相关 刷题:队列的应用

news2025/1/10 10:17:48

上期文章

【每日算法】理论:多模态系列 刷题:栈的应用

文章目录

  • 上期文章
  • 一、上期问题
  • 二、本期理论问题
      • 1、GPT1,2,3的区别
      • 2、解决过拟合的方法
      • 3、LLM的生成原理
      • 4、对比LSTM,GRU,transformer
      • 5、zero-shot
      • 6、pre-norm和post-norm的区别?bert用的是哪一种?
  • 三、力扣刷题回顾-栈与队列
      • 239. 滑动窗口最大值
      • 347.前 K 个高频元素


一、上期问题

  • GPT
  • BLIP
  • Pix2Pix
  • 常见的激活函数及其优缺点
  • 残差模块如何缓解梯度消失
  • ViLT

二、本期理论问题

1、GPT1,2,3的区别

  • GPT1是GPT系列的第一个模型,提出了decoder-only架构和预训练-微调范式;
  • GPT2在GPT1的基础上,
    • 在扩展到下游任务时,会有 zero-shot 的设定,不需要再重新训练模型,因此训练好之后在任何任务上都能用。
    • 结构上:将后置层归一化(post-norm)改为前置层归一化(pre-norm);模型最后一个自注意力层之后,额外增加一个层归一化;去掉了fine-tuning 训练,只有无监督的 pre-training阶段。
  • GPT3在结构上和GPT-1 GPT-2的区别主要在于使用了稀疏的自注意力模块来减少计算复杂度,具体叫局部带状稀疏注意力locally banded sparse attention。

【论文精读】 GPT,GPT-2,GPT-3:大力出奇迹

2、解决过拟合的方法

过拟合是指模型在训练数据上表现非常好,但在未见过的新数据(测试数据)上表现较差。这种现象是由于模型在训练时过度拟合了训练数据的细节和噪声,导致在新数据上泛化能力较差。

  • 数据增强:通过对训练数据进行随机变换(例如旋转、翻转、平移等),增加数据的多样性,从而减少过拟合的可能性。
  • 正则化:添加正则化项(如L1正则化或L2正则化)到损失函数中,限制模型的参数大小,降低过拟合风险。
  • 提前停止(Early Stopping):在训练过程中,通过监控验证集的性能,当性能不再提升时,停止训练,防止过度拟合。
  • 使用更多数据:增加训练数据量可以降低过拟合风险,让模型更好地学习数据的真实分布。
  • 简化模型:减少模型的复杂度,如减少网络的层数、每层的神经元数量等。

3、LLM的生成原理

生成原理是基于条件概率的文本生成。在训练过程中,LLM学习了文本数据中的统计规律,包括单词之间的关联、句子结构、语法规则等。通过给定一个初始文本序列或部分文本序列,LLM可以利用学到的统计模型来计算下一个最有可能出现的词或字符,然后将其作为生成序列的一部分。这个过程不断迭代,每次根据前面生成的序列预测下一个最合适的词或字符,从而逐步生成出一段连贯的文本。

4、对比LSTM,GRU,transformer

  • LSTM旨在处理长期依赖关系时遇到RNN中的梯度消失问题。LSTM通过引入门控机制来控制信息的流动,有效地延长了梯度的传播路径,从而减轻了梯度消失的影响
  • GRU是LSTM的简化版,计算效率和内存占用相对改善很多,但是性能差异不大
  • transformer引入了自注意力机制,使encoder端后面的列也能看到前面的序列,同时也能够并行计算计算效率有大幅的提升

5、zero-shot

zero-shot是在训练集类别和测试集类别之间没有交集的情况下,通过借助类别的描述来建立训练集和测试集之间的联系,从而实现只利用训练集数据训练模型之后,模型就能对测试集的对象进行分类。zero-shot模型在做到下游任务时,既不需要下游任务的任何标注的信息,也不需要重新训练模型。

6、pre-norm和post-norm的区别?bert用的是哪一种?

Post-Norm和Pre-Norm是根据Normalization在结构中的位置进行划分的。同一设置之下,Pre Norm结构往往更容易训练,效果也更好,但是如果单独调,post norm的最终效果会更好。Post-Norm在残差之后做归一化,对参数正则化的效果更强,进而模型的收敛性也会更好;而Pre-Norm有一部分参数直接加在了后面,没有对这部分参数进行正则化,可以在反向时防止梯度爆炸或者梯度消失,使得训练更容易,大模型的训练难度大,因而使用Pre-Norm较多。

【论文精读】 GPT,GPT-2,GPT-3:大力出奇迹

三、力扣刷题回顾-栈与队列

上期涉及题目:

  • 20. 有效的括号
  • 1047. 删除字符串中的所有相邻重复项
  • 150. 逆波兰表达式求值

本期题目:

  • 239. 滑动窗口最大值
  • 347.前 K 个高频元素

239. 滑动窗口最大值:

  • 给定输入:一个整数数组nums,有一个大小为 k 的滑动窗口从数组的最左侧移动到数组的最右侧。你只可以看到在滑动窗口内的 k 个数字。
  • 要求输出:返回 滑动窗口中的最大值 。

347.前 K 个高频元素:

  • 给定输入:一个整数数组 nums 和一个整数 k
  • 要求输出:返回其中出现频率前 k 高的元素
  • 补充:可以按 任意顺序 返回答案。

对比分析:
239. 滑动窗口最大值347.前 K 个高频元素都是运用队列的题目。239. 滑动窗口最大值一题主要使用单调队列,而347.前 K 个高频元素主要使用优先级队列。


239. 滑动窗口最大值

核心思想:先自行创建一个单调队列,在将大小为k的滑动窗口中元素放进队列中时,如果元素比当前队列中元素值都大,那么就弹出前边的元素,确保当前队列的最外端的元素始终为窗口的最大值。

在这里插入图片描述

from collections import deque

class MyQueue:
    def __init__(self):
        self.queue = deque() #这里需要使用deque实现单调队列,直接使用list会超时
    
    #每次弹出的时候,比较当前要弹出的数值是否等于队列出口元素的数值,如果相等则弹出。
    #同时pop之前判断队列当前是否为空。
    def pop(self,value):
        if self.queue and value == self.queue[0]:
            self.queue.popleft() #list.pop()时间复杂度为O(n),这里需要使用collections.deque()

    #如果push的数值大于入口元素的数值,那么就将队列后端的数值弹出,直到push的数值小于等于队列入口元素的数值为止。
    #这样就保持了队列里的数值是单调从大到小的了。
    def push(self,value):
        while self.queue and value > self.queue[-1]:
            self.queue.pop()
        self.queue.append(value)

    #查询当前队列里的最大值 直接返回队列前端也就是front就可以了。
    def front(self):
        return self.queue[0]

class Solution:
    def maxSlidingWindow(self, nums: List[int], k: int) -> List[int]:
        queue = MyQueue()
        result = []
        for i in range(k): #先将前k个元素放进队列
            queue.push(nums[i])
        result.append(queue.front()) #result记录前k个元素的最大值
        for i in range(k,len(nums)): 
            queue.pop(nums[i-k]) #滑动窗口移除最前面元素
            queue.push(nums[i]) #滑动窗口前加入最后面的元素
            result.append(queue.front()) #记录对应的最大值
        return result

简略版本:

class Solution:
    def maxSlidingWindow(self, nums: List[int], k: int) -> List[int]:
        ans = []
        q = deque()  # 双端队列
        for i, x in enumerate(nums):
            # 1. 入
            while q and nums[q[-1]] <= x:
                q.pop()  # 维护 q 的单调性
            q.append(i)  # 入队
            # 2. 出
            if i - q[0] >= k:  # 队首已经离开窗口了
                q.popleft()
            # 3. 记录答案
            if i >= k - 1:
                # 由于队首到队尾单调递减,所以窗口最大值就是队首
                ans.append(nums[q[0]])
        return ans

347.前 K 个高频元素

核心思想:使用map来进行统计元素出现的频率,使用优先级队列对频率进行排序

class Solution:
    def topKFrequent(self, nums: List[int], k: int) -> List[int]:
        map_ = {} #nums[i]:对应出现的次数
        for i in range(len(nums)):
            map_[nums[i]] = map_.get(nums[i],0)+1
        
        #对频率排序
        #定义一个小顶堆,大小为k
        pri_que = [] #小顶堆

        #用固定大小为k的小顶堆,扫描所有频率的数值
        for key,freq in map_.items():
            heapq.heappush(pri_que,(freq,key))
            if len(pri_que) > k:
                heapq.heappop(pri_que)
        
        #找出前k个高频元素,因为小顶堆先弹出的是最小的,所以倒序来输出到数组
        result =[0]*k
        for i in range(k-1,-1,-1):
            result[i] = heapq.heappop(pri_que)[1]
        return result

参考:
代码随想录算法训练营第十一天|239. 滑动窗口最大值,347.前 K 个高频元素,总结

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1640382.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

vscode远程免密ssh原理与实操方法

什么是SSH SSH是一种加密协议&#xff0c;全称为Secure Shell&#xff0c;用于安全地远程登录到服务器或其他远程设备上执行命令或传输文件。它提供了一种安全的加密通信机制&#xff0c;使得远程登录和文件传输等操作不会被恶意攻击者窃取或篡改&#xff0c;确保了数据的保密…

扩展学习|本体研究进展

文献来源&#xff1a; 王向前,张宝隆,李慧宗.本体研究综述[J].情报杂志,2016,35(06):163-170. 一、本体的定义 本体概念被引入人工智能、知识工程等领域后被赋予了新的含义。然而不同的专家学者对本体的理解不同,所给出的定义也有所差异。 人工智能领域的学者Neches(1991)等人对…

eSIM Network搭建指南

有任何关于GSMA\IOT\eSIM\RSP\业务应用场景相关的问题&#xff0c;欢迎W: xiangcunge59 一起讨论, 共同进步 (加的时候请注明: 来自CSDN-iot).

doxygen 辅助阅读代码的神器

简介 Doxygen是一个文档生成工具&#xff0c;主要用于编写编程语言的软件文档。它最初是为C设计的&#xff0c;但后来增加了对C、C#、Java、Objective-C、Python、IDL&#xff08;在某些情况下还有PHP、C#和D&#xff09;的支持。Doxygen可以从一组带有文档注释的源代码文件中…

【数据结构】如何创建一棵红黑树(附动图讲解)

一、前言 二、红黑树的概念 三、红黑树的性质 四、红黑树节点的定义 五、红黑树的插入 5.1 节点的初始颜色 5.2 红黑树的调整 六、红黑树的验证 6.1 验证有序 6.2 验证红黑树性质 七、红黑树与AVL树的比较 一、前言 在前面AVL树的学习中&#xff0c;我们知道了如何…

golang 基础知识细节回顾

之前学习golang的速度过于快&#xff0c;部分内容有点囫囵吞枣的感觉&#xff0c;写gorm过程中有很多违反我常识的地方&#xff0c;我通过复习去修正了我之前认知错误和遗漏的地方。 itoa itoa自增的作用在编辑error code时候作用很大&#xff0c;之前编辑springboot的error c…

【Linux学习】(2)OS的简单了解|Linux的基本指令操作

前言 本文将先简单了解什么是操作系统&#xff0c;再讲解一些Linux的基本指令。 一、操作系统的简单了解 1、什么是操作系统&#xff08;Operating System&#xff0c;简称OS&#xff09;&#xff1f; OS是一款做软硬件管理的软件。软硬件的体系结构图&#xff1a; 硬件&…

探索高级聚类技术:使用LLM进行客户细分

在数据科学领域&#xff0c;客户细分是理解和分析客户群体的重要步骤。最近&#xff0c;我发现了一个名为“Clustering with LLM”的GitHub仓库&#xff0c;它由Damian Gil Gonzalez创建&#xff0c;专门针对这一领域提供了一些先进的聚类技术。在这篇文章中&#xff0c;我将概…

「 网络安全常用术语解读 」SBOM主流格式SWID详解

国际标准化组织&#xff08;ISO&#xff09;和国际电工委员会&#xff08;International Electrotechnical Commission&#xff0c;IEC&#xff09;发布了ISO/IEC 19770-2软件标识&#xff08;Software Identification&#xff0c;SWID&#xff09;标签标准&#xff0c;该标准定…

Qt模型视图代理之MVD(模型-视图-代理)概念的简单介绍

往期回顾 Qt绘图与图形视图之Graphics View坐标系的简单介绍-CSDN博客 Qt绘图与图形视图之基本图元绘制的简单介绍-CSDN博客 Qt绘图与图形视图之自定义图元实现拖拽、拉伸、旋转功能-CSDN博客 Qt模型视图代理之MVD(模型-视图-代理)概念的简单介绍 一、基本概念 Qt模型视图代理…

前端页面平滑过渡解决方案

一、问题产生 在使用图片作为页面背景时&#xff0c;无法使用transtion进行平滑过渡&#xff0c;直接切换背景又会降低使用体验。 二、解决方式 使用clip-path对背景图片裁剪配合transtion实现平滑过渡的效果 三、效果展示 网址&#xff1a;ljynet.com 四、实现方式 tem…

ICode国际青少年编程竞赛- Python-1级训练场-for循环练习

ICode国际青少年编程竞赛- Python-1级训练场-for循环练习 1、 for i in range(3):Dev.step(4)Dev.turnLeft()2、 for i in range(3):Dev.step(2)Dev.turnRight()Dev.step(2)Dev.turnLeft()3、 for i in range(3):Dev.step(2)Dev.turnRight()Dev.step(2)Dev.turnLeft()4、 for…

32.Docker认识

Docker介绍 Docker是一个快速交付应用&#xff0c;运行应用的技术。 1.可以将程序、依赖、运行环境一起打包为一个镜像&#xff0c;可以迁移到任意Linux操作系统。 2.运行时利用沙箱机制行程隔离容器&#xff0c;各个应用互不干扰。 3.启动、移除都可以通过一行命令完成&am…

算法学习系列(五十五):背包模型(三)

目录 引言一、潜水员二、背包问题求具体方案三、机器分配四、开心的今明五、金明的预算方案 引言 今天介绍的是背包模型&#xff0c;还是以题目的形式来介绍的。主要讲了背包问题求方案&#xff0c;就是由最优方案递推回去即可。还有就是一些比较经典的背包问题&#xff0c;其…

Spring Boot | Spring Security ( SpringBoot安全管理 )、Spring Security中 的 “自定义用户认证“

目录 : Spring Boot 安全管理 &#xff1a;一、Spring Security 介绍二、Spring Security 快速入门2.1 基础环境搭建 :① 创建Spring Boot 项目② 创建 html资源文件③ 编写Web控制层 2.2 开启安全管理效果测试 :④ 添加 spring-boot-starter-security 启动器⑤ 项目启动测试 三…

Windows server2016关闭ie增强

要关闭Windows Server 2016上的IE增强安全配置&#xff0c;请按照以下步骤操作&#xff1a; 打开“服务器管理器”。点击“本地服务器”。在服务器管理器中&#xff0c;找到“IE增强的安全配置”&#xff0c;点击旁边的“启用”&#xff0c;打开“Internet Explorer增强的安全配…

android init进程启动流程

Android系统完整的启动流程 android 系统架构图 init进程的启动流程 init进程启动服务的顺序 bool Service::Start() {// Starting a service removes it from the disabled or reset state and// immediately takes it out of the restarting state if it was in there.flags_…

【Leetcode每日一题】 动态规划 - 简单多状态 dp 问题 - 删除并获得点数(难度⭐⭐)(70)

1. 题目解析 题目链接&#xff1a;740. 删除并获得点数 这个问题的理解其实相当简单&#xff0c;只需看一下示例&#xff0c;基本就能明白其含义了。 2.算法原理 问题分析 本题是「打家劫舍」问题的变种&#xff0c;但核心逻辑依然保持一致。题目要求从给定的数组nums中选择…

【 书生·浦语大模型实战营】作业(七):大模型实战评测

【 书生浦语大模型实战营】作业&#xff08;七&#xff09;&#xff1a;大模型实战评测 &#x1f389;AI学习星球推荐&#xff1a; GoAI的学习社区 知识星球是一个致力于提供《机器学习 | 深度学习 | CV | NLP | 大模型 | 多模态 | AIGC 》各个最新AI方向综述、论文等成体系的学…

「2024年」前端开发常用工具函数总结 TypeScript

前言 在前端开发中&#xff0c;工具函数是提高代码复用率、保持代码整洁和增加开发效率的关键。使用 TypeScript 编写工具函数不仅可以帮助开发者捕捉到更多的类型错误&#xff0c;还可以提供更清晰的代码注释和更智能的代码补全。下面是一些在 TypeScript 中常用的前端开发工…