这是我见过最棒的大模型干货!!!

news2024/9/20 14:13:11

大模型技术的发展和迭代2024年已经可以按天来计算了,几乎每天都有新的大模型和技术登场。

从基座模型Mamba2Jamaba,到DoraLoftQGaLore等最新的微调技术;KTOIPOSimPO等微调技术;再到GPTQSmoothQuantAWQGGUF等量化技术。大模型全链路的技术的迭代日新月异。

节前,我们组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、今年参加社招和校招面试的同学。

针对大模型技术趋势、算法项目落地经验分享、新手如何入门算法岗、该如何准备面试攻略、面试常考点等热门话题进行了深入的讨论。

总结链接如下:

《大模型面试宝典》(2024版) 发布!

《AIGC 面试宝典》圈粉无数!

喜欢本文记得收藏、关注、点赞。更多实战和面试交流,也欢迎与我们交流


详细内容

在这里插入图片描述

模块一:基座模型

1、Transformer架构与机制

  • 多头自注意力机制:Query, Key, Value机制

  • Multi-query attention

  • 位置编码技术

  • 层归一化与残差连接

  • 案例:剖析LLama3模型结构

2、大模型训练与优化

  • 预训练、微调与对齐过程

  • SFT与LoRA微调

  • 对齐与DPO

  • 处理长距离依赖

  • 处理更长的上下文

  • 梯度下降变体

3、Mamba介绍

  • Transformer与Seq2Seq各自有缺点

  • Differential Equation基础

  • 选择性状态空间模型(SSMs)

  • Discretization, Recurrent计算

  • The HIPPO矩阵

  • 基于Pytorch实现一个基本的Mamba块

4、Mamba核心组建与优化

  • 局部卷积宽度及其重要性

  • Selective Scan

  • 整体模型架构

  • Mamba的优化策略

  • 与Transformer优化的比较分析

5、Mamba2

  • Mamba与Mamba2的区别

  • Mamba2中的高级SSMs

  • 结构状态空间对偶性

  • SSMs和Transformers之间的等价性

  • 块分解技术

  • 面向硬件的实现

  • 高效投影和归一化

  • 实践:在Mamba2中实现高维SSMs

6、Mamba的应用

  • 文本生成与文本摘要生成

  • 机器翻译与情感分析

  • 基于Mamba构造大模型

  • 基于Mamba构造多模态大模型

  • 医疗、金融领域的应用

7、Jamba模型

  • 混合架构设计基础

  • SSMs与Transformer注意机制的集成

  • 结合Mamba和Transformer方法的优点

  • Jamba模型剖析

  • 多模态注意力和状态空间集成

  • 跨模态嵌入对齐

8、KANs

  • KANs vs MLPs

  • Kolmogorov-Arnold representation theorem

  • 基础架构

  • Convolutional KANs (CKANs)

  • 训练KANs

  • 实践:从零实现KANs

模块二:指令微调技术

9、LoRA微调技术

  • 必要的数学知识 - 低秩分解

  • LoRA的核心原理

  • LoRA中的各类参数设置

  • 优化并获得LoRA参数

  • LoRA源码解读

  • 基于开源模型实现LoRA微调

10、DoRA微调技术

  • 从LoRA到DoRA

  • DoRA解决的核心问题

  • 权重分解的低秩适应

  • DoRA的梯度分析

  • DoRA的源码分析

  • 基于开源模型实现DoRA微调

11、LoftQ微调技术

  • 量化技术基础

  • 不同的量化技术

  • 传统方法与基于LoRA的量化

  • LoftQ算法的详细介绍

  • 背后的理论分析

12、GaLore微调技术

  • Weight Gradient的low rank特性

  • GaLore模型详解

  • 低秩子空间的组成

  • 内存高效优化

  • 超参数的调整

  • 背后的一些理论分析

13、Mixture of LoRAs

  • Routing策略设计

  • MoA架构设计

  • 模型的详解

  • 模型源码分析

  • 基于开源模型实现模型微调

模块三:对齐技术

14、DPO对齐技术

  • 偏好优化基础

  • Bradley-Terry model

  • 推导DPO的目标

  • 详解DPO的训练

  • DPO背后的理论分析

  • 基于开源模型实现DPO对齐

15、KTO对齐技术

  • HALOs介绍

  • KTO的推导过程

  • KL的估计

  • 理解超参数

  • KTO与DPO

16、IPO对齐技术

  • 序列似然校准

  • 算法详解

  • online IPO

  • 背后的理论分析

  • 基于开源模型实现IPO对齐

17、SimPO对齐技术

  • DPO与SimPO主要区别

  • 推导SimPO的目标

  • SimPO的参数设置

  • SimPO源码分析

  • 对齐技术的未来发展

模块四:模型量化技术

18、GPTQ量化技术

  • 量化技术基础

  • OBQ介绍

  • GPTQ算法详解

  • 背后理论分析

  • 基于LLama大模型进行GPTQ量化

19、SmoothQuant量化技术

  • 数据分布对量化的影响

  • SmoothQuant核心思想

  • SmoothQuant算法详解

  • 算法源码分析

  • 基于LLama大模型进行SmoothQuant量化

20、AWQ量化技术

  • AWQ核心思想

  • 分析量化导致的误差

  • 选取最有价值的1%权重

  • AWQ算法详解

  • 基于LLama大模型进行AWQ量化

21、GGUF量化技术

  • 从GPU到CPU使用

  • GGUF核心思想

  • GGUF算法详解

  • 基于LLama大模型+GGUF

模块五:多模态技术

22、MoE-LLaVA

  • 视觉大模型基础

  • 训练多模态大模型的Scaling挑战

  • Hard Routers和Soft Routers

  • MoE总体结构

  • MoE三阶段训练

  • 模型源码解读

  • 微调一个MoE-LLaVA模型

23、Mini-Gemini

  • 模型背后核心思想

  • Dual Vision Encoders

  • Patch Info Mining

  • 模型详解

  • 模型源码解读

24、VideoLLaMA2

  • 模型背后核心思想

  • 模型总体结构

  • 模型算法解析

  • 多任务微调

  • 微调一个VideoLLaMA2模型

模块六:图与大模型

25、图与大模型基础

  • 图、知识图谱基础

  • 图和大模型结合三种常见方法

  • 利用图来增强大模型推理

  • 利用大模型来增强图模型

  • 两者的直接结合

  • 大模型对图的推理

26、推荐系统与大模型

  • 推荐系统设计

  • 推荐系统中使用大模型

  • Prompt的设计

  • 微调推荐大模型思路

  • 微调一个推荐领域大模型

27、GraphGPT: Graph的指令微调

  • Graph的推理能力分析

  • 图结构的编码

  • Self- supervised微调

  • 基于任务的微调

  • CoT蒸馏

  • GraphGPT的应用场景

28、知识图谱与LLM的结合

  • 知识图谱背景介绍

  • 知识图谱与LLM结合的几种方式

  • 训练能够理解知识图谱的LLM基座模型

  • 知识图谱与LLM对推荐系统的价值

模块七:具身智能

29、具身AI简介

  • 历史背景和关键里程碑

  • 应用和未来趋势

  • 具身智能和大模型的结合

  • 具AI的理论

  • 具身AI的认知架构

30、大型语言模型、感知器

  • LLM在具身AI中的角色

  • 将LLM与具身系统集成的技术

  • 具身AI中的自然语言理解和生成

  • 机器人学简介和机器人类型

  • 传感器技术和数据采集

  • 执行器和控制系统

  • 案例:使用LLM的机器人系统

31、具身AI系统设计

  • 具身AI的设计原则

  • 人机交互(HRI)

  • 多模态界面

  • 具身AI中的强化学习

  • 实时决策

32、评估与测试

  • 评估具身AI系统的指标

  • 性能测试和基准测试

  • 用户研究和反馈收集

  • 迭代设计和改进

用通俗易懂的方式讲解系列

  • 重磅来袭!《大模型面试宝典》(2024版) 发布!

  • 重磅来袭!《大模型实战宝典》(2024版) 发布!

  • 用通俗易懂的方式讲解:不用再找了,这是大模型最全的面试题库

  • 用通俗易懂的方式讲解:这是我见过的最适合大模型小白的 PyTorch 中文课程

  • 用通俗易懂的方式讲解:一文讲透最热的大模型开发框架 LangChain

  • 用通俗易懂的方式讲解:基于 LangChain + ChatGLM搭建知识本地库

  • 用通俗易懂的方式讲解:基于大模型的知识问答系统全面总结

  • 用通俗易懂的方式讲解:ChatGLM3 基础模型多轮对话微调

  • 用通俗易懂的方式讲解:最火的大模型训练框架 DeepSpeed 详解来了

  • 用通俗易懂的方式讲解:这应该是最全的大模型训练与微调关键技术梳理

  • 用通俗易懂的方式讲解:Stable Diffusion 微调及推理优化实践指南

  • 用通俗易懂的方式讲解:大模型训练过程概述

  • 用通俗易懂的方式讲解:专补大模型短板的RAG

  • 用通俗易懂的方式讲解:大模型LLM Agent在 Text2SQL 应用上的实践

  • 用通俗易懂的方式讲解:大模型 LLM RAG在 Text2SQL 上的应用实践

  • 用通俗易懂的方式讲解:大模型微调方法总结

  • 用通俗易懂的方式讲解:涨知识了,这篇大模型 LangChain 框架与使用示例太棒了

  • 用通俗易懂的方式讲解:掌握大模型这些优化技术,优雅地进行大模型的训练和推理!

  • 用通俗易懂的方式讲解:九大最热门的开源大模型 Agent 框架来了

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1923442.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

STM32实战篇:按键(外部输入信号)触发中断

功能要求 将两个按键分别与引脚PA0、PA1相连接,通过按键按下,能够触发中断响应程序(不需明确功能)。 代码流程如下: 实现代码 #include "stm32f10x.h" // Device headerint main() {//开…

ZGC的流程图

GC标记过程 1、初始标记 扫描所有线程栈的根节点,然后再扫描根节点直接引用的对象并进行标记。这个阶段需要停顿所有的应用线程(STW),但由于只扫描根对象直接引用的对象,所以停顿时间很短。停顿时间高度依赖根节点的数…

鸿蒙HarmonyOS应用开发为何选择ArkTS不是Java?

前言 随着智能设备的快速发展,操作系统的需求也变得越来越多样化。为了满足不同设备的需求,华为推出了鸿蒙HarmonyOS。 与传统的操作系统不同,HarmonyOS采用了一种新的开发语言——ArkTS。 但是,刚推出鸿蒙系统的时候&#xff0…

uni-app 保存号码到通讯录

1、 添加模块 2、添加权限 3、添加策略 Android: "permissionExternalStorage" : {"request" : "none","prompt" : "应用保存运行状态等信息,需要获取读写手机存储(系统提示为访问设备上的照片…

Prometheus + alermanager + webhook-dingtalk 告警

添加钉钉机器人 1. 部署 alermanager 1.1 下载软件包 wget https://github.com/prometheus/alertmanager/releases/download/v0.26.0/alertmanager-0.26.0.linux-amd64.tar.gz 网址 :Releases prometheus/alertmanager (github.com) 1.2 解压软件包 mkdir -pv …

用 Kotlin 编写四则运算计算器:从零开始的简单教程

人不走空 🌈个人主页:人不走空 💖系列专栏:算法专题 ⏰诗词歌赋:斯是陋室,惟吾德馨 目录 🌈个人主页:人不走空 💖系列专栏:算法专题 ⏰诗词歌…

电-气阀门定位器YT-1000系列产品说明

电-气阀门定位器YT-1000系列 使用注意事项 • 搬运安装或使用中对产品过大的震动或撞击会成为产品故障的原因。 • 超过规定参数范围使用也会成为产品故陷的原因。 • 不使用的气路接口要用堵塞堵住。 • 不使用产品而长时间放悝在室外时,要盖上产品外壳以免雨水进入产品…

八款主流电脑监控软件推荐|2024年最佳电脑监控软件排行榜

在现代社会中,电脑监控软件已经成为企业和家庭不可或缺的工具。无论是为了确保员工的工作效率,还是保护孩子在互联网上的安全,这些软件都能提供有力的支持。本文将为大家介绍2024年最受欢迎的八款电脑监控软件。 1. 固信软件 固信软件是一款综…

服务重启时容器未自动启动

1、容器重启策略 通过设置容器的重启策略,‌可以决定在容器退出时Docker守护进程是否重启该容器。‌常见的重启策略包括:‌ no:‌不重启容器,‌默认策略。‌always:‌无论容器是如何退出的,‌总是重启容器…

2024年公共文化与社会服务国际会议(ICPCSS 2024)

2024年公共文化与社会服务国际会议 2024 International Conference on Public Culture and Social Services 【1】会议简介 2024年公共文化与社会服务国际会议是一个集学术性、实践性和国际性于一体的盛会。我们期待与您共同探讨公共文化与社会服务的未来发展方向,为…

【公益案例展】华为云X《无尽攀登》——攀登不停,向上而行

‍ 华为云公益案例 本项目案例由华为云投递并参与数据猿与上海大数据联盟联合推出的 #榜样的力量# 《2024中国数据智能产业最具社会责任感企业》榜单/奖项”评选。 大数据产业创新服务媒体 ——聚焦数据 改变商业 夏伯渝,中国无腿登珠峰第一人,一生43年…

基于GIS矿产勘查靶区优选技术

定义: 找矿远景区(ore-finding prospect): 一般将中小比例尺(小于等于1:10万)成矿预测所圈定的找矿有利地段(preferable ore-finding area)成为找矿远景区 找矿靶区(ore-finding t…

IPD流程学习笔记

一、前言 互联网行业讲究的是快速试错,所以IPD流程的应用并不多,但是传统企业数字化转型中,怎么确保项目投入可以切合市场需求,有较好的ROI及落地性,轻量级的IPD还是很有必要了解下的,特别是重资产类的业务…

LAMP万字详解(概念、构建步骤)

目录 LAMP Apache 起源 主要特点 软件版本 编译安装httpd服务器 编译安装的优点 操作步骤 准备工作 编译 安装 优化执行路径 添加服务 守护进程 配置httpd 查看 Web 站点的访问情况 虚拟主机 类型 部署基于域名的虚拟主机 为虚拟主机提供域名解析&#xff…

原料药合成偶联反应中钯残留去除

摘要:海普开发的HP214 是一种具有螯合硫脲基团的大孔树脂,专为选择性去除汞、铂族贵金属、金和银而设计。同时还特别适用于从有机工艺流程中回收钯催化剂。 #原料药合成偶联反应中钯残留去除 在有机合成中,以过渡金属络合物催化进行高选择性…

博士论文 | 神经网络的结构与表示 147页

由于神经网络在人工智能领域占据主导地位,一个试图了解其内部工作原理的研究分支领域应运而生。这个子领域的一个标准方法是将神经网络主要理解为代表人类可理解的特征。另一种探索较少的可能性是将它们理解为多步骤的计算机程序。这样做的一个先决条件似乎是某种形…

中霖教育:税务师和中级会计师哪个难?

税务师和中级会计师是财会专业的两个比较常见的证书,二者之间哪个更难? 税务师考试包含五个不同的科目:包括《税法一》、《税法二》、《涉税服务实务》、《涉税服务相关法律》以及《财务与会计》,考生在连续五个年度内通过即可。 中级会计…

【人工智能】-- 迁移学习

个人主页:欢迎来到 Papicatch的博客 课设专栏 :学生成绩管理系统 专业知识专栏: 专业知识 文章目录 🍉引言 🍉迁移学习 🍈基本概念 🍍定义 🍌归纳迁移学习(Induct…

[IDEA插件] JarEditor 编辑jar包(直接新增、修改、删除jar包内的class文件)

文章目录 1. 安装插件 JarEditor2. 在IDEA中添加外部JAR包3. JarEditor 使用介绍 之前我们需要修改jar内文件的时候需要解压jar包,反编译class,新建java源文件,修改代码,再编译成class,替换jar包内的class文件。 现在…

亚马逊IP关联是什么?要怎么解决呢?

亚马逊不仅提供了广泛的商品和服务,也是许多企业和个人选择的电子商务平台。然而,与亚马逊相关的IP关联问题,特别是在网络安全和运营管理方面,经常成为使用亚马逊服务的用户和商家关注的焦点。通过了解亚马逊IP关联的含义、可能的…