这是我见过最棒的大模型干货！！！

这是我见过最棒的大模型干货！！！

news2025/7/6 1:08:42

大模型技术的发展和迭代2024年已经可以按天来计算了，几乎每天都有新的大模型和技术登场。

从基座模型Mamba2，Jamaba，到Dora，LoftQ，GaLore等最新的微调技术；KTO，IPO，SimPO等微调技术；再到GPTQ，SmoothQuant，AWQ，GGUF等量化技术。大模型全链路的技术的迭代日新月异。

节前，我们组织了一场算法岗技术&面试讨论会，邀请了一些互联网大厂朋友、今年参加社招和校招面试的同学。

针对大模型技术趋势、算法项目落地经验分享、新手如何入门算法岗、该如何准备面试攻略、面试常考点等热门话题进行了深入的讨论。

总结链接如下：

《大模型面试宝典》(2024版) 发布！

《AIGC 面试宝典》圈粉无数！

喜欢本文记得收藏、关注、点赞。更多实战和面试交流，也欢迎与我们交流

详细内容

在这里插入图片描述

模块一：基座模型

1、Transformer架构与机制

多头自注意力机制：Query, Key, Value机制
Multi-query attention
位置编码技术
层归一化与残差连接
案例：剖析LLama3模型结构

2、大模型训练与优化

预训练、微调与对齐过程
SFT与LoRA微调
对齐与DPO
处理长距离依赖
处理更长的上下文
梯度下降变体

3、Mamba介绍

Transformer与Seq2Seq各自有缺点
Differential Equation基础
选择性状态空间模型（SSMs）
Discretization, Recurrent计算
The HIPPO矩阵
基于Pytorch实现一个基本的Mamba块

4、Mamba核心组建与优化

局部卷积宽度及其重要性
Selective Scan
整体模型架构
Mamba的优化策略
与Transformer优化的比较分析

5、Mamba2

Mamba与Mamba2的区别
Mamba2中的高级SSMs
结构状态空间对偶性
SSMs和Transformers之间的等价性
块分解技术
面向硬件的实现
高效投影和归一化
实践：在Mamba2中实现高维SSMs

6、Mamba的应用

文本生成与文本摘要生成
机器翻译与情感分析
基于Mamba构造大模型
基于Mamba构造多模态大模型
医疗、金融领域的应用

7、Jamba模型

混合架构设计基础
SSMs与Transformer注意机制的集成
结合Mamba和Transformer方法的优点
Jamba模型剖析
多模态注意力和状态空间集成
跨模态嵌入对齐

8、KANs

KANs vs MLPs
Kolmogorov-Arnold representation theorem
基础架构
Convolutional KANs (CKANs)
训练KANs
实践：从零实现KANs

模块二：指令微调技术

9、LoRA微调技术

必要的数学知识 - 低秩分解
LoRA的核心原理
LoRA中的各类参数设置
优化并获得LoRA参数
LoRA源码解读
基于开源模型实现LoRA微调

10、DoRA微调技术

从LoRA到DoRA
DoRA解决的核心问题
权重分解的低秩适应
DoRA的梯度分析
DoRA的源码分析
基于开源模型实现DoRA微调

11、LoftQ微调技术

量化技术基础
不同的量化技术
传统方法与基于LoRA的量化
LoftQ算法的详细介绍
背后的理论分析

12、GaLore微调技术

Weight Gradient的low rank特性
GaLore模型详解
低秩子空间的组成
内存高效优化
超参数的调整
背后的一些理论分析

13、Mixture of LoRAs

Routing策略设计
MoA架构设计
模型的详解
模型源码分析
基于开源模型实现模型微调

模块三：对齐技术

14、DPO对齐技术

偏好优化基础
Bradley-Terry model
推导DPO的目标
详解DPO的训练
DPO背后的理论分析
基于开源模型实现DPO对齐

15、KTO对齐技术

HALOs介绍
KTO的推导过程
KL的估计
理解超参数
KTO与DPO

16、IPO对齐技术

序列似然校准
算法详解
online IPO
背后的理论分析
基于开源模型实现IPO对齐

17、SimPO对齐技术

DPO与SimPO主要区别
推导SimPO的目标
SimPO的参数设置
SimPO源码分析
对齐技术的未来发展

模块四：模型量化技术

18、GPTQ量化技术

量化技术基础
OBQ介绍
GPTQ算法详解
背后理论分析
基于LLama大模型进行GPTQ量化

19、SmoothQuant量化技术

数据分布对量化的影响
SmoothQuant核心思想
SmoothQuant算法详解
算法源码分析
基于LLama大模型进行SmoothQuant量化

20、AWQ量化技术

AWQ核心思想
分析量化导致的误差
选取最有价值的1%权重
AWQ算法详解
基于LLama大模型进行AWQ量化

21、GGUF量化技术

从GPU到CPU使用
GGUF核心思想
GGUF算法详解
基于LLama大模型+GGUF

模块五：多模态技术

22、MoE-LLaVA

视觉大模型基础
训练多模态大模型的Scaling挑战
Hard Routers和Soft Routers
MoE总体结构
MoE三阶段训练
模型源码解读
微调一个MoE-LLaVA模型

23、Mini-Gemini

模型背后核心思想
Dual Vision Encoders
Patch Info Mining
模型详解
模型源码解读

24、VideoLLaMA2

模型背后核心思想
模型总体结构
模型算法解析
多任务微调
微调一个VideoLLaMA2模型

模块六：图与大模型

25、图与大模型基础

图、知识图谱基础
图和大模型结合三种常见方法
利用图来增强大模型推理
利用大模型来增强图模型
两者的直接结合
大模型对图的推理

26、推荐系统与大模型

推荐系统设计
推荐系统中使用大模型
Prompt的设计
微调推荐大模型思路
微调一个推荐领域大模型

27、GraphGPT: Graph的指令微调

Graph的推理能力分析
图结构的编码
Self- supervised微调
基于任务的微调
CoT蒸馏
GraphGPT的应用场景

28、知识图谱与LLM的结合

知识图谱背景介绍
知识图谱与LLM结合的几种方式
训练能够理解知识图谱的LLM基座模型
知识图谱与LLM对推荐系统的价值

模块七：具身智能

29、具身AI简介

历史背景和关键里程碑
应用和未来趋势
具身智能和大模型的结合
具AI的理论
具身AI的认知架构

30、大型语言模型、感知器

LLM在具身AI中的角色
将LLM与具身系统集成的技术
具身AI中的自然语言理解和生成
机器人学简介和机器人类型
传感器技术和数据采集
执行器和控制系统
案例：使用LLM的机器人系统

31、具身AI系统设计

具身AI的设计原则
人机交互（HRI）
多模态界面
具身AI中的强化学习
实时决策

32、评估与测试

评估具身AI系统的指标
性能测试和基准测试
用户研究和反馈收集
迭代设计和改进

用通俗易懂的方式讲解系列

重磅来袭！《大模型面试宝典》(2024版) 发布！
重磅来袭！《大模型实战宝典》(2024版) 发布！
用通俗易懂的方式讲解：不用再找了，这是大模型最全的面试题库
用通俗易懂的方式讲解：这是我见过的最适合大模型小白的 PyTorch 中文课程
用通俗易懂的方式讲解：一文讲透最热的大模型开发框架 LangChain
用通俗易懂的方式讲解：基于 LangChain + ChatGLM搭建知识本地库
用通俗易懂的方式讲解：基于大模型的知识问答系统全面总结
用通俗易懂的方式讲解：ChatGLM3 基础模型多轮对话微调
用通俗易懂的方式讲解：最火的大模型训练框架 DeepSpeed 详解来了
用通俗易懂的方式讲解：这应该是最全的大模型训练与微调关键技术梳理
用通俗易懂的方式讲解：Stable Diffusion 微调及推理优化实践指南
用通俗易懂的方式讲解：大模型训练过程概述
用通俗易懂的方式讲解：专补大模型短板的RAG
用通俗易懂的方式讲解：大模型LLM Agent在 Text2SQL 应用上的实践
用通俗易懂的方式讲解：大模型 LLM RAG在 Text2SQL 上的应用实践
用通俗易懂的方式讲解：大模型微调方法总结
用通俗易懂的方式讲解：涨知识了，这篇大模型 LangChain 框架与使用示例太棒了
用通俗易懂的方式讲解：掌握大模型这些优化技术，优雅地进行大模型的训练和推理！
用通俗易懂的方式讲解：九大最热门的开源大模型 Agent 框架来了

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1923442.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

STM32实战篇：按键（外部输入信号）触发中断

STM32实战篇：按键（外部输入信号）触发中断

功能要求将两个按键分别与引脚PA0、PA1相连接，通过按键按下，能够触发中断响应程序（不需明确功能）。代码流程如下： 实现代码 #include "stm32f10x.h" // Device headerint main() {//开…

阅读更多...

ZGC的流程图

ZGC的流程图

GC标记过程 1、初始标记扫描所有线程栈的根节点，然后再扫描根节点直接引用的对象并进行标记。这个阶段需要停顿所有的应用线程（STW），但由于只扫描根对象直接引用的对象，所以停顿时间很短。停顿时间高度依赖根节点的数…

阅读更多...

鸿蒙HarmonyOS应用开发为何选择ArkTS不是Java？

鸿蒙HarmonyOS应用开发为何选择ArkTS不是Java？

前言随着智能设备的快速发展，操作系统的需求也变得越来越多样化。为了满足不同设备的需求，华为推出了鸿蒙HarmonyOS。与传统的操作系统不同，HarmonyOS采用了一种新的开发语言——ArkTS。但是，刚推出鸿蒙系统的时候&#xff0…

阅读更多...

uni-app 保存号码到通讯录

uni-app 保存号码到通讯录

1、添加模块 2、添加权限 3、添加策略 Android： "permissionExternalStorage" : {"request" : "none","prompt" : "应用保存运行状态等信息，需要获取读写手机存储（系统提示为访问设备上的照片…

阅读更多...

Prometheus + alermanager + webhook-dingtalk 告警

Prometheus + alermanager + webhook-dingtalk 告警

添加钉钉机器人 1. 部署 alermanager 1.1 下载软件包 wget https://github.com/prometheus/alertmanager/releases/download/v0.26.0/alertmanager-0.26.0.linux-amd64.tar.gz 网址 ：Releases prometheus/alertmanager (github.com) 1.2 解压软件包 mkdir -pv …

阅读更多...

用 Kotlin 编写四则运算计算器：从零开始的简单教程

用 Kotlin 编写四则运算计算器：从零开始的简单教程

人不走空 🌈个人主页：人不走空 💖系列专栏：算法专题 ⏰诗词歌赋：斯是陋室，惟吾德馨目录 🌈个人主页：人不走空 💖系列专栏：算法专题 ⏰诗词歌…

阅读更多...

电－气阀门定位器YT-1000系列产品说明

电－气阀门定位器YT-1000系列产品说明

电－气阀门定位器YT-1000系列使用注意事项 • 搬运安装或使用中对产品过大的震动或撞击会成为产品故障的原因。 • 超过规定参数范围使用也会成为产品故陷的原因。 • 不使用的气路接口要用堵塞堵住。 • 不使用产品而长时间放悝在室外时，要盖上产品外壳以免雨水进入产品…

阅读更多...

八款主流电脑监控软件推荐|2024年最佳电脑监控软件排行榜

八款主流电脑监控软件推荐|2024年最佳电脑监控软件排行榜

在现代社会中，电脑监控软件已经成为企业和家庭不可或缺的工具。无论是为了确保员工的工作效率，还是保护孩子在互联网上的安全，这些软件都能提供有力的支持。本文将为大家介绍2024年最受欢迎的八款电脑监控软件。 1. 固信软件固信软件是一款综…

阅读更多...

服务重启时容器未自动启动

服务重启时容器未自动启动

1、容器重启策略通过设置容器的重启策略，‌可以决定在容器退出时Docker守护进程是否重启该容器。‌常见的重启策略包括：‌ no：‌不重启容器，‌默认策略。‌always：‌无论容器是如何退出的，‌总是重启容器…

阅读更多...

2024年公共文化与社会服务国际会议（ICPCSS 2024）

2024年公共文化与社会服务国际会议（ICPCSS 2024）

2024年公共文化与社会服务国际会议 2024 International Conference on Public Culture and Social Services 【1】会议简介 2024年公共文化与社会服务国际会议是一个集学术性、实践性和国际性于一体的盛会。我们期待与您共同探讨公共文化与社会服务的未来发展方向，为…

阅读更多...

【公益案例展】华为云X《无尽攀登》——攀登不停，向上而行

【公益案例展】华为云X《无尽攀登》——攀登不停，向上而行

‍ 华为云公益案例本项目案例由华为云投递并参与数据猿与上海大数据联盟联合推出的 #榜样的力量# 《2024中国数据智能产业最具社会责任感企业》榜单/奖项”评选。大数据产业创新服务媒体 ——聚焦数据改变商业夏伯渝，中国无腿登珠峰第一人，一生43年…

阅读更多...

基于GIS矿产勘查靶区优选技术

基于GIS矿产勘查靶区优选技术

定义： 找矿远景区(ore-finding prospect)： 一般将中小比例尺（小于等于1：10万）成矿预测所圈定的找矿有利地段（preferable ore-finding area）成为找矿远景区找矿靶区（ore-finding t…

阅读更多...

IPD流程学习笔记

IPD流程学习笔记

一、前言互联网行业讲究的是快速试错，所以IPD流程的应用并不多，但是传统企业数字化转型中，怎么确保项目投入可以切合市场需求，有较好的ROI及落地性，轻量级的IPD还是很有必要了解下的，特别是重资产类的业务…

阅读更多...

LAMP万字详解（概念、构建步骤）

LAMP万字详解（概念、构建步骤）

目录 LAMP Apache 起源主要特点软件版本编译安装httpd服务器编译安装的优点操作步骤准备工作编译安装优化执行路径添加服务守护进程配置httpd 查看 Web 站点的访问情况虚拟主机类型部署基于域名的虚拟主机为虚拟主机提供域名解析&#xff…

阅读更多...

原料药合成偶联反应中钯残留去除

原料药合成偶联反应中钯残留去除

摘要：海普开发的HP214 是一种具有螯合硫脲基团的大孔树脂，专为选择性去除汞、铂族贵金属、金和银而设计。同时还特别适用于从有机工艺流程中回收钯催化剂。 #原料药合成偶联反应中钯残留去除在有机合成中，以过渡金属络合物催化进行高选择性…

阅读更多...

博士论文 | 神经网络的结构与表示 147页

博士论文 | 神经网络的结构与表示 147页

由于神经网络在人工智能领域占据主导地位，一个试图了解其内部工作原理的研究分支领域应运而生。这个子领域的一个标准方法是将神经网络主要理解为代表人类可理解的特征。另一种探索较少的可能性是将它们理解为多步骤的计算机程序。这样做的一个先决条件似乎是某种形…

阅读更多...

中霖教育：税务师和中级会计师哪个难?

中霖教育：税务师和中级会计师哪个难?

税务师和中级会计师是财会专业的两个比较常见的证书，二者之间哪个更难? 税务师考试包含五个不同的科目：包括《税法一》、《税法二》、《涉税服务实务》、《涉税服务相关法律》以及《财务与会计》，考生在连续五个年度内通过即可。中级会计…

阅读更多...

【人工智能】-- 迁移学习

【人工智能】-- 迁移学习

个人主页：欢迎来到 Papicatch的博客课设专栏 ：学生成绩管理系统专业知识专栏： 专业知识文章目录 🍉引言 🍉迁移学习 🍈基本概念 🍍定义 🍌归纳迁移学习（Induct…

阅读更多...

[IDEA插件] JarEditor 编辑jar包（直接新增、修改、删除jar包内的class文件）

[IDEA插件] JarEditor 编辑jar包（直接新增、修改、删除jar包内的class文件）

文章目录 1. 安装插件 JarEditor2. 在IDEA中添加外部JAR包3. JarEditor 使用介绍之前我们需要修改jar内文件的时候需要解压jar包，反编译class，新建java源文件，修改代码，再编译成class，替换jar包内的class文件。现在…

阅读更多...

亚马逊IP关联是什么？要怎么解决呢？

亚马逊IP关联是什么？要怎么解决呢？

亚马逊不仅提供了广泛的商品和服务，也是许多企业和个人选择的电子商务平台。然而，与亚马逊相关的IP关联问题，特别是在网络安全和运营管理方面，经常成为使用亚马逊服务的用户和商家关注的焦点。通过了解亚马逊IP关联的含义、可能的…

阅读更多...

推荐文章

最新文章