LLM资料大全：文本多模态大模型、垂直领域微调模型、STF数据集、训练微调部署框架、提示词工程等

LLM资料大全：文本多模态大模型、垂直领域微调模型、STF数据集、训练微调部署框架、提示词工程等

news2026/2/13 2:18:39

前言

自ChatGPT为代表的大语言模型（Large Language Model, LLM）出现以后，由于其惊人的类通用人工智能（AGI）的能力，掀起了新一轮[自然语言处理]领域的研究和应用的浪潮。尤其是以ChatGLM、LLaMA等平民玩家都能跑起来的较小规模的LLM开源之后，业界涌现了非常多基于LLM的二次微调或应用的案例。本项目旨在收集和梳理中文LLM相关的开源模型、应用、数据集及教程等资料，目前收录的资源已达100+个！

常见底座模型细节概览：

底座	包含模型	模型参数大小	训练token数	训练最大长度	是否可商用
ChatGLM	ChatGLM/2/3 Base&Chat	6B	1T/1.4	2K/32K	可商用
LLaMA	LLaMA/2/3 Base&Chat	7B/8B/13B/33B/70B	1T/2T	2k/4k	部分可商用
Baichuan	Baichuan/2 Base&Chat	7B/13B	1.2T/1.4T	4k	可商用
Qwen	Qwen/1.5 Base&Chat	7B/14B/72B/110B	2.2T/3T	8k/32k	可商用
BLOOM	BLOOM	1B/7B/176B-MT	1.5T	2k	可商用
Aquila	Aquila/2 Base/Chat	7B/34B		2k	可商用
InternLM	InternLM/2 Base/Chat/Code	7B/20B		200k	可商用
Mixtral	Base&Chat	8x7B		32k	可商用
Yi	Base&Chat	6B/9B/34B	3T	200k	可商用
DeepSeek	Base&Chat	1.3B/7B/33B/67B		4k	可商用
XVERSE	Base&Chat	7B/13B/65B/A4.2B	2.6T/3.2T	8k/16k/256k	可商用

一、大模型全套的学习路线

学习大型人工智能模型，如GPT-3、BERT或任何其他先进的神经网络模型，需要系统的方法和持续的努力。既然要系统的学习大模型，那么学习路线是必不可少的，下面的这份路线能帮助你快速梳理知识，形成自己的体系。

L1级别:AI大模型时代的华丽登场

L2级别：AI大模型API应用开发工程

L3级别：大模型应用架构进阶实践

L4级别：大模型微调与私有化部署

一般掌握到第四个级别，市场上大多数岗位都是可以胜任，但要还不是天花板，天花板级别要求更加严格，对于算法和实战是非常苛刻的。建议普通人掌握到L4级别即可。

以上的AI大模型学习路线，不知道为什么发出来就有点糊，高清版可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

二、640套AI大模型报告合集

这套包含640份报告的合集，涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。

三、大模型经典PDF籍

随着人工智能技术的飞速发展，AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型，如GPT-3、BERT、XLNet等，以其强大的语言理解和生成能力，正在改变我们对人工智能的认识。那以下这些PDF籍就是非常不错的学习资源。

四、AI大模型商业化落地方案

作为普通人，入局大模型时代需要持续学习和实践，不断提高自己的技能和认知水平，同时也需要有责任感和伦理意识，为人工智能的健康发展贡献力量。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1826487.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

Qwen-Agent：Qwen2加持，强大的多代理框架 - 函数调用、代码解释器以及 RAG！

Qwen-Agent：Qwen2加持，强大的多代理框架 - 函数调用、代码解释器以及 RAG！

✨点击这里✨：🚀原文链接：（更好排版、视频播放、社群交流、最新AI开源项目、AI工具分享都在这个公众号！） Qwen-Agent：Qwen2加持，强大的多代理框架 - 函数调用、代码解释器以及 RAG&…

阅读更多...

全局解决SpringBoot框架中的application.properties/yml注解中文乱码问题（一劳永逸）

全局解决SpringBoot框架中的application.properties/yml注解中文乱码问题（一劳永逸）

问题原因 Spring Boot在加载application.properties/yml配置文件时，默认使用ISO-8859-1编码。这种编码方式并不支持中文字符，因此当配置文件中包含中文字符时，就会出现乱码，现象如下： 问题解决本解决方法是全局设置…

阅读更多...

最快安装zabbix

最快安装zabbix

部署zabbix 6.x 建议使用红帽系统。 https://download.rockylinux.org/pub/rocky/8/isos/x86_64/Rocky-8.9-x86_64-minimal.iso1> 配置安装yum源 [rootzabbix ~]# yum install https://mirrors.huaweicloud.com/zabbix/zabbix/6.2/rhel/8/x86_64/zabbix-release-6.2-3.el8…

阅读更多...

PMS助力制造企业高效运营︱PMO大会

PMS助力制造企业高效运营︱PMO大会

全国PMO专业人士年度盛会北京易贝恩项目管理科技有限公司副总经理朱洪泽女士受邀为PMO评论主办的2024第十三届中国PMO大会演讲嘉宾，演讲议题为“PMS助力制造企业高效运营”。大会将于6月29-30日在北京举办，敬请关注！ 议题简要： …

阅读更多...

DeepDriving | CUDA编程-05：流和事件

DeepDriving | CUDA编程-05：流和事件

本文来源公众号“DeepDriving”，仅用于学术分享，侵权删，干货满满。原文链接：CUDA编程-05：流和事件 1 CUDA流在CUDA中有两个级别的并发：内核级并发和网格级并发。前面的文章DeepDriving | CUDA编程-04&…

阅读更多...

基于System-Verilog点亮LED灯

基于System-Verilog点亮LED灯

文章目录一、System-Verilog介绍1.1System-Verilog 二、简单的语法介绍2.1接口实例2.2全局声明和语句实例2.3时间单位和精度2.4用户定义的类型2.5 枚举类型三、流水灯参考一、System-Verilog介绍 1.1System-Verilog SystemVerilog是一种硬件描述和验证语言（HDV…

阅读更多...

数据分析必备：一步步教你如何用matplotlib做数据可视化（2）

数据分析必备：一步步教你如何用matplotlib做数据可视化（2）

1、Matplotlib Anaconda Anaconda是Python和R编程语言的免费开源发行版，用于大规模数据处理，预测分析和科学计算。该分发使包管理和部署变得简单容易。 Matplotlib和许多其他有用的(数据)科学工具构成了分发的一部分。包版本由包管理系统Conda管理。 …

阅读更多...

50【Aseprite 作图】模糊工具笔刷

50【Aseprite 作图】模糊工具笔刷

1 模糊工具 2 笔刷然后选中后 Ctrl B，就变成笔刷了可以按住shift ，像画一条线一样或者用矩形、圆形工具、油漆桶工具在上方可以选择笔刷的不同形式，如果是“图案与来源对齐”，就是来源不变，笔刷不会覆盖之前…

阅读更多...

Vue3【十五】标签的Ref属性

Vue3【十五】标签的Ref属性

Vue3【十五】标签的Ref属性标签的ref属性用于注册模板引用用在dom标签上，获取的是dom节点用在组件上，获取的是组件实例对象案例截图目录结构代码 app.vue <template><div class"app"><h1 ref"title2">你…

阅读更多...

uniapp开发微信小程序问题汇总

uniapp开发微信小程序问题汇总

1. 自定义校验规则validateFunction失效 2. 微信小程序不支持<Br>换行在 <text></text> 标签中使用\n(必须 text 标签，view 标签无效 ) 3. 微信小程序无法使用本地静态资源图片的解决方法 (1) 将图片上传到服务器，小程序访问该图片…

阅读更多...

sql优化之利用聚簇索引减少回表次数：limit 100000,10

sql优化之利用聚簇索引减少回表次数：limit 100000,10

1. 问题描述产品：我要对订单列表页做一个分页功能，每页10条数据，商家可以根据金额过滤订单技术：好的，我写一个sql实现分页，x表示偏移页数，自测limit 10,10耗时200ms： SELECT * …

阅读更多...

C# WPF入门学习主线篇（二十三）—— 控件模板（ControlTemplate）和数据模板（DataTemplate）

C# WPF入门学习主线篇（二十三）—— 控件模板（ControlTemplate）和数据模板（DataTemplate）

C# WPF入门学习主线篇（二十三）—— 控件模板（ControlTemplate）和数据模板（DataTemplate） 在WPF开发中，控件模板（ControlTemplate）和数据模板（DataTemplate&am…

阅读更多...

Opencv基本操作

Opencv基本操作

Opencv基本操作导入并使用opencv进行图像与视频的基本处理 opencv读取的格式是BGR import cv2 #opencv读取的格式是BGR import numpy import matplotlib.pyplot as plt %matplotlib inline图像读取通过cv2.imread()来加载指定位置的图像信息。 img cv2.imread(./res/ca…

阅读更多...

Tomcat基础详解

Tomcat基础详解

第一篇：Tomcat基础篇 lecture：邓澎波一、构建Tomcat源码环境工欲善其事必先利其器，为了学好Tomcat源码，我们需要先在本地构建一个Tomcat的运行环境。 1.源码环境下载源码有两种下载方式： 1.1 官网下载 https://…

阅读更多...

联想正式发布全栈算力基础设施新品，加速筑基AI 2.0时代

联想正式发布全栈算力基础设施新品，加速筑基AI 2.0时代

6月14日，以“异构智算稳定高效”为主题的联想算力基础设施新品发布会在北京成功举办。据「TMT星球」了解，在与会嘉宾和合作伙伴的见证下，联想正式发布率先搭载英特尔至强 6能效核处理器的联想问天WR5220 G5、联想ThinkSystem SR630 V4、联…

阅读更多...

Qt项目天气预报(2) - 重写事件函数

Qt项目天气预报(2) - 重写事件函数

鼠标右键实现退出界面知识点QMenu: QMenu 弹出对话框 --> 相对QMessageBox 更加轻量点 QMenu是Qt库中用于创建弹出式菜单的类，它通常出现在应用程序的顶部菜单栏、按钮的右键菜单或自定义上下文菜单中。以下是关于QMenu的详细介绍： 1. 类的基本特…

阅读更多...

apt和apt-get有什么区别?内含常用命令以及软件源配置

有时候我们上网找与Linux相关的资料的时候，经常会需要安装一些软件包，找到的一些文章会贴出命令我们直接去命令行里执行就能一键下载安装，然后这些命令中逃不开的就是apt和apt-get。那么apt和apt-get有什么区别呢？ 首先我们先了…

阅读更多...

力扣 SQL题目

力扣 SQL题目

185.部门工资前三高的所有员工公司的主管们感兴趣的是公司每个部门中谁赚的钱最多。一个部门的高收入者是指一个员工的工资在该部门的不同工资中排名前三。编写解决方案，找出每个部门中收入高的员工。以任意顺序返回结果表。返回结果格式如下所示。 …

阅读更多...

照明灯具哪个品牌好，一文详细带你了解照明灯具种类有哪些

照明灯具哪个品牌好，一文详细带你了解照明灯具种类有哪些

在孩子学习过程中，有一样物品的重要性不容忽视，那就是一盏提供舒适光源的照明灯具。那么照明灯具哪个品牌好？面对不断增加的学业负担，孩子们经常需要在夜晚借助台灯的光亮进行学习，这已经成为了家庭生活中普遍的情景。…

阅读更多...

LVS工作模式详解，NAT全方位剖析

LVS工作模式详解，NAT全方位剖析

请求到达： 当用户请求到达Director Server（负载均衡服务器）时，数据包会先到达内核空间的PREROUTING链。此时，数据包的源IP为CIP（Client IP），目标IP为VIP（Virtual IP&…

阅读更多...

推荐文章

最新文章