不同类型的 LLM 有什么区别

不同类型的 LLM 有什么区别

news2025/4/27 6:11:14

LLM 有不同类型的模型，例如 Base 和 Instruct，他们有什么区别呢，Base 模型是基于原始语料进行训练的模型，生成结果时会持续生成，直到达到最大长度。而指令模型是经过问答数据集进行训练的，回答是会根据上下文判断来终止对话。本文将使用红 Qwen 2.5 分别展示两种模型的效果：

Qwen/Qwen2.5-1.5B

Qwen 2.5 Base 模型，结果指出输出：

## 下载模型
model_id = "./qwen2.5"
from modelscope import snapshot_download
snapshot_download("Qwen/Qwen2.5-1.5B", local_dir="./qwen2.5")
## 加载模型
from modelscope import AutoModelForCausalLM
model = AutoModelForCausalLM.from_pretrained(model_id,  device_map="auto",  load_in_4bit=True)
## 加载Tokenizer
from modelscope import AutoTokenizer
tokenizer = AutoTokenizer.from_pretrained(model_id)
## 输入转 Token
sequence = ["In a hole in the ground there lived a hobbit."]
encoded_text = tokenizer(sequence, return_tensors="pt").to("cuda")
print(tokenizer(sequence))
## 输出Token
generate_id = model.generate(**encoded_text)
## Token 转文字
tokenizer.batch_decode(generate_id, skip_special_tokens=True)[0]

可以看到结果一直在输出
在这里插入图片描述

Qwen/Qwen2.5-1.5B-Instruct

只需要将模型名称修改一下，其他代码完全一致。可以看到回答简洁很多。
在这里插入图片描述

总结

Instruct 和 Base 模型的区别主要是训练数据的不同，Instruct 在 Base 的基础上做了更有针对性的对话训练，日常功能开发中，模型需要选用 Instruct 模型。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2203095.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

【AI大模型】关于ToB垂直领域大模型的一点探索和尝试

【AI大模型】关于ToB垂直领域大模型的一点探索和尝试

本文分享了物流技术团队在垂直领域大模型开发和部署过程中的技术细节、挑战解决策略以及实际应用案例。 ‍ 背景大家好，我们是淘天物流技术团队，在过去一年多的实践工作中，我们团队围绕“物流体验”这一垂直领域，尝试通过垂直…

阅读更多...

大坝渗流监测设备——渗压计

大坝渗流监测设备——渗压计

渗压计是一种用于监测大坝等水工建筑物渗流压力的重要设备，其准确性和可靠性对于保障大坝安全运行至关重要。南京峟思将为大家详细介绍渗压计的工作原理、安装方法及其在大坝渗流监测中的应用。渗压计主要利用振弦频率的变化来测量渗透水压力。设备由透水部件、感应…

阅读更多...

使用UDP网络型灯光协议控制器控制DMX512步进电机

使用UDP网络型灯光协议控制器控制DMX512步进电机

目录 1、硬件介绍 （1）灯光控制器 （2）步进电机 （3）接线图 （4）多路步进电机DMX接线 2、调试软件测试 （1）软件界面 （2）控制器ip地…

阅读更多...

今夜无眠！Model 2来猎杀国产新能源了

今夜无眠！Model 2来猎杀国产新能源了

文 | AUTO芯球作者 | 雷慢 10月11日国内新能源车企注定会有一个不眠夜， 为什么啊，马斯克已经放出狠话了， 10月10日（美东时间）的发布会“将载入史册”， 别不信啊，据说这次会发布三款车&…

阅读更多...

AI测试入门：向量数据库知识图谱的适用场景

AI测试入门：向量数据库知识图谱的适用场景

AI测试入门：向量数据库 & 知识图谱的适用场景 1. 向量数据库概述2. 知识图谱概述3. 适用场景分析3.1 使用向量数据库的场景3.2 使用知识图谱的场景4. 案例分析4.1 搜索引擎中的应用4.2 医疗健康领域的应用4.3 社交媒体平台中的应用4.4 供应链管理中的应用总结1. 向量数据库…

阅读更多...

其他浏览器可以联网，但edge不能联网

其他浏览器可以联网，但edge不能联网

问题描述： 今早edge无法上网，检测网络连接正常，而且其他chrome，Firefox和360浏览器都可以上网。解决方案： 注意：为防止是代理问题，可以在扩展中禁用后再试试如果没有代理或者禁用代理也不…

阅读更多...

AIOps探索 | AI与人类协作：未来IT运维应急响应的新模式

AIOps探索 | AI与人类协作：未来IT运维应急响应的新模式

内容来源于--布博士（擎创科技产品解决方案专家） 在科技日新月异的今天，人工智能（AI）如同一场汹涌澎湃的浪潮，席卷着各个行业领域，IT 运维应急响应也正站在这一变革的风口浪尖。随着信息技术架构…

阅读更多...

为什么越来越多的男性开始光顾美容机构？美业管理系统/个案疗愈系统源码

为什么越来越多的男性开始光顾美容机构？美业管理系统/个案疗愈系统源码

近年来，我们可以清晰地观察到一个明显的趋势：越来越多的男性开始光顾医美美容机构。这种现象的出现并非偶然，而是由多种因素共同作用的结果。本文将结合社会观念的转变、媒体和广告的影响、职业发展压力、技术进步以及自我关注和健康意识的…

阅读更多...

$基于非线性干扰观测器的六自由度机械臂控制$

基于非线性干扰观测器的六自由度机械臂控制

1.观测器公式推导当存在扰动时，机械臂的动力学方程如下： 对上式进行恒等变化得： 设计干扰观测器： 令，则： 观测误差满足 ，取，因加速度不可测，定义辅助向量： …

阅读更多...

爬虫工具——Fidder的安装

爬虫工具——Fidder的安装

一、Fidder的安装出现这样的界面就是安装成功了二、Fiddler的配置 1.端监听手机端设置但是如果你想要对手机上的app进行抓包怎么办呢，那么你还需要进行以下操作： 首先你的Fiddler所在的电脑和手机必须处在同一个局域网内(即连着同一个路由器)。 …

阅读更多...

【MySQL 10】索引

【MySQL 10】索引

目录 1.初始索引 1.1索引概念 1.2常见索引分类 1.3 见一下索引（案例） 2.关于物理磁盘 2.1见一下物理磁盘 2.2 了解磁盘的存储结构 2.3对磁盘的逻辑结构进行抽象 4.磁盘随机访问与连续访问 5.MySQL表与磁盘 3. MySQL 与磁盘的交互 3.1MySQL 与…

阅读更多...

中国市场的NFT生存法则：消费属性与圈子文化

中国市场的NFT生存法则：消费属性与圈子文化

自2021年NFT数字藏品概念爆发以来，它迅速吸引了全球范围内的玩家、投资者以及艺术家和品牌的参与。然而，随着市场逐渐冷却，尤其是在中国市场，NFT的定位变得越来越微妙和复杂。在全球其他地区，NFT逐渐走向金融化&#x…

阅读更多...

开源2+1链动S2B2C商城小程序下社区团长的社群温度营造与商业价值实现

开源2+1链动S2B2C商城小程序下社区团长的社群温度营造与商业价值实现

摘要：本文聚焦于社区团长在社群运营中的角色，阐述在开源21链动S2B2C商城小程序的背景下，社区团长如何通过多种角色互动营造社群温度，进而实现商业价值中的复购增长等目标，分析其中的作用机制、面临的挑战及应对策略。 …

阅读更多...

数据结构-八大排序之基数排序

数据结构-八大排序之基数排序

基数排序（RadixSort） 1. 理论知识： 1.1 原理： 定义0-9 十个桶 (数组），先排序个位，再排序十位，排序百位... 1.2 例子： ①根据最大值确定需要执行多少遍（这里…

阅读更多...

Python编程：创意爱心表白代码集

Python编程：创意爱心表白代码集

在寻找一种特别的方式来表达你的爱意吗？使用Python编程，你可以创造出独一无二的爱心图案，为你的表白增添一份特别的浪漫。这里为你精选了六种不同风格的爱心表白代码，让你的创意和情感通过代码展现出来。话不多说，咱…

阅读更多...

太速科技-607-基于FMC的12收和12发的光纤子卡

太速科技-607-基于FMC的12收和12发的光纤子卡

基于FMC的12收和12发的光纤子卡一、板卡概述本卡是一个FPGA夹层卡（FMC）模块，可提供高达2个CXP模块接口，提供12路收，12路发的光纤通道。每个通道支持10Gbps,通过Aurora协议，可以组成X4&#xff0…

阅读更多...

【力扣刷题实战】（顺序表）删除有序数组中的重复项

【力扣刷题实战】（顺序表）删除有序数组中的重复项

大家好，我是小卡皮巴拉文章目录目录编辑力扣题目：删除有序数组中的重复项题目描述示例 1： 示例 2： 解题思路具体思路题目要点完整代码（C语言） 兄弟们共勉 ！！&a…

阅读更多...

树控件QTreeWidget

树控件QTreeWidget

树控件跟表格控件类似，也可以有多列，也可以只有1列，可以有多行，只不过每一行都是一个QTreeWidgetItem，每一行都是一个可以展开的树常用属性和方法显示和隐藏标题栏树控件只有水平标题栏 //获取和设置标题栏的显…

阅读更多...

为什么链表算法题如此亲睐虚拟节点..........

为什么链表算法题如此亲睐虚拟节点..........

欢迎来到破晓的历程的博客 ⛺️不负时光，不负己✈️ 引言相信大家在做算法题的时候，会经常用到虚拟节点这个技巧。但是却不明白它会给我们带来多大的便利，今天我们利用几道算法题来分析一下。如何使用？ 我们定义的链表结构…

阅读更多...

封装的线程池

封装的线程池

1.首先写一个队列来存，线程 queue.c #ifndef QUEUE_H #define QUEUE_H #include <stdbool.h> #include <stdlib.h> #include <stdio.h> typedef struct Queue {void **arr;int cap;int front;int rear; } Queue; //创建队列 Queue *create_queu…

阅读更多...

推荐文章

最新文章