【人工智能】如何选择合适的大语言模型,是能否提高工作效率的关键!!!

news2025/2/15 18:35:55

DeepSeek R1入门指南

  • 导读
  • 一、提示语差异
    • 1.1 指令侧重点不同
    • 1.2 语言风格差异
    • 1.3 知识运用引导不同
  • 二、挑选原则
    • 2.1 模型选择
    • 2.2 提示语设计
    • 2.3 避免误区
  • 结语

DeepSeek R1入门指南

导读

大家好,很高兴又和大家见面啦!!!

在前面的内容中,我们对 R1 做了一个细致的了解,作为一款具有强COT能力的大语言模型,它是否真正的适合我们的日常工作?

在当下这些众多的大语言模型中,我们应该如何选择一款适合自己的大语言模型,这就显得尤为重要了!!!

在今天的内容中,我们将会学习一下如何挑选一款甚至是多款适合自己的大语言模型,下面我们就直接进入正题吧!!!

一、提示语差异

在人工智能领域,推理模型和通用模型应用广泛,二者功能不同,提示语也存在显著差异。这些差异直接影响模型对输入信息的理解和处理,进而决定输出结果。

1.1 指令侧重点不同

推理模型

  • 重点在于引导逻辑推导与问题拆解。以 DeepSeek R1 为例,在处理数学证明题时,提示语会要求模型明确已知条件,依据相关定理和规则,逐步推导中间步骤,最终得出结论。比如 “已知三角形 ABC 中,AB = AC,角 A = 60°,证明三角形 ABC 是等边三角形,请详细阐述推理过程”。推理模型需将复杂问题细化,通过逻辑链条得出结果。

通用模型

  • 强调任务的宽泛定义与目标达成。以 GPT - 4 执行一般性写作任务为例,提示语可能是 “写一篇关于科技发展对生活影响的文章,字数在 800 字左右”。通用模型更关注整体任务的完成,对内容的主题、篇幅等提出要求,不侧重具体的逻辑推导过程。

1.2 语言风格差异

推理模型

  • 提示语语言严谨、精确,杜绝模糊表述。因为推理过程需要准确的逻辑指引,稍有模糊就可能导致推理错误。在法律推理任务中,提示语会明确指出法律条文的具体条款和案例细节,让模型依据精准信息进行判断。如 “根据《中华人民共和国民法典》第 577 条,分析此合同纠纷案例中被告的违约责任”。

通用模型

  • 提示语相对灵活、自由,能激发多样化的输出。在创意写作任务中,提示语可以是 “以环保为主题,创作一首富有想象力的诗歌”,鼓励模型自由发挥,生成具有创新性和独特性的内容。

1.3 知识运用引导不同

推理模型

  • 提示语引导模型综合运用多领域知识进行推理。在解决跨学科问题时,如分析城市交通拥堵对经济发展的影响,提示语会要求模型结合交通学、经济学、社会学等多方面知识,深入分析各因素之间的相互关系。如 “从交通流量、出行成本、商业活动等角度,分析交通拥堵如何影响城市经济发展”。

通用模型

  • 引导模型运用广泛的知识储备,但不强调特定的知识整合方式。在回答一般性常识问题时,如 “简述中国古代四大发明及其对世界的影响”,通用模型依据其庞大的知识体系直接作答,不需要像推理模型那样进行复杂的逻辑关联和推导。

二、挑选原则

2.1 模型选择

我们在选择使用的AI工具时,首先我们要做的就是选择AI工具的模型——推理模型与通用模型:

  • 优先根据任务类型而非模型热度选则
    • 像数学任务这种对需要严格逻辑链的任务选推理模型
    • 像诗歌创作这种自由度要求高的创意任务选通用模型

2.2 提示语设计

其次,不同的模型,我们在进行使用时,其提示语肯定也是有所区别的:

  • 推理模型:简洁指令,聚焦目标,信任其内化能力。
    • 推理模型的推理能力强,因此我们在使用推理模型时需要做到——要什么直接说
  • 通用模型:结构化、补偿性引导
    • 通用模型的推理能力弱,因此我们在使用通用模型时需要做到——缺什么补什么

2.3 避免误区

最后,不同的模型,我们在进行使用时,还应该避免出现不合适的方式:

  • 不要对推理模型使用“启发式”提示(如角色扮演),可能干扰其逻辑主线。
  • 不要对通用模型“过度信任”(如直接询问复杂推理问题,需分步验证结果)。

结语

在今天的内容中我们介绍了不同模型之间的提示语的差异:

  1. 指令侧重点不同
    • 推理模型:重点在于引导逻辑推导与问题拆解。
    • 通用模型:强调任务的宽泛定义与目标达成。
  2. 语言风格差异
    • 推理模型:提示语语言严谨、精确,杜绝模糊表述。
    • 通用模型:提示语相对灵活、自由,能激发多样化的输出。
  3. 知识运用引导不同
    • 推理模型:提示语引导模型综合运用多领域知识进行推理。
    • 通用模型:引导模型运用广泛的知识储备,但不强调特定的知识整合方式。

推理模型与通用模型的提示语在指令侧重点、语言风格和知识运用引导上各有特点。了解这些差异,有助于使用者根据具体需求,选择合适的模型,并通过精准的提示语,获得更理想的输出结果。

我们在挑选所使用的模型时,应该注意3点:

  1. 优先根据任务类型而非模型热度选则
    • 推理模型:应用于复杂度高,逻辑链强的任务
    • 通用模型:应用于自由度高,发散性强的任务
  2. 不同类型的模型使用不同风格的提示语
    • 推理模型:要什么说什么
    • 通用模型:缺什么补什么
  3. 避免对不同的模型使用不合适的方式
    • 推理模型:避免出现启发式的提示语
    • 通用模型:避免出现高逻辑链的提示语

今天的内容到这里就全部结束了,在下一篇内容中我们将介绍如何对AI模型下达指令并且表达自己的需求,大家记得关注哦!如果大家喜欢博主的内容,可以点赞、收藏加评论支持一下博主,当然也可以将博主的内容转发给你身边需要的朋友。最后感谢各位朋友的支持,咱们下一篇再见!!!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2298864.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Unity使用反射进行Protobuf(CS/SC)协议,json格式

protobuf生成的协议,有挺多协议的.利用反射生成dto进行伪协议的响应 和 发送请求 应用场景: 请求(CS)_后端先写完了,前端还搞完时,可使用此请求,可自测 响应(SC)_可自行构建一个响应,对数据进行测试 // 请求 使用物品 CS message ReqUseItem{optional Opcodes MessageID1[def…

初学 mybatis

前言 回顾之前 不使用 mybatis 框架,我们是怎么通过Java 操作数据库的 "jdbc" 前提:使用maven 构建的项目 1 添加 关于jdbc 的依赖,以及辅助操作数据库的 commons-dubli jar包 截取 前后端项目 2 添加配置文件里面内容有&…

C语言进阶习题(4结构体)【1】通讯录的实现

目录 1.使用结构体实现通讯录功能2.思路3. 代码实现3.1 test.c3.2 contact.c3.3 contact.h 1.使用结构体实现通讯录功能 主要功能有:显示通讯录信息,增加通讯录中人的信息,删除通讯录中人的信息,查找通信录中信息,修改…

释放你的元数据:使用 Elasticsearch 的自查询检索器

作者:来自 Elastic Josh Asres 了解如何使用 Elasticsearch 的 “self-quering” 检索器来通过结构化过滤器提高语义搜索的相关性。 在人工智能搜索的世界中,在海量的数据集中高效地找到正确的数据至关重要。传统的基于关键词的搜索在处理涉及自然语言的…

1.14学习总结

日常刷题单 刷了题目后,对于排序方法更加熟练,手搓代码的速度也得到了提高。 感觉字符串还不熟练,高精度更是云里雾里,上升空间极大。 同时看见今晚有个入门难度的测试,去练了练手,想看看自己是什么成分&…

【Prometheus】prometheus黑盒监控balckbox全面解析与应用实战

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,阿里云开发者社区专家博主,CSDN全栈领域优质创作者,掘金优秀博主,51CTO博客专家等。 🏆《博客》:Python全…

游戏引擎学习第101天

回顾当前情况 昨天的进度基本上完成了所有内容,但我们还没有进行调试。虽然我们在运行时做的事情大致上是对的,但还是存在一些可能或者确定的bug。正如昨天最后提到的,既然现在时间晚了,就不太适合开始调试,所以今天我…

海康摄像头IPV6模式,手动,自动,路由公告

海康摄像头DS-2DC7220IW-A 网络设置中的IPv6配置选项。IPv6是互联网协议(IP)的第六版,用于替代IPv4,提供更多的IP地址和改进的网络功能。图片中的选项允许用户选择如何配置设备的IPv6网络连接: 手动:用户可…

架构设计系列(二):CI/CD

一、概述 CI/CD 是 持续集成(Continuous Integration) 和 持续交付/持续部署(Continuous Delivery/Continuous Deployment) 的缩写,是现代软件开发中的一套核心实践和工具链,旨在提高软件交付的效率、质量…

DDoS技术解析

这里是Themberfue 今天我们不聊别的,我们聊聊著名的网络攻击手段之一的 DDoS,看看其背后的技术细节。 DoS 了解 DDoS 前,先来讲讲 DoS 是什么,此 DoS 而不是 DOS 操作系统啊。1996年9月6日,世界第三古老的网络服务提供…

28 在可以控制 postgres 服务器, 不知道任何用户名的情况下怎 进入 postgres 服务器

前言 最近有这样的一个需求, 有一个 postgres 服务器 但是 不知道 他的任何的用户名密码, 但是我想要查询这台 postgres 服务器 然后 基于这个需求, 我们看一下 怎么来处理 pg_hba.conf 认证方式修改为 trust 首先将 postgres 服务器的认证方式修改为 trust 这时候 …

《图解设计模式》笔记(十)用类来表现

二十二、Command模式:命令也是类 一个类调用某方法,虽然调用结果会反映在对象的状态中,但不会留下工作的历史记录。 若有一个类表示“请进行这项工作”的“命令”,每一项想做的工作就不再是“方法的调用”这种动态处理了,而是一个表示命令的类的实例,即可以用“物”来表…

docker容器部署jar应用导入文件时候报缺少字体错误解决

如题,在导入文件时候报错如下: Handler dispatch failed; nested exception is java.lang.NoClassDefFoundError: Could not initialize class sun.awt.X11FontManager 经查是缺少对应字体,解决办法有两张: 第一种:…

npm安装时无法访问github域名的解决方法

个人博客地址:npm安装时无法访问github域名的解决方法 | 一张假钞的真实世界 今天在用npm install的时候出现了github项目访问不了的异常: npm ERR! Error while executing: npm ERR! /bin/git ls-remote -h -t https://github.com/nhn/raphael.git np…

APP端弱网模拟与网络测试:如何确保应用在各种网络环境下稳定运行

随着智能手机的普及,APP的网络性能成为用户体验的关键因素之一。尤其是在弱网环境下,应用的表现可能严重影响用户的满意度。因此,APP端的网络测试,尤其是弱网模拟,成为了提升产品质量和用户体验的重要环节。 当前APP网…

从 ClickHouse 到 Apache Doris:在网易云音乐日增万亿日志数据场景下的落地

导读:日志数据已成为企业洞察系统状态、监控网络安全及分析业务动态的宝贵资源。网易云音乐引入 Apache Doris 作为日志库新方案,替换了 ClickHouse。解决了 ClickHouse 运维复杂、不支持倒排索引的问题。目前已经稳定运行 3 个季度,规模达到…

BFS 走迷宫

#include<bits/stdc.h> using namespace std; int a[100][100],v[100][100];//访问数组 n,m<100 struct point {int x;int y;int step; }; queue<point> r;//申请队列 int dx[4]{0,1,0,-1};//四个方向 右下左上 int dy[4]{1,0,-1,0}; int main() { /* 5 4 1 …

计算机毕业设计SpringBoot+Vue.js医院住院管理系统(源码+lw文档+PPT+讲解视频)

温馨提示&#xff1a;文末有 CSDN 平台官方提供的学长联系方式的名片&#xff01; 温馨提示&#xff1a;文末有 CSDN 平台官方提供的学长联系方式的名片&#xff01; 温馨提示&#xff1a;文末有 CSDN 平台官方提供的学长联系方式的名片&#xff01; 作者简介&#xff1a;Java领…

MongoDB 7 分片副本集升级方案详解(下)

#作者&#xff1a;任少近 文章目录 1.4 分片升级1.5 升级shard11.6 升级shard2,shard31.7 升级mongos1.8重新启用负载均衡器1.9 推荐MongoDB Compass来验证数据 2 注意事项&#xff1a; 1.4 分片升级 使用“滚动”升级从 MongoDB 7.0 升级到 8.0&#xff0c;即在其他成员可用…

【含开题报告+文档+PPT+源码】基于spring boot的固定资产管理系统

开题报告 本研究论文提出了一种基于SpringBoot框架构建的全面且高效的固定资产管理系统&#xff0c;旨在优化企业内部的固定资产全生命周期管理流程。该系统集成了员工权限管理、业务流程处理及数据分析于一体&#xff0c;实现了员工便捷的登录注册功能&#xff0c;并通过安全…