企业如何正确地利用LLM大模型？

企业如何正确地利用LLM大模型？

news2025/2/22 6:53:11

大型语言模型 (LLM) 不值得信任。就是这样。

考虑到它们先进的 AI 能力以及当今强大的基础模型的普遍知识，这似乎是一件令人惊讶的事情。然而，问题的关键在于 LLM 无法解释其输出。你不能信任 LLM 的结果，不是因为它不准确，而是因为它令人费解。没有办法审核答案或检查其工作。

这类似于接受一个人的话，却没有能力验证他们的主张；这对于关键的业务决策来说是行不通的。健康的关系建立在信任的基础上。企业与其 ML 模型的关系也不例外。那么你如何克服你的信任问题呢？

你可能听过这样一句话：“信任，但要核实”。这句古老的谚语是否预示着LLM的到来？虽然你不能完全信任大型语言模型，但这并不意味着你应该完全放弃它们。

NSDT工具推荐： Three.js AI纹理开发包 - YOLO合成数据生成器 - GLTF/GLB在线编辑 - 3D模型格式在线转换 - 可编程3D场景编辑器 - REVIT导出3D模型插件 - 3D模型语义搜索引擎 - Three.js虚拟轴心开发包 - 3D模型在线减面 - STL模型在线切割

1、是否有可能超越 LLM 响应猜测？

LLM 在统计概率领域运行，没有确定性边界。它们生成解决方案而不引用任何预定义的数据库或“真相来源”。因此，不可能交叉检查 LLM 输出或要求他们证明他们的答案。这就像试图检查一个人的大脑内容一样——你做不到。

用于生成每个 LLM 响应的配方成分无法追踪或解构；配方本质上是一个黑匣子。但这并不是绝望的理由。

LLM 响应上下文中固有的不信任并不意味着组织应该放弃它们。 LLM 就像你听说的那样强大；你只需要正确使用它们。

如果使用得当，它们可以作为自主智能代理的组成部分，用于回答企业问题。诀窍是使用 LLM 将自然语言问题重新定义为结构化查询。当针对受管理和可审计的数据源执行这些查询时，它们会产生准确的答案——最重要的是，可证明的准确答案。

在这个场景中，用户的回答是透明且可审计的，而不是隐藏在黑匣子里。答案满足了用户的需求，但背后一切都是可追溯和可验证的。就像老师要求学生“展示你的作品”一样，答案和答案的路径都是完全可见的。

2、真实用例：人力资源数据代理

假设你是公司的人力运营经理。你无法询问 ChatGPT，“哪些员工受我们的薪资范围政策约束？”

ChatGPT 不知道如何回答这个问题；它不知道你有多少员工，你的薪资范围政策是什么，以及它应该考虑哪些其他参数。这些信息在你组织的数据存储中是分散的；其中一些是私密的，ChatGPT 无法获取。

当然，你可以努力在数据库上训练 ChatGPT；向其提供有关你的薪资范围政策以及员工名册等的信息。但是，你无法验证它的响应是否准确；它们只是最佳猜测。

现在，重新构建你的方法。使用像上面这样的自主代理架构来重新构建你的查询过程。

你问代理，“哪些员工受我们的薪资范围政策约束？”代理可以在知识图谱中查找你的策略，并了解策略的定义方式。

假设此示例为“必须每年审查工资高于其工资范围最高工资 95% 的每个员工”。它可以利用这些知识将问题重新定义为“哪些员工的工资高于其工资范围最高工资的 95%？” 这个问题可以转化为结构化查询。

代理可以运行该查询并得到答案 - 它对问题的答案包含完整而全面的上下文路径以“显示工作”并得出事实的、有数据支持的响应。你（最终用户可以）可以验证它是否查找了正确的策略、正确解释了它并运行了正确的查询。

3、克服 LLM 信任问题

自主代理方法将 AI 问答的强大功能与强大的可解释性和可审计性结合在一起。因此，公司可以依靠这些智能代理进行决策，并确保他们的 AI 驱动的见解是受规则控制且值得信赖的。

尽管 LLM 在管理大量数据和复杂查询方面具有显著优势，但必须严格管理其使用，以确保透明度、可验证性和信任度。归根结底，不仅仅是 LLM，自主代理加上知识图谱和强大的治理框架，才能成为企业可靠的 AI 解决方案。

4、最后的想法

LLM 既不是你可以完全信任的魔盒，也不是混乱的潘多拉魔盒。通过正确的方法和严格的治理，可以有效地利用它们。

通过将自然语言问题重新定义为结构化查询，我们可以确保 AI 驱动的企业解决方案的准确性、可解释性和治理。这不是要丢弃盒子，而是要学习如何明智地补充它。

原文链接：企业利用LLM的正确方法 - BimAnt

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1696456.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

新抖：抖音的数据分析平台，敢用深色系，别的真不敢！

新抖：抖音的数据分析平台，敢用深色系，别的真不敢！

举报评论 0

阅读更多...

（南京观海微电子）——MCU屏介绍

（南京观海微电子）——MCU屏介绍

MCU-LCD屏与RGB-LCD屏主要区别在于显存的位置： RGB-LCD的显存是由系统内存充当的，因此其大小只受限于系统内存的大小，这样RGB-LCD可以做出较大尺寸，像现在4.3只能算入门级，而MID中7、10的屏都开始大量使用。 MCU-L…

阅读更多...

第二天-④查看前后端要做的事(权限分配)

第二天-④查看前后端要做的事(权限分配)

阅读更多...

window好用的网速工具

window好用的网速工具

这是一个用于显示当前网速、CPU及内存利用率的桌面悬浮窗软件，并支持任务栏显示，支持更换皮肤。 github链接如下 https://github.com/zhongyang219/TrafficMonitor?tabreadme-ov-file

阅读更多...

PyQt6--Python桌面开发（33.QToolBar工具栏控件)

PyQt6--Python桌面开发（33.QToolBar工具栏控件)

QToolBar工具栏控件

阅读更多...

Spring MVC+mybatis 项目入门：旅游网（一）项目创建与准备

Spring MVC+mybatis 项目入门：旅游网（一）项目创建与准备

个人博客：Spring MVCmybatis 项目入门:旅游网（一）项目创建与准备 | iwtss blog 先看这个！ 这是18年的文章，回收站里恢复的，现阶段看基本是没有参考意义的，技术老旧脱离时代（2024年辣…

阅读更多...

解密Spring Boot Starter与自动配置：探秘神奇的背后

解密Spring Boot Starter与自动配置：探秘神奇的背后

starter可以理解为Spring Boot中的一站式集成启动器，包含了一系列可以集成到应用中的依赖项，可以快递集成spring组件及其框架，而不需要到处找示例代码。一、为什么要用starter？ 在springboot还没有出来之前，我们使用…

阅读更多...

白嫖的在线工具类宝藏网站清单，快点击进来收藏一波

白嫖的在线工具类宝藏网站清单，快点击进来收藏一波

简单整理了一下自己日常经常使用的10个免费工具网站，建议点赞关注收藏，快点分享给小伙伴们！ 1.奶牛快传:用户体验更好的网盘工具。 https://cowtransfer.com/ 今年开始使用的一款网盘工具，和百度网盘类似,叫奶牛快传，如…

阅读更多...

实现地图上展示坐标时，不要全部展示、只展示几个距离相对较大marker点位，随着地图放大再全部展示出来。

实现地图上展示坐标时，不要全部展示、只展示几个距离相对较大marker点位，随着地图放大再全部展示出来。

比例尺级别地面分辨率 （米/像素）比例尺0156543.031：591658700.82178271.5151：295829350.4239135.75751：147914675.2319567.878751：73957337.649783.9393751：36978668.854891.9696881&#xff1a…

阅读更多...

2024年5月LLM最新排名：GPT-4o出道即巅峰！国内3个大模型榜上有名！

2024年5月LLM最新排名：GPT-4o出道即巅峰！国内3个大模型榜上有名！

大家好，我是木易，一个持续关注AI领域的互联网技术产品经理，国内Top2本科，美国Top10 CS研究生，MBA。我坚信AI是普通人变强的“外挂”，所以创建了“AI信息Gap”这个公众号，专注于分享AI全维度知识…

阅读更多...

orin部署tensorrt、cuda、cudnn、pytorch、onnx

orin部署tensorrt、cuda、cudnn、pytorch、onnx

绝大部分参考https://blog.csdn.net/qq_41336087/article/details/129661850 非orin可以参考https://blog.csdn.net/JineD/article/details/131201121 报错显卡驱动安装535没法安装、原始是和l4t-cuda的部分文件冲突 Options marked [*] produce a lot of output - pipe it th…

阅读更多...

核函数的介绍

核函数的介绍

1.核函数的介绍： 1、用线性核等于没有用核。 2、多项式核：随着d越大，则 fai(X) 对应的维度将越高。（可以通过d得到对应的fai(X)函数）。 3、高斯核函数：无限维度。 4、tanh核。 2.如何选择核函数的参数&am…

阅读更多...

2024年云南特岗教师报名流程，超详细，明天就开始报名哦！

2024年云南特岗教师报名流程，超详细，明天就开始报名哦！

2024年云南特岗教师报名流程，超详细，明天就开始报名哦！

阅读更多...

深入理解 Mysql 分层架构：从存储引擎到查询优化器的内部机制解析

深入理解 Mysql 分层架构：从存储引擎到查询优化器的内部机制解析

一、基础架构 1.连接器 1.会先连接到这个数据库上，这时候接待你的就是连接器。连接器负责跟客户端建立连接、获取权限、维持和管理连接 2.用户密码连接成功之后，会从权限表中拿出你的权限，后续操作权限都依赖于此时拿出的权限,这就意味着当链…

阅读更多...

【学习笔记】计算机组成原理（七）

【学习笔记】计算机组成原理（七）

指令系统文章目录指令系统7.1 机器指令7.1.1 指令的一般格式7.1.2 指令字长 7.2 操作数类型和操作类型7.2.1 操作数类型7.2.2 数据在存储器中的存放方式7.2.3 操作类型 7.3 寻址方式7.3.1 指令寻址7.3.1.1 顺序寻址7.3.1.2 跳跃寻址 7.3.2 数据寻址7.3.2.1 立即寻址7.3.2.2 直…

阅读更多...

月薪5万是怎样谈的？

月薪5万是怎样谈的？

知识星球（星球名：芯片制造与封测技术社区，星球号：63559049）里的学员问：目前是晶圆厂的PE，但是想跳槽谈了几次薪水，都没法有大幅度的增长，该怎么办？“学得文武…

阅读更多...

three.js能实现啥效果？看过来，这里都是它的菜（09）

three.js能实现啥效果？看过来，这里都是它的菜（09）

Hi，这是第九期了，继续分享three.js在可视化大屏中的应用，本期分享位移动画的实现。位移动画 Three.js位移动画是指在Three.js中实现物体位置的平移动画。通过改变物体的位置属性，可以实现物体沿着指定路径从一个位置移动到另一…

阅读更多...

PostgreSQL基本使用

PostgreSQL基本使用

参考文档：PostgreSQL基本使用与数据备份_postgresql 数据备份-CSDN博客一、数据库的操作 1. 本机登录 2.创建新用户来访问 PostgreSQL 3 重启数据库服务 4.创建数据库并查看数据库 5.连接数据并删除数据库 6.建表插入数据，查看数据库下所有的表&#…

阅读更多...

Python数据可视化（四）

Python数据可视化（四）

实现图形的动画效果在 matplotlib 中，不仅可以绘制静态图形，也可以绘制动态图形。对于动态图形来说，我们称之为动画或许会让读者更容易明白。绘制动画的方法主要有两种：一种是使用模块 animation 绘制动画；另一种是…

阅读更多...

GVM: Golang多版本管理利器

GVM: Golang多版本管理利器

本文介绍了 Go Version Manager 的功能和使用方法，介绍了如何通过 GVM 在系统上安装和管理多个 Go 语言版本。原文: GVM: Go Version Manager, for Golang manage multiple versions Go 版本管理器（GVM，Go Version Manager）是一款…

阅读更多...

推荐文章

最新文章