打造基于大模型的AI产品

news2024/11/24 8:51:03

我要飞往印度进行短暂旅行,因此花了一个小时的时间处理在线签证申请流程。完成后,由于我现在知道涉及的内容,我向 ChatGPT 4o 询问了相关问题。这些观点中的大多数都是部分或完全错误的。

NSDT工具推荐: Three.js AI纹理开发包 - YOLO合成数据生成器 - GLTF/GLB在线编辑 - 3D模型格式在线转换 - 可编程3D场景编辑器 - REVIT导出3D模型插件 - 3D模型语义搜索引擎 - Three.js虚拟轴心开发包 - 3D模型在线减面 - STL模型在线切割 

这是一个“不公平”的测试。这是使用 LLM 的“糟糕”方式的一个很好的例子。这些不是数据库。它们不会对问题产生精确的事实答案,它们是概率系统,而不是确定性系统。今天的 LLM 无法给我一个完全准确的答案。答案可能是正确的,但你不能保证这一点。

人们有一种趋势,认为这意味着这些LLM是无用的。这是一种误解。相反,思考生成式 AI 模型的一个有用方法是,它们非常擅长告诉你对这样的问题的良好答案可能是什么样子。在一些用例中,“看起来是个不错的答案”正是你想要的,而在一些用例中,“大致正确”就是“完全错误”。

事实上,进一步推论,可以认为完全相同的提示和完全相同的输出可能是好结果,也可能是坏结果,这取决于你想要它的原因。

不管怎样,在这种情况下,我确实需要一个精确的答案,而 ChatGPT 原则上不能依赖它给我一个答案,相反,它给了我一个错误的答案。我要求它做一些它做不到的事情,所以这是一个不公平的测试,但它是一个相关的测试。答案仍然是错误的。

有两种方法可以尝试解决这个问题。一种是将其视为科学问题 - 现在还为时过早,模型会变得更好。你可以经常说“RAG”和“多智能体”。模型肯定会变得更好,但会好多少呢?你可以花上几周时间在 YouTube 上观看机器学习科学家争论这个问题的视频,结果却发现他们其实并不知道。实际上,这是“大模型会产生通用人工智能吗?”争论的一个版本,因为在我看来,一个能够完全正确回答“任何”问题的模型听起来至少是一种通用人工智能的良好定义(不过,同样,没有人知道)。

但另一种方法是将其视为产品问题。我们如何围绕我们应该假设会“出错”的模型构建有用的大众市场产品?

AI人员对我这样的例子的常见反应是说“你用错了” :

  • 我问了错误的问题类型
  • 我以错误的方式提问

我应该做大量提示工程设计!但过去 50 年消费者计算的发展告诉我们,你不能通过让用户学习命令行来推动技术的应用 - 你必须走向用户:

早期的即时工程(WordPerfect 纸板键盘覆盖层)。这不是未来

我认为我们可以进一步将其分解为两种产品问题。

一方面,屏幕截图中的产品设计传达了确定性,而模型本身本质上是不确定的。谷歌给你(大部分)十个蓝色链接,传达“它可能是其中之一”的信息,但这里我们只得到了一个“正确”的答案。这误导了很多人,尤其是因为文本生成(与实际答案不同)几乎是完美的。事实上,德勤的这项有趣的调查表明,一旦人们使用了这些系统,他们更容易被这种明显的确定性误导:

但问题的另一半是,在我得到“答案”之前,产品并没有告诉我可以问什么。我给了它一个“坏”查询(它实际上不能很好地回答),但产品中没有任何内容告诉我。相反,它被呈现给我作为一个通用工具。如果产品必须尝试回答任何问题,那么模型就很难正确,但这也使得界面很难传达哪些是好问题。

我制作了下面的幻灯片,用于我将在印度进行的演讲,试图捕捉由此提出的替代方案:

最激进的方法是完全通用的聊天机器人作为产品,我刚刚讨论了其中的挑战。但至少还有另外两种方法。

第一种方法是将产品限制在一个狭窄的领域,这样你就可以围绕输入和输出创建一个自定义 UI,传达它能做什么、不能做什么以及你可以问什么,也许还可以关注模型本身(因此有了 RAG)。这为我们带来了过去 12 个月中爆发式增长的编码助手和营销工具,以及知识管理工具的首次尝试。WPP 已经建立了一个内部仪表板,让其员工将模型引导到特定的品牌语调或目标人群。因此,“让这个工具为品牌 Y 的演示 Z 提出 50 个产品 X 的想法 - 不要问它你是否患有阑尾炎。”你将提示包装在按钮和 UI 中 - 在产品中:

但另一种方法是,用户永远看不到提示或输出,或者根本不知道这是生成式人工智能,输入和输出都被抽象为其他事物中的函数。该模型启用了某些功能,或者使构建该功能变得更快、更容易,即使你以前可以做到这一点。这就是上一波机器学习的大部分内容被吸收到软件中的方式:有新功能,或者功能效果更好,或者可以更快、更便宜地构建,但用户永远不知道它们是“人工智能”——它们不是紫色的,也没有小星星群。因此,有一个老笑话说,AI是任何还没有起作用的东西,因为一旦它起作用,它就只是软件。

从另一个角度来看:对于任何新技术,我们首先尝试让它适应我们已经存在的问题,而目前的市场领导者则试图让它成为一项功能(因此谷歌和微软在去年将LLM喷洒到他们的所有产品上)。然后,初创公司使用它来拆分现有产品(拆分搜索、Oracle 或电子邮件),但与此同时,其他初创公司试图找出我们可以构建的真正原生于新技术的产品。这分阶段进行。首先,Flickr 有一个 iPhone 应用程序,但后来 Instagram 使用智能手机摄像头,并使用本地计算添加过滤器,再后来,Snap 和 TikTok 使用触摸屏、视频和位置来打造真正原生于平台的产品。那么,我们用它构建了什么样的原生体验,不是聊天机器人本身,也不是“错误率”无关紧要,而是以某种方式抽象了这种新功能?

这当然提出了一个悖论,我之前已经谈到过:我们拥有一项通用技术,但部署方式是将其分解为单一用途的工具和体验。然而,将其视为悖论可能只是错位了正确的抽象层次。电动机是一种通用技术,但你不会从家得宝 (Home Depot) 购买一箱电动机 - 你会购买钻头、洗衣机和搅拌机。通用技术被实例化为用例。个人电脑和智能手机是取代单一用途工具的通用工具 - 它们取代了打字机、计算器、录音机和音乐播放器 - 但这些功能都是通过一个单一用途软件实现的:大多数人不会将 Excel 用作文字处理器。有些人对 LLM 如此兴奋的一个原因是他们可能不会遵循这种模式:他们可能会通过所有这些抽象级别上升到顶部。这将没有空间容纳“薄 GPT 包装器”。然而,我认为他们还不能真正做到这一点,因此,我刚才所写的一切实际上只是在思考,即使这种情况从未发生,你又能建立什么来改变世界。


原文链接:打造AI产品 - BimAnt

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1835877.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Linux C编译器从零开发三

AST语法树 BNF抽象 expr equality equality relational ("" relational | "!" relational)* relational add ("<" add | "<" add | ">" add | ">" add)* add mul ("" …

苹果电脑下载vite包错

苹果电脑下载vite包错/Users/lili/.npm/_cacache/index-v5/c5/50/b451703d03b3802b9ee6b7ff2b0bde4de7f26830eb52c904d6911c137cf8包错解决方式 解决方式&#xff1a;sudo chown -R 501:20 "/Users/wangxin/.npm"

2024/6/18(RBAC,查询用户权限,细粒度授权,选课,支付宝生成二维码支付,支付结果查询需要内网穿透)

黑马程序员【学成在线项目】,P141 测试沙箱支付宝_黑马学成在线支付宝沙箱-CSDN博客 需要内网穿透

甘特图如何画以及具体实例详解

甘特图如何画以及具体实例详解 甘特图是一种常见的项目管理工具又称为横道图、条状图(Bar chart)。是每一位项目经理和PMO必须掌握的项目管理工具。甘特图通过条状图来显示项目、进度和其他时间相关的系统进展的内在关系随着时间进展的情况。但是多项目经理和PMO虽然考了各种证…

OSPF开销、协议优先级、定时器(华为)

#交换设备 OSPF开销值 如果没有定义OSPF接口的开销值&#xff0c;OSPF会根据该接口的带宽自动计算其开销值。 计算公式&#xff1a; 接口开销 带宽参考值 / 接口带宽 &#xff08;取整数部分&#xff0c;结果小于1时取1&#xff09;通过改变带宽参考值可以间接改变接口的开…

多模态融合算法分析

多模态融合算法分析 多模态论文多模态融合早期融合晚期融合混合融合模型级融合 对比分析早期融合&#xff08;Feature-level Fusion&#xff09;晚期融合&#xff08;Decision-level Fusion&#xff09;混合融合&#xff08;Hybrid Fusion&#xff09;ML-LSTM&#xff08;Multi…

BC153 [NOIP2010]数字统计

数字统计 一.题目描述二.输入描述&#xff1a;三.输出描述&#xff1a;四.数字范围五.题目思路六.代码实现 一.题目描述 请统计某个给定范围[L, R]的所有整数中&#xff0c;数字2出现的次数。 比如给定范围[2, 22]&#xff0c;数字2在数2中出现了1次&#xff0c;在数12中出现1次…

[机器学习算法]线性回归

1. 理解基本概念 在开始学习线性回归之前&#xff0c;确保理解以下基本概念&#xff1a; 自变量&#xff08;特征&#xff09;&#xff1a;用来预测因变量&#xff08;目标&#xff09;的输入变量。 因变量&#xff08;目标&#xff09;&#xff1a;需要预测的输出变量。 回归…

网关助力边缘物联网

网关助力边缘物联网 在探讨网关如何助力边缘物联网&#xff08;IoT&#xff09;的议题时&#xff0c;我们不得不深入分析这一技术交汇点的复杂性与潜力。边缘计算与物联网的融合&#xff0c;通过将数据处理与分析能力推向网络边缘&#xff0c;即数据生成的地方&#xff0c;极大…

自我激励学习提升语言模型的推理能力

随着人工智能技术的快速发展&#xff0c;语言模型&#xff08;LMs&#xff09;在各种下游任务中展现出了卓越的能力。特别是在少样本&#xff08;few-shot&#xff09;和零样本&#xff08;zero-shot&#xff09;学习环境中&#xff0c;通过吸收特定任务的指令和示例&#xff0…

IDEA设置nacos权重

本地开发的时候&#xff0c;连接开发环境的NACOS&#xff0c;有时候会有其他请求发送到自己的机子上&#xff0c;由于本地代码会有更新不及时的情况&#xff0c;导致代码报错&#xff0c;同时也会影响本地的日志输出&#xff0c;此时只要在idea设置 spring.cloud.nacos.discov…

icloud 邮箱登入失败

APP NAME mail2HOSTING APP NAME cloudos2CLIENT TIME Tue Jun 11 2024 09:00:47 GMT0800 (中国标准时间) (1718067647802)USER AGENT Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/125.0.0.0 Safari/537.36HOSTNAME www.icloud.…

掌握这三点软文营销技巧:轻松助力品牌传播

在营销方式层出不穷的今天&#xff0c;软文推广已不再只是简单的文字堆砌&#xff0c;而是成为了品牌与消费者深度沟通的桥梁。随着消费者获取信息的渠道越来越多元化&#xff0c;软文推广也迎来了新的趋势和挑战。今日投媒网将与您分享如何在新时代背景下&#xff0c;提升软文…

空气质量预报模式系统WRF-CMAQ

空气污染问题日益受到各级政府以及社会公众的高度重视&#xff0c;从实时的数据监测公布到空气质量数值预报及预报产品的发布&#xff0c;我国在空气质量监测和预报方面取得了一定进展。随着计算机技术的高速发展、空气污染监测手段的提高和人们对大气物理化学过程认识的深入&a…

已解决:geecg Column ‘id‘ in order clause is ambiguous

报错&#xff1a;Column id in order clause is ambiguous&#xff1b; MyBatis关联查询&#xff0c;相同字段名冲突&#xff0c;sql语句已经使用别名但仍然报错。 分析&#xff1a;写mapper映射文件时&#xff0c;在写到一对一关联&#xff0c;一对多关联时&#xff0c;由于两…

Maven 配置学习:存在两个本地私服如何配置

Maven 配置学习&#xff1a;存在两个本地私服如何配置 目录 Maven 配置学习&#xff1a;存在两个本地私服如何配置解释&#xff1a;1.本地仓库位置&#xff1a;2.Profiles 定义&#xff1a;3.Repositories 定义顺序&#xff1a;4.Active Profiles&#xff1a; 操作步骤&#xf…

掌握rpc、grpc并探究内在本质

文章目录 rpc是什么&#xff1f;又如何实现服务通信&#xff1f;理解rpcRPC的通信过程通信协议的选择小结RPC VS Restful net_rpc实践案例net/rpc包介绍创建服务端创建client 看看net_rpc的通信调度实现的内部原理明确目标基于自己实现的角度分析我会怎么做代码分析 grpc介绍与…

电脑数据恢复,掌握4个方法,恢复数据很简单!

在数字化浪潮席卷全球的今天&#xff0c;电脑数据已成为我们生活与工作中不可或缺的一部分。然而&#xff0c;当这些数据因各种原因意外丢失或损坏时&#xff0c;那种失落与无助的感觉常常令人倍感焦虑。 想象一下&#xff0c;你正在为一项重要项目加班加点&#xff0c;突然电…

PHP基础语法【上】

文章目录 一、环境安装二、代码应该写在哪里&#xff1f;三、什么是错误&#xff1f;四、变量无需声明变量变量命名规则变量的作用域可变变量 五、常量常量的定义常量的特性 六、数据类型NULL 空值Boolean 布尔类型Integer 整型Float 浮点型String 字符串Array 数组Object 对象…

Matlab复数相关

文章目录 MATLAB复数相关知识相关函数 MATLAB复数相关知识 相关函数 假定存在复数zabi 函数说明real(z)返回复数z的实部&#xff08;a&#xff09;imag(z)返回复数z的虚部&#xff08;b&#xff09;abs(z)返回复数的模即|z| &#xff08; ( a 2 ) ( b 2 ) \sqrt{(a^2)(b^2)…