如何打造垂直LLM的护城河

news2024/12/25 2:10:45

B2B人工智能初创企业的一个伟大策略是打造“垂直人工智能”产品:成为特定行业的人工智能助手,比如律师、金融服务、医生。 听起来很简单:你可以利用LLM的超能力,并将其应用于宠物行业的特定数据和用例。 这就是我们在Explain所做的事情:Explain是公共部门(基础设施、公用事业、房地产、建筑等)专业人士的人工智能助手,帮助他们在超级无聊的公开招标中挖掘关键信息,总结 正式报告或撰写建筑许可证草稿。

但问题在于:如果你和每个人都获得相同的LLM,你如何建立护城河,即可防御的竞争优势? 你如何才能不依赖你的 LLM 提供商并确保创造的价值归你所有? 根据我们的经验,我们找到了三种有效的方法。

在线工具推荐: Three.js AI纹理开发包 - YOLO合成数据生成器 - GLTF/GLB在线编辑 - 3D模型格式在线转换 - 可编程3D场景编辑器 

1、无聊的工作流程自动化胜过聪明的洞察力生成

标准 B2B 策略:如果你嵌入用户的流程和工作流程中,你就锁定了他们。这对于AI产品仍然适用,对我们来说,这意味着专注于流程自动化而不是洞察生成。

我们团队的座右铭是“无聊的阅读和写作是机器的事”:我们有时会担心人工智能霸主即将崛起,但截至目前,大多数人工智能仍然是自动执行人类很容易完成的无聊、重复性任务 一次,但不可能做数千次。 LLM所做的主要是扩大自动化的范围。 我们的一位客户希望跟踪其行业中每次公开招标的获胜者和失败者; 对于每个招标,地方当局都会发布一份小报告,客户团队必须提取 3 条信息; 但每年有 100,000 份招标报告,信息以半结构化格式编写,必须以另一种格式输入客户的 CRM 中。 非常无聊,可以通过人工智能实现自动化,而且在工作流程中非常重要!

对我们来说,这些用例比复杂的评分、趋势分析或出色的数据可视化效果更好,后者虽然很耀眼,但并不持久。

2、你需要一些自己的数据(LangChain还不够)

LLM让我们所有人都兴奋不已,但如果没有你自己的一些数据,LLM就没有意义。 它可以是你公开获取并构建到数据库中的数据(新闻、官方文件、法律、财务报告),也可以是你的用户的数据(他们的内部备忘录档案或之前对公开招标的回复),但你需要对包含用户相关信息的数据的特权访问。 这就是为什么,在Explain,我们的第一步是建立我们独特的公共文档数据库,我们抓取了数以万计的网站,然后进行清理、分类和结构化。 然后是LLM。

要将 LLM 应用于你的数据,可能会使用某些版本的 LangChain 软件包,它允许你通过将数据作为提示的一部分提供给 LLM 来处理自己的数据,而不是简单地与 GPT 对话并让它处理你自己的数据。 根据其参数的权重回答。 因此,你的技术栈将如下所示:根据你的数据库,你将提取数据的相关部分(检索阶段); 然后,你将在提示中将这些部分提供给LLM并表述任务(提示工程阶段)。 最近许多基于 LLM 的工具都使用这种类型的体系结构(例如本文中描述的):新的 Bing 或工具允许你在浏览器、pdf 或操作系统中使用 LLM。

这是一个非常强大的技术栈,它避免了 LLM 因自己的设备而陷入的许多幻觉和错误。 它也非常灵活,在我们的团队中它已经成为许多传统 NLP 任务(情感分析、实体识别、摘要等)的默认响应。 顺便说一句:如果你当前的 NLP 堆栈是围绕许多专门的、非 LLM 的算法构建的,那么你就背负了 NLP 债务,并且可能不再具有竞争优势。

但这里的关键点是,虽然超级功能来自LLM组件,但护城河来自数据库组件。 所以如果你没有先建立一个独特的数据库,LangChain 是不够的。

3、微调 LLM 胜过提示工程以实现可扩展性

前两个护城河都不是来自LLM本身。 这个可以。

前面描述的检索 + LLM 架构的一个限制是它存在不可扩展的风险。 当然,编写精心设计的提示并调用 GPT-4 API 确实有效,但成本可能非常高:使用 GPT-4,我们花费了 3 美元来建立一个地区最有利于风电的 50 位地方官员名单 。 我们不可能把它交给用户。

根据Explain 首席技术官 Guillaume Barrois 进行的研究,适合我们的技术栈如下。

  • 我们没有使用最新、最昂贵的 LLM (GPT-4),而是使用更小的模型(到目前为止,我们使用了 Hugging Face 库中的开源模型)。 成本降低 10 至 100 倍。
  • 然后,为了提高性能,我们根据我们的文档对其用例进行微调:我们向其提供有关新基础设施项目的民选官员声明的训练集或一页官方决策的 3 行摘要。
  • 神奇之处在于:用于微调的训练集非常大(高达 100 000 个样本),但我们不是手动构建训练集:我们使用 GPT-4 代替。 当前LLM的一项不为人知的成就是,他们在许多中低复杂度的任务上实现了人类水平的表现:正如一位大学水平的老师向我报告的那样,GPT-4 在总结方面比 80% 的人更好。 本科生。 因此,对于此类任务,你可以使用 GPT-4 来构建训练集,而不是人工标记器,然后将其提供给开源 LLM 进行微调。 你可以构建最先进的自动化技术栈,专门用于微调任何LLM。
  • 因此,你最终会得到一个更便宜、更小、更快的 LLM,它可以满足你 75% 的任务,而上一代旗舰 LLM 则只需要 1% 的资源。

斯坦福Alpaca论文中很好地描述了这一策略,根据我们的测试,它似乎适合我们。 工具不断涌现,可以帮助你更轻松地完成工作。 当然,它可能不适用于高复杂性或高方差的任务,但我们相信这是 B2B 用例的最佳选择,在这些用例中,用户倾向于在大量实例中重复有限数量的任务。

我们还相信,这种策略比根据数据从头开始培训自己的LLM的“硬核”路线具有更好的性价比,例如彭博社最近报道的那样。 我不清楚这项工作的哪一部分是关于效率与研发展示他们的LLM技能,但我们把钱花在微调路线上。 来自谷歌内部的泄密事件也证实了这一点。

这个微调栈与成本优化无关:它提供了完全不同的用户体验,因为它允许你为所有核心任务释放 LLM 的力量,并大大加快推理性能。 这种优势是有道理的,因为它基于你的数据和你对用例的了解。

该技术栈将限制你对某个特定 LLM 提供商的依赖:栈的核心是微调组件,它可以插入许多不同的通用 LLM 上。

在Explain,我们非常相信SaaS 公司的垂直人工智能战略。 我们使用产品驱动和技术驱动的策略来建立强大的进入壁垒:充分了解你的客户并融入他们的工作流程; 投资拥有一个独特的数据库; 构建一个可扩展的 LLM 栈,针对你的数据和用例进行微调。


原文链接:垂直LLM的护城河 - BimAnt

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1250910.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

excel表中慎用合并单元格,多用跨列居中

如下一个excel例表: 要将首行居中,最好的办法如下: 1、选中首行单元格 2、按下ctrl1,调出“设置单元格格式”,选中“对齐”,在“水平对齐”中选择“跨列居中” 3、完成任务 这样居中的好处是:可…

五分钟,Docker安装flink,并使用flinksql消费kafka数据

1、拉取flink镜像,创建网络 docker pull flink docker network create flink-network2、创建 jobmanager # 创建 JobManager docker run \-itd \--namejobmanager \--publish 8081:8081 \--network flink-network \--env FLINK_PROPERTIES"jobmanager.rpc.ad…

HCIP-八、路由引入

八、路由引入 实验拓扑实验需求及解法1.配置所有设备的IP地址。2.R1/2/3/4运行OSPF3.R3/4/5运行IS-IS4.在R3/4上将OSPF 1引入IS-IS5.在R3/4上将IS-IS引入OSPF6.路径优化 实验拓扑 实验需求及解法 本实验模拟OSPF与IS-IS互联的网络环境,完成以下需求: 1…

linux开启apache服务

vim /etc/apache2/ports.conf 键盘输入i 进入插入编辑模式,修改apache2默认监听端口号为8080 ,编辑好后,按Esc键“:wq!” 保存退出。(注:端口也可以不修改) 在终端输入“/etc/init.d/apache2 …

微信公众号对接获取用户openid预约项目心路全历程

公众号对接获取openid全历程 一、背景二、选型三、开始修改若依框架四、自己搭后端框架五、前端框架uni-app修改六、对接获取公众号登录用户openId七、总结 一、背景 老板接了朋友的一个公众号需求,要求做一个简单的疫苗预约系统。功能是获取当前登录用户&#xff0…

VRRP的交换机VRRP主备配置例子

拓朴如下: 主要配置如下: [S1] vlan batch 10 20 # interface Vlanif10ip address 10.1.1.1 255.255.255.0vrrp vrid 1 virtual-ip 10.1.1.254vrrp vrid 1 priority 200vrrp vrid 1 preempt-mode timer delay 20 # interface Vlanif20ip address 13.1.1…

【pandas】数据透视表【pivot_table】

pivot_table pandas的pivot_table函数是一个非常有用的工具,用于创建一个数据透视表,这是一种用于数据总结和分析的表格形式。 以下是pivot_table的基本语法: pandas.pivot_table(data, valuesNone, indexNone, columnsNone, aggfuncmean,…

【LLM_04】自然语言处理基础_2

一、神经网络1、循环神经网络(RNN)2、门控循环单元(GRU)3、长短期记忆网络(LSTM)4、双向RNN5、卷积神经网络(CNN) 二、注意力机制1、注意力机制原理介绍2、注意力机制的各种变式3、注…

十大排序之堆排序(详解)

文章目录 🐒个人主页🏅算法思维框架📖前言: 🎀堆排序 时间复杂度O(n*logn)🎇1. 算法步骤思想🎇2、动画演示🎇3.代码实现 🐒个人主页 🏅算法思维框架 &#x1…

Redis集群(新)

1.什么是集群 Redis集群实现了对Redis的水平扩容,可实现并发写操作,启动n个redis节点,将数据分别存储在不同的节点中,每块节点负责不同区域的插槽,所以Redis集群通过分区来提供一定程度的可用性。 Redis集群现采用的是…

mac测试远程端口是否可连接

打开命令行工具,使用命令nc -z ip port即可 ,如果成功,则会返回如下信息: 。

算法基础之表达式求值

算法基础之表达式求值 中序表达式求值 用栈 将字符和数字分别用栈存储 由下往上计算 左子树算完再算右子树 判断方法&#xff1a;当前符号优先级<前一个符号优先级 则左右子树已遍历完 #include<iostream>#include<cstring>#include<stack>#include&l…

单文件组件MVVM

单文件组件&MVVM 所谓组件化开发&#xff0c;就是创建一个个组件。 Vue是一个大类&#xff0c;渲染一切从new Vue开始。 指定视图&#xff1a;el template render:jsx语法 $mount[数学公式] 编译App.vue&#xff0c;作为视图入口 单个组件&#xff1a;结构 样式 data compu…

彩纸屋在线少儿编程源码/scratch在线编程系统/培训管理系统源码/在线培训系统源码PHP

源码简介&#xff1a; 彩纸屋在线少儿编程源码&#xff0c;它是scratch在线编程系统&#xff0c;作为培训管理系统源码/在线培训系统源码&#xff0c;采用PHP源码。 彩纸屋是全国首家提供scratch开源定制和少儿编程培训管理系统源代码的服务商&#xff0c;彩纸屋提供的scratc…

MIT6.824-Raft笔记:Raft初探、副本间log时序

从宏观角度说明raft在程序中的作用&#xff0c;和客户端的关系&#xff0c;以及多个副本之间的关系&#xff1b;从微观角度说明多个副本之间raft对日志处理的流程。 1. Raft 初探 宏观角度说明raft在程序中的作用&#xff0c;和客户端的关系&#xff0c;以及多个副本之间的关…

激活函数与非线性化:探索神经网络中的关键元素

随着人工智能领域的迅猛发展&#xff0c;神经网络成为实现各种复杂任务的有力工具。其中&#xff0c;激活函数及其非线性化特性扮演着至关重要的角色。本文将深入探讨激活函数的基本概念、作用原理以及常见的几种激活函数&#xff0c;并介绍它们在神经网络中发挥的重要作用。 …

Web3 进入“殖民时代”

最近在 AI 和 Web3 领域发生了两件“大”事&#xff0c;两件事都具有指标意义&#xff0c;但在媒体上其意义都被大量的八卦细节给掩埋了。 其实看待任何重大事件&#xff0c;都可以有两种不同的视角。第一是娱乐的视角&#xff0c;在新闻事件中找乐子。如果是本着这个目的&…

STM32-使用固件库新建工程

参考链接: 【入门篇】11-新建工程—固件库版本&#xff08;初学者必须认认真真看&#xff09;_哔哩哔哩_bilibili 使用的MCU是STM32F103ZET6 。 这篇参考的是野火的资料&#xff0c;可以在“野火大学堂”或者它的论坛上下载。&#xff08;我通常是野火和正点原子的资料混着看的…

【DDS】OpenDDS配置与使用

&#x1f60f;★,:.☆(&#xffe3;▽&#xffe3;)/$:.★ &#x1f60f; 这篇文章主要介绍OpenDDS配置与使用。 无专精则不能成&#xff0c;无涉猎则不能通。——梁启超 欢迎来到我的博客&#xff0c;一起学习&#xff0c;共同进步。 喜欢的朋友可以关注一下&#xff0c;下次更…

能让PDF看起来像是扫描件的Look Scanned

什么是 Look Scanned ? Look Scanned 是一个能够让 PDF 看起来就像是扫描件一样的纯前端网站。你再也不需要麻烦地打印之后扫描了&#xff0c;你所需要的就是鼠标点几下。 这是个挺有意思的软件&#xff0c;但是老苏不确定什么场景下会用到这个软件&#xff0c;如果不想自己搭…