奥运会Ⅷ--生成式人工智能的力量倍增器

生成式人工智能在商业领域的崭新时代

随着 OpenAI 的ChatGPT、Anthropic 的Claude和 Google 的Bard的推出，大规模文本分析和自然语言处理 (NLP) 的长期梦想瞬间成为现实。AI 不仅令人信服地通过了图灵测试，还催化了企业战略的范式转变。突然之间，AI 不仅仅是一个话题——它瞬间成为每家有远见的公司路线图不可或缺的一部分。原因何在？

在生成式人工智能出现之前，讨论的大多数用例都涉及数字（请参阅我的博客“生成式人工智能的商业应用”）。现在，有了类似人类的文本和易于使用的界面，可以用简单的语言聊天并获得真实的响应，人工智能现在可供全球所有人使用——无论他们的技能水平如何。生成式人工智能技术当然可以复现他们所学到的东西，但当你要求它创造一些独特的东西时会发生什么？在大多数情况下，它们都很挣扎。

OpenAI 的ChatGPT、Meta 的AudioCraft和Midjourney等技术能够以几乎人类般的流畅度创作文字、代码、旋律和视觉杰作。但必须记住，从本质上讲，它们的熟练程度和创新性取决于它们所输入的数据。如果您的竞争对手只是使用与您相同的公开模型，那么这如何成为竞争优势的基础？

对于精明的商业领袖来说，信息非常明确：组织的数据不仅仅是一种商品——它是你最强大的武器。我的整个职业生涯都在数据和分析领域度过，利用非结构化数据的潜力的梦想一直困扰着企业，但似乎总是有点遥不可及。事实上，去年夏天我和一位行业分析师朋友开玩笑说：“也许今年我们将破解文本分析的难题。”我当时并不知道 2022 年 11 月会发生什么。

然而，创造人工智能驱动的商业成功的旅程并不意味着采用通用模型，而是要调整和修改人工智能，以理解和运作组织独特的环境（由数据驱动）。

将公司的独特背景应用于生成式人工智能

对于任何企业来说，将所有拼图拼凑在一起可能有点令人生畏。然而，情况很清楚，要创造竞争优势，您需要创建一个了解组织独特需求、互动和运营方式的系统。从根本上讲，有几种不同的方法可以应用此上下文，概述如下。

为大語言模型 (LLM) 添加背景信息

让我们从您的大型语言模型（LLM）开始；您可以从头开始构建、进行微调或购买一个软件包。

从头开始构建：这肯定是一项艰巨的任务。构建自己的 AI 解决方案提供了无限的定制，但代价高昂。不仅是金钱方面，还有所需的时间、专业知识和资源。麦肯锡的一篇文章表明，初始构建的成本可能在 500 万至 2 亿美元之间，而定期费用为 100 万至 500 万美元。只有最大的组织才能负担得起这种方法。
微调现有模型：您可以调整或调整现有的生成式 AI 模型，而不是从零开始。这种方法在定制和成本之间实现了平衡，允许您使用已经预先训练过的基础来根据您的情况定制 AI。麦肯锡估计，这将花费 200 万至 1000 万美元，每年的经常性维护预算为 50 万至 100 万美元。
购买预包装解决方案：对于喜欢现成解决方案的公司，有现成的 AI 产品可供选择。这些产品可能缺乏相同程度的个性化，但它们提供更快的部署和更低的初始成本。这些产品通常用于简化业务运营但不会成为您的竞争优势的情况。麦肯锡计算出，这在 0.5 万美元到 200 万美元之间，每年需支付 0.5 万美元的经常性费用。

现在，我们如何增强您的模型？

通过 RAG 添加上下文

对于许多公司来说，安全和隐私是其运营的基础。将您的专有数据发送给可以使用您的数据为他人训练模型的服务提供商，这简直是不合情理的。事实上，我喜欢Hippocratic AI 的口头禅“不伤害”。医疗保健、保险、银行、制造、法律等许多领域对数据的使用方式、传输位置和存储方式都有严格的规定。因此，如果您的组织不打算使用您的数据来微调模型，请考虑检索增强生成 (RAG)。本质上，RAG 方法将您的组织数据连接到 LLM，而无需实际将您的数据提供给 LLM。RAG 允许您与 LLM 聊天的响应包含您的专有数据。换句话说，它提供了上下文！