这一年来,生成式 AI 领域的发展可谓日新月异。大语言模型 (LLM) 已经从学术研究圈的新宠,变成了开发者、产品经理、IT 决策者、高管等所有人都密切关注和亲身参与的重要课题。
一年间,这类问题在新闻报道、技术大会、开发者闲聊、同事讨论、博客文章中反复出现:生成式 AI 只是昙花一现的炒作吗?会不会只是一时的技术风潮?AI 在多次曙光初现后又经历了漫长的低谷期,这一次它真的能长盛不衰吗?如果这一切都是大势所趋,企业又该如何利用生成式 AI 的力量去颠覆市场,而不是被淘汰出局呢?
让我们一起来听听一些开发者对生成式 AI 的心声:
“生成式 AI 能帮助开发者更快速、更安全地构建应用,但它肯定不会取代人类。”——来自某位开发者
“我对那些能提升开发效率的工具充满期待,比如 CodeWhisperer。”——来自某云服务公司的运营主管
“生成式 AI 一定会蓬勃发展下去。”——来自某位首席技术官
这些言论的中心思想是一样的,那就是生成式 AI 必将为开发者赋能,尤其是让开发工作变得更快速、更轻松。
如前所述,最典型的例子就是 Amazon CodeWhisperer,它利用 AI 驱动的代码为开发者大幅提升了开发效率。然而,用于训练 Amazon CodeWhisperer 等生成式 AI 编程助手的数据质量至关重要。
为此,MongoDB 与 Amazon CodeWhisperer 数据科学团队携手,以 MongoDB 的大量使用案例来训练 CodeWhisperer 的底层模型,力求为开发者提供最佳的代码参考。
生成式 AI 的进步不仅让开发者的工作更高效、更轻松,更重要的是,它大大降低了构建 AI 应用的门槛。现在,即使是没有太多 AI/ML 经验的开发者,也能在应用开发中轻松驾驭大语言模型 (LLM)。
实际上,相比以往,开发者现在要打造一款 AI 驱动的应用简直易如反掌。一位参会的数据工程师这样评论:“生成式 AI 为毫无 AI 从业经验的人敞开了大门,让他们也能利用自身的业务领域知识参与到 AI 应用的开发浪潮中。”
检索增强生成 (Retrieval-Augmentation Generation,简称 RAG) 是一个很好的范例。正如 MongoDB 的 Mat Keep 所说:“就在一年之前,检索增强生成 (RAG) 还是一个晦涩难懂的深奥概念。但随着生成式 AI 的大火,RAG 架构如今已经成为企业级应用的标配。”
RAG 技术对开发者来说可谓是一件相当趁手的工具。这一技术将预训练通用生成式 AI 模型惊人的知识量和推理能力,与企业内部及时准确的定制化数据完美结合。如此一来,开发者就能快速搭建出一款基于企业私域数据和知识的 AI 应用,而无需投入成本和时间让专业的数据科学团队去训练和调优模型。RAG 只是新一代 AI 开发工具和技术变革浪潮的一个缩影,这些工具和技术能够让开发者有信心、有把握地拥抱 AI 时代。
纵观以上种种,不难看出,当前生成式 AI 蓬勃发展的新时代,离不开诸多开发者的积极探索和参与。即便如此,由于任何人都能轻松获取和使用先进的商用或开源生成式 AI 模型,企业竞争的制胜法宝最终还是要回归到自身独一无二的资产:数据。
展望未来,我们不禁要问:开发者们会就生成式 AI 展开哪些新的讨论?从过去一年的经验来看,未来也许还将发生翻天覆地的变革。所以,没人敢断言生成式 AI 的具体发展方向。但有一点可以肯定:数据和开发者,将始终是生成式 AI 未来发展的两大要素。