Elasticsearch：生成式人工智能带来的社会转变

作者：JEFF VESTAL

了解 Elastic 如何走在大型语言模型革命的最前沿 – 通过提供实时信息并将 LLM 集成到数据分析的搜索、可观察性和安全系统中，帮助用户将 LLM 提升到新的高度。

iPhone 社会转变：新时代的黎明

曾几何时，不久前，世界还是一个不同的地方。 “智能手机” 的概念仍然是一个新鲜事物，手机主要是一种打电话的工具，也许还可以偶尔发送短信。是的，我们曾经也有 “智能” 手机，但它们更简单，主要面向商业用户，并且主要用于电话用途。网页浏览？它就在那里，但很轻，不是你需要花几个小时做的事情。

2007年，一场巨浪席卷了我们日常生活的海岸，从此世界发生了翻天覆地的变化。这一波浪潮就是 iPhone。尽管一开始人们对 iPhone 感到兴奋、怀疑，甚至彻底拒绝（还记得黑莓的反应吗？），但 iPhone 很快就成为了社会游戏规则的改变者。

iPhone 不仅仅是一部电话；它也是一部手机。正如史蒂夫·乔布斯所说：“一个 iPod、一部电话和一个互联网通讯器……你们都明白了吗？这不是三台设备，而是一部手机。”* 不久之后，App Store 的推出打开了潘多拉魔盒的可能性，引发了一场数字革命。没过多久，iPhone 就变得无处不在，粘在全球用户的手中。突然间，世界触手可及。你的口袋里有完整的互联网知识吗？这不再是一个梦想，而是一个现实。

但社会转变不仅仅涉及技术；这是关于我们与世界以及彼此互动的方式。 iPhone 改变了我们消费媒体的方式、购物的方式、工作的方式，甚至约会的方式。它将我们变成了高度互联的存在，能够随时随地与任何人联系（无论好坏）。

快进到今天，很难想象没有智能手机的世界。它们已经成为我们生活中不可或缺的一部分，以至于我们常常认为它们是理所当然的。但正当我们已经习惯了这一技术奇迹时，另一场革命正在酝酿之中，这场革命有望与 iPhone 一样具有变革性，甚至更强。这场革命是由大型语言模型 (LLM) 和 ChatGPT 等聊天界面引领的。

LLMs 遵循类似的模式：下一个大浪潮

正如早期的 “智能” 手机为 iPhone 铺平了道路一样，我们已经生活在 LLM 革命的序幕中相当长一段时间了。在过去 50 多年里，人类越来越倾向于采用直观的方法与信息系统交互。 SQL 提供了一种描述用户搜索内容的方法。自然语言处理 (NLP) 提供了一种从自然人类问题中提取上下文的方法，允许程序员键入特定实体。如今，生成式人工智能允许人类使用完全自然的语言与信息系统进行交互。

当然，机器学习（ML）模型已经存在了几十年，虽然与我们过去几个月的经历相比，它们可能看起来 “更简单”，但它们一直在做好自己的工作，稳步学习和改进。大多数模型都是针对特定任务而设计的 —— 无论是分类、回归还是其他任务。

在 ChatGPT 出现之前的几年里，深度神经网络 (deep neural networkd - DNN) 变得非常强大，尤其是对于图像任务。在 NLP 中，门控循环神经网络 (gated recurrent neural networks,) 虽然不是变压器级的精确度，但已被大多数最先进的 NLP 系统所使用。此外，这些高级模型通常由组织而不是个人用户使用。

在 ChatGPT 出现之前，个人就可以使用更简单版本的机器人。想想 Siri 和 Google Assistant。或者微软早期在短暂但值得注意的 Tay 上所做的努力。这些 “人工智能助手” 可以回答我们的命令，回答我们的问题，执行简单的任务，例如查找天气，甚至执行预先配置的自动化任务。但它们只是更大的事情的先驱。

然后 ChatGPT 出现了，随之而来的是一个新时代的黎明。对于许多人来说，这是第一次与 LLM 直接互动。借助免费的网络浏览器界面，普通大众现在可以与 LLM 进行互动和聊天。听起来像是一件小事，对吧？但这种看似简单的互动标志着人类与人工智能之间关系的巨大转变。

就像 iPhone 一样，人们对 ChatGPT 的最初反应也褒贬不一。当然，大家都很兴奋。科技爱好者和未来学家们难掩喜悦之情。但也有人持怀疑态度，在某些地方甚至存在彻底的恐惧。这可能只是一种时尚吗？ LLM 会取代工作吗？这些问题继续在公众讨论中占据重要地位。

但就像 iPhone 一样，人们对 LLMs 的兴趣与日俱增。谷歌、Facebook 和其他科技巨头正在发布自己的 LLMs 和聊天机器人。 Azure 是 OpenAI（ChatGPT 的创建者）的密切合作伙伴和创始人，并将 ChatGPT 集成到其全套产品中。开源 LLM 正在迅速发展，一些内部人士甚至暗示它们最终可能会超越谷歌和 OpenAI。

所以，我们正站在另一场社会变革的悬崖边。 LLM 革命的浪潮正在高涨，即将席卷我们。正如十多年前的 iPhone 所做的那样，LLM 即将以我们难以想象的方式改变我们的生活。

即将到来的社会转变

人们对 LLMs 的兴趣日益浓厚，已经导致了各个行业的转型。然而，这反过来又引起了对偏见、不准确性和安全性的担忧。未来几年，人们与数据交互的标准将是使用搜索框、聊天机器人和为执行工作流程而构建的提示。转变已经开始。

大型语言模型旨在从自然语言的语法、语义和上下文中理解和生成类似人类的文本。尽管在所有情况下都无法与人类表现相媲美，但最新版本的 ChatGPT 在各种专业和学术环境中都显示出可比的结果。它于 2023 年 3 月推出，凭借视觉输入、更高的字数限制、改进的推理和可操纵性等功能从其他模型中脱颖而出。

这些大型模型擅长理解和创建跨广泛主题和应用的类人文本，引领自然语言处理领域。他们在情感分析、文本摘要、翻译、问答和代码生成等任务中表现出色。然而，他们面临的挑战不仅仅限于内容生成。例如，过去的数据收集时间没有新信息添加到模型中。知识日期的这种硬停止可能会导致不准确的响应，尤其是当信息随着时间的推移而变化时。他们还努力解决训练数据中的偏见，从而导致输出可能延续有害的刻板印象。另一个问题是可能产生不适当或令人反感的内容。此外，这些模型计算量大，需要大量资源才能有效运行。它们还带有 tokn 限制等限制，这会影响它们可以生成的内容的长度和复杂性。最后，与这些模型相关的运营和使用成本可能很高，使得访问和可扩展性成为许多用户关注的问题。

这些挑战需要更多的研究和开发来缓解这些问题并释放这些模型的全部潜力。随着技术的进步，预计未来的迭代将具有增强的功能和更少的限制。因此，这将为它们被更广泛的接受和融入社会结构铺平道路。

随着这些模型变得更容易获得和负担得起，它们预计将彻底改变生活和工作的各个方面。在学术界，LLMs 可以充当宝贵的研究助理，浏览大量文献，提供简洁的总结或提出创新的研究轨迹。在商业领域，他们可以为客户服务聊天机器人提供支持，提供 24/7 支持并以几乎像人类一样的流畅性和理解力管理客户查询。

LLMs 的潜在应用范围甚至更广。例如，在教育领域，他们可以提供个性化辅导，适应每个学生独特的学习节奏和风格。在医疗保健领域，他们可以协助分析患者症状和医学文献，从而支持临床诊断和治疗决策。将 LLMs 融入我们的生活不仅可以提高我们的生产力，还可以丰富我们在众多生活领域的经验。

鉴于这些发展，社会必须与这些技术一起适应和发展。这包括制定监管框架、道德准则和教育计划，以应对大型语言模型的影响和影响。我们的工作、沟通和互动方式将在未来几年发生巨大变化，这凸显了为即将到来的社会转变做好准备的重要性。

为了有效地应对这一转变，至关重要的是利用处于这一技术浪潮最前沿的组织，利用他们的专业知识来挖掘 LLMs 的潜力。 Elastic® 就是这样的组织之一。作为一名构建者，我喜欢思考我们可以构建的新事物，并且作为 Elasticsearch® 的长期用户，思考 Elasticsearch 在构建新工具以利用 LLMs 的潜力方面将发挥的作用很有趣。

用大语言模型把握未来

Elastic 以其创新和强大的搜索功能而闻名，完全有能力利用社会向大型语言模型的转变。随着 LLMs 继续革新各个领域，Elastic 不仅对这一变革性技术保持开放态度，而且在制定战略方面处于领先地位，以帮助其用户充分利用这些模型的潜力。

Elasticsearch Relevance Engine™（ESRE™）是一款一流的文档检索系统，通过促进实时公共数据的访问，突破了 LLMs 所能实现的界限。 Elastic 也将此功能扩展到专有信息。通过安全且量身定制的解决方案，Elastic 使 LLMs 能够帮助内部员工轻松浏览复杂的文档，同时通过基于角色的访问控制 (RBAC) 等功能维护对其数据的隐私控制。

Elastic 还使用户能够集中其可观察性和安全数据，并将其与 LLMs 的推理能力相集成，开辟了一个充满可能性的新世界。这种集成的变革潜力可以从最近的一篇博客文章中窥见一斑，该文章演示了 Elastic 可以与 LLM 集成的单向方式，或者这篇博客讨论了如何将 Elasticsearch 与开源 LLM 集成。此外，最近对 LangChain Python 库的贡献展示了如何使用 Elastic 生成向量，并且此 PR 允许将 Elastic 用作存储嵌入并执行近似 kNN 和混合搜索的向量数据库。

生成式人工智能的未来就在这里。通过注册接收独家新闻、Elastic 产品更新、AI 趋势、动手演示等，随时了解与 AI 相关的所有信息！

本文中描述的任何特性或功能的发布和时间安排均由 Elastic 自行决定。当前不可用的任何特性或功能可能无法按时交付或根本无法交付。

在这篇博文中，我们可能使用了第三方生成式人工智能工具，这些工具由其各自所有者拥有和运营。 Elastic 对第三方工具没有任何控制权，我们对其内容、操作或使用不承担任何责任，也不对你使用此类工具可能产生的任何损失或损害负责。使用人工智能工具处理个人、敏感或机密信息时请务必谨慎。你提交的任何数据都可能用于人工智能培训或其他目的。无法保证你提供的信息将得到安全或保密。在使用之前，你应该熟悉任何生成式人工智能工具的隐私惯例和使用条款。

Elastic、Elasticsearch 和相关标志是 Elasticsearch N.V. 的商标、徽标或注册商标。在美国和其他国家。所有其他公司和产品名称均为其各自所有者的商标、徽标或注册商标。