使用 Vertex AI Gemini 模型和 Elasticsearch Playground 快速创建 RAG 应用程序

news2025/2/3 22:05:08

作者:来自 Elastic Jeff Vestal

在这篇博客中,我们将使用 Elastic 的 Playground 和 Vertex AI API 将 Elasticsearch 连接到 Google 的 Gemini 1.5 聊天模型。将 Gemini 模型添加到 Playground 使 Google Cloud 开发人员能够快速建立 LLM、测试检索、调整分块并使用 Elastic 将 gen AI 搜索应用程序交付到生产环境。

你需要一个启动并运行的 Elasticsearch 集群。我们将在 Elastic Cloud 上使用 serverless 项目。如果你没有帐户,可以注册免费试用。

你还需要一个启用了 Vertex AI 的 Google Cloud 帐户。如果你没有 Google Cloud 帐户,可以注册免费试用。

配置 Vertex AI

首先,我们将配置一个 Vertex AI 服务帐户,这将允许我们安全地从 Elasticsearch 向 Gemini 模型进行 API 调用。你可以按照此处 Google Cloud 文档页面上的详细说明进行操作,但我们将介绍要点。

转到 Google Cloud 控制台的 “ Create Service Account” 部分。在那里,选择已启用 Vertex AI 的项目。

接下来,为你的服务帐户命名,并可选地提供描述。点击 “Create and Continue”。

为你的项目设置访问控制。对于本博客,我们使用了 “Vertex AI User” 角色,但你需要确保你的访问控制适合你的项目和帐户。

单击 “Done”。

Google Cloud 中的最终设置是为服务帐户创建 API 密钥并以 JSON 格式下载。

单击服务帐户中的 “KEYS”,然后单击 “ADD KEY” 和 “Create New”。

确保选择 “json” 作为密钥类型,然后单击 “CREATE”。

密钥将被创建并自动下载到你的计算机。我们将在下一节中需要此密钥。

从 Playground 连接到你的 LLM

配置 Google Cloud 后,我们可以继续在 Elastic 的 Playground 中配置 Gemini LLM 连接。

本博客假设你已经在 Elasticsearch 中拥有要与 Playground 一起使用的数据。如果没有,请按照搜索实验室博客 Playground:在几分钟内使用 Elasticsearch 试验 RAG 应用程序以开始使用。

在 Kibana 中,从侧面导航菜单中选择 Playground。在 Serverless 中,它位于 “Build” 标题下。首次打开时,你可以选择 “Connect to an LLM”。

选择 “Google Gemini”

填写表格以完成配置。

打开上一节创建并下载的 JSON 凭证文件,复制完整的 JSON,并将其粘贴到 “Credentials JSON” 部分。然后点击 “Save

现在是 Playground 时间!

Elastic 的 Playground 允许你在集成到完整代码之前尝试 RAG 上下文设置和系统提示。

通过在与模型聊天时更改设置,你可以看到哪些设置将为你的应用程序提供最佳响应。

此外,配置搜索 Elasticsearch 数据中的哪些字段以将上下文添加到你的聊天完成请求中。添加上下文将有助于巩固模型并提供更准确的响应。

此步骤使用 Elastic 的 ELSER 稀疏嵌入模型(内置),通过语义搜索检索上下文,并将其传递给 Gemini 模型。

就这些(目前)

对话式搜索是一个令人兴奋的领域,开发人员正在使用强大的大型语言模型(例如 Google Vertex AI 提供的模型)来构建新的体验。Playground 简化了原型设计和调整过程,使你能够更快地交付应用程序。

探索更多使用 Elasticsearch 和 Google Vertex AI 构建的想法,祝你搜索愉快!

准备好自己尝试一下了吗?开始免费试用。
想要获得 Elastic 认证吗?了解下一期 Elasticsearch 工程师培训何时开始!

原文:Quickly iterate chat apps on Elasticsearch playground with Google Cloud Gemini models — Search Labs

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2191319.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

开源的云平台有哪些?

开源云平台为用户提供了构建、管理和运行云基础设施及应用的能力,同时允许社区参与开发和改进。以下是一些知名的开源云平台: 1. OpenStack 简介:OpenStack:一个广泛使用的开源云平台,它由多个组件组成,提…

PriorityQueue分析

概述 PriorityQueue,优先级队列,一种特殊的队列,作用是能保证每次取出的元素都是队列中权值最小的(Java的优先队列每次取最小元素,C的优先队列每次取最大元素)。元素大小的评判可以通过元素本身的自然顺序…

linux信号 | 学习信号四步走 | 透析信号是如何被处理的?

前言:本节内容讲述linux信号的捕捉。 我们通过前面的学习, 已经学习了信号的概念, 信号的产生, 信号的保存。 只剩下信号的处理。 而信号的处理我们应该着重注意的是第三种处理方式——信号的捕捉。 也就是说, 这篇文章…

基于yolov8的100种蝴蝶智能识别系统python源码+pt模型+训练日志+精美GUI界面

【算法介绍】 基于YOLOv8的100种蝴蝶智能识别系统是一个结合了深度学习和人工智能技术的先进工具,旨在提高生物多样性监测和保护领域的效率和精确度。该系统利用YOLOv8深度学习算法,通过9955张图片的训练,能够准确识别100种不同的蝴蝶类型&a…

15分钟学 Python 第37天 :Python 爬虫入门(三)

Day 37 : Python爬虫入门大纲 章节1:Python爬虫概述 1.1 什么是爬虫? 网页爬虫(Web Crawler)是一种自动访问互联网上网页并提取数据的程序。爬虫的作用包括搜索引擎索引内容、市场调查、数据分析等。 1.2 爬虫的工作原理 发起…

深入探究:在双链表指定元素的后面进行插入操作的顺序

归纳编程学习的感悟, 记录奋斗路上的点滴, 希望能帮到一样刻苦的你! 如有不足欢迎指正! 共同学习交流! 🌎欢迎各位→点赞 👍 收藏⭐ 留言​📝惟有主动付出,才有丰富的果…

Redis篇(缓存机制 - 分布式缓存)(持续更新迭代)

目录 一、单点 Redis 的问题 1. 数据丢失问题 2. 并发能力问题 3. 故障恢复问题 4. 存储能力问题 5. 四种问题的解决方案 二、Redis持久化(两种方案) 1. RDB持久化 1.1. 简介 1.2. 执行时机 save命令 bgsave命令 停机时 触发RDB条件 1.3. …

SpringMVC项目的创建和使用

1.新建module,名称叫02_springmvc   2.新建文件夹web   3.点击确定,就会看到如下图,idea自动给我们创建了web.xml   这时候web文件夹多一个小点点的标识 &am…

OS_过程调用与系统调用

2024.06.25:操作系统过程调用与系统调用学习笔记 第5节 过程调用与系统调用 5.1 过程调用/函数调用/子程序调用5.2 系统调用5.2.1 系统调用汇编层 5.3 过程调用与系统调用的对比 5.1 过程调用/函数调用/子程序调用 (过程调用)也称为&#xf…

SpringBoot框架下校园资料库的构建与优化

1系统概述 1.1 研究背景 如今互联网高速发展,网络遍布全球,通过互联网发布的消息能快而方便的传播到世界每个角落,并且互联网上能传播的信息也很广,比如文字、图片、声音、视频等。从而,这种种好处使得互联网成了信息传…

【Conda】修复 Anaconda 安装并保留虚拟环境的详细指南

目录 流程图示1. 下载 Anaconda 安装程序2. 重命名现有的 Anaconda 安装目录Windows 操作系统Linux 操作系统 3. 运行新的 Anaconda 安装程序Windows 操作系统Linux 操作系统 4. 同步原环境使用 robocopy 命令(Windows)使用 rsync 命令(Linux…

CUDA与TensorRT学习四:模型部署基础知识、模型部署的几大误区、模型量化、模型剪枝、层融合

文章目录 一、模型部署基础知识1)FLOPS和TOPS定义介绍、计算公式(1)基础定义(2)计算公式(3)FLOPS在GPU试怎么运算?(4)Ampere SM的电子元件结构 2)…

【小沐学GIS】blender导入OpenTopography地形数据(BlenderGIS、OSM、Python)

文章目录 1、简介1.1 blender1.2 OpenStreetMap地图 2、BlenderGIS2.1 下载BlenderGIS2.2 安装BlenderGIS2.3 申请opentopography的key2.4 抓取卫星地图2.5 生成高度图2.6 获取OSM数据 结语 1、简介 1.1 blender https://www.blender.org/ Blender 是一款免费的开源 3D 创作套…

[uni-app]小兔鲜-07订单+支付

订单模块 基本信息渲染 import type { OrderState } from /services/constants import type { AddressItem } from ./address import type { PageParams } from /types/global/** 获取预付订单 返回信息 */ export type OrderPreResult {/** 商品集合 [ 商品信息 ] */goods: …

微信小程序地理定位与逆地址解析详解

地理定位 1 原理与思路 在微信小程序中,地理定位功能可以通过调用微信提供的API接口来实现。这些接口允许我们获取用户的当前位置或者让用户通过地图选择位置。获取到位置信息后,我们可以使用逆地址解析来获取详细的地址信息,如省、市、区、…

CUDA安装教程

文章目录 一、CUDA的下载和安装1.1 查看NVIDIA适配CUDA版本1.2 下载CUDA Toolkit1.3 安装CUDA 二、环境配置三、查看是否安装成功 一、CUDA的下载和安装 CUDA在深度学习中允许开发者充分利用NVIDIA GPU的强大计算能力来加速深度学习模型的训练和推理过程。 1.1 查看NVIDIA适配…

15分钟学 Python 第39天:Python 爬虫入门(五)

Day 39:Python 爬虫入门数据存储概述 在进行网页爬虫时,抓取到的数据需要存储以供后续分析和使用。常见的存储方式包括但不限于: 文件存储(如文本文件、CSV、JSON)数据库存储(如SQLite、MySQL、MongoDB&a…

多模态理论基础——什么是多模态?

文章目录 多模态理论1.什么是多模态(multimodal)2.深度学习中的多模态 多模态理论 1.什么是多模态(multimodal) 模态指的是数据或者信息的表现形式,如文本、图像、音频、视频等 多模态指的是数据或者信息的多种表现…

算法笔记(十)——队列+宽搜

文章目录 N 叉数的层序遍历二叉树的锯齿形层序遍历二叉树最大宽度在每个树行中找最大值 BFS是图上最基础、最重要的搜索算法之一; 每次都尝试访问同一层的节点如果同一层都访问完了,再访问下一层 BFS基本框架 void bfs(起始点) {将起始点放入队列中;标记…

一款基于.NET开发的简易高效的文件转换器

前言 今天大姚给大家分享一款基于.NET开发的免费(GPL-3.0 license)、简易、高效的文件转换器,允许用户通过Windows资源管理器的上下文菜单来转换和压缩一个或多个文件:FileConverter。 使用技术栈 ffmpeg:作为文件转换…