Java通过RAG构建专属知识问答机器人_超详细

news2024/10/12 3:37:53

RAG:融合检索与生成的文本精准生成技术

检索增强生成(RAG)是一种技术,它通过结合检索模型和生成模型来提高文本生成的准确性。具体来说,RAG首先利用检索模型从私有或专有的数据源中搜索相关信息,然后将这些信息提供给生成模型,如大型语言模型(LLM),以生成更加准确、基于上下文的回复。这种方法有助于减少大模型在生成过程中可能出现的“幻觉”现象,并且能够使模型的回答更贴合企业的特定数据,从而提高了回答的精确度与相关性。这样,在使用大模型时,即使面对企业特有的知识或数据,也能获得更为精准的答案。

Spring AI:提升Java AI开发效率与灵活性的解决方案

我们使用了Spring AI来做这个检索增强。

之所以选择Spring AI,是因为在过去用Java编写AI应用时面临的一个主要困境是没有非常标准的Java封装。

现在,Spring项目推出了一套可以兼容市面上主要各类生成任务的接口——Spring AI,极大地解决了这一问题。

Spring AI通过标准化不同AI提供者的接口实现,使得开发者能够一次编写代码,仅通过修改配置即可轻松切换不同的AI实现。

同时,它直接兼容Flux流输出,简化了与基于流的机器人模型的集成。通过良好的抽象设计,Spring AI显著减少了程序员在对接不同类型接口时查阅文档和迁移实现的工作量,为基于Java的AI开发带来了极大的便利性和效率提升。因此,采用Spring AI不仅提高了开发效率,还增强了项目的可维护性与灵活性。

Spring生态AI框架:Spring AI Alibaba,赋能Java开发者高效对接多AI服务商

Spring AI Alibaba 是基于 Spring 生态系统设计的用于AI工程的应用框架,特别适合 Java 和 Spring Boot 开发者。它通过提供一套统一的抽象接口,标准化了不同AI服务提供商(如阿里云、OpenAI等)的接入方式,使得开发者能够轻松切换AI服务而无需大幅改动代码。此外,Spring AI Alibaba 集成了阿里云百炼系列的多个模型,支持对话、文本生成图像等功能,并提供了诸如Prompt Template等实用工具来简化开发过程。其核心优势在于极大提高了AI应用开发的效率与灵活性,同时保持了与现有Java Spring Boot项目的良好兼容性。

增强检索:打造PDF财务报表查询后端代码

为了通过检索增强的方式读取一个阿里巴巴的财务报表PDF并提供对外服务,我们需要按照以下步骤进行:

1. 确保前置条件

  • JDK版本:确保你的JDK版本在17及以上。
  • Spring Boot版本:确认使用的Spring Boot版本为3.3.x或更高。
  • API Key申请:访问阿里云百炼页面,登录账号后开通“百炼大模型推理”服务,并创建一个新的API Key。将此Key配置到环境变量中:
export AI_DASHSCOPE_API_KEY=YOUR_VALID_API_KEY

并且,在application.properties文件里添加:

spring.ai.dashscope.api-key: ${AI_DASHSCOPE_API_KEY}

2. 添加仓库与依赖

由于spring-ai-alibaba-starter尚未发布到Maven中央仓库,因此需要在项目的pom.xml文件中添加如下仓库设置来支持获取最新快照版本及里程碑版本:

<repositories>
    <repository>
        <id>sonatype-snapshots</id>

        <url>https://oss.sonatype.org/content/repositories/snapshots</url>

        <snapshots>
            <enabled>true</enabled>

        </snapshots>

    </repository>

    <repository>
        <id>spring-milestones</id>

        <name>Spring Milestones</name>

        <url>https://repo.spring.io/milestone</url>

        <snapshots>
            <enabled>false</enabled>

        </snapshots>

    </repository>

    <repository>
        <id>spring-snapshots</id>

        <name>Spring Snapshots</name>

        <url>https://repo.spring.io/snapshot</url>

        <releases>
            <enabled>false</enabled>

        </releases>

    </repository>

</repositories>

然后添加必要的依赖项:

<dependencies>
    <dependency>
        <groupId>com.alibaba.cloud.ai</groupId>

        <artifactId>spring-ai-alibaba-starter</artifactId>

        <version>1.0.0-M2</version>

    </dependency>

    <!-- 其他依赖 -->
</dependencies>

3. 编写RAG服务相关代码

首先定义RagService类用于处理索引构建和查询逻辑。这包括向量存储、文档检索器以及如何使用这些组件来处理来自客户端的请求。

public class RagService {

    private final ChatClient chatClient;
    private final VectorStore vectorStore;
    private final DashScopeApi dashscopeApi = new DashScopeApi("您的API密钥");
    DocumentRetriever retriever;

    public RagService(ChatClient chatClient, EmbeddingModel embeddingModel) {
        this.chatClient = chatClient;
        vectorStore = new DashScopeCloudStore(dashscopeApi,
                new DashScopeStoreOptions("阿里巴巴财报知识库"));
        retriever = new DashScopeDocumentRetriever(dashscopeApi,
                DashScopeDocumentRetrieverOptions.builder().withIndexName("阿里巴巴财报知识库").build());
    }

    // 构建索引
    public String buildIndex() {
        String filePath = "/path/to/your/financial_report.pdf";
        DocumentReader reader = new DashScopeDocumentCloudReader(filePath, dashscopeApi, null);
        List<Document> documentList = reader.get();
        vectorStore.add(documentList);
        return "SUCCESS";
    }

    // 查询方法
    public StreamResponseSpec queryWithDocumentRetrieval(String message) {
        StreamResponseSpec response = chatClient.prompt().user(message)
                .advisors(new DocumentRetrievalAdvisor(retriever, DEFAULT_USER_TEXT_ADVISE)).stream();
        return response;
    }
}

4. 创建Controller以暴露REST API

最后,我们需要创建一个控制器类来接收HTTP请求,并调用之前定义的服务方法。

@RestController
@RequestMapping("/ai")
public class RagController {

    private final RagService ragService;

    public RagController(RagService ragService) {
        this.ragService = ragService;
    }

    @GetMapping("/steamChat")
    public Flux<String> generate(@RequestParam(value = "input", defaultValue = "2024年6月止,云智能集团的营收是多少?") String input, HttpServletResponse httpResponse) {
        StreamResponseSpec chatResponse = ragService.queryWithDocumentRetrieval(input);
        httpResponse.setCharacterEncoding("UTF-8");
        return chatResponse.content();
    }

    @GetMapping("/buildIndex")
    public String buildIndex() {
        return ragService.buildIndex();
    }
}

通过上述步骤,我们实现了基于Spring Cloud Alibaba框架下的检索增强功能,能够从指定的PDF文件中提取信息并通过HTTP接口返回给用户。需要注意的是,在实际部署前,请确保已经完成了所有必要的环境配置,特别是关于API密钥的安全管理和正确配置。

构建React流式聊天应用:从零开始的实现攻略


基于提供的知识,我们可以分析出构建一个支持流式输出的前端项目需要遵循一定的步骤。这里的项目将使用React框架来创建,并与后端服务进行交互以处理用户输入并显示响应。后端接口返回的是flux<String>数据类型,这意味着客户端能够以渐进的方式接收和展示信息,而非等待全部数据加载完毕后再一次性展示。

分析

从给出的知识来看,我们已经有了关于如何设置基础React环境、以及如何处理流式数据请求的具体示例。这些例子非常适合用来作为本问题解决方案的基础。接下来将详细介绍如何根据要求实现这样一个前端应用。

实现步骤

首先,确保你已经安装了Node.js和npm(或yarn),然后按照以下步骤操作:

  1. 初始化一个新的React应用
npx create-react-app rag-chat-frontend
cd rag-chat-frontend
npm install
  1. 修改public/index.html文件(如果需要自定义HTML头部等信息):不过在这个案例中,我们可以直接使用默认生成的内容。
  1. 更新src/index.js以引入应用程序入口点:
import React from 'react';
import ReactDOM from 'react-dom';
import App from './App';

ReactDOM.render(
  <React.StrictMode>
    <App />
  </React.StrictMode>,
  document.getElementById('root')
);
  1. 编写主组件src/App.js:
import React from 'react';
import ChatComponent from './components/ChatComponent';

function App() {
  return (
    <div className="App">
      <ChatComponent />
    </div>

  );
}

export default App;
  1. 创建聊天组件src/components/ChatComponent.js 来处理用户输入及流式数据接收:
import React, { useState } from 'react';

function ChatComponent() {
  const [input, setInput] = useState('');
  const [messages, setMessages] = useState('');

  const handleInputChange = (event) => {
    setInput(event.target.value);
  };

  const handleSendMessage = async () => {
    try {
      const response = await fetch(`http://localhost:8080/ai/steamChat?input=${input}`);
      if (!response.ok) throw new Error('Network response was not ok');
      const reader = response.body.getReader();
      const decoder = new TextDecoder('utf-8');
      let done = false;

      while (!done) {
        const { value, done: readerDone } = await reader.read();
        done = readerDone;
        const chunk = decoder.decode(value, { stream: true });
        setMessages((prevMessages) => prevMessages + chunk);
      }
      setMessages((prevMessages) => prevMessages + '\n\n=============================\n\n');
    } catch (error) {
      console.error('Failed to fetch', error);
    }
  };

  return (
    <div>
      <input
        type="text"
        value={input}
        onChange={handleInputChange}
        placeholder="Enter your message"
      />
      <button onClick={handleSendMessage}>Send</button>

      <div>
        <h3>Messages:</h3>

        <pre>{messages}</pre>

      </div>

    </div>

  );
}

export default ChatComponent;
  1. 启动你的React应用:
npm start

这将打开浏览器并自动导航到 http://localhost:3000/ ,你可以在这里测试你的聊天界面。

小结

通过上述步骤,我们建立了一个基本的聊天应用程序界面,它可以通过发送GET请求至指定URL (http://localhost:8080/ai/steamChat) 来与后端通信。该请求会携带用户的输入文本参数。当后端开始流式地返回数据时,前端应用程序会逐步解析这些数据片段,并即时更新显示给用户。这种方式非常适合于实时性较强的场景,如在线聊天或实时问答系统。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2206762.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

day-63 优质数对的总数 II

思路 nums1[i] 可以被 nums2[j] * k 整除,所以nums[i]/k的所有因子都符合条件&#xff0c;问题转换为遍历nums1,统计nums[i]/k的因子出现次数&#xff0c;然后遍历nums2&#xff0c;如果nums2[i]是某一个因子&#xff0c;将其出现次数加入答案中即可 解题过程 利用哈希表统计出…

2024年第三季度Sui DeFi总结

受益于Sui上一系列基础性发展的推动&#xff0c;DeFi流动性和网络性能在2024年Q3得到了显著提升。Sui新的共识引擎Mysticeti开始在网络上推广&#xff0c;极大地降低了延迟&#xff0c;并使交易得以快速确认。新的原生桥接工具Sui Bridge也在测试后正式上线&#xff0c;使得Sui…

睿考网:2025年中级会计师考试备考

有准备的人已经开始备考25年中级会计师考试了&#xff0c;关于25年中会考试&#xff0c;这些信息提前了解一下! 25年中级会计报名条件和报考关键时间 一、报考条件&#xff1a; 1.具备大学专科学历&#xff0c;从事会计工作满5年。 2.具备大学本科学历或学士学位&#xff0…

我的2023,一个创业者的自述与思考(3)

前言 计划是每年都会写一篇总结&#xff0c;但是很遗憾去年因为不可控的原因没有写&#xff0c;今年正常的对2023年做一个总结&#xff0c;总结的目的是为了给自己一个时间节点&#xff0c;告诉自己一年结束了&#xff0c;新的一年又要开始&#xff0c;同时也是向关心我的亲人、…

VMware vCenter Server 8.0U3c 发布下载,修复 U3b 更新停止响应的问题

VMware vCenter Server 8.0U3c 发布下载 - 集中式管理 vSphere 环境 Server Management Software | vCenter 请访问原文链接&#xff1a;https://sysin.org/blog/vmware-vcenter-8-u3/ 查看最新版。原创作品&#xff0c;转载请保留出处。 作者主页&#xff1a;sysin.org VMw…

3节点kafka关闭leader后消费不正常,丢失接收不了消息?

关键配置&#xff1a; "topic": "__consumer_offsets"的副本数 /opt/kafka/kafka_2.13-3.8.0/config 在初始化搭建的时候&#xff0c;注意修改红色的部分内容&#xff1a;&#xff08;3个节点&#xff09; [rootk1 config]# cat server.properties |gre…

数据结构 -- 跳表

文章目录 概要跳表的结构跳表的查找过程插入操作删除操作补充 概要 跳表&#xff08;Skip List&#xff09;是一种基于链表的数据结构&#xff0c;通过增加多级索引来加速查找、插入和删除操作。它可以看作是链表与二分查找的结合体&#xff0c;能够在保持数据有序的同时&…

使用IMX6UL定时器EPTI实现延时

上一节&#xff0c;我们讲解了如何使用Imx6uL上面的定时器EPTI&#xff0c;这一节我们将使用EPTI进行实战&#xff0c;也就是使用定时器的效果来使用延时 在之前的实验中我们都使用到了按键&#xff0c;用到按键就要处理因为机械结构带来的按键抖动问题&#xff0c;也就是按键消…

ELK:Elasticsearch、Logstash、Kibana Spring Cloud Sleuth和Spring Cloud Zipkin

〇、虚拟机中docker安装elasticsearch 、Kibana、Logstash elasticsearch导入中文分词器 Logstash修改es数据库ip及创建索引名配置 一、elasticsearch数据库的结构 和mysql作比较&#xff0c;mysql中的数据库的二维表相当于es数据库的index索引结构&#xff1b;mysql数据库的二…

Java_EE ( IO 流技术)

什么是IO输入(Input)指的是&#xff1a;可以让程序从外部系统获得数据&#xff08;核心含义是“读”&#xff0c;读取外部数据&#xff09;。输出(Output)指的是&#xff1a;程序输出数据给外部系统从而可以操作外部系统&#xff08;核心含义是“写”&#xff0c;将数据写出到外…

七言-重阳寄友

题 记 九九重阳节&#xff0c;岁岁嵌在仲秋季节里&#xff0c;人们的心情也便随着气温的下降而逐渐地沉静下来。 丰收的喜悦洋溢在山水和田野之间。金黄的稻穗低垂着头&#xff0c;仿佛在向大地母亲致以最深情的敬意。 果园里&#xff0c;沉甸甸的苹果、梨子挂满枝头&#…

职场上的人情世故你知多少

1.发微信找人帮忙&#xff0c;半天不回&#xff0c;那基本没戏了&#xff0c;不要再打扰了&#xff0c;懂得都懂。 2.能力越大&#xff0c;事情越多&#xff0c;要懂得张弛有度&#xff0c;不要把自己全抛出去&#xff0c;给自己留点余地&#xff0c;毕竟你不知道别人如何暗地…

关于电动车新国标要求的北斗定位功能资料

一、安装及接口 电动自行车应内置北斗定位模块&#xff0c;安装于电动自行车不易损坏的固定部件中。定位装置所采用的芯片或模组应支持UAR或SPI接口至少支持接收处理北斗 B1C和B2a信号 二、定位检测环境 应具备接收实际卫星信号并进行电动自行车整车运行状态下检测的实验室条件…

【Axure安装包与汉化包附带授权证书】

一、下载Axure安装包与汉化包附带授权证书 1.下载汉化包 【快传】: 点击链接即可保存 2.解压安装包 解压下载好的压缩包&#xff0c;能看到有lang也就是汉化包&#xff0c;AxureRP-Setup-RC.exe 也就是Axure9的安装程序&#xff0c;以及汉化说明和授权码。 二、安装Axure9…

机器人末端的负载辨识

关节处的摩擦力变小了&#xff0c;导致系统的参数辨识精度会变高&#xff0c;因为动力学方程中的摩擦力项占的比例会变小。 为什么要有一个负载的参数辨识&#xff0c;因为对于整个系统来说&#xff0c;除了负载哈&#xff0c;其他关节都是不变的&#xff0c;出厂时都设置好了&…

用YOLOv5跑口罩佩戴识别时的一些问题解决

文章目录 1. 问题12. 问题23. 问题3 1. 问题1 1. 报错&#xff1a;TypeError: No loop matching the specified signature and casting was found for ufunc greater. 2. 原因&#xff1a;版本不兼容。 3. 解决&#xff1a; 先查看当前的 numpy 版本&#xff1a;pip list卸载当…

【动手学深度学习】5.2 参数管理(个人向笔记+代码注释)

之前的课程中&#xff0c;我们只是通过深度学习框架完成训练的工作&#xff0c;而忽略了操作参数的具体细节。所以我们我们介绍的内容有&#xff1a; 访问参数&#xff0c;用于调试&#xff0c;诊断和可视化参数初始化在不同的模型组件间共享参数 下面是一个有单隐藏层的多层感…

基于Python flask的豆瓣电影可视化系统,豆瓣电影爬虫系统

博主介绍&#xff1a;✌Java徐师兄、7年大厂程序员经历。全网粉丝13w、csdn博客专家、掘金/华为云等平台优质作者、专注于Java技术领域和毕业项目实战✌ &#x1f345;文末获取源码联系&#x1f345; &#x1f447;&#x1f3fb; 精彩专栏推荐订阅&#x1f447;&#x1f3fb; 不…

猿人学 — 第1届第17题(解题思路附源码)

猿人学 — 第1届第17题 根据题目“天杀的Http2.0”大概知道&#xff0c;请求的协议应该遵照的是Http2.0协议&#xff0c;并且目标网站专门对此进行了检测&#xff0c;在Network面板中右键表头&#xff0c;勾选Protocol 果不其然&#xff0c;一堆请求都是遵照Http2.0协议。而u…

2023年4月自考《数据库系统原理》04735试题

目录 一:选择题 二:填空题 三:设计题 四:简答题 五:综合题 一:选择题 1.在数据库系统中&#xff0c;专门用户建立和管理数据的软件是 (书中)P28页 A.DBS B.DB C.DBA D.DBMS 2.通常所说的数据库系统容不包括 (书中)P29页 A.应用程序 B.数据库管理员 C.用户 D.网络环境 …