1.8k Star!RAGApp:在任何企业中使用 Agentic RAG 的最简单方法!

news2025/1/19 17:07:52

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传
原文链接:(更好排版、视频播放、社群交流、最新AI开源项目、AI工具分享都在这个公众号!)

1.8k Star!RAGApp:在任何企业中使用 Agentic RAG 的最简单方法!

🌟在任何企业中使用 Agentic(代理的) RAG 的最简单方法!配置起来与OpenAI 的自定义GPTs一样简单。

嘿,欢迎来到Aitrainee的频道。今天我要给大家介绍一个非常酷的新应用——RAGApp。

** RAGApp ** ,顾名思义,就是一个开源的 RAG 应用程序,可以让你和 PDF、DOC、电子表格等文档聊天。你可以用它来创建各种 RAG
代理,比如财务代理、股票代理、编码代理、一般聊天代理等等。使用它就像 ChatGPT 一样简单,几秒钟就能上手,而且它比 ChatGPT 更强大。
RAGApp 兼容多种平台,包括 Ollama(适用于本地模型) 、OpenAI、Groq、HuggingFace、Gemini
等等。你还可以用它连接 GPT-4O、Gemini 1.5 Pro 和 Gemini 1.5 Flash,以及 Mistral AI 的 Mixtral
8x22b、LLaMa、Gemini 和 OpenAI API。

配置起来与OpenAI 的自定义GPTs一样简单,但可以使用 Docker 在你自己的云基础架构中部署。使用LlamaIndex( LLM
应用程序的数据框架 开源项目 )构建。

▲ 配置起来与OpenAI 的自定义 GPT一样简单

教程&演示视频: 人工智能自动完成代码以免费创建软件!

油管博主: AlCodeKing / 字幕译:Aitrainee, 接在 这里

https://www.youtube.com/watch?v=V2tQVzyQiiY

开始使用

要运行 RAGapp,请使用镜像启动一个 Docker 容器:

docker run -p 8000:8000 ragapp/ragapp

启动容器后,在浏览器中访问 http://localhost:8000/admin 来配置 RAGapp。可以选择使用 OpenAI 或 Gemini
的托管 AI 模型,或者使用 Ollama 的本地模型。

端点

Docker 容器暴露以下端点:

  • 管理 UI: http://localhost:8000/admin

  • 聊天 UI: http://localhost:8000

  • API 文档: http://localhost:8000/docs

注意 : 聊天 UI 和 API 仅在 RAGapp 配置完成后才可用。

为了确保 RAGapp 的安全,建议在云环境中保护 /admin 路径,因为 RAGapp 本身不包含任何认证层。

部署

使用 Docker Compose

提供了一个 docker-compose.yml 文件,使得在自己的基础设施中轻松部署 RAGapp,并与 Ollama 和 Qdrant
一起使用。

可以通过 MODEL 环境变量指定要使用的模型,例如 llama3

MODEL=llama3 docker-compose up

如果未指定 MODEL 变量,将默认使用模型 phi3 ,该模型比 llama3 略弱,但下载速度更快。

注意 : docker-compose.yml 文件中的 setup 容器将把选定的模型下载到 ollama
文件夹中,这个过程可能需要几分钟。

还可以通过 OLLAMA_BASE_URL 环境变量指定要使用的 Ollama 主机。如果未指定 OLLAMA_BASE_URL
变量,默认指向 Docker Compose 启动的 Ollama 实例 ( http://ollama:11434 )。

如果使用的是本地 Ollama 实例,可以通过将 OLLAMA_BASE_URL 变量设置为 http://host.docker.internal:11434 来连接到 RAGapp:

MODEL=llama3 OLLAMA_BASE_URL=http://host.docker.internal:11434 docker-compose up

对于 macOS 用户,这是必要的,因为 Docker for Mac 不支持 GPU 加速。

Kubernetes

可以轻松地在自己的云基础设施中部署 RAGapp。定制的 Kubernetes 部署描述符即将推出,敬请期待。

开发

要进行开发,请按照以下步骤操作:

poetry install --no-root  
make build-frontends  
make dev

注意 : 在开发过程中查看管理 UI,请访问 http://localhost:3000/admin。

Github:https://github.com/ragapp/ragapp/

知音难求,自我修炼亦艰

抓住前沿技术的机遇,与我们一起成为创新的超级个体

(把握AIGC时代的个人力量)

**
**

** 点这里 👇 关注我,记得标星哦~ **

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

预览时标签不可点

微信扫一扫
关注该公众号

轻触阅读原文

AI进修生



收藏

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1719728.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

期末速成 ——计算机组成原理(2)数值的表示与运算

目录 一、定点数的表示 (一)无符号数和有符号数的表示 (二)机器数的定点表示 (三)原码、补码、反码、移码 (1)原码表示法 二、浮点数的表示 三、溢出判断 (一)采用一位符号位 (二)采用双符号位 四…

基于SSM的车辆租赁管理系统(含源码+sql+视频导入教程)

👉文末查看项目功能视频演示获取源码sql脚本视频导入教程视频 1 、功能描述 基于SSM的车辆租赁管理系统1拥有两种角色 管理员:用户管理、用户租车、用户换车和车辆入库、添加汽车、添加客户、生成出租单、客户选车、出租单管理、查询出租单、角色权限管…

如何格式化只读U盘?

U盘只读无法格式化,该怎么处理?别担心!本文将向你提供一些实用方法,助你解决U盘写保护的难题。这些方法能有效帮助你解除U盘的只读状态,从而可以顺利进行格式化和其他操作。 不能格式化只读U盘 “我购买了一个U盘&…

RK3588+FPGA+AI高性能边缘计算盒子,应用于视频分析、图像视觉等

搭载RK3588(四核 A76四核 A55),CPU主频高达 2.4GHz ,提供1MB L2 Cache 和 3MB L3 ,Cache提供更强的 CPU运算能力,具备6T AI算力,可扩展至38T算力。 产品规格 系统主控CPURK3588,四核…

官方正版 | FastCopy - Windows 上最快的文件复制&备份软件

『FastCopy 软件概述』 FastCopy 是一款高性能的文件复制和备份工具,专为 Windows 操作系统设计。它以其卓越的速度和丰富的功能,在用户中赢得了良好的声誉。以下是 FastCopy 的主要特点和优势: 速度优化:FastCopy 通过多线程、异…

20240531在飞凌的OK3588-C开发板上跑原厂的Buildroot测试ETH0接口【仅供参考】

20240531在飞凌的OK3588-C开发板上跑原厂的Buildroot测试ETH0接口 2024/5/31 20:28 rootrk3588-buildroot:/# ifconfig eth0 up rootrk3588-buildroot:/# ifconfig eth1 up rootrk3588-buildroot:/# ifconfig rootrk3588-buildroot:/# rootrk3588-buildroot:/# ifconfig eth1…

[深度学习]yolov10+deepsort+pyqt5实现目标追踪

YOLOv10DeepSORTPyQt5实现目标追踪系统 在现代智能监控系统中,目标追踪技术扮演着至关重要的角色。结合YOLOv10(一种先进的实时目标检测算法)与DeepSORT(一种多目标追踪算法),并通过PyQt5构建用户界面&…

tp6发送邮件有哪些步骤?如何配置tp6发信?

tp6发送邮件有安全风险吗?怎么测试tp6邮件发送功能? 无论是商业沟通、文件传输还是个人交流,电子邮件都是一种快捷且有效的方式。AokSend将详细介绍使用tp6发送邮件的具体步骤,帮助读者更好地掌握这一技能。 tp6发送邮件&#x…

【vue】@、@/、../和./的区别

:表示vue语法中v-on的简写;绑定事件的专用格式。当事件触发的时候,函数才会来调用; /:在build文件夹下webpack.base.conf.js找到,便能知道代表什么了; 这里指向src文件夹 . /:表示当前目录下&…

React useContext源码分析

React 框架中 useContext Hook 用于数据的传递,组件的数据传递有几种方式,通过 props、状态管理 和 useContext。本文将讲述useContext 在 React 是如何工作的,创建一个简单的 Context 例子并根据源码进行 Debug: 创建 context …

web 前端开发技术---网页的制作

这是一个网页代码 上年包含了电子邮件&#xff0c;选项建 等等 分享给大家 <!-- prj_7_1.html --> <!DOCTYPE html> <html lang"en"><head><meta charset"utf-8"><title>留言板设计</title><style type&…

安卓如何书写注册和登录界面

一、如何跳转一个活动 左边的是本活动名称&#xff0c; 右边的是跳转界面活动名称 Intent intent new Intent(LoginActivity.this, RegisterActivity.class); startActivity(intent); finish(); 二、如果在不同的界面传递参数 //发送消息 SharedPreferences sharedPreferen…

矩阵短视频:成都科成博通文化传媒公司

重塑内容生态与传播格局、在数字化时代&#xff0c;短视频以其独特的形式和高效的传播能力&#xff0c;迅速崛起并成为了社交媒体领域的明星。成都科成博通文化传媒公司​而“矩阵短视频”作为短视频领域的一种新兴策略&#xff0c;正以其独特的优势&#xff0c;逐渐重塑内容生…

OpenAI助手API接入-问答对自动生成

支持GPT-3.5-Turbo, GPT-4o, GPT-4-Turbo import json import openai from pathlib import Path import os client openai.OpenAI(base_urlbase_url, api_keyapi_key) file client.files.create( fileopen("H3.pdf", "rb"), purposeassistants ) …

利用GNSS IMU集成提高车道级定位精度

准确的定位对于很多不同的事情都是至关重要的。导航系统可以引导我们去某个地方&#xff0c;自动驾驶汽车可以利用这些数据在道路上安全行驶。尽管全球导航卫星系统(GNSS)在定位方面非常出色&#xff0c;但它们可能并不总是提供最准确的车道水平事实。解决这个问题的一个有希望…

【linux】docker下nextcloud安装人脸识别插件2

接上文 【linux】docker下nextcloud安装人脸识别插件-CSDN博客 由于作者不再维护此插件&#xff0c;转而开发新的插件 recognize &#xff0c;因此同步更新插件使用教程。 1、下载人脸识别app&#xff1a;recognize Recognize - Apps - App Store - Nextcloud 2、将插件recog…

鸿蒙开发接口媒体:【@ohos.multimedia.medialibrary (媒体库管理)】

媒体库管理 说明&#xff1a; 该组件从API Version 6开始支持。后续版本如有新增内容&#xff0c;则采用上角标单独标记该内容的起始版本。 发前请熟悉鸿蒙开发指导文档&#xff1a; gitee.com/li-shizhen-skin/harmony-os/blob/master/README.md点击或者复制转到。 导入模块 …

SAP-FI和SD的集成逻辑

FI_AR应收账款 1. 销售业务流程概览 2. SD模块组织架构 3. SAP与金税系统开票过程介绍 4. SD后台基本环境搭建 后台配置:请参照文档“01 SD_后台配置清单_V1.0” 5. 客户主数据 客户主数据相关事务代码: FD01(FI模块单个) FD02(OB20

Redis常用命令大全

目录 1、五大数据类型的基本命令 1.1 字符串 1.2 列表 1.3 哈希 1.4 集合 1.5 有序集合 2、与key相关 2.1 查看redis数据的类型 2.2 查看当前redis库中的所有key命令 3、除了五大数据类型外常见命令 3.1 键操作 3.2 服务器操作 3.3 连接操作 3.4 发布/订阅 3.5 事…

神经网络与深度学习——第5章 卷积神经网络

本文讨论的内容参考自《神经网络与深度学习》https://nndl.github.io/ 第5章 卷积神经网络 卷积神经网络 卷积 卷积的定义 一维卷积 二维卷积 互相关 卷积的变种 卷积的数学性质 交换性 导数 卷积神经网络 用卷积来代替全连接 卷积层 汇聚层 卷积网络的整体结构 参数学习 卷…