AI检索增强生成引擎-RAGFlow-深度理解知识文档,提取真知灼见

news2024/9/26 1:24:28

💡 RAGFlow 是什么?

1f5e07904268ea3dfa8c232810933b83.jpegRAGFlow是一款基于深度文档理解构建的开源RAG(Retrieval-Augmented Generation)引擎。RAGFlow个人可以为各种规模的企业及提供一套专业的RAG工作流程,结合针对用户群体的大语言模型(LLM)不同的复杂格式数据提供可靠的问答以及有理有据的引用。

开源地址

c866fd7350fc6f4faf430d3b9f813e73.jpeghttps://github.com/infiniflow/ragflow/https://ragflow.io/

🌟主要功能

4c58d06916d4381e39d6d67e3367ce75.jpeg

  • 基于深度文档理解,能够从各种复杂格式的非重构数据中提取真知灼见。
  • 真正在无限上下文(代币)的场景接下来完成快速大海捞针测试。

最大程度降低幻觉(幻觉)

2f4949226d6599a81e304f46f811298c.jpeg

  • 文本切片过程可视化,支持手动调整。
  • 有理有据:答案提供了快照的关键引用并支持追根溯源。

🍔兼容多种数据源

202dad023946cceda3d4cde5585502ea.jpeg

  • 支持丰富的文件类型,包括Word文档、PPT、excel表格、txt文件、图片、PDF、影印件、格式、格式化数据、网页等。

🛀全程无忧、自动化的RAG工作流程

  • 全面优化的RAG工作流程可以支持从个人应用其实超大型企业的群体生态系统。
  • 大语言模型LLM以及提供模型均支持配置。
  • 基于多路召回、融合重排序。
  • 提供易用的API,可以轻松集成到各类企业系统。

🔎系统架构

84d4fcf0985fff43424df2553b144a60.jpeg

🎬快速开始

📝 前提条件

  • CPU >= 4 核
  • 内存 >= 12 GB
  • Docker >= 24.0.0 & Docker Compose >= v2.26.1
  • 如果您并没有在本机安装 Docker(Windows、Mac,或者 Linux),可以参考文档安装 Docker Engine自行安装。

🚀启动服务器

确认vm.max_map_count的大小:$ sysctl vm.max_map_count如果vm.max_map_count的值小于262144,可以进行重置:# 这里我们设为 262144:
$ sudo sysctl -w vm.max_map_count=262144你的初始化会在下次系统重启时被重置。如果希望做永久保存,还需要在/etc/sysctl.conf文件里把vm.max_map_count的值再相应更新一遍:vm.max_map_count=262144克隆仓库:$ git clone https://github.com/infiniflow/ragflow.git进入docker文件夹,利用提前编译好的Docker镜像启动服务器:$ cd ragflow/docker
$ chmod +x ./entrypoint.sh
$ docker compose -f docker-compose-CN.yml up -d核心镜像文件大约15GB,可能需要一定时间提取。请等待。服务器启动成功后再次确认服务器状态:$ docker logs -f ragflow-server出现以下界面提示说明服务器启动成功: ____ ______ __
/ __ \ ____ _ ____ _ / ____// /____ _ __
/ /_/ // __ `// __ `// /_ / // __ \| | /| / /
/ _, _// /_/ // /_/ // __/ / // /_/ /| |/ |/ /
/_/ |_| \__,_/ \__, //_/ /_/ \____/ |__/|__/
/____/

* Running on all addresses (0.0.0.0)
* Running on http://127.0.0.1:9380
* Running on http://x.x.x.x:9380
INFO:werkzeug:Press CTRL+C to quit在你的浏览器中输入你的服务器的IP地址并登录RAGFlow。

  1. 上面这个例子中,您只需输入 http://IP_OF_YOUR_MACHINE 即可:未配置过配置则消耗输入端口(默认的 HTTP 服务端口 80)。
  2. 在service_conf.yaml文件的user_default_llm栏配置LLM工厂,并在API_KEY栏填写和你选择的大模型相对应的API密钥。
  3. 好戏开始,接着奏乐接着舞!

🛠️ 源码编译、安装 Docker 镜像

$ git clone https://github.com/infiniflow/ragflow.git
$ cd ragflow/
$ docker build -t infiniflow/ragflow:v0.3.0 .
$ cd ragflow/docker
$ chmod +x ./entrypoint.sh
$ docker compose up -d

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1615573.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

玩转 AIGC!使用 SD-WebUI 实现从文本到图像转换

节前,我们组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、参加社招和校招面试的同学,针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。 基于大家…

500道Python毕业设计题目推荐,附源码

博主介绍:✌程序员徐师兄、7年大厂程序员经历。全网粉丝12w、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 🍅文末获取源码联系🍅 👇🏻 精彩专栏推荐订阅👇…

Quick Service Setup(快速服务设置)

Quick Service Setup界面使用户能够使用最少的参数快速配置和编辑简单的应用程序服务。Alteon自动为虚拟服务创建所需的对象(虚拟服务器、服务器组、真实服务器、SSL策略、FastView策略等)。通过快速服务设置,您可以配置HTTP, HTTPS,基本slb(第4层TCP或U…

BootstrapAdmin Net7:基于RBAC的后台管理框架,实现精细化权限管理与多站点单点登录

BootstrapAdmin Net7:基于RBAC的后台管理框架,实现精细化权限管理与多站点单点登录 摘要 随着企业信息化建设的不断深入,后台管理系统在企业运营中扮演着越来越重要的角色。本文介绍了一款基于RBAC(Role-Based Access Control)的…

海外媒体如何发布软文通稿

大舍传媒-带您了解海外发布新潮流 随着全球化的不断深入,越来越多的中国企业开始关注海外市场。为了在国际舞台上树立品牌形象,企业纷纷寻求与海外媒体合作,通过发布软文通稿的方式,传递正面信息,提升品牌知名度。作为…

算法导论 总结索引 | 第三部分 第十一章:散列表

1、动态集合结构,它至少要支持 INSERT、SEARCH 和 DELETE字典操作 散列表 是实现字典操作的 一种有效的数据结构。尽管 最坏情况下,散列表中 查找一个元素的时间 与链表中 查找的时间相同,达到了 Θ(n)。在实际应用中,散列表的性…

制造业降本,为什么要关注流程挖掘?

不同于传统制造,智能制造企业数字化启动早、程度高,却总因“集成陷阱”无法摆脱业财协同差的问题。长期的“治标不治本”,导致超支、违规、资金分配不合理等问题仍藏于每个任务流中,甚至直接影响营运现金流的健康度。 《从流程挖掘到降本增收——智能制造企业支出洞察》报告,基…

实验2 NFS部署和配置

一、实训目的 1.了解NFS基本概念 2.实现NFS的配置和部署 二、实训准备 1.准备一台能够安装OpenStack的实验用计算机,建议使用VMware虚拟机。 2.该计算机应安装CentOS 7,建议采用CentOS 7.8版本。 3.准备两台虚拟机机(客户机和服务器机&…

NTLM认证

文章目录 1.概念(1) 本地认证(2) SAM(3) NTLM Hash(4) NTLM 和 NTLM Hash(5) NTLM v2 1.概念 (1) 本地认证 Windows不存储用户的明文密码,它会将用户的明文密码经过加密后存储在 SAM (Security Account Manager Database,安全账号管理数据库)中。 (2)…

短视频素材哪里找?8个视频素材库免费下载无水印

是不是想要拓宽你的视频素材资源库,探索更多能够为你的视频项目注入新鲜血液的网站。这一次,我们将介绍一系列全球精选的视频素材网站,每一个都能为你的创作带来不同的视觉享受和灵感启发。 1. 蛙学府(中国) 提供广泛…

Docker② —— Cgroups详解

1. 概述 Cgroups 的全称是control groups,cgroups为每种可以控制的资源定义了一个子系统。Cgroups分为三个部分: cgroup 本身:对进程进行分组hierarchy:将 cgroup 形成树形结构subsystem:真正起到限制作用的部组件 cp…

从底层分析并详解SpringAOP底层实现

首先分析AOP的实现 首先切面(Advisor)由通知(Advice)和切点(Pointcut)组成 包括前置通知后置通知等等最终都会被转化为实现 MethodInterceptor 接口的环绕通知 先看一段代码了解一下是aop是怎么运作的 首先定义了两个类实现了MethodInterceptor接口&…

OpenCV与AI深度学习 | OpenCV如何读取仪表中的指针刻度

本文来源公众号“OpenCV与AI深度学习”,仅用于学术分享,侵权删,干货满满。 原文链接:OpenCV如何读取仪表中的指针刻度 最近遇到一个问题,如何读取仪表中的指针指向的刻度。 解决方法有多种,比如&#xff…

67条tips实战案例渗透测试大佬的技巧总结

67条tips实战案例渗透测试大佬的技巧总结。 Tips 1. 手动端口探测 nmap的-sV可以探测出服务版本,但有些情况下必须手动探测去验证 使用Wireshark获取响应包未免大材小用,可通过nc简单判断 eg. 对于8001端口,nc连接上去,随便输…

oracle 执行计划详解

执行计划是指示 Oracle 如何获取和过滤数据、产生最终的结果集,是影响SQL 语句执行性能的关键因素。在深入了解执行计划之前,首先需要知道执行计划是在什么时候产生的,以及如何让 SQL 引擎为语句生成执行划。 先了解 SQL 语句的处理执行过程…

LocalAi,Ollama+AnythingLLM搭建部署本地大模型AI知识库,汉化版本

AnythingLLM 是一个全栈应用程序,您可以使用商业现成的 LLM 或流行的开源 LLM 和 vectorDB 解决方案来构建私有 ChatGPT,无需任何妥协,您可以在本地运行,也可以远程托管并能够智能聊天以及您提供的任何文件。 AnythingLLM 将您的文…

【系统架构师】-案例考点(三)

1、信息系统架构ISA设计 四种架构模型: 1)单机应用 2)客户机/服务器模式:两层、三层C/S、B/S模型、MVC模式等 3)面向服务架构SOA 4)企业数据交换总线:不同企业应用之间通过信息交换的公共频…

思科 Packet Tracer 实验八 DHCP基本配置(以路由为中继)

一、实验目的 了解思科网络设备的配置基本特点及 IOS 命令基本操作方法 了解DHCP的工作原理及基本配置 二、实验过程 1) 实验拓扑如下: 2)由于使用DHCP‘协议动态配置ip,所以除了DHCP服务器和路由器接口外其他的主机,服务器的i…

AB5 点击消除

AB5 点击消除 可以用栈来解决。 当栈为空的时候,直接将字符入栈当栈非空的时候 当前字符与栈顶字符相同 出栈 当前字符与栈顶字符不同 入栈 重复上述2步即可。 栈在输出的时候不能从栈底开始输出,需要先把栈顶元素弹出并保存下来,在进行输…

过滤器Filter和拦截器Interceptor心得

上一篇文章讲了监听器Listener,下面我们来讲一下过滤器和拦截器。 一、过滤器Filter。 首先,servlet容器(比如tomcat)肯定的要有servlet才能发挥它的光彩。在上古jsp时代,我们会写各种servlet通过不同的请求来实现我…