6.4K+ Star!一个强大的本地知识库问答系统,支持多格式文件和跨语言检索,为企业提供高效、安全的数据洞察……

news2024/11/28 10:33:07

https://github.com/netease-youdao/QAnything

【阅读原文】跳转Github项目

转自AIGC创想者

项目简介

QAnything 是一个基于本地知识库的问答系统,它能够理解和回答基于任何类型文件的问题。

QAnything支持的文件格式非常广泛,包括PDF、Word、PPT、XLS、Markdown、Email、TXT、Image、CSV和Web链接等,这使得它能够适应多种不同的使用场景。

图片

适用场景

QAnything适合于需要处理和分析大量文档和数据的场景,如企业知识管理、学术研究、法律文档审查、市场分析等。

  1. 企业知识管理:企业可以利用QAnything构建内部知识库,员工通过自然语言问答的方式快速获取所需信息,提高工作效率。

  2. 学术研究:研究人员可以使用QAnything来管理和分析大量的学术论文、报告和数据集,快速找到研究中需要的信息。

  3. 法律文档审查:法律专业人士可以使用QAnything来审查和分析合同、法律文件等,确保文档的合规性和准确性。

  4. 市场分析:市场分析师可以利用QAnything分析市场报告、消费者反馈等,以获得有价值的市场洞察。

使用方法

QAnything项目的安装步骤分为几个主要部分,包括系统要求、Docker安装和纯Python环境安装。以下是详细的安装步骤:

系统要求

在开始安装之前,请确保您的系统满足以下最低要求:

  • Linux:推荐使用NVIDIA GPU(至少GTX 1050Ti,更好的选择是RTX 3090),并确保GPU内存至少为4GB(如果使用OpenAI API)。

  • NVIDIA驱动:版本至少为525.105.17。

  • Docker:版本至少为20.10.5。

  • Docker Compose:版本至少为2.23.3。

  • Git Large File Storage (LFS):需要安装。

Docker安装
  1. 拉取QAnything仓库:

git clone https://github.com/netease-youdao/QAnything.git
  1. 进入项目根目录:

cd QAnything
  1. 根据提供的启动脚本和说明启动QAnything服务:

  • 默认在GPU 0上启动(如果使用OpenAI API,确保GPU内存至少为4GB)。

bash run.sh
  1. 指定GPU启动(可选):

  • 对于Windows10/Windows11 WSL2用户,推荐使用以下命令启动:

# For Windows OS: Need to enter the **WSL2** environment.
# Step 1. Download the public LLM model (e.g., Qwen-7B-QAnything) and save to "/path/to/QAnything/assets/custom_models"
# (Optional) Download Qwen-7B-QAnything from ModelScope: https://www.modelscope.cn/models/netease-youdao/Qwen-7B-QAnything
# (Optional) Download Qwen-7B-QAnything from Huggingface: https://huggingface.co/netease-youdao/Qwen-7B-QAnything
cd QAnything/assets/custom_models
git clone https://huggingface.co/netease-youdao/Qwen-7B-QAnything

# Step 2. Execute the service startup command. Here we use "-b hf" to specify the Huggingface transformers backend.
cd ../../
bash ./run.sh -c local -i 0 -b hf -m Qwen-7B-QAnything -t qwen-7b-qanything
  • 对于GPU计算能力大于等于8.6且VRAM大于等于24GB的情况,可以使用多GPU启动:

bcd QAnything
bash ./run.sh -c local -i 0,1 -b default  # gpu ids: 0,1, Please confirm how many GPUs are available. Supports up to two cards for startup. 
  1. 体验应用:

  • 通过在Web浏览器中输入以下地址来访问前端界面:http://your_host:5052/qanything/

  • 如果需要访问API,请参考API地址:http://your_host:8777/api/

  1. 关闭服务(如果需要):

  • 使用以下命令关闭服务:

bash close.sh
  1. 离线安装:

如果需要在没有网络的环境中安装QAnything,可以在有网络的机器上下载Docker镜像和代码,然后将镜像和代码复制到离线机器上,加载镜像并运行。


注:本文内容仅供参考,具体项目特性请参照官方 GitHub 页面的最新说明。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2060331.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【GH】【EXCEL】P6: Shapes

文章目录 componentslinepicture components line picture Picture A Picture object Input parameters: Worksheet (Generic Data) A Worksheet, Workbook, Range Object, Excel Application, or Text Worksheet NameName (Text) An optional object nameLocation (Point) A p…

停车场管理系统--论文pf

TOC springboot544停车场管理系统--论文pf 第1章 绪论 1.1 课题背景 二十一世纪互联网的出现,改变了几千年以来人们的生活,不仅仅是生活物资的丰富,还有精神层次的丰富。在互联网诞生之前,地域位置往往是人们思想上不可跨域的…

推荐一个开源的kafka可视化客户端GUI工具(Kafka King)

大佬的博客地址: https://blog.ysboke.cn/posts/tools/kafka-king Github地址: https://github.com/Bronya0/Kafka-King Kafka-King功能清单 查看集群节点列表(完成)支持PLAINTEXT、SASL PLAINTEXT用户名密码认证(完…

基于数据挖掘的消费者商品交易数据分析可视化与聚类分析

文章目录 有需要本项目的代码或文档以及全部资源,或者部署调试可以私信博主项目介绍项目实现实现流程实现过程数据预处理EDA探索性数据分析聚类分析每文一语 有需要本项目的代码或文档以及全部资源,或者部署调试可以私信博主 项目介绍 基于python的消费…

HexView 刷写文件脚本处理工具-命令行介绍(六)-CheckSum计算(/CS:)-CRC32

CheckSum计算 checksum计算是hexview最常用,也是比较实用的功能之一,每一版本支持的功能不同,最新的版本大概支持几十种CheckSum的计算。 界面计算 经常在操作的时候,如果是偶尔计算可以直接使用界面就可以了,非常清楚明了。 命令行介绍 通常使用计算的时候是在释放…

大话C语言:第43篇 结构体的位域

位域是结构体中的一个特殊成员,它允许我们指定该成员所占用的位数,而不是使用完整的字节或更大的单位。这在需要精确控制数据在内存中的布局时特别有用,例如在网络编程或硬件接口编程中。 位域的定义语法如下: struct 标签或者结…

利用TeamCity实现maven项目的CI/CD

1.什么是TeamCity? TeamCity 是一款由 JetBrains 开发的强大的持续集成(Continuous Integration,CI)和持续部署(Continuous Deployment,CD)工具。它帮助开发团队自动化构建、测试和部署过程&am…

Spring Boot OAuth2.0应用

本文展示Spring Boot中,新版本OAuth2.0的简单实现,版本信息: spring-boot 2.7.10 spring-security-oauth2-authorization-server 0.4.0 spring-security-oauth2-client 5.7.7 spring-boot-starter-oauth2-resource-server 2.7.10展示三个服务…

汽车服务管理系统 _od8kr

TOC springboot580汽车服务管理系统 _od8kr--论文 系统概述 该系统由个人管理员和员工管理,用户三部分组成。其中:用户进入系统首页可以实现首页,热销汽车,汽车配件,汽车资讯,后台管理,在线客…

TCP端口范围

ip_local_port_range sysctl -a | grep ip_local_port_range | head 默认情况下,net.ipv4.ip_local_port_range的默认值为32768-60999。这意味着本地应用程序可以使用的端口号范围为32768到60999。 sysctl -a | grep net.ipv4.ip_local_reserved_ports |head …

光伏检测气象站:实时监测:高效管理

随着全球对可再生能源需求的日益增长,光伏发电作为清洁能源的重要组成部分,其重要性日益凸显。然而,光伏发电的效率与稳定性受气象条件影响显著,如光照强度、温度、湿度、风速等因素均能直接影响光伏板的发电效率。因此&#xff0…

宠物空气净化器是智商税吗?希喂、范罗士热门产品真实性能测试

宠物空气净化器作为宠物领域的新产品,凭借自身独特的功能受到铲屎官们的喜爱,越来越多的商家关注到这个市场。然而,市面上品牌逐渐增多,质量却参差不齐,一些不良商家以次充好,容易让消费者陷入消费陷阱。 …

Codeforces Round 961 D. Cases 【SOS DP、思维】

D. Cases 题意 有一个长度为 n n n 且仅由前 c c c 个大写字母组成的字符串,问最少选取多少种字母为每个单词的结尾,使得每个单词长度不超过 k k k 思路 首先注意到最后一个字母一定要选择,接下来我们给出一个断言:如果一个…

Fx - day3 - 沙盒/更改集/互联更改集/配置包

Fxiaoke - day3 - 沙盒/更改集/互联更改集/配置包 学习目标:熟悉 沙盒,更改集,配置包,互联更改集 的概念以及使用场景 0、前言 沙盒理解 很多时候我们可能需要一个沙盒环境,什么是沙盒环境? 沙盒环境&…

如何打造Java SpringBoot私房菜定制上门服务系统,实现个性化餐饮体验?

✍✍计算机编程指导师 ⭐⭐个人介绍:自己非常喜欢研究技术问题!专业做Java、Python、微信小程序、安卓、大数据、爬虫、Golang、大屏等实战项目。 ⛽⛽实战项目:有源码或者技术上的问题欢迎在评论区一起讨论交流! ⚡⚡ Java实战 |…

惠海H4312 dcdc同步整流降压恒压IC 30V 40V转3.3V/5V/12V小体积大电流单片机供电

1.产品描述 H4312是一种内置30V耐压MOS,并且能够实现精确恒压以及恒流的同步降压型 DC-DC 转换器: 支持 3.1A 持续输出电流输出电压可调,最大可支持 100%占空比;通过调节FB 端口的分压电阻,可以输出2.5V到 24V的稳定电压。 H4312 采用高端…

【脏数据 bug 解决】ValueError: mean must have 1 elements if it is an iterable, got 3

问题描述: 在训练模型的过程中,出现 clip_image_processor 无法处理数据的问题,说明数据集中很可能出现了脏数据。本文使用的数据为 LAION-Aesthetics-V2-6.5plus,从 https://dagshub.com/DagsHub-Datasets/LAION-Aesthetics-V2-…

21、springboot3 vue3开发平台-前端-自定义树形穿梭框,用于角色权限分配

文章目录 1. 使用原因2. 实现3. 使用 1. 使用原因 elemenutplus 有穿梭框,但是不支持树状数据的操作,所以这里自定义树状穿梭框,用于菜单权限分配, 如下: 2. 实现 这里主要是将菜单列表树解构后添加修改组合再恢复…

STM32H7双路CAN踩坑记录

STM32H7双路CAN踩坑记录 目录 STM32H7双路CAN踩坑记录1 问题描述2 原因分析3 解决办法4 CAN配置参考代码 1 问题描述 STM32的CAN1和CAN2无法同时使用。 注:MCU使用的是STM32H743,其他型号不确定是否一样,本文只以STM32H743举例说明。 2 原因…

odoo17 网站内容存在哪了

odoo17 网站内容存在哪了 查数据库内容,却没找到 没理解这些内容到底存在了哪里呢