通过容器启动QAnything知识库问答系统

news2024/12/21 21:46:17

QAnything (Question and Answer based on Anything) 是致力于支持任意格式文件或数据库的本地知识库问答系统,可断网安装使用。目前已支持格式:PDF(pdf)Word(docx)PPT(pptx)XLS(xlsx)Markdown(md)电子邮件(eml)TXT(txt)图片(jpg,jpeg,png)CSV(csv)网页链接(html)等格式。

一.后端启动

1.run.sh命令启动

因为显卡配置原因,没有使用Qwen-7B-QAnything模型,而使用了MiniChat-2-3B模型,启动命令bash ./run.sh -c local -i 0 -b hf -m MiniChat-2-3B -t minichat。其中参数物理意义如下所示:

参数解释
-c用于指定 llm API 模式的选项,可以选择 localcloud。默认是 local。如果设置为 -c cloud,则需要先手动将环境变量 {OPENAI_API_KEY, OPENAI_API_BASE, OPENAI_API_MODEL_NAME, OPENAI_API_CONTEXT_LENGTH} 设置到 .env 文件中。
-i用于指定 GPU 设备 ID。
-b用于指定 LLM 推理运行时后端,选项包括 defaulthfvllm
-m用于指定使用 FastChat serve API 加载 LLM 模型的路径,选项包括 Qwen-7B-Chatdeepseek-llm-7b-chat 等。
-t用于指定使用 FastChat serve API 时,根据 LLM 模型的对话模板,选项包括 qwen-7b-chatdeepseek-chat 等。

更加完整的QAnything服务启动命令使用,如下所示:

为了使用更多LLM,需要在/path/to/QAnything/third_party/FastChat/fastchat/conversation.py中配置conv_template。支持使用 FastChat API 与 Huggingface Transformers/vllm 运行时后端的公共大型语言模型(LLM),如下所示:

2.启动成功日志

如果想要查看相关日志,请查看QAnything/logs/目录下的日志文件,如下所示:

序号日志文件解释
1debug.log用户请求处理日志
2sanic_api.log后端服务运行日志
3llm_embed_rerank_tritonserver.log(单卡部署)LLM embedding和rerank tritonserver服务启动日志
4llm_tritonserver.log(多卡部署)LLM tritonserver服务启动日志
5embed_rerank_tritonserver.log(多卡部署或使用openai接口)embedding和rerank tritonserver服务启动日志
6rerank_server.logrerank服务运行日志
7ocr_server.logOCR服务运行日志
8npm_server.log前端服务运行日志
9llm_server_entrypoint.logLLM中转服务运行日志
10fastchat_logs/*.logFastChat服务运行日志
11qa_logs/qa.log问答服务运行日志

3.启动成功容器

容器名称解释
qanything-container-local这是一个运行 qanything 应用的容器。qanything 是一个基于深度学习的对话系统,可以处理各种对话任务。在这个容器中,qanything 应用会根据环境变量的设置,选择本地或云端的模型进行运行。
milvus-standalone-local这是一个运行 milvus 的容器。milvus 是一个开源的向量数据库,用于处理大规模的向量检索和相似性搜索。在这个容器中,milvus 以单机模式运行。
milvus-minio-local这是一个运行 minio 的容器。minio 是一个高性能的开源对象存储服务器,用于存储非结构化的数据,如图片、视频、日志文件等。在这个容器中,minio 用于存储 milvus 的数据。
mysql-container-local这是一个运行 mysql 的容器。mysql 是一个关系型数据库管理系统,用于存储结构化的数据。在这个容器中,mysql 用于存储应用的数据。
milvus-etcd-local这是一个运行 etcd 的容器。etcd 是一个开源的分布式键值存储系统,用于共享配置和服务发现。在这个容器中,etcd 用于存储 milvus 的配置信息。

二.前端启动

1.npm命令启动

前端启动命令分别为npm installnpm run dev,如下所示:

2.启动成功界面

3.新建知识库

新建知识库后,上传文件,就可以和知识库进行对话了,如下所示:

三.部署问题

1.CUDA驱动版本更新

在部署QAnything过程中遇到的最大问题是NVIDIA Driver问题,但是没在意这个问题,后面部署失败,升级后基本就成功了。

ERROR: This container was built for NVIDIA Driver Release 530.30 or later, but version 522.06 was detected and compatibility mode is UNAVAILABLE.

2.通过GeForce Experience升级驱动

通过GeForce Experience升级驱动为最新版本,如下所示:

说明:驱动升级完毕后,重启电脑,然后重新运行run.sh命令。

参考文献

[1] QAnything GitHub:https://github.com/netease-youdao/QAnything

[2] QAnything HuggingFace:https://huggingface.co/netease-youdao/QAnything

[3] Ant Design Vue:https://www.antdv.com/components/overview-cn/

[4] Node.js下载地址:https://nodejs.org/dist/v18.16.0/

[5]前端开发文档:https://github.com/ai408/QAnything/blob/master/front_end/README.md

[6] QAnything接口文档:https://github.com/netease-youdao/QAnything/blob/master/docs/API.md

[7] QAnything中文介绍:https://github.com/netease-youdao/QAnything/blob/master/README_zh.md

[8] 有道智云AI开放平台:https://ai.youdao.com/DOCSIRMA/html/aigc/api/qanything/index.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1885349.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

洛必达法则在Android应用程序中的应用

洛必达法则在Android应用程序中的应用 前言 在高等数学中,洛必达法则(L’Hpital’s Rule)是一个用于计算未定式极限的有力工具。洛必达法则为我们提供了一种简便的方法,通过求导数来处理一些复杂的极限问题。在Android开发中,尽管我们通常不会直接遇到需要应用洛必达法则…

第二届重庆国际渔业博览会

The 2th Chongqing International Fisheries & Seafood Expo 时间:2024年10月25-27日 地点:重庆国际博览中心 同期举办:第十六届中国(重庆)火锅美食文化节暨第九届中国(重庆)国际火锅产业博览会 展会规模: 展出…

【C++知识点总结全系列 (06)】:STL六大组件详细介绍与总结(配置器、容器、迭代器、适配器、算法、仿函数)

STL六大组件目录 前言1、配置器(1)What(2)Why(3)HowA.调用new和delete实现内存分配与销毁B.STL Allocator (4)allocator类A.WhatB.HowC.allocator的算法 2、容器(1)What(2)Which(有哪些容器)(3)序列容器(顺序容器)A.WhichB.array&…

Unreal Engine@Jetson Orin Nano尚不支持

Unreal EngineJetson Orin Nano尚不支持 1. 源由2. Unreal Engine介绍3. 问题4. 编译方法5. 补充 1. 源由 最近在看SC-Explorer方面的内容,在模拟方面采用了Unreal Engine。 本打算跑下模拟,因此打算在JetsonOrin的板子上试试看。 2. Unreal Engine介绍…

【Python】已解决:urllib.error.HTTPError: HTTP Error 403: Forbidden

文章目录 一、分析问题背景二、可能出错的原因三、错误代码示例四、正确代码示例五、注意事项 已解决:urllib.error.HTTPError: HTTP Error 403: Forbidden 一、分析问题背景 在使用Python的urllib库中的urlopen或urlretrieve函数下载文件时,有时会遇到…

SAP 物料状态简介

在物料主数据中有个物料状态的栏位,这个栏位的作用就在于对涉及到相应物料主数据的各种事务进行不同形式的限制,从而达到对物料的用途进行管控的作用。在实际业务中,尤其是涉及到物料的生命周期管理时,当某个物料已经被禁用的时候…

报表-显示图片(logo、签名、签章等)

1、数据源 字段里面存图片url或base64 比如:https://img2.baidu.com/it/u99450198,2193994199&fm253 as img1 或data:image/png;base64,因为base64体积大,适用于图片尺寸小,并且数量小的情况 2、报表设计 使用ShowImage方…

【创建者模式-建造者模式】

概要 将一个复杂对象的构建与表示分离,使得同样的构建过程可以创建不同的表示。 建造者模式包含以下角色 抽象建造者类(Builder):这个接口规定要实现复杂对象的那些部分的创建,并不涉及具体的部件对象的创建。具体建…

C++获取数组长度以及数组的函数传参获取数组长度

1、C获取数组长度----sizeof(array)/sizeof(array[0]) 定义一个数组,int arr[]{1,2,3,4,5,6,7,8,9}; sizeof()方法用于统计变量的内存大小,sizeof(arr)用于获取数组arr占用的内存大小 sizeof&#xff08…

罗德和神牛、西圣无线麦克风哪个好用?罗德、西圣多方位实测对比

随着短视频行业的兴起,越来越多人开始加入自媒体创作的行业中,不过对于短视频而言,光有好的画面是不够的,还需要清晰、干净的声音。而无线领夹麦适用于唱歌、直播、吃播、短视频、访谈等场景使用,而且能够极大的提高声…

交通气象站:保障道路畅通的守护者

随着现代社会的飞速发展,交通网络日益密集,人们的出行越来越依赖于公路、铁路和航空等交通方式。然而,多变的天气条件常常给交通安全带来隐患,如大雾、雨雪、强风等恶劣天气不仅影响行车视线,还可能造成路面湿滑、结冰…

计算机硬件(考点篇)试题

波特率: 在电子通信领域,波特(Baud)即调制速率,指的是有效数据讯号调制载波的速率,即单位时间内载波调制状态变化的次数。波特(Baud,单位符号:Bd)。 波特率…

78.Vue 3 重用性模态框组件

模态框是大多数 Web 应用程序中的基本构建块。虽然最初实现起来可能看起来有点棘手,但实际上,使用 Vue 和一些 Flexbox 技巧,这不仅可行,而且非常简单。 让我们一起实现一个基础的模态框组件。 架构如下: AppModal.vue…

【OceanBase】OBProxy 无状态的理解

SueWakeup 个人主页:SueWakeup 系列专栏:为祖国的科技进步添砖Java 个性签名:保留赤子之心也许是种幸运吧 本文封面由 凯楠📸友情提供 目录 前言 OBProxy 无状态的概述 OBProxy 无状态特性带来的优点 1. 高可用 2. 负载均衡…

当Matplotlib遇见SciencePlots

分享一个Matplotlib扩展工具SciencePlots,一行代码绘制science、nature、ieee等要求的图形。 安装 安装SciencePlots # 直接从PyPI安装 pip install SciencePlots 安装latex 如果latex未安装,会报错:RuntimeError: Failed to process st…

尚硅谷k8s 2

p54-56 k8s核心实战 service服务发现 Service:将一组 Pods 公开为网络服务的抽象方法。 #暴露Deploy,暴露deploy会出现在svc kubectl expose deployment my-dep --port8000 --target-port80#使用标签检索Pod kubectl get pod -l appmy-depapiVersion: v1 kind: Service metad…

简易电阻、电容和电感测量仪-FPGA

通过VHDL语言编写程序用于设计电阻、电容和电感测量仪,通过使用试验箱进行验证是否设计正确,资料获取到咸🐟:xy591215295250 \\\或者联系wechat 号:comprehensivable 设计并制作--台数字显示的电阻、电容和电感参数测试…

【技术杂谈】如何访问Github | 解决无法连接Github的问题

访问网页的过程 什么是域名?什么是IP地址?- 域名是网站的名称。 - IP地址是服务器在互联网上的逻辑地址。域名往往是固定的,但是IP地址很有可能是会改变的。计算机通过Host文件检查本地缓存是否有域名对应IP地址 Host文件路径 C:\Windows\Sy…

使用API有效率地管理Dynadot域名,为文件夹中的域名设置域名隐形转发

关于Dynadot Dynadot是通过ICANN认证的域名注册商,自2002年成立以来,服务于全球108个国家和地区的客户,为数以万计的客户提供简洁,优惠,安全的域名注册以及管理服务。 Dynadot平台操作教程索引(包括域名邮…

爬虫cookie是什么意思

“爬虫 cookie”指的是网络爬虫在访问网站时所使用的cookie,网络爬虫是一种自动化程序,用于在互联网上收集信息并进行索引,这些信息可以用于搜索引擎、数据分析或其他目的。 本教程操作系统:Windows10系统、Dell G3电脑。 “爬虫…