wenda+fess问答系统

news2024/11/18 23:37:03

1 安装conda

2 创建环境 conda activate --name wenda python=3.8

3 安装依赖工具包

pip install -r requirements/requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install torch BeautifulSoup4 torchvision torchaudio pdfminer.six -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install -r requirements/requirements-chatglm_api.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install -r requirements/requirements-glm6b-lora.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install -r requirements/requirements-gpt4free.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install -r requirements/requirements-llama.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install -r requirements/requirements-openai.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install -r requirements/requirements-qdrant.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

4  下载模型

语言模型是chatGLM-6B,大家也可以使用其他的基础模型

链接:百度网盘 请输入提取码 提取码:xt9l

放在  /home/user/wenda/model下

文本向量模型text2vec-large-chinese

cd /home/user/data/wenda/model
# 安装 git lfs
git lfs install
# 如果报错 git: 'lfs' is not a git command.
# 执行如下(Ubuntu):
sudo apt-get install git-lfs
 
# 从huggingface官网拉取模型指针文件
git clone https://huggingface.co/GanymedeNil/text2vec-large-chinese
 
# 下载模型
wget https://huggingface.co/GanymedeNil/text2vec-large-chinese/resolve/main/pytorch_model.bin
# 覆盖text2vec-large-chinese中的 pytorch_model.bin文件
mv pytorch_model.bin text2vec-large-chinese/

5修改配置

example.config.yml改名为config.yml

library: 
     strategy: "sogowx:3 bingsite:2 rtst:2 agents:0"
     #知识库参数,每组参数间用空格分隔,冒号前为知识库类型,后为抽取数量。

     #知识库类型:
     #bing        cn.bing搜索,仅国内可用,目前处于服务降级状态
     #sosowx      sogo微信公众号搜索,可配合相应auto实现全文内容分析
     #fess        fess搜索引擎
     #rtst        支持实时生成的sentence_transformers
     #remote      调用远程闻达知识库,用于集群化部署
     #kg          知识图谱,暂未启用
     #特殊库:
     #mix         根据参数进行多知识库融合
     #agents      提供网络资源代理,没有知识库查找功能,所以数量为0
     #            (目前stable-diffusion的auto脚本需要使用其中功能,同时需开启stable-diffusion的api功能)

#fess模式下改为strategy: "fess:2"  2为抽取数量

     show_soucre: true
     #知识库显示来源

 glm6b: 
     path: "model/chatglm-6b-int4"
     #glm模型位置"
     strategy: "cuda:1 fp16 *14 -> cuda:2"
     #cuda fp16	 所有glm模型 要直接跑在gpu上都可以使用这个参数
     #cuda fp16i8	 fp16原生模型 要自行量化为int8跑在gpu上可以使用这个参数
     #cuda fp16i4	 fp16原生模型 要自行量化为int4跑在gpu上可以使用这个参数
     #cuda:0 fp16 *14 -> cuda:1	fp16 多卡流水线并行,使用方法参考RWKV的strategy介绍。总层数28
#strategy: "cuda:1 fp16 *14 -> cuda:2"可多卡并行

 6  创建知识库

创建txt文件夹

cd /home/user/wenda/

 mkdir txt

7 安装fess

先安装jdk

## linux系统
1. 安装JDK 
```
wget https://download.java.net/java/17/latest/jdk-17_linux-x64_bin.tar.gz
sudo tar xvf jdk-17_linux-x64_bin.tar.gz -C /usr/local/
```
解压后,JDK 17 将被安装在 /usr/local/jdk-17 目录中。

配置环境变量。要在系统中使用 JDK 17,您需要将其添加到 PATH 环境变量中。您可以使用以下命令将其添加到 /etc/profile 文件中:

```
 rm -f /etc/alternatives/java
 ln -s /usr/local/jdk-17.0.6/bin/java /etc/alternatives/java
     echo export JAVA_HOME=/usr/local/jdk-17.0.6 >>/etc/profile
     echo export PATH='$PATH':'$JAVA_HOME'/bin >>/etc/profile
     echo export CLASSPATH=.:'$JAVA_HOME'/lib/dt.jar:'$JAVA_HOME'/lib/tools.jar >>/etc/profile
     source /etc/profile
```
确认安装。您可以使用以下命令检查 JDK 17 是否已成功安装:
```
java -version
```
如果一切正常,您应该会看到类似以下内容的输出:

openjdk version "17.0.1" 2021-10-19
OpenJDK Runtime Environment (build 17.0.1+12-39)
OpenJDK 64-Bit Server VM (build 17.0.1+12-39, mixed mode, sharing)

安装fess

2. 安装fess14.7.0
下载fess
解压fess
```
unzip fess-14.7.0.zip
cd bin
 ./fess -d
```

将知识库/home/user/wenda/txt添加到fess中

在crawler选的file system创建新的 name,输入名称和位置/home/user/wenda/txt

在这里插入图片描述

在这里插入图片描述

 

 在这里插入图片描述

 自动返回File System页面. 点击刚才创建的选项(自己输入的Name),新建job

在这里插入图片描述

进入侧边栏的System内的Scheduler. 可以看到很多任务

  • 目录的前面可以看到刚刚创建的job.点击进入
  • 点击Start now. 刷新界面即可看到该任务正在运行. running

 在这里插入图片描述

 在这里插入图片描述

fess网址​​​​​​http://127.0.0.1:8080/

wenda网址http://127.0.0.1wenda网址

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/641535.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

降维和特征选择的对比

降维? 降低数据集中特征的维数,同时保持尽可能多的信息的技术被称为降维。它是机器学习和数据挖掘中常用的技术,可以最大限度地降低数据复杂性并提高模型性能。 降维可以通过多种方式实现,包括: 主成分分析 (PCA):PCA 是一种统计方法,可识别一组不相关的变量,将原始变…

华为OD机试真题B卷 JavaScript实现【报文重排序】,附详细解题思路

一、题目描述 对报文进行重传和重排序是常用的可靠性机制&#xff0c;重传缓冲区内有一定数量的子报文&#xff0c;每个子报文在原始报文中的顺序已知&#xff0c;现在需要恢复出原始报文。 二、输入描述 输入第一行为N&#xff0c;表示子报文的个数&#xff0c;0 < N &l…

chatgpt赋能python:Python建模:从入门到精通

Python建模&#xff1a;从入门到精通 Python是一种高级编程语言&#xff0c;已经成为了机器学习和数据科学领域的事实标准。因为Python比其他语言更容易学习和上手&#xff0c;所以它是入门级开发人员和数据科学家的首选语言。 在本文中&#xff0c;我们将介绍Python建模的基…

深入解析IT专业分类、方向及就业前景:高考毕业生如何选择适合自己的IT专业?重点探索近年来人工智能专业发展及人才需求

目录 一、IT专业的就业前景和发展趋势二、了解IT专业的分类和方向三、你对本专业的看法和感想四、本专业对人能力素养的要求五、建议和思考其它资料下载 当今社会&#xff0c;信息技术行业以其迅猛的发展和无限的潜力成为了吸引无数年轻人的热门选择。特别是对于高考毕业生来说…

10.面向对象编程(高级部分)|Java学习笔记

文章目录 类变量和类方法类变量类变量使用注意事项和细节 类方法类方法使用注意事项和细节 理解 main 方法语法代码块代码块使用注意事项和细节讨论 单例设计模式单例模式应用实例饿汉式 VS 懒汉式 final 关键字final 使用注意事项和细节 抽象类抽象类的介绍抽象类使用的注意事…

Vue中如何进行文件压缩与解压缩?

Vue中如何进行文件压缩与解压缩&#xff1f; 在前端开发中&#xff0c;文件的压缩和解压缩是经常需要用到的功能。尤其是在需要上传和下载文件的场景下&#xff0c;文件压缩可以减小文件大小&#xff0c;加快文件传输速度&#xff0c;提高用户体验。本文将介绍在Vue项目中如何…

纷享销客王亚辉:聚焦终端,打造医疗健康行业管理新高度

1.医疗健康行业持续增长的关键 是数字化经营客户价值 随着生活水平和生活质量的不断提高&#xff0c;人们的医疗健康意识日渐增强&#xff0c;对医疗健康的需求越来越强烈&#xff1b;同时&#xff0c;国家政策的扶持再加上人口老龄化进程加快&#xff0c;进一步推动着医疗健…

【spring源码系列-05】refresh中prepareRefresh方法的执行流程

Spring源码系列整体栏目 内容链接地址【一】spring源码整体概述https://blog.csdn.net/zhenghuishengq/article/details/130940885【二】通过refresh方法剖析IOC的整体流程https://blog.csdn.net/zhenghuishengq/article/details/131003428【三】xml配置文件启动spring时refres…

003、体系结构之TiKV持久化

TiKV架构和作用 数据持久化分布式一致性MVCC分布式事务Coprocessor coprocessor : 协同处理器。 可以将一些SQL计算交给TiKV处理。不需要将TiKV所有数据通过网络发送给TiDB Server RocksDB 任何持久化的存储引擎&#xff0c;数据终归要保存在磁盘上&#xff0c;TiKV 也不例外…

NeRF in the wild 论文解读与公式推导

NeRF in the Wild: Neural Radiance Fields for Unconstrained Photo Collections 论文&#xff1a;https://openaccess.thecvf.com/content/CVPR2021/papers/Martin-Brualla_NeRF_in_the_Wild_Neural_Radiance_Fields_for_Unconstrained_Photo_CVPR_2021_paper.pdfhttps://op…

不同等级的Pads工程师,薪资差距有多大?

作为一种广泛应用在PCB设计的EDA工具&#xff0c;Pads软件在中国的电子设计行业中有着重要地位&#xff0c;尤其是不同等级的Pads工程师&#xff0c;在薪资、工作范围等有很大的差异&#xff0c;本文将从中国出发&#xff0c;多方面分析对比不同等级的Pads工程师&#xff0c;希…

监控、审计和运行时安全

监控、审计和运行时安全 目录 文章目录 监控、审计和运行时安全目录1、分析容器系统调用&#xff1a;SysdigSysdig介绍安装sysdigsysdig常用参数sysdig常用命令Chisels(实用的工具箱)其它命令 2、监控容器运行时&#xff1a;FalcoFalco介绍Falco架构安装falco自定义扩展规则文件…

ElasticSearch(ES)介绍

前言 为什么学习ElasticSearch&#xff1f; 1、ElasticSearch具备非常强的大数据分析能力。虽然Hadoop也可以做大数据分析&#xff0c;但是ElasticSearch的分析能力非常高&#xff0c;具备Hadoop不具备的能力。比如有时候用Hadoop分析一个结果&#xff0c;可能等待的时间比较…

免费获取程序员好书,这个宝藏网站等你来挖!

今天给大家分享一个免费的程序员、IT、互联网资源的​免费书籍网站。​ 书籍类型涵盖了Vue、CSS、小程序等前端语言、框架&#xff1b;.NET、JAVA、Go等后端语言&#xff1b;Android、IOS、Flutter等移动语言&#xff1b;数据库、云计算大数据、网络系统运维、UI美工设计、游戏…

【CASA模型】生态系统NPP及碳源、碳汇模拟、土地利用变化、未来气候变化、空间动态模拟实践技术应用

查看原文>>>生态系统NPP及碳源、碳汇模拟、土地利用变化、未来气候变化、空间动态模拟实践技术应用 由于全球变暖、大气中温室气体浓度逐年增加等问题的出现&#xff0c;“双碳”行动特别是碳中和已经在世界范围形成广泛影响。碳中和可以从碳排放&#xff08;碳源&am…

Jmeter调用Oracle、pg、MySql 储存过程,实例,获取返回值

JDBC Request: 1、重要参数说明&#xff1a; Variable Name&#xff1a;数据库连接池的名字&#xff0c;需要与JDBC Connection Configuration的Variable Name Bound Pool名字保持一致   Query&#xff1a;填写的sql语句未尾不要加“;”   Parameter valus&#xff1a;参数…

统信UOS系统开发笔记(四):从Qt源码编译安装之编译安装QtCreator4.11.2,并配置编译测试Demo

若该文为原创文章&#xff0c;转载请注明原文出处 本文章博客地址&#xff1a;https://hpzwl.blog.csdn.net/article/details/131182539 红胖子(红模仿)的博文大全&#xff1a;开发技术集合&#xff08;包含Qt实用技术、树莓派、三维、OpenCV、OpenGL、ffmpeg、OSG、单片机、软…

激光雷达安全系统:让世界变得更安全

基于3D激光雷达的安全系统具有更高的可靠性,减少了误报,因此具有更高级别的安全性。激光雷达在安全和监视应用中越来越受欢迎,由于其高可靠性、远程、厘米级精度以及对具有挑战性的天气和照明条件不敏感等特点,它很容易击败相机或雷达等同行。 01 基于激光雷达的安全系统 …

技术文章—基于SPAD / SiPM技术的激光雷达方案

激光雷达(LiDAR)是一种测距技术,近年来越来越多地用于汽车先进驾驶辅助系统(ADAS)、手势识别和3D映射等应用。尤其在汽车领域,随着传感器融合的趋势,LiDAR结合成像、超声波、毫米波雷达,互为补足,为汽车提供全方位感知,为迈向更安全的自动驾驶铺平道路。安森美半导体提供…

简历项目合集

基于Arduino的超声波悬浮装置 超声波悬浮原理 项目图片 概述 实验需要使用Arduino驱动换能器产生一个40KHz的方波&#xff0c;可以使用换能器组&#xff0c;也可以使用Arduino的超声波模块。但是仅仅使用Arduino输出的方波信号的功率&#xff0c;并不足以使得小物体悬浮&…