【Langchain-Chatchat】部署ChatGLM3-6B-32K教程

news2025/2/21 7:55:06

介绍

Langchain-Chatchat这个框架可以帮助我们更容易的部署大语言模型，之前也写过ChatGLM传统的部署教程，有兴趣的可以参考

【ChatGLM3】第三代大语言模型多GPU部署指南
【ChatGLM2-6B】从0到1部署GPU版本

借助Langchain-Chatchat框架，可以用更少的配置，帮我们做了大量的细节，并且还支持知识库和Agent等功能，下面将介绍如何使用docker方式和源码方式部署。

使用docker方式部署

docker run -d --name chatchat --gpus all -p 18501:8501 registry.cn-beijing.aliyuncs.com/chatchat/chatchat:0.2.7

使用源码方式部署

# 拉取仓库
git clone https://github.com/chatchat-space/Langchain-Chatchat.git

# 进入目录
cd Langchain-Chatchat

# 创建虚拟环境
conda create -n chatchat python==3.11
source activate chatchat

# 安装全部依赖
pip install -r requirements.txt 
pip install -r requirements_api.txt
pip install -r requirements_webui.txt  

# 默认依赖包括基本运行环境（FAISS向量库）。如果要使用 milvus/pg_vector 等向量库，请将 requirements.txt 中相应依赖取消注释再安装。

初始化知识库和配置文件

按照下列方式初始化自己的知识库和简单的复制配置文件

python copy_config_example.py
python init_database.py --recreate-vs

根据需要修改配置

以下列出需要修改的配置文件中的配置参数，根据参数名在配置文件在搜索

修改模型相关配置参数configs/model_config.py.example
- LLM_MODELS
- MAX_TOKENS
- 模型路径(根据自己使用的模型找到对应的路径进行修改):
  - MODEL_PATH.embed_model.bge-large-zh-v1.5
  - MODEL_PATH.llm_model.chatglm3-6b-32k
  - VLLM_MODEL_DICT.chatglm3-6b-32k
修改服务启动相关配置参数configs/server_config.py.example
- 服务启动端口:
  - web服务端口: WEBUI_SERVER.port
  - API服务端口: API_SERVER.port
  - FSCHAT_MODEL_WORKERS.default.gpus
  - FSCHAT_MODEL_WORKERS.default.num_gpus

一键启动

按照以下命令启动项目

python startup.py -a

编写启动脚本

新建start.sh，内容如下

source activate chatchat

>nohup.out
nohup python startup.py -a &

运行效果截图

在这里插入图片描述

参考资料

源码

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1539140.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

【Langchain-Chatchat】部署ChatGLM3-6B-32K教程

介绍

使用docker方式部署

使用源码方式部署

初始化知识库和配置文件

根据需要修改配置

一键启动

编写启动脚本

运行效果截图

参考资料

相关文章

从产品组装和维护/维修的角度来看，基于增强现实的指导：关于挑战和机遇的最新综述

二分查找法总结

力扣刷题31-33（力扣 0024/0070/0053）

想来开视频号小店，你需要准备好这些内容！新手建议收藏！

性能测试-Jmeter中IF控制器使用

小红书扫码登录分析与python实现

Unity发布webgl之后打开PDF文件，不使用js，不和浏览器交互

mysql80-DBA数据库学习1

Python代码实现Excel表格转HTML文件

政安晨：【深度学习实践】【使用 TensorFlow 和 Keras 为结构化数据构建和训练神经网络】（六）—— 二元分类

基于Matlab的眼底图像血管分割，Matlab实现

前端应用开发实验：条件渲染和循环渲染

FFmepg--AVFilter过滤器使用以及yuv视频裁剪

【技术栈】Redis 中的事务及持久化方式

百度地图的使用(js，vue2，vue3)

后端系统开发之——功能完善

一键掌控：Shell脚本自动化安装与管理Conda环境的艺术

pyrealsense2获取保存点云

Prometheus+Grafana 监控Tongweb嵌入式（by lqw）

项目配置之道：优化Scrapy参数提升爬虫效率