【ChatGLM2-6B】nginx转发配置

news2024/10/6 9:22:09

背景

好不容易把ChatGLM2-6B大语言模型部署好了,使用streamlit方式启动起来了,终于可以愉快的玩耍了,然后想着申请一个域名,使用HTTPS协议访问,但实践过程中,发现这个大语言模型的nginx转发配置还是有点小小的与众不同,折腾了半天,终于研究出来了。如何在只有CPULinux服务器上部署ChatGLM2-6B,可以参考这篇文章

先请教下ChatGLM2这个问题

在这里插入图片描述

不错,回答的很是专业,使用这个配置还是有点用,但并不能解决所有问题。可能会出现如下几个错误

ERR_INCOMPLETE_CHUNKED_ENCODING

在请求/static/js/main.ccfdda4f.js这个js文件的时候,可能会报ERR_INCOMPLETE_CHUNKED_ENCODING错误,这是因为main.ccfdda4f.js这个js文件有1.1Mnginx的缓冲区不够用,需要修改nginx缓冲区设置

location / {
    proxy_pass http://LLM;

    # main.ccfdda4f.js文件有1.1M,需要修改缓冲区大小
    proxy_buffer_size 1024k; #设置代理服务器(nginx)保存用户头信息的缓冲区大小
    proxy_buffers 16 1024k; #proxy_buffers缓冲区,网页平均在32k以下的设置
    proxy_busy_buffers_size 2048k; #高负荷下缓冲大小(proxy_buffers*2)
    proxy_temp_file_write_size 2048k; #设定缓存文件夹大小,大于这个值,将从upstream服务器传
}

websocket报403错误

查看/_stcore/stream请求,是与大模型建立websocket连接,错误信息大致如下
failed: Error during WebSocket handshake: Unexpected response code: 403,但如果使用80443端口,则不会报这个错,只要是非80443就会报这个错,根本原因是nginx转发的时候必须设置HostOrigin请求头,并且值还要一样

    location /_stcore/stream {
        proxy_pass http://LLM;

        # websocket配置
        proxy_http_version 1.1;
        proxy_set_header Upgrade $http_upgrade;
        proxy_set_header Connection "upgrade";
        proxy_cache_bypass $http_upgrade;
        # Host与Origin必须设置,并且Host的值与Origin的值//后面的部分必须一致
        proxy_set_header Host "$http_host";
        proxy_set_header Origin "$scheme://$http_host";
    }
  • 这里使用 h t t p h o s t 比 http_host比 httphosthost更准确
  • 经过实测,只要HostOrigin请求头$http_host部分的值相同就可以成功转发,即使随便写一个值,只要相同也可以成功转发

关于nginx中$host$http_host$proxy_host的区别

变量是否显示端口
$host不显示端口浏览器请求的ip,不显示端口
$http_host端口存在则显示浏览器请求的ip和端口号
$proxy_host默认80端口不显示,其它显示被代理服务的ip和端口号

完整的nginx配置如下

upstream LLM {
    server 127.0.0.1:8501;
}

server {
    listen       30443 ssl;
    listen       443 ssl;
    listen       80;
    server_name  chatglm.xxx.cn;

    ssl_certificate /etc/nginx/ssl/chatglm.xxx.cn.pem;
    ssl_certificate_key /etc/nginx/ssl/chatglm.xxx.cn.key;

    location / {
        proxy_pass http://LLM;

        # main.ccfdda4f.js文件有1.1M,需要修改缓冲区大小
        proxy_buffer_size 1024k; #设置代理服务器(nginx)保存用户头信息的缓冲区大小
        proxy_buffers 16 1024k; #proxy_buffers缓冲区,网页平均在32k以下的设置
        proxy_busy_buffers_size 2048k; #高负荷下缓冲大小(proxy_buffers*2)
        proxy_temp_file_write_size 2048k; #设定缓存文件夹大小,大于这个值,将从upstream服务器传
    }

    location /_stcore/stream {
        proxy_pass http://LLM;

        # websocket配置
        proxy_http_version 1.1;
        proxy_set_header Upgrade $http_upgrade;
        proxy_set_header Connection "upgrade";
        proxy_cache_bypass $http_upgrade;
        # Host与Origin必须设置,并且Host的值与Origin的值//后面的部分必须一致
        proxy_set_header Host "$http_host";
        proxy_set_header Origin "$scheme://$http_host";
    }
}

总结

  • 以上是一步一步摸索出来的,研究成果来之不易
  • 任何看似简单的东西,动手实践后,才能理解的更加深刻
  • 终于对ChatGLM2-6B有了一定的了解,还会继续对大语言模型进行训练和微调,与君共勉

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1117789.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Swingbench 压力测试(超详细)

目录 前提需要有配置好的oracle哦 1、环境准备 2、安装Swingbench 3、造数据 4、压测 前提需要有配置好的oracle哦 1、环境准备 启动监听 lsnrctl start 启动数据库 sqlplus / as sysdba startup 创建表 CREATE TABLESPACE soe DATAFILE /u01/app/oracle/oradata/or…

重生奇迹MU游戏上格斗家挂机小技巧

重生奇迹MU作为一个独特的职业,重生奇迹MU游戏中的格斗家有着多种挂机技巧,以下是一些重生奇迹MU格斗家挂机小技巧供玩家参考: 1.使用幽冥光速拳 幽冥光速拳是格斗家的核心技能之一,可以快速消灭怪物并提高经验值。建议玩家将此…

【PX4报错】Crash dumps present on SD,vehicle needs service

报错: Critical: Preflight Fail: Crash dumps present on SD,vehicle needs service 解决: 将COM_ARM_HFLT_CHECK改为Disabled 参考: PX4常见解锁失败报错及解决方法

PCA降维可视化

二维 import pandas as pd import warnings warnings.filterwarnings("ignore")df pd.read_csv(data/data.csv).dropna() features df.columns[:-1] X, y df[features], df[label]from sklearn.preprocessing import MinMaxScaler # 创建MinMaxScaler对象 scaler…

论坛介绍|COSCon'23 大数据(D)

众多开源爱好者翘首期盼的开源盛会:第八届中国开源年会(COSCon23)将于 10月28-29日在四川成都市高新区菁蓉汇举办。本次大会的主题是:“开源:川流不息、山海相映”!各位新老朋友们,欢迎到成都&a…

柯桥银泰附近有学德语的地方吗,留学德语培训

01 die Garantiefr jemandem/etwas 给某人或某事的保障 Das System bietet die Garantie fr die Bauer. 02 der Gebrauch von etwas 使用某物 Wir haben den Gebrauch vom Computer gelerbt. 我们学会了使用电脑。 03 Die Geduld mit jemandem/etwas 对..的耐心 Der Lehre…

llava1.5-部署

llava1.5 ——demo部署 下载代码和权重 新建weights文件夹,并下载到LLaVA/weights/中。->需要修改文件名为llava-版本,例如llava-v1.5-7b. 运行 启动控制台 python -m llava.serve.controller --host 0.0.0.0 --port 4006启动gradio python -m…

网络拥塞控制的经济学原理

作为一个流通和兑换系统(与被发送速率兑换出的带宽不同,公路交通不是兑换系统,车辆只是单体),网络传输与货币流通和兑换是一回事,借一些经济学术语能更深刻理解拥塞的成因和缓解以及制定拥塞控制策略,这是一个新视角。…

2024年浙大MPA复试可能面临的变数:权重加大

熟悉浙大mpa项目常规批复试规则的同学都知道,每年的复试成绩权重一般都在40%,这个权重对于每年复试后综合成绩的排名影响会比较大,按照mpa联考复试1分等于初试3分的规则,联考笔试成绩假如有15分差异的两个考生,复试成绩…

Docker 部署本地爬虫项目到服务器

笔记:一直想写一篇博客的,那就趁着周末闲暇时光记录一下。 目录 一、前提准备 二、Docker部署爬虫示例 整体梳理 1、打包构建本地项目镜像 2、在 hub 网站上 创建一个仓库。 3、将本地镜像与hub上的仓库打上标签 4、确保已登录 Dockerhub 账号 …

一键掌握多家快递信息,快递批量查询高手软件助你高效管理物流

一键掌握多家快递信息,快递批量查询高手软件助你高效管理物流 在当今这个高度信息化的时代,快递行业的发展可谓日新月异。随着网购的普及,如何高效、准确地掌握多家快递公司的信息,成为了很多消费者和管理者面临的难题。为了解决…

fastadmin笔记,fastadmin表格功能

fastadmin笔记 官方文档请到: https://ask.fastadmin.net/article/323.html自行查阅 1、默认有个切换功能。 浏览模式可以切换卡片视图和表格视图两种模式,如果不需要此功能 在该控制器对应的js 文件中添加上showToggle:false即可。 2、导出功能 …

谷歌浏览器误代码STATUS_INVALID_IMAGE_HASH如何一行代码解决

一、直入主题: 1.谷歌浏览器突然就不能用了,如下图: 2.如何解决 --test-type -no-sandbox 卸载浏览器重装还是一样的问题,目前我们的谷歌浏览器版本号:Chrome 已是最新版本 版本 118.0.5993.89(正式版本&a…

2023年中职组“网络安全”赛项 云南省竞赛任务书

2023年中职组“网络安全”赛项 云南省竞赛任务书 一、竞赛时间 总计:360分钟 二、竞赛阶段 竞赛阶段 任务阶段 竞赛任务 竞赛时间 分值 A模块 A-1 登录安全加固 180分钟 200分 A-2 本地安全策略配置 A-3 流量完整性保护 A-4 事件监控 A-5 服务加固 A-6 防火墙策…

同步网盘选择指南:哪个同步网盘更好用?

同步盘是当下热门的云存储服务之一,它可以将您的文件在不同设备之间进行同步,使您可以随时随地访问和共享您的文件,因此受到了许多用户的喜爱。 一、什么是同步盘 首先到底什么是同步盘?同步盘是指一种云存储服务,它…

回归预测 | MATLAB实现BO-GRU贝叶斯优化门控循环单元多输入单输出回归预测

回归预测 | MATLAB实现BO-GRU贝叶斯优化门控循环单元多输入单输出回归预测 目录 回归预测 | MATLAB实现BO-GRU贝叶斯优化门控循环单元多输入单输出回归预测效果一览基本介绍模型搭建程序设计参考资料 效果一览 基本介绍 MATLAB实现BO-GRU贝叶斯优化门控循环单元回归预测。基于贝…

开关电源负载调整率测试规范国标有哪些?负载调整率测试方法是什么?

负载调整率是用来描述在额定电压下负载电流从0变化到最大时,输出电压相应的变化情况。它是衡量电源芯片好坏的重要指标,因此负载调整率测试是必不可少的环节。那么要如何测试电源芯片负载调整率呢?有哪些测试规范呢? 开关电源芯片测试规范 适用范围&am…

沃通SSL证书服务多省区一体化政务服务平台

近年来,我国政务服务数字化水平不断提升,数字政府建设取得积极成效。依托全国一体化政务服务平台,政务服务效能不断提升,“一网通办”能力显著增强,为创新政府治理、优化营商环境提供了有力支撑。沃通SSL证书具备保护数…

C语言判断设备存储是大端还是小端

一、运行结果 二、源代码 # define _CRT_SECURE_NO_WARNINGS # include <stdio.h>//实现判断函数&#xff1b; int check_sys() {//初始化变量值&#xff1b;int a 1;//判断并返回值&#xff1b;return (*(char*)&a); }int main() {//调用判断内存函数&#xff1b;…

内存拷贝函数 memcpy 的原理及实现

memcpy是memory copy的缩写&#xff0c;意为内存复制&#xff0c;在写C语言程序的时候&#xff0c;我们常常会用到它。它的函原型如下&#xff1a; void *memcpy(void *dest, const void *src, size_t n);它的功能是从src的开始位置拷贝n个字节的数据到dest。如果dest存在数据…