快速配置 Nginx 来实现 GPT 流式传输

news2025/1/10 17:58:19

目录

  • 1. Nginx 参考配置
  • 2. Nginx 核心参数
  • 3. 其他参数

场景代理 ChatGPT代理各种 GPT 工具套壳等。

1. Nginx 参考配置

支持 GPT 流式访问的配置如下,请根据实际需求适当取舍即可:

server {
    listen 80;
    server_name chat.test.com;  # 绑定的域名

	# 配置的时候不要配置全局,仅在需要转发的地方进行配置
    location /chatgpt {
        proxy_set_header Host $host;
     	proxy_set_header X-real-ip $remote_addr;
      	proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
        proxy_pass http://chatgpt-backend; # 使用定义的服务器组
        
        proxy_http_version 1.1; # 可选, websocket 可用
        proxy_set_header Upgrade $http_upgrade;  # 可选
        proxy_set_header Connection "Upgrade";  # 可选
        proxy_buffering off; # 核心参数
    }

    upstream chatgpt-backend {  # 定义一组服务器,主要用于负载均衡配置
        server 172.10.1.119:8080;
        server 172.10.1.120:8080;

    }
}

2. Nginx 核心参数

  • proxy_buffering off;

这个指令告诉 Nginx 不要缓冲来自上游服务器的响应,而是立即将其发送给客户端。这对于需要实时或流式传输数据的场景非常有用,比如实时聊天、流媒体等。

proxy_buffering 默认为 on:表示启用代理缓冲,Nginx 将缓冲来自后端服务器的响应,并在接收完整响应后才将其发送给客户端。这可以提高性能并减少对后端服务器的请求频率,但可能会导致延迟

【注】打开与关闭各有对应的场景。

3. 其他参数

  • proxy_set_header Host $host;

设置请求的目标主机头。$host 变量将被替换为客户端请求中的主机名。

  • proxy_set_header X-Real-IP $remote_addr;

设置客户端的真实 IP 地址。$remote_addr 变量包含客户端的 IP 地址。

  • proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;

设置客户端 IP 地址的列表。当请求通过代理时,代理服务器会将原始客户端 IP 地址添加到 X-Forwarded-For 头部中。$proxy_add_x_forwarded_for 变量将在原始 X-Forwarded-For 值的基础上添加新的 IP 地址。

  • proxy_set_header Upgrade $http_upgrade;

设置升级头,用于告知后端服务器客户端是否支持升级到其他协议。通常用于支持 WebSocket 连接。$http_upgrade 变量包含请求中的 Upgrade 头部信息。

  • proxy_set_header Connection "Upgrade";

设置连接头,指示客户端和服务器之间的连接类型。在支持 WebSocket 的情况下,将连接类型设置为 “Upgrade” 以启用升级协议。

  • proxy_http_version 1.1;

proxy_http_version 指令用于设置与后端服务器之间的 HTTP 协议版本。默认情况下,Nginx
会使用与客户端之间相同的 HTTP 协议版本与后端服务器通信。但有时您可能希望显式地指定与后端服务器之间使用的 HTTP 协议版本。

指定 proxy_http_version 1.1; 表示要求 Nginx 与后端服务器之间使用 HTTP/1.1 协议进行通信。HTTP/1.1 是较新的协议版本,具有许多改进和增强功能,比如持久连接、分块传输编码等。通过指定HTTP/1.1,您可以确保与后端服务器之间使用最新的协议特性,并可能提高性能和功能。

【注】默认情况下,Nginx 会自动检测客户端的 HTTP 协议版本,并与后端服务器进行相应的通信。因此,通常情况下不需要显式地设置 proxy_http_version

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1669663.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

信号处理SCI期刊,中科院2区,专业性强,审稿速度快!

一、期刊名称 Signal Processing 二、期刊简介概况 期刊类型:SCI 学科领域:信号处理 影响因子:4.4 中科院分区:2区 出版方式:订阅模式/开放出版 版面费:选择开放出版需支付$3300 三、期刊征稿范围 …

蛋白胨(Peptone)主要应用于微生物发酵领域 我国进口量持续增长

蛋白胨(Peptone)主要应用于微生物发酵领域 我国进口量持续增长 蛋白胨(Peptone)是一种有机化合物,分子式为C5H9NO2。蛋白胨外观呈淡黄至棕黄色粉剂,含有肉香气味,易溶于水,不溶于乙醚…

AVL树!

文章目录 1.AVL树的概念2.AVL树的插入和旋转3.AVL树的旋转3.1旋转的底层:3.2 右旋转3.3 左旋转3.4 双旋 4.AVL树的底层 1.AVL树的概念 当向二叉搜索树中插入新结点后,如果能保证每个结点的左右子树高度之差的绝对值不超过1(需要对树中的结点进行调整)&a…

HR4988内置转换器和过流保护的微特步进电机驱动芯片

描述 HR4988是一款内部集成了译码器的微特步进电机驱动器,能使双极步进电机以全、半、1/4、1/8、1/16步进模式工作。步进模式由逻辑输入管脚MSx选择。其输出驱动能力达到32V和2A。 译码器是HR4988易于使用的关键。通过STEP管脚输入一个脉冲就可以使电机完成一次步进…

详解循环队列——链表与数组双版本

前言:本节内容主要是讲解循环队列。 在本篇中会讲到两个版本——数组版本、链表版本。本篇内容适合正在学习数据结构队列章节或者已经学过队列但对循环队列感觉模糊的友友们 。 首先先来看一下什么是循环队列 什么是循环队列 因为是刚开始讲解, 所以我们…

zabbix基础

监控系统基本介绍: 企业级应用中,服务器数量众多,一般情况下需要维护人员进行长时间对服务器体系、计算机或其他网络设备(包括硬件和软件)进行长时间进行性能跟踪,保证正常稳定安全的运行,于是…

Spring Bean的生命周期 五步 七步 十步 循序渐进

👨‍🏫 参考视频地址 💖 五步版 实例化 bean(构造方法)属性注入(set() 方法)初始化方法(自定义)使用bean销毁方法(自定义) 💖 七步版…

轨迹规划 | 图解纯追踪算法Pure Pursuit(附ROS C++/Python/Matlab仿真)

目录 0 专栏介绍1 纯追踪算法原理推导2 自适应纯追踪算法(APP)3 规范化纯追踪算法(RPP)4 仿真实现4.1 ROS C仿真4.2 Python仿真4.3 Matlab仿真 0 专栏介绍 🔥附C/Python/Matlab全套代码🔥课程设计、毕业设计、创新竞赛必备!详细介绍全局规划…

Embedding技术学习

可能很多人并没有关注Embedding技术,但实际上它是GPT非常重要的基础,准备的说,它是GPT模型中理解语言/语义的基础。 【解释什么是Embedding】 对于客观世界,人类通过各种文化产品来表达,比如:语言&#x…

上下左右翻转照片以及标注信息扩充数据集

目录 前言: 示例项目数据结构: 源代码: 运行代码后生成的项目结构: 效果: 前言: 使用yolo训练模型时,遇到数据集很小的情况(一两百张),训练出来的模型效…

部品图纸管理系统-部品图纸管理系统推荐

部品图纸管理系统-部品图纸管理系统推荐: 彩虹图纸管理系统是一种专门用于管理部品图纸和相关文档的软件系统。该系统旨在提供一个集中、协同、统一和高效的平台,以便企业能够轻松地存储、组织、查询、审批和共享部品图纸。 以下是彩虹图纸管理系统通常具…

关于【python中启动web服务后发送post请求时报错“500 Internal Server Error”的问题】

关于【python中启动web服务后发送post请求时报错“500 Internal Server Error”的问题】 问题描述 在原有的conda虚拟环境中运行项目的web服务时运行正常,换到一个配置好的新的虚拟环境中运行同样的项目代码时就报错“500 Internal Server Error”。 解决方案&…

Request请求数据 (** kwargs参数)

目录 🌟前言🍉request入门1. params2. data3. json4. headers5. cookies6. auth7. files8. timeout9. proxies10. allow_redirects11. stream12. verify13. cert 🌟总结 🌟前言 在Python中,发送网络请求是一项常见的任…

企业微信hook接口协议,ipad协议http,同步消息记录

同步消息记录 参数名必选类型说明uuid是String每个实例的唯一标识,根据uuid操作具体企业微信limit是int每次返回大小seq是int查询下标 请求示例 {"uuid":"ecb033af-6fcd-4ec2-880e-41f070b65eaf","limit":1000, "seq":1…

led灯哪个品牌质量好?分享五款耐用又护眼的护眼台灯

led灯哪个品牌质量好?在LED照明日益普及的今天,选择一款质量上乘、耐用且护眼的LED台灯显得尤为重要。本文将为大家推荐五款备受好评的护眼台灯品牌,这些品牌凭借其卓越的照明效果、舒适的视觉体验以及优质的售后服务,成为了市场上…

根据特定条件在列表中加一列操作,符合此条件时此列才会展示

我们想要列表中有一列数据在A环境打开是显示的,在B环境打开则不显示,这里B环境表示为默认环境 1、不能直接用环境判断加在列表的前面,否则其他环境会出现空格情况 constructor(props) {super(props)const columns [{ title: 姓名, dataInd…

英语口语打分和纠正的开发引擎

英语口语打分和纠正的开发引擎包括但不限于以下几种,这些引擎利用了深度学习、大数据分析等先进技术,能够对发音准确度、流利度、完整度、韵律特征等进行全方位评价和纠正。开发者可以根据自己的需求选择合适的引擎进行集成,以提升英语口语学…

PSO-SVM多变量回归预测|粒子群算法优化支持向量机|Matalb

目录 一、程序及算法内容介绍: 基本内容: 亮点与优势: 二、实际运行效果: 三、算法介绍: 四、完整程序下载: 一、程序及算法内容介绍: 基本内容: 本代码基于Matlab平台编译&am…

【Tello无人机】实物轨迹跟踪控制

上一篇介绍了Tello无人机仿真环境中的飞行控制,本篇将介绍tello无人机在物理系统中的轨迹跟踪,实现实物无人机的速度控制。本文采用的无人机为Tello TT,TELLO Talent由飞行器和拓展配件两部分组成。飞行器配备视觉定位系统,并集成…

618有哪些值入手的好物?盘点618值得选购好物清单

马上就要618大促了,要说618期间优惠力度最大的那肯定还是家电、数码这一类型的,下面就给大家整理了几款值得入手的家电数码好物! 好物推荐一、西圣Mike无线领夹麦克风 真的强烈推荐西圣Mike无线领夹麦克风!市场上某些制造商可能…