深入理解与配置 Nginx TCP 日志输出

news2025/3/13 16:07:12

一、背景介绍

在现代网络架构中,Nginx 作为一款高性能的 Web 服务器和反向代理服务器,广泛应用于各种场景。除了对 HTTP/HTTPS 协议的出色支持,Nginx 从 1.9.0 版本开始引入了对 TCP 和 UDP 协议的代理功能,这使得它在处理数据库连接代理、流媒体服务代理等 TCP 相关业务场景中也发挥着重要作用。
在 TCP 代理场景下,准确、详细的日志记录对于监控服务运行状态、排查故障、分析业务流量等工作至关重要。通过合理配置 Nginx 的 TCP 日志输出,运维人员和开发人员能够获取到丰富的信息,如客户端连接来源、后端服务器响应情况、数据传输量等,从而为系统的稳定运行和优化提供有力支持。

二、原理剖析

Nginx 的 TCP 日志输出依赖于其内部的日志模块,在 TCP 代理过程中,当客户端与 Nginx 建立连接,Nginx 再与后端服务器建立连接并进行数据转发时,日志模块会在不同阶段收集各种相关信息。这些信息包括但不限于连接的源地址和目标地址、协议类型、连接状态、数据传输的字节数等。
根据配置的日志格式和规则,日志模块将收集到的信息进行格式化处理,并在适当的时机将日志写入到指定的文件中。默认情况下,Nginx 会在 TCP 连接断开时完成日志记录并写入文件,以减少频繁的磁盘 I/O 操作对性能的影响。然而,通过一些配置调整,我们可以改变日志记录的时机和方式,使其更符合业务需求。

三、详细配置步骤

3.1 确认 Nginx 支持 stream 模块

在进行 TCP 日志配置前,首先要确保 Nginx 已启用stream模块。如果在启动 Nginx 时出现nginx: [emerg] unknown directive "stream"错误,说明 Nginx 在编译时未包含该模块。可以通过重新编译 Nginx 并添加–with-stream选项来解决,或者使用包管理器安装支持stream模块的 Nginx 版本(不同系统的包管理器操作有所不同,如在 Ubuntu 中可尝试安装nginx-stream-module相关包)。

3.2 配置日志格式

在 Nginx 配置文件中,一般在stream模块内定义日志格式。例如:

stream {
    log_format tcp_log '$remote_addr - $upstream_addr - [$time_local] '
                       '$protocol $status $bytes_sent $bytes_received';
   ...
}

在上述配置中:

  1. $remote_addr表示客户端的 IP 地址。
  2. $upstream_addr是后端服务器的地址。
  3. $time_local为本地时间。
  4. $protocol指使用的协议(如 TCP)。
  5. $status表示连接状态。
  6. b y t e s s e n t 和 bytes_sent和 bytessentbytes_received分别是发送给客户端和从客户端接收的字节数。

3.3 配置访问日志

配置好日志格式后,需要指定日志文件路径以及使用的日志格式。例如:

stream {
   ...
    access_log /opt/app/nginx/log/doris-proxy.log tcp_log buffer=32k flush=5m;
}

这里,/opt/app/nginx/log/doris-proxy.log是日志文件路径。tcp_log是前面定义的日志格式名称。buffer=32k设置了日志缓冲区大小为 32KB,以减少磁盘 I/O 次数。flush=5m表示每 5 分钟将缓冲区中的日志刷新到磁盘。如果希望日志更实时地记录,可以适当减小flush的时间间隔,如flush=10s。

3.4 配置错误日志

除了访问日志,错误日志对于排查问题也非常重要。在stream模块中添加错误日志配置:

stream {
   ...
    error_log /opt/app/nginx/log/doris-proxy-error.log notice;
}

/opt/app/nginx/log/doris-proxy-error.log是错误日志文件路径,notice是日志级别。可以根据实际需求调整日志级别,如debug(最详细)、info、warn、error、crit(最简略)。

3.5 配置 TCP 代理服务器并关联日志

在stream模块内配置 TCP 代理服务器,并确保每个server块中关联上述定义的日志配置。例如:

stream {
   ...
    server {
        listen 7034;
        proxy_connect_timeout 300s;
        proxy_timeout 3880000s;
        proxy_pass backend_server;

        access_log /opt/app/nginx/log/doris-proxy.log tcp_log buffer=32k flush=5m;
        error_log /opt/app/nginx/log/doris-proxy-error.log notice;
    }
}

backend_server应替换为实际的后端服务器地址或服务器组名称。

3.6 检查配置并重启 Nginx

完成配置修改后,使用nginx -t命令检查配置文件语法是否正确。如果无误,执行sudo service nginx restart命令重启 Nginx 服务,使配置生效。
实际效果如下

四、日志格式详解

Nginx 提供了丰富的内置变量用于日志格式定义,通过组合这些变量,可以创建满足不同需求的日志格式。除了前面提到的常用变量,还有:

  1. $session_time:会话持续时间,即从客户端连接到连接断开的总时长。
  2. $upstream_bytes_sent:发送给后端服务器的字节数。
  3. $upstream_bytes_received:从后端服务器接收的字节数。
  4. $upstream_connect_time:与后端服务器建立连接所花费的时间。

例如,以下是一个更详细的日志格式定义:

log_format detailed_tcp_log '$remote_addr [$time_local] '
                           '$protocol $status $bytes_sent $bytes_received '
                           '$session_time "$upstream_addr" '
                           '"$upstream_bytes_sent" "$upstream_bytes_received" "$upstream_connect_time"';

这种详细的日志格式能够提供更全面的信息,帮助运维人员深入分析 TCP 连接的整个生命周期和数据传输情况。

五、高级设置

5.1 日志缓存优化

Nginx 使用日志缓存来提高性能,减少磁盘 I/O 操作。除了前面提到的buffer和flush参数,还可以通过open_log_file_cache指令进一步优化日志缓存。例如:

open_log_file_cache max=1000 inactive=20s valid=1m min_uses=2;
  1. max:指定缓存中最多可以存储的日志文件描述符数量。
  2. inactive:设置在多长时间内(这里是 20 秒),如果一个日志文件描述符没有被使用,就会从缓存中移除。
  3. valid:表示每隔 1 分钟检查一次缓存中日志文件的状态,确保其有效性。
  4. min_uses:规定一个日志文件描述符至少被使用 2 次后才会被缓存。

5.2 日志轮转

随着时间的推移,日志文件会不断增大,为了管理日志文件大小并保留历史日志,需要进行日志轮转。在类 Unix 系统中,通常使用logrotate工具来实现。例如,在/etc/logrotate.d/目录下创建一个针对 Nginx TCP 日志的配置文件,内容如下:

/opt/app/nginx/log/doris-proxy.log {
    daily
    missingok
    rotate 7
    compress
    delaycompress
    notifempty
    create 640 nginx nginx
    sharedscripts
    postrotate
        /usr/sbin/nginx -s reopen
    endscript
}

上述配置表示:

  1. daily:每天进行一次日志轮转。
  2. missingok:如果日志文件不存在,不报错继续执行。
  3. rotate 7:保留 7 天的日志文件,旧的日志文件将被删除。
  4. compress:对轮转后的日志文件进行压缩。
  5. delaycompress:延迟压缩,在下一次轮转时压缩上一次轮转的日志文件。
  6. notifempty:如果日志文件为空,不进行轮转。
  7. create 640 nginx nginx:轮转后创建新的日志文件,权限为 640,所有者和组为nginx。
  8. sharedscripts:只在所有日志文件都轮转后执行一次脚本。
  9. postrotate和endscript之间的命令/usr/sbin/nginx -s reopen:通知 Nginx 重新打开日志文件,以便将新的日志写入新文件。

5.3 基于条件的日志记录

在某些情况下,可能希望只记录特定条件下的 TCP 连接日志。例如,只记录与特定后端服务器通信的日志,或者只记录传输字节数超过一定阈值的日志。虽然 Nginx 原生的 TCP 日志模块没有像 HTTP 模块那样强大的条件日志功能,但可以通过一些第三方模块(如nginx-sticky-module-ng)或结合日志收集工具(如logstash、fluentd)来实现。
例如,使用logstash可以在日志收集阶段对 Nginx TCP 日志进行过滤和处理。在logstash的配置文件中,可以编写如下规则:

input {
    file {
        path => "/opt/app/nginx/log/doris-proxy.log"
        start_position => "beginning"
    }
}
filter {
    if [message] =~ /192.168.1.100/ {
        # 只处理与IP为192.168.1.100的后端服务器相关的日志
    }
}
output {
    elasticsearch {
        hosts => ["localhost:9200"]
        index => "nginx_tcp_logs"
    }
}

通过这种方式,可以实现更灵活、更有针对性的日志记录和处理。
通过对 Nginx TCP 日志输出的深入理解和合理配置,能够更好地监控和管理基于 TCP 协议的服务,为系统的稳定运行和优化提供有力支持。希望本文所介绍的内容能帮助读者在实际工作中充分利用 Nginx 的日志功能,提升系统运维和开发的效率。nginx官网详细配置

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2311480.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【文心索引】搜索引擎测试报告

目录 一、项目背景 1、互联网信息爆炸的时代背景 2、搜索引擎的应运而生 3、搜索引擎的市场需求和竞争态势 4、搜索引擎项目的意义 二、项目功能 1、基础搜索功能 2、用户交互与体验功能 3、数据索引与爬取功能 三、测试报告 3.1.功能测试 3.1.1.输入测试&#xff…

ReAct论文阅读笔记总结

ReAct:Synergizing Reasoning and Acting in Language Models 背景 最近的研究结果暗示了在自主系统中结合语言推理与交互决策的可能性。 一方面,经过适当Prompt的大型语言模型(LLMs)已经展示了在算术、常识和符号推理任务中通…

InternalError: too much recursion

🤍 前端开发工程师、技术日更博主、已过CET6 🍨 阿珊和她的猫_CSDN博客专家、23年度博客之星前端领域TOP1 🕠 牛客高级专题作者、打造专栏《前端面试必备》 、《2024面试高频手撕题》、《前端求职突破计划》 🍚 蓝桥云课签约作者、…

在WSL2-Ubuntu中安装CUDA12.8、cuDNN、Anaconda、Pytorch并验证安装

#记录工作 提示:整个过程最好先开启系统代理,也可以用镜像源,确保有官方发布的最新特性和官方库的完整和兼容性支持。 期间下载会特别慢,需要在系统上先开启代理,然后WSL设置里打开网络模式“Mirrored”,以设置WSL自动…

LLM论文笔记 19: On Limitations of the Transformer Architecture

Arxiv日期:2024.2.26机构:Columbia University / Google 关键词 Transformer架构幻觉问题数学谜题 核心结论 1. Transformer 无法可靠地计算函数组合问题 2. Transformer 的计算能力受限于信息瓶颈 3. CoT 可以减少 Transformer 计算错误的概率&#x…

基于51单片机的智能水箱控制系统proteus仿真

地址:https://pan.baidu.com/s/1zgG90VB5TEA05O2ZkKC3CA 提取码:1234 仿真图: 芯片/模块的特点: AT89C52/AT89C51简介: AT89C52/AT89C51是一款经典的8位单片机,是意法半导体(STMicroelectroni…

虚拟系统实验

实验拓扑 启动虚拟系统 [FW]vsys enable 配置资源类 先查看 配置 创建虚拟系统 [USG6000V1]vsys name vsysa 绑定资源类 [USG6000V1-vsys-vsysa]assign resource-class r1 将接口划入虚拟系统 [USG6000V1-vsys-vsysa]assign interface GigabitEthernet 1/0/1 公共接口 --- 勾…

V90伺服电机初调试

分配设备IP地址 打开博途,将IP地址分配给对应伺服 打开V-ASSISTANT软件,刷新后读取硬件。VASSISTANT软件选择指定伺服,点击设备调试, 在控制模式选项中选择基本定位器控制(EPOS) 在设置PROFINET-选择报文页…

Air780EPM:SIM 卡接口设计指导来啦~

在数字化浪潮中,SIM卡作为通信设备的“身份证”,早已成为人们生活中不可或缺的存在。 以下详细阐述了SIM卡接口如何通过读取卡片信息完成4G网络鉴权,并支持双卡切换功能,使设备能够灵活选择最优网络。这种看似简单的机制&#xf…

DNS云解析有什么独特之处?

在数字化浪潮中,每一次网页点击、视频加载或在线交易背后,都依赖着域名系统(DNS)的高效运转。传统DNS架构的局限性(如单点故障、延迟高、安全脆弱)在云计算时代被彻底颠覆,DNS云解析作为新一代解…

VMware Workstation安装rocky9.5虚拟机

1、在镜像源网站中下载rocky镜像源,下载dvd版(图像,软件全部都有,其他版本还需下载图像),这里我使用的镜像源网站是ubuntu-releases安装包下载_开源镜像站-阿里云 2、找到isos: 3、找x86_64/ 4、…

概念|RabbitMQ 消息生命周期 待消费的消息和待应答的消息有什么区别

目录 消息生命周期 一、消息创建与发布阶段 二、消息路由与存储阶段 三、消息存活与过期阶段 四、消息投递与消费阶段 五、消息生命周期终止 关键配置建议 待消费的消息和待应答的消息 一、待消费的消息(Unconsumed Messages) 二、待应答的消息…

多模态知识图谱融合

1.Knowledge Graphs Meet Multi-Modal Learning: A Comprehensive Survey 1.1多模态实体对齐 1.2多模态实体链接 研究进展&#

多宠识别:基于计算机视觉的智能宠物管理系统架构解析

一、行业痛点与技术方案演进 在多宠家庭场景中,传统方案面临三大技术瓶颈: 1. 生物特征混淆:同品种/毛色宠物识别准确率低于65% 2. 动态场景适应:进食/奔跑状态下的误检率达30% 3. 数据孤岛问题:离线设备无法实现持续…

蓝桥杯-15届研究生组-A 劲舞团

思路和时间复杂度 思路&#xff1a;签到模拟题&#xff0c;但是思路也很重要&#xff0c;在K的重新赋值时&#xff0c;卡了一下&#xff0c;在不满足时间条件时&#xff0c;应该重置为1时间复杂度&#xff1a; 代码 #include <iostream> #include<cmath>…

最长重复子数组、最长公共子序列、判断子序列

20250307 题目区别dp数组含义的区别dp数组状态转移方程 代码随想录&#xff1a; 最长重复子数组 最长公共子序列 判断子序列 题目区别 最长重复子数组&#xff08;连续&#xff09;&#xff1a; 最长公共子序列&#xff08;不连续&#xff09;&#xff1a; 判断子序列 dp数…

【数据分析】转录组基因表达的KEGG通路富集分析教程

禁止商业或二改转载,仅供自学使用,侵权必究,如需截取部分内容请后台联系作者! 文章目录 介绍差异分析(limma)KEGG富集分析(enrichKEGG)可视化加载R包数据下载导入数据基因差异分析火山图KEGG通路富集分析可视化通路结果另一个案例总结系统信息参考介绍 KEGG富集分析,可…

SpringBoot - 用责任链模式实现业务编排

文章目录 前因责任链&#xff1a;像工作台一样组织代码CodeSEQ3.1 定义处理器规范3.2 实现具体处理器3.3 共享上下文3.4 组装责任链 适用场景优势 前因 2000多行的业务逻辑里&#xff0c;各种校验规则、促销计算、库存操作像意大利面条一样缠绕在一起。最要命的是这样的代码结…

ResNet 改进:轻量级的混合本地信道注意机制MLCA

目录 1. MLCA注意力机制 2. 改进位置 3. 完整代码 Tips:融入模块后的网络经过测试,可以直接使用,设置好输入和输出的图片维度即可 1. MLCA注意力机制 MLCA(Mixed Local Channel Attention)是一种轻量级的混合本地信道注意机制,旨在提升卷积神经网络(CNN)在图像处理…

【第22节】C++设计模式(行为模式)-Iterator(迭代器)模式

一、问题背景 Iterator 模式是设计模式中最为常见和实用的模式之一。它的核心思想是将对聚合对象的遍历操作封装到一个独立的类中&#xff0c;从而避免暴露聚合对象的内部表示。通过 Iterator 模式&#xff0c;我们可以实现对聚合对象的统一遍历接口&#xff0c;而不需要关心聚…