Node.js健康检查和过载保护

news2024/10/6 14:24:33

c059da859f1582218b3e11264b4a1b58.jpeg[图片来源:unsplash.com[1]]

设想一下,你有30个Node服务器与 "Nginx "服务器平衡。服务器的负载被平均分配,所以如果你有9000个用户,每个服务器有300个客户。把负载平均分配给每台服务器并不意味着你可以避免过载,因为你的工作对每个用户都可能不同。例如,对于user_1,你可能读取3个文件,但对于user_2,你可能需要读取10个(3.34倍)。根据用户的请求过程会有更多的复杂性,这是现实中需要去思考和解决的问题。在类似于这种的情况之下,开发者不得不平衡对同每一台服务器的请求,因为一旦这台服务器是Server Overload(过载)的状态,你的服务可能会挂掉。

健康检查 每隔n秒向服务器发送请求,以了解服务器是否能够处理更多的请求,如果正常,服务器将其标记为OK,并继续从Balancer(平衡器)接收更多的请求,否则服务器将其标记为Error,Balancer将不会向该服务器发送任何请求,直到Balancer再次发送健康检查请求并标记为OK。

这个过程被称为健康检查。

作为检测应用是否正常运行的机制,服务器健康检查通常在以下情况下使用:

  1. 高可用性

  2. 负载均衡:如果正在使用多个实例运行同一项目或者应用,则可以将负载平衡器配置为定期查询每个实例并记录其响应时间和状态。

  3. 自动化部署:自动化部署过程中包括激活新版本后立即执行的测试步骤,这些测试步骤大多数都涉及到对系统组件进行基本的功能验证或心跳监控。

  4. 监控和警报:当服务不再可访问或出现其他问题时,服务器健康检查可以触发警报并通知管理员或开发人员进行干预操作。

实际应用

以下是基于Express和Node.js实现健康检查的简单Demo:

  1. 安装healthcheck模块:使用npm或yarn等包管理工具安装healthcheck模块。

  2. 在Express应用中添加路由:创建一个新路由来处理/healthcheck请求,并返回200 OK响应。

const healthCheck = require('express-healthcheck');

app.use('/health', healthCheck({
  healthy: function () {
    return { everything: 'is ok' };
  }
}));
  1. 向监控系统报告:如果正在使用譬如Prometheus[2]之类的监控系统,则可以将其配置为定期查询/health接口并记录结果。此外,还可以将结果发送到其他系统进行分析和通知。

  2. 添加自定义检查项:除了默认提供的基本系统信息之外,还可以编写自己的检查函数来测试特定组件或功能是否可用。这些函数必须返回承诺对象并被注册到健康检查器中:

const checkDbConnection = async () => {
  try {
    const client = await pool.connect();
    await client.query('SELECT NOW()');
    return true;
  } catch (e) {
    console.error(e);
    return false;
  }
};

const customChecks = [checkDbConnection];

app.use('/health', healthCheck({
  healthy: function () {
    return { everything: 'is ok' };
  },
  customChecks
}));

结合着nginx和node.js做健康检查

考虑到实际项目中广泛使用Nginx的现状,所以笔者推荐使用nginx_upstream_check_module(不随Nginx源码分发)和Node.js来实现服务器健康检查:

  1. 首先,在Nginx配置文件中启用upstream_check模块。例如,可以在http块中添加如下代码:

http {
  upstream myapp {
    server localhost:3000;

    check interval=3000 rise=2 fall=3 timeout=2000 type=http;
    check_http_send "HEAD /health HTTP/1.0\r\n\r\n";
    check_http_expect_alive http_2xx http_3xx;
  }
}

这将创建一个名为myapp的上游组,并且每隔3秒钟会向localhost:3000发送一个HTTP HEAD请求以检查其状态。

  1. 在Node.js应用中,按照前面提到的方法设置/ healthcheck路由(或任何其他自定义路由)。

const healthCheck = require('express-healthcheck');

app.use('/health', healthCheck({
  healthy: function () {
    return { everything: 'is ok' };
  }
}));
  1. 确保应用正在侦听端口3000并运行。如果需要更改端口,请相应地更新Nginx配置文件。

  2. 最后,在浏览器中访问http://localhost/_nginx_health_check/myapp(根据需要更改主机和路径),以确保Nginx正确显示了myapp上游组件的状态,并且已经能够成功连接到Node.js服务端点。

通过以上几个步骤,就可以将nginx_upstream_check_module和Node.js结合起来创建一个强大的健康检查机制。

尽管ngx_http_healthcheck_module拥有着高效、零活且易于配置的优点,但是由于其仅适用于 HTTP 服务,不支持 TCP 或 UDP 健康检查:如果要检测连接到非 Web 服务器(如数据库)是否正常工作,则需要另外使用第三方组件或软件包。

HAProxy

HAProxy[3]是一个开源的负载均衡工具,可以将来自客户端的请求分发到多个后端服务器,并确保这些请求能够平衡地分配给所有可用的服务器。HAProxy支持多种协议,例如HTTP、TCP和SMTP等。

HAProxy最初是为高可用性而设计的,在其最简单的形式下,它只需配置两个或更多台服务器即可实现基本负载均衡。但随着时间推移和版本更新,它已经成为一款功能强大且广泛应用于各种场景中(包括大型企业网络)的软件。

除了提供负载均衡之外,HAProxy还具有其他有用功能。例如:

  1. 健康检查:HAProxy可以定期检查后端服务器是否健康,并根据需要启停不健康或超时连接。

  2. SSL终止:HAProxy可以在前置代理层上执行SSL加密和解密操作。

  3. 请求重写:HAProxy允许使用ACL规则对传入请求进行修改或过滤。

  4. 日志记录:HAProxy生成详细日志以便于跟踪问题并进行性能优化。

HAProxy可以与Nginx和NodeJS结合使用,以提供一个高性能、可扩展和可靠的网络服务基础设施。以下是将这些技术结合起来使用的一种可能方式:

  1. 使用Nginx作为一个反向代理:在这种配置中,Nginx作为前端服务器,接收所有来自客户端的传入请求,并将其转发到适当的后端服务器进行处理。开发者可以配置Nginx分别在80或443端口监听HTTP或HTTPS流量。

  2. 将HAProxy配置为一个负载平衡器:HAProxy应该被配置为在运行NodeJS项目的多个后端服务器之间分配传入的流量。负载平衡算法可以根据使用者的具体需求来定制。

  3. 使用PM2部署NodeJS项目:PM2是一个进程管理器,可以轻松地在多个服务器实例上管理和扩展NodeJS项目。

  4. 在负载均衡器层面上设置SSL终端:如果开发者的应用需要SSL加密,可以通过在负载平衡器上安装SSL证书,在HAProxy层面上设置SSL终止。

下面是使用这些技术时需要考虑到的一些问题:

  • 如果应用需要在客户端请求之间保持会话数据,可能想配置粘性会话。

  • 使用ping检查或自定义脚本等工具监控服务器的健康状态。

  • 通过在Nginx和HAProxy中配置缓存规则来优化性能。

总的来说,将HAProxy与Nginx和nodeJS结合起来,为建立快速、可靠的Web服务提供了一个强大的工具集,可以处理大量的流量,同时在系统故障或中断的情况下提供强大的故障转移机制。

过载保护

为了检查服务器是否过载并防止过载,开发者通常需要检查一些指标。这也取决于项目代码逻辑是否完全准确无误,但在这里可以看到必须检查的通用指标。

  • 事件循环延迟

  • 已用堆内存

  • ...

我们可以借助于overload-protection[4]这个包,可以帮助我们快速定位到这些指标。另一个值得推荐的包是event-loop-lag[5],接受一个代表刷新事件循环滞后测量频率的毫秒数,并返回一个可以调用的函数,以接收最新的滞后测量值,单位为毫秒。

使用overload-protection包,我们可以指定限制,超过这个限服务器将无法处理更多的请求。当配置的最大请求限制通过时,软件包会自动发送503 SERVICE UNAVAILABLE。该包与http、express、restify和koa包一起工作。

但是,如果负载平衡器(Banlancer)可以发送socket进行Health Check,并且你想用socket来做,那么就需要使用别的包来完成此事了。

结语

解释 "健康检查 "和 "过载保护"[6]。

"每台服务器至少应该有一个健康检查的实现机制,这对分布式系统来说是至关重要的。"

[1]

unsplash.com: https://unsplash.com/

[2]

Prometheus: https://prometheus.io/

[3]

HAProxy: https://www.haproxy.org/

[4]

overload-protection: https://github.com/davidmarkclements/overload-protection

[5]

event-loop-lag: https://github.com/pebble/event-loop-lag

[6]

Explaining “Health Checks” and “Overload Protection”: https://blog.bitsrc.io/nodejs-health-checks-and-overload-protection-368a132a725e

- END -

关于奇舞团

奇舞团是 360 集团最大的大前端团队,代表集团参与 W3C 和 ECMA 会员(TC39)工作。奇舞团非常重视人才培养,有工程师、讲师、翻译官、业务接口人、团队 Leader 等多种发展方向供员工选择,并辅以提供相应的技术力、专业力、通用力、领导力等培训课程。奇舞团以开放和求贤的心态欢迎各种优秀人才关注和加入奇舞团。

70537d5f90329483fd1d5483085aee53.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/698600.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

linux下MySQL忘记密码解决方法

背景:自己搭建了很多测试环境,有的时候,某一台机器上面的MySQL密码可能就忘了,这种情况怎么办?记录一下解决方法,便于以后迅速解决这一类问题 第一步:查看MySQL的进程是否存活 ps -ef|grep my…

CMU15-445 2022 Fall 通关记录 —— Project 2:B+ Tree(上篇)

Project 2:B Tree Project #2 - BTree | CMU 15-445/645 :: Intro to Database Systems (Fall 2022) NOTE: 记录完成该Pro中,一些可能会遇到的问题: 本实验中,有很多API是需要自己去实现的,因此&#xf…

NLP入门:word2vec self-attention transformer diffusion的技术演变

这一段时间大模型的相关进展如火如荼,吸引了很多人的目光;本文从nlp领域入门的角度来总结相关的技术路线演变路线。 1、introduction 自然语言处理(Natural Language Processing),简称NLP。这个领域是通过统计学、数…

自学黑客(网络安全),一般人我劝你还是算了吧(自学网络安全学习路线--第十七章 网络安全技术下)【建议收藏】

文章目录 一、自学网络安全学习的误区和陷阱二、学习网络安全的一些前期准备三、自学网络安全学习路线一、扫描工具赏析1、扫描工具概述2、如何获取扫描工具3、常用扫描工具4、SATAN的分级5、SATAN的特点6、SNMP7、Nessus8、X-scan9、常用扫描工具比较10、其它扫描工具 二、扫描…

【azure】office 365邮箱auth2认证之spa的刷新令牌过期后如何处理

参考:https://learn.microsoft.com/zh-cn/azure/active-directory/develop/refresh-tokens 官方对令牌和刷新令牌生命周期的描述 已失效的刷新令牌如何获取新的令牌和刷新令牌 /*** office 365使用失效的刷新令牌和应用程序的相关信息来获取新的访问令牌和刷新令牌…

PyTorch安装配置(windows)

一、Anaconda安装与配置 Anaconda提供了conda机制用于管理Python数据分析时常用的工具库/包 官网下载最新的(翻墙):https://repo.anaconda.com/archive/ 清华大学Anaconda镜像站:https://mirrors4.tuna.tsinghua.edu.cn/help/an…

从研发赋能型PMO到产研管理型PMO的组织变革思考︱广联达产研管理部副总经理丰之恺

广联达科技股份有限公司产研管理部副总经理丰之恺先生受邀为由PMO评论主办的2023第十二届中国PMO大会演讲嘉宾,演讲议题:从研发赋能型PMO到产研管理型PMO的组织变革思考。大会将于8月12-13日在北京举办,敬请关注! 议题简要&#x…

4G无线通信技术的单片机远程升级研究(学习)

介绍了一种基于4G无线通信技术的单片机远程在线升级系统及方法,由上位机、4G无线模块、嵌入式设备终端3部分组成。 结合EC20 R2.1 4G模块,介绍了4G无线网络的组建方法,借助4G网络实现远程无线升级。 通过验证测试,系统能够实现嵌入…

css内阴影

CSS内阴影及特定方向内阴影 基本参数: /* x 偏移量 | y 偏移量 | 阴影颜色 */ box-shadow: 60px -16px teal;/* x 偏移量 | y 偏移量 | 阴影模糊半径 | 阴影颜色 */ box-shadow: 10px 5px 5px black;/* x 偏移量 | y 偏移量 | 阴影模糊半径 | 阴影扩散半径 | 阴影…

Python GUI编程利器:初始Tkinker(1)

小朋友们好,大朋友们好! 我是猫妹,一名爱上Python编程的小学生。 和猫妹学Python,一起趣味学编程。 神兽归笼 最近天气炎热起来了,大家一定要注意防暑降温啊! 马上要放暑假了,你有什么计划没…

AI届老牌顶流!AI孙燕姿?AI配音?带你玩转语音合成!

热度与争议并存!AI孙燕姿成新晋顶流?随着AI孙燕姿的爆火,AI老牌顶流「语音合成」再度被炒热飞桨AI Studio也汇聚着众多“语音合成”深度玩家本期就来带大家快速上手 AI克隆歌手 该应用项目使用AI孙燕姿同源模型So-VITS-SVC 4.0,其…

Pyside6-QtCharts+psutil实战-绘制一个CPU监测工具

今天是实战篇章,我们结合可以快速提升我们开发效率的工具一起开实战一波实时读取系统CPU使用情况的折线图。 使用的开发工具Qt Designer来开发UI界面。 十分便捷。使用起来也算比较的简单了,虽然也存在不少的BUG。 ❝ 对所需要的控件进行拖拽式&#xff…

如何看待低级爬虫与高级爬虫?

爬虫之所以分为高级和低级,主要是基于其功能、复杂性和灵活性的差异。根据我总结大概有下面几点原因: 功能和复杂性:高级爬虫通常提供更多功能和扩展性,包括处理复杂页面结构、模拟用户操作、解析和清洗数据等。它们解决了开发者…

死神来了 | 印度火车,能靠点谱吗?

点击文末“阅读原文”即可参与节目互动 剪辑、音频 / 阿福 运营 / SandLiu 卷圈 监制 / 姝琦 封面 / 姝琦Midjourney 产品统筹 / bobo 场地支持 / 声湃轩天津录音间 6月初,印度三列火车先后相撞,造成288人死亡、1175人受伤,被称为印度本世…

基于Echarts2.X的地图数据可视化指南

目录 前言 一、关于Echarts版本 1、为什么用Echarts2.2.7 2、文件目录说明 二、地图数据可视化 1、新建map.html 2、Echarts图表初始化 3、参数设置 三、源码展示分析 1、初始化阶段 2、timelineOption.js模拟数据 总结 前言 在前面的博文(数据会说话-从我国…

ebpf执行报错no BTF found for kernel

一、现象描述 采用cilium epbf框架开发的ebpf程序无法在系统上正常运行。 curtiscurtis-desktop:~$ cd work/ curtiscurtis-desktop:~/work$ ls kmodule vfs_write_moitor curtiscurtis-desktop:~/work$ curtiscurtis-desktop:~/work$ sudo ./vfs_write_moitor -filename/mn…

第九十天学习记录:C++核心:函数提高

函数默认参数 在C中,函数的形参列表中的形参是可以有默认值的。 语法:返回值类型 函数名 (参数默认值){} 问:C语言可以在函数的形参赋默认值吗? 答: 在C语言中&#xf…

Unity 之 抖音小游戏本地数据最新存储方法分享

Unity 之 抖音小游戏本地数据最新存储方法分享 一、抖音小游戏文件存储系统背景二、文件存储系统的使用方法2.1 初始化2.1 创建目录2.3 存储数据2.4 删除目录/文件2.5 其他相关操作 三,小结 抖音小游戏是一种基于抖音平台开发的小型游戏,与传统的 APP 不…

Java POI (2)—— Excel文件的上传与导出(实例演示)

一、单文件的上传功能 这里是一个demo的流程图,下面按照这个流程图做了一个简单的实现,有部分判断没有加上,实际操作中,可以根据自己的需求进行增加或者修改。并且此处还是在接受文件传入后将文件进行了下载,保存到本地…

哪个爬虫库用的最多?

在Python中,最常用的爬虫库是requests和BeautifulSoup。requests库用于发送HTTP请求和处理响应,而BeautifulSoup库用于解析HTML文档。这两个库通常结合使用,用于爬取网页内容并提取所需的数据。其他常用的爬虫库还包括Scrapy、Selenium等。 常…