如何在几百万qps的网关服务中实现灵活调度策略

news2025/1/24 22:48:03

在这里插入图片描述

作者 | 加纳斯

导读

说起百度的BFE可能不少人都听说过,但是其实在百度内部还有一个几百万qps的通用网关服务:Janus。截止当前,Janus服务不仅覆盖了百度内部FEED、评论、点赞、关注、直播等十多个中台服务的内网流量,而且为百度app、知道、经验、passport、百科、问一问等业务提供了外网流量服务。

在百度已有BFE且BFE开源的情况下,为什么要建设Janus网关?Janus网关区别于其他网关的核心点有哪些?面对众多的接入方,如何实现既能通用又能个性化的流量调度呢?

来本文一探究竟吧。

全文3802字,预计阅读时间10分钟。

01 为什么要建设Janus

在百度已有BFE且BFE开源的情况下,为什么要建设Janus网关?

从场景上看,与BFE面向通用功能的流量网关场景不同,Janus不仅可以作为流量网关,也可以作为业务网关、混合网关;不仅面向通用功能,也支持个性化需求。从实现上看,Janus的部分技术参考了BFE,但是与厂内BFE主要提供saas类的服务不同,Janus提供的是一个通用技术方案,谁使用谁部署,谁有个性化需求谁自己定制插件。因此,Janus网关的应用场景相对更广一些,当前的使用场景主要包含流量网关、业务网关、混合网关三种模式,流量拓扑如下:

图片

部署拓扑:

图片

02 核心问题

从流量调度规则为例,大部分的使用方的转发规则都相对比较简单,但是部分业务的转发规则来自于原来的nginx配置,相对比较复杂,更有些使用方会有偏业务的逻辑在里面,例如:

  1. 从某时刻后,将API1的A机房和B机房的流量切30%到C机房;

  2. 将某个APP的某个版本之上的android流量切到新的路由规则;

  3. cookie有某些特征或者query中有某些特征的流量转发到预览环境。

那么在调度阶段如何更好地解决如下两个问题呢:

  1. 如何让简单的路由规则配置起来特别简单,性能较高?

  2. 如何实现复杂甚至业务个性化的调度策略实现?

把问题放大到网关的全局应用场景来看,如何既能通用,写个插件大家都能用;又能支持个性化,尽量能通过通用插件满足业务特例的问题;还能灵活,流量网关、业务网关都能胜任。既要、又要、还要的问题通常是使用tradeoff的方式加以平衡解决,但是Janus的解决方案同时满足了上面的三个需求:通过插件机制满足通用化需求+通过可动态下发编程能力的方式进行差异化配置+通过SDK集成到业务部署的方式支持灵活使用。

03 流量调度方案设计

3.1 方案思路概述

为了将服务的转发规则更加清晰,Janus将路由分为了三级(与nginx类似):

图片

由上面的挑战分析可知:

  1. 对于大多数的简单路由规则需要相对简单,性能相对高,通过域名匹配+树路由实现的url匹配即可;

  2. 对于少量的复杂路由规则需要扩展性足够强,可以在特征匹配阶段引入一个极简的脚本语言来实现。

3.2 基础路由规则支持

通过树路由支持的部分规则如下:

图片

3.3 进阶路由规则支持

上述的简单路由规则可以满足90%+的业务需求,但是对于类似`从某时刻后,将API1的A机房和B机房的流量切30%到C机房`这种需求是满足不了的。因此,在特征匹配阶段可以通过`变量表达式`+`条件表达式`进行精细化匹配。

变量表达式

为了能根据系统里面的常见特征进行精细化匹配,首先我们要对系统里面的常见特征进行描述。例如:

  1. 通过${idc}表示当前所属的机房

  2. 通过${time}表示当前时间

  3. 通过${query}表示get参数

  4. 通过${header}表示header里面的数值

但是当特征越来越多的时候,就会略显臃肿,存在的特征变量越来越多,这时候Janus引入了分级的概念,比如:

图片

如图所示,就可以用${request.query.id}来表示本次请求中key为id的query值。并且如上的特征变量是可以扩充的,每个使用方可以根据自己的系统差异、环境差异定义自己的特征变量体系。

条件表达式

有了上面实现的变量表达式,我们就可以用$描述我们需要的特征变量了,但是如何对这些特征变量进行操作呢?

Janus的方案是定义一门极简的语言(无论是用yacc等一类的生成语法分析的工具,还是自己做词法分析、语法分析,实现都比较简单,这里不再赘述实现细节),只支持逻辑运算+函数调用,部分例子如下:

函数调用:

图片

逻辑运算:

图片

Janus在有变量表达式来表示系统特征的基础上,添加了条件表达式来对系统特征进行操作、判断。由于可以不断扩充变量表达式和条件表达式,因此Janus几乎可以满足用户的任意需求。

性能对比

通过如上方案介绍可以看出,采用从控制面下发表达式的方式,可以满足绝大部分场景的需求,但是,对性能影响如何呢?

在数据面接收到控制面下发转发规则时,首先会对变量表达式和条件表达式进行编译,映射成go的代码,在后续运行时,与直接调用原生的go语言差异并不大。对比数据如下:

条件表达式:

“random(0,100) || random(100,100)”

对应的benchmark数据:

goos: windows
goarch: amd64
cpu: 11th Gen Intel(R) Core(TM) i5-1145G7 @ 2.60GHz
BenchmarkRandom-8       35817918            34.52 ns/op        0 B/op          0 allocs/op

原生go代码:

(0 > rand.Intn(100)) || (100 > rand.Intn(100))

对应的benchmark数据:

goos: windows
goarch: amd64
cpu: 11th Gen Intel(R) Core(TM) i5-1145G7 @ 2.60GHz
BenchmarkRawRandom-8     39136900          31.63 ns/op         0 B/op         0 allocs/op

可以看到使用表达式与使用原生go代码在性能上相差不到10%,区别并不是特别大。

04 方案泛化

通过上面的变量表达式+条件表达式的方式,很好地解决了流量调度问题。实际上,该方案可以作为一个通用解决方案解决很多类似问题。以Janus网关为例,在很多地方都大量存在这个变量表达式和条件表达式。

4.1 插件的运行条件

以容灾插件为例,用户可以把容灾插件配置在任意路由规则上,但是大家认定的触发容灾的规则可能不一样,比如:

  1. 有些业务认为:只有后端的http协议返回5xx才需要容灾

  2. 有些业务认为:后端的http协议返回5xx 或者 返回值的json里面errno != 0需要容灾

  3. 更有些业务认为:后端的http协议返回5xx 或者 header里面的sla_status=0需要容灾

一方面,我们想做一个通用的容灾插件,另一方面,大家的触发规则的标准又千奇百怪、各不相同。怎么解决这个矛盾呢?

Janus的答案是:把控制权交给用户,用户配置容灾插件的时候同时配置一个条件表达式,只有条件表达式返回true,才会运行容灾逻辑。

上面的问题对应的下发配置如下:

  1. num_gt(${response.code}, 499)

  2. num_gt($ {response.code}, 499) || (!str_equal($ {response.jsonbody.errno}, 0))

  3. num_gt($ {response.code}, 499) || (!str_equal(${response.header.sla_status}, 0))

这样就做到了既是一个通用容灾插件,又可以做到个性化的触发逻辑。

4.2 通用缓存插件的设计

当我们想做一个通用的redis缓存插件时,存取逻辑比较简单:

// 请求下游前
if data, ok := redis.Get(key); ok {
    return data
}

// 请求下游
data := reqeust(xxx)

// 请求下游后
redis.Set(key, data)

但是,与上面的插件面临的问题类似,通用缓存插件的key怎么定义呢?

  1. 评论接口只要id一样就认为是同一个请求

  2. 我的粉丝接口不仅需要id一样,还需要uk一样才是同一个请求

  3. 主页接口需要uk一样才认为是同一个请求

解决思路是用变量表达式来把key的定义交给用户,用户配置缓存插件的时候同时配置key的规则,比如:

  1. comment_${request.query.id}

  2. fans_$ {request.query.id}_${request.query.uk}

  3. homepage_${request.query.uk}

这样就解决了通用缓存插件中的通用与个性化之间的矛盾。

05 展望

在Janus网关服务中,通过常规路由规则+变量表达式+条件表达式的方式实现了各种流量调度策略,并将方案泛化到了各种其他功能的实现上,支撑了几百万QPS的流量及众多使用方的接入。通过已经实现的系统变量及规则的组合,基本可以实现任意功能,但是当需要新的规则时,则需要在Janus中上线新的条件表达式实现。为了进一步强化Janus中的动态配置表现能力,Janus正在进行表示式与Go官方标准库的无缝打通。这样就可以在控制面进行更加灵活的配置下发动态编程能力,满足更广泛的需求。

——END——

推荐阅读:

深入浅出DDD编程

百度APP iOS端内存优化实践-内存管控方案

Ernie-SimCSE对比学习在内容反作弊上应用

质量评估模型助力风险决策水平提升

合约广告平台架构演进实践

AI技术在基于风险测试模式转型中的应用

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/46786.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【Java】JavaFx桌面编程整理

JavaFX是用于构建富Internet应用程序的Java库。 使用此库编写的应用程序可以跨多个平台一致地运行。 使用JavaFX开发的应用程序可以在各种设备上运行,例如台式计算机,移动电话,电视,平板电脑等。 为了开发具有丰富功能的Client Si…

运动爱好者的专属耳机,轻巧时尚又好用,哈氪无界上手

很多朋友在户外健身的时候喜欢戴上耳机,在音乐的节奏中去运动,现在市面上的运动耳机选择也特别丰富,为了在户外运动更安全,有些朋友会选择骨传导这种不入耳的耳机,上周我看到哈氪出了一款发带耳机,将运动发…

rac/rac one node扩容

某现场部署的cDAS RAC Onde Node超融合架构,2个计算/存储节点,1台仲裁节点 现网架构: 随着业务量增加,准备把仲裁节点加以利用,添加到融合节点的计算存储集群当中,与另外两个融合节点组成三节点的计算存储集群 改造后的架构: 一、配置仲裁节点(第三个计算/存储节点)…

windocs连接麒麟桌面---vnc软件

目录 一、下载vnc 二、麒麟服务器安装VNC远程 三、客户端连接 一、下载vnc客户端 Download VNC Viewer 6.22.826 - free - latest version

Nodejs -- 一文学会如何在Express中使用JWT(json web token)

文章目录在Express中使用JWT1 安装JWT相关的包2 导入JWT相关的包3 定义secret密钥4 在登录成功后生成JWT字符串5 将JWT字符串还原为JSON对象6 使用req.user获取用户信息7 捕获解析JWT失败后产生的错误8 完整代码示例在Express中使用JWT 1 安装JWT相关的包 运行如下命令&#…

Java基础概念-03-字面量

在有些资料中,会把字面量叫做,常量,或字面值常量,但最正确的叫法还是,字面量 小数在 Java 中也称为浮点数 下面是课本中的介绍: 常量是指在程序运行过程中,其值不能被修改的量,Java…

C# 移动飞机

一 实现一个飞机游戏,可以使用键盘控制飞机的移动。 二 游戏的显示 GameView:负责游戏的显示; 使用自定义绘制的技术,将飞机场地绘制出来; cells:3x3的单元格; OnSizeChanged:计算单元格的位置和大小&…

用VS软件开发“中国象棋“游戏<笔记摘录>

整体架构如上 1.很直观地去看这个中国象棋的界面,数一下它有多少行和多少列. 10行,9列:要注意这里数的是安放象棋的位置,有10行9列 这里我们首先想到的必然是二维数组,每一个行列交叉的点都设置成二维数组a[i][j]这样的格式,以此来确定棋盘上面每一个棋子的位置和走向. 我们…

01 导论【计量经济学及stata应用】

配套教材:《计量经济学及stata应用.陈强.2015.高等教育出版社》 官方课程链接:http://www.econometrics-stata.com/ 官方公众微信号:econometrics-stata 写博客的初衷就是为了督促自己把所学的知识进行整理和完善,我将于接下来的时…

性能测试-CPU性能分析,用户态us高,初步定位到代码行

监控工具安装 Grafana:安装请看我上一篇文章性能测试-JMeter influxdb grafana性能测试监控平台-食用指南_Tommy.IT的博客-CSDN博客JMeter测试脚本跑起来,在influxdb服务看看数据里面的数据,原来influxdb的jmeter库里面没有表,当JMeter脚本运…

PyCharm+PyQT5之三界面与逻辑的分离

之二的例程已经实现了界面与逻辑的分离,所建立的 Dialog Mainwindow 或者 widgets 等,界面改变其主调程序(暂且这样叫)更改,或者不需要大规模更改, 主调函数的程序是这样的 import sys import FistUI from PyQt5.QtWidgets import QApplication, QMainWindow,QDialog if __nam…

KubeSphere 多行日志采集方案深度探索

作者:大飞哥,视源电子运维工程师,KubeSphere 用户委员会广州站站长 采集落盘日志 日志采集,通常使用 EFK 架构,即 ElasticSearch,Filebeat,Kibana,这是在主机日志采集上非常成熟的方案,但在容器…

React Server Component: 混合式渲染

作者:谢奇璇 React 官方对 Server Comopnent 是这样介绍的: zero-bundle-size React Server Components。 这是一种实验性探索,但相信该探索是个未来 React 发展的方向,与 React Server Component 相关的周边生态正在积极的建设当中。 术语…

R语言主成分分析可视化(颜值高,很详细)

文章目录PCA特征值可视化提取变量结果变量结果可视化变量和主成分的cos2可视化变量对主成分的贡献可视化Dimension description提取样本结果样本结果可视化样本的cos2可视化样本对主成分的贡献可视化biplot参考资料网络上很多R语言教程都是基于R语言实战进行修改,今…

Mysql密码忘记后怎么重置密码,mysql8之后有改动

mysql8之前的修改方式: 1.管理员身份打开cmd:然后关闭mysql,停止MySQL服务,输入 net stop mysql 停止服务 2.切换到MySQL的bin文件下,输入mysqld --console --skip-grant-tables --shared-memory。 3上个窗口保留不要…

四种类型自编码器AutoEncoder理解及代码实现

自编码器(AE) 自编码器的结构和思想 结构 自编码器是一种无监督的数据压缩和数据特征表达方法。自编码器是神经网络的一种,经过训练后的能尝试将输入复制到输出。自编码器由编码器和解码器组成。如下图所示: 自编码器指的是试图…

电脑键盘功能基础知识,快速入门,抓住这份详细教程

在互联网生活发达的今天,电脑已经成为了学习工作的必备工具。而用来操作电脑的关键,就是我们经常使用的键盘和鼠标。最近有不少的小伙伴来私信小编,希望小编做一个电脑键盘功能基础知识介绍的详细教程。这不,小编应大家要求&#…

视频编解码 - RTP 与 RTCP

目录 RTP 实时传输协议 RTCP协议 将H264 RTP打包 RTP 实时传输协议 音视频数据传输,先将原始数据经过编码压缩后,将码流打包成一个个RTP包,再将码流传输到接收端。 打包的作用 接收端要正确地使用这些音视频编码数据,不仅仅需…

深度学习之路=====12=====>>MNasNet(tensorflow2)

简介 原文: MnasNet: Platform-Aware Neural Architecture Search for Mobile 来源: CVPR2019 作者: Google (Mingxing Tan, Bo Chen, Ruoming Pang, Vijay Vasudevan, Mark Sandler, Andrew Howard, Quoc V. Le) 摘要: 使用神经结构搜索(neural archit…

界面控件DevExpress WPF的主题设计器,可轻松完成应用主题研发

DevExpress WPF拥有120个控件和库,将帮助您交付满足甚至超出企业需求的高性能业务应用程序。通过DevExpress WPF能创建有着强大互动功能的XAML基础应用程序,这些应用程序专注于当代客户的需求和构建未来新一代支持触摸的解决方案。 DevExpress WPF的The…