文章目录
- 一、什么是Sentinel
- 二、Sentinel 的主要特性
- 1. 流量控制:
- 2. 熔断降级:
- 3. 实时监控:
- 4. 规则配置:
- 5. 集成方便:
- 三、Sentinel 分为哪几部分:
- 1. 核心库(Java 客户端)
- 2. 控制台(Dashboard)
- 四、Sentinel 功能和设计理念
- 1. 流量控制
- 2. 熔断降级
- 3. 系统自适应保护
- 五、Sentinel工作主流程
- 六、Sentinel 与 hystrix对比
- 七、Sentinel 版本选择
- 八、Sentinel-dashboard安装
- 九、手动接入Sentinel-基于API实现
- 1. 引入依赖
- 2. 定义资源
- 3. 定义流控规则
- 4. 发请求验证
- 5. 查看结果
- 十、Spring Cloud Alibaba 集成 Sentinel
- 1. 引入依赖
- 2. 添加配置
- 3. 添加 controller
- 4. 访问sentinel控制台
- 十一、Sentinel之流控规则
- 1. 流控模式
- 1.1 快速失败
- 1.2 Warm Up
- 1.3 排队等待
- 2. 流控效果
- 2.1 直接拒绝:
- 2.2 关联:
- 2.3 链路:
- 3. 阈值类型
- 3.1. QPS(Queries Per Second,每秒查询数)阈值类型:
- 3.2. 线程数阈值类型:
一、什么是Sentinel
Sentinel是由阿里巴巴开源的一款 👽分布式系统的流量防卫兵👽,用于保护应用程序免受高并发、高负载和故障的影响。它主要用于实时监控应用程序的流量、熔断不可用的资源、降级服务以及提供实时的统计数据等功能。
Sentinel 以流量为切入点,从流量控制、流量路由、熔断降级、系统自适应过载保护、热点流量防护等多个维度保护服务的稳定性
二、Sentinel 的主要特性
1. 流量控制:
Sentinel可以通过设置流量控制规则,限制应用程序的请求流量,防止资源被过度消耗或超负荷。
2. 熔断降级:
当应用程序中的某个资源出现故障或超过设定的阈值时,Sentinel可以自动对该资源进行熔断,防止故障扩散,保护系统的稳定性。
3. 实时监控:
Sentinel提供实时的监控和统计数据,可以对应用程序的流量、响应时间、错误率等进行实时监控,及时发现问题并进行处理。
4. 规则配置:
Sentinel支持通过代码或配置文件来定义流量控制和熔断规则,灵活性较高。
5. 集成方便:
Sentinel可以与常见的Java应用程序框架(如Spring Cloud、Dubbo等)进行集成,方便在现有项目中使用。
三、Sentinel 分为哪几部分:
Sentinel 分为两个部分:
1. 核心库(Java 客户端)
- 核心库(Java 客户端)不依赖任何框架/库,能够运行于所有 Java 运行时环境,同时对 Dubbo / Spring Cloud 等框架也有较好的支持。
2. 控制台(Dashboard)
- 控制台(Dashboard)基于 Spring Boot 开发,打包后可以直接运行,不需要额外的 Tomcat 等应用容器。
四、Sentinel 功能和设计理念
官方网址:Sentinel 功能和设计理念
1. 流量控制
流量控制在网络传输中是一个常用的概念,它用于调整网络包的发送数据。然而,从系统稳定性角度考虑,在处理请求的速度上,也有非常多的讲究。任意时间到来的请求往往是随机不可控的,而系统的处理能力是有限的。我们需要根据系统的处理能力对流量进行控制。Sentinel 作为一个调配器,可以根据需要把随机的请求调整成合适的形状,如下图所示:
流量控制有以下几个角度:
- 资源的调用关系,例如资源的调用链路,资源和资源之间的关系;
- 运行指标,例如 QPS、线程池、系统负载等;
- 控制的效果,例如直接限流、冷启动、排队等。
2. 熔断降级
除了流量控制以外,及时对调用链路中的不稳定因素进行熔断也是 Sentinel 的使命之一。由于调用关系的复杂性,如果调用链路中的某个资源出现了不稳定,可能会导致请求发生堆积,进而导致级联错误。
Sentinel 和 Hystrix 的原则是一致的: 当检测到调用链路中某个资源出现不稳定的表现,例如请求响应时间长或异常比例升高的时候,则对这个资源的调用进行限制,让请求快速失败,避免影响到其它的资源而导致级联故障。
在限制的手段上,Sentinel 和 Hystrix 采取了完全不一样的方法。
Hystrix 通过 线程池隔离 的方式,来对依赖(在 Sentinel 的概念中对应 资源)进行了隔离。这样做的好处是资源和资源之间做到了最彻底的隔离。缺点是除了增加了线程切换的成本(过多的线程池导致线程数目过多),还需要预先给各个资源做线程池大小的分配。
Sentinel 对这个问题采取了两种手段:
-
通过并发线程数进行限制
和资源池隔离的方法不同,Sentinel 通过限制资源并发线程的数量,来减少不稳定资源对其它资源的影响。这样不但没有线程切换的损耗,也不需要您预先分配线程池的大小。当某个资源出现不稳定的情况下,例如响应时间变长,对资源的直接影响就是会造成线程数的逐步堆积。当线程数在特定资源上堆积到一定的数量之后,对该资源的新请求就会被拒绝。堆积的线程完成任务后才开始继续接收请求。 -
通过响应时间对资源进行降级
除了对并发线程数进行控制以外,Sentinel 还可以通过响应时间来快速降级不稳定的资源。当依赖的资源出现响应时间过长后,所有对该资源的访问都会被直接拒绝,直到过了指定的时间窗口之后才重新恢复。
3. 系统自适应保护
Sentinel 同时提供系统维度的自适应保护能力。防止雪崩,是系统防护中重要的一环。当系统负载较高的时候,如果还持续让请求进入,可能会导致系统崩溃,无法响应。在集群环境下,网络负载均衡会把本应这台机器承载的流量转发到其它的机器上去。如果这个时候其它的机器也处在一个边缘状态的时候,这个增加的流量就会导致这台机器也崩溃,最后导致整个集群不可用。
针对这个情况,Sentinel 提供了对应的保护机制,让系统的入口流量和系统的负载达到一个平衡,保证系统在能力范围之内处理最多的请求。
五、Sentinel工作主流程
官方网址:工作主流程
在 Sentinel 里面,所有的资源都对应一个资源名称(resourceName),每次资源调用都会创建一个 Entry 对象。Entry 可以通过对主流框架的适配自动创建,也可以通过注解的方式或调用 SphU API 显式创建。Entry 创建的时候,同时也会创建一系列功能插槽(slot chain),这些插槽有不同的职责,例如:
-
NodeSelectorSlot负责收集资源的路径,并将这些资源的调用路径,以树状结构存储起来,用于根据调用路径来限流降级;
-
ClusterBuilderSlot则用于存储资源的统计信息以及调用者信息,例如该资源的 RT, QPS, thread count 等等,这些信息将用作为多维度限流,降级的依据;
-
StatisticSlot则用于记录、统计不同纬度的 runtime 指标监控信息;
-
FlowSlot则用于根据预设的限流规则以及前面 slot 统计的状态,来进行流量控制;
-
AuthoritySlot则根据配置的黑白名单和调用来源信息,来做黑白名单控制;
-
DegradeSlot 则通过统计信息以及预设的规则,来做熔断降级;
-
SystemSlot则通过系统的状态,例如 load1 等,来控制总的入口流量;
Sentinel 将 ProcessorSlot 作为 SPI 接口进行扩展(1.7.2 版本以前 SlotChainBuilder 作为 SPI),使得 Slot Chain 具备了扩展的能力。您可以自行加入自定义的 slot 并编排 slot 间的顺序,从而可以给 Sentinel 添加自定义的功能。
六、Sentinel 与 hystrix对比
好处就不用说了,自己看图吧。
七、Sentinel 版本选择
官方网址:alibaba与sentinel版本对应关系
这里自己的springcloud Alibaba版本是2.2.8.RELEASE,所以对应的sentinel版本是1.8.4
八、Sentinel-dashboard安装
sentinel版本官方地址:官方网址-安装包
java -jar sentinel-dashboard-1.8.4.jar
控制台网址:http://localhost:8080/#/dashboard/
默认的用户名和密码:
sentinel/sentinel
九、手动接入Sentinel-基于API实现
官方案例:手动接入 Sentinel
1. 引入依赖
<dependency>
<groupId>com.alibaba.csp</groupId>
<artifactId>sentinel-core</artifactId>
<version>1.8.6</version>
</dependency>
2. 定义资源
@RequestMapping(value = "/hello")
public void hello() {
Entry entry = null;
try {
entry = SphU.entry("HelloWorld");
/*您的业务逻辑 - 开始*/
System.out.println("hello world");
/*您的业务逻辑 - 结束*/
} catch (BlockException e1) {
/*流控逻辑处理 - 开始*/
System.out.println("block!");
/*流控逻辑处理 - 结束*/
} finally {
if (entry != null) {
entry.exit();
}
}
}
3. 定义流控规则
@PostConstruct
private static void initFlowRules(){
List<FlowRule> rules = new ArrayList<>();
FlowRule rule = new FlowRule();
rule.setResource("HelloWorld");
rule.setGrade(RuleConstant.FLOW_GRADE_QPS);
// Set limit QPS to 5.
rule.setCount(5);
rules.add(rule);
FlowRuleManager.loadRules(rules);
}
注意流控规则:这里设置的是每秒不超过5笔请求(QPS–>5)
4. 发请求验证
使用 ApiPost 模拟1s中内发送10笔请求:如下
5. 查看结果
查看控制台日志打印:如下图
十、Spring Cloud Alibaba 集成 Sentinel
新建一个微服务模块:alibaba-sentinel-demo
1. 引入依赖
<dependency>
<groupId>com.alibaba.cloud</groupId>
<artifactId>spring-cloud-starter-alibaba-sentinel</artifactId>
</dependency>
2. 添加配置
server:
port: 8899
spring:
application:
## 指定服务名称,在nacos中的名字
name: alibaba-sentinel-demo
cloud:
nacos:
discovery:
# nacos的服务地址,nacos-server中IP地址:端口号
server-addr: 127.0.0.1:8848
sentinel:
transport:
## 指定控制台的地址,默认端口8080
dashboard: localhost:8080
management:
endpoints:
web:
exposure:
## yml文件中存在特殊字符,必须用单引号包含,否则启动报错
include: '*'
3. 添加 controller
@RestController
@RequestMapping("/hello")
public class HelloController {
@GetMapping("/test3")
public String test(){
return "hello,world";
}
}
4. 访问sentinel控制台
如下:
十一、Sentinel之流控规则
官方文档:流量控制
流量控制(flow control),其原理是监控应用流量的 QPS 或并发线程数等指标,当达到指定的阈值时对流量进行控制,以避免被瞬时的流量高峰冲垮,从而保障应用的高可用性。
一条限流规则主要由下面几个因素组成,我们可以组合这些元素来实现不同的限流效果:
- resource:资源名,即限流规则的作用对象
- count: 限流阈值
- grade: 限流阈值类型(QPS 或并发线程数)
- limitApp: 流控针对的调用来源,若为 default 则不区分调用来源
- strategy: 调用关系限流策略
- controlBehavior: 流量控制效果(直接拒绝、Warm Up、匀速排队)
对应控制台的流控规则界面如下:
1. 流控模式
流量控制的效果包括以下几种:直接拒绝、Warm Up、匀速排队。对应 FlowRule 中的 controlBehavior 字段。
1.1 快速失败
最简单的方式,快速失败方式是默认的流量控制方式,当QPS超过任意规则的阈值后,新的请求就会被立即拒绝,拒绝方式为抛出 FlowException 。
1.2 Warm Up
Warm Up 方式,即预热/冷启动方式。当系统长期处于低水位的情况下,当流量突然增加时,直接把系统拉升到高水位可能瞬间把系统压垮。通过"冷启动",让通过的流量缓慢增加,在一定时间内逐渐增加到阈值上限,给冷系统一个预热的时间,避免冷系统被压垮。
预热底层是根据令牌桶算法实现的,源码对应得类在com.alibaba.csp.sentinel.slots.block.flow.controller.WarmUpController
该算法有一个冷却因子coldFactor,默认值是3,即请求 QPS 从 threshold(阈值) / 3 开始,经预热时长逐渐升至指定的 QPS 阈值。
比如设定QPS阈值为 6,流控效果为 warm up,预热时长为 秒,如下图:
测试代码:
@RequestMapping(value = "/hello")
public void hello() {
Entry entry = null;
try {
entry = SphU.entry("HelloWorld");
/*您的业务逻辑 - 开始*/
System.out.println("hello world");
/*您的业务逻辑 - 结束*/
} catch (BlockException e1) {
/*流控逻辑处理 - 开始*/
System.out.println("block!");
/*流控逻辑处理 - 结束*/
} finally {
if (entry != null) {
entry.exit();
}
}
}
使用ApiPost模式发请求:
🚗观察实时监控界面,可以看到有一个大概 8s 预热的过程 QPS 从 2 慢慢的升到了 6🚗
1.3 排队等待
匀速排队方式会严格控制请求通过的间隔时间,也即是让请求以均匀的速度通过,对应的是漏桶算法。
该方式的作用如下图所示:
这种方式主要用于处理间隔性突发的流量,例如消息队列。想象一下这样的场景,在某一秒有大量的请求到来,而接下来的几秒则处于空闲状态,我们希望系统能够在接下来的空闲期间逐渐处理这些请求,而不是在第一秒直接拒绝多余的请求。
注意:匀速排队模式暂时不支持 QPS > 1000 的场景。
比如排队等待下,QPS为10,超时时间设置为10s:
使用ApiPost模拟一直发请求,如下:
✨观察实时监控界面,可以看到QPS一直保持10,超出的请求并没有拒绝,因为没有到超时时间✨
2. 流控效果
流控模式总共分为三种,对应元素strategy,分别如下:
2.1 直接拒绝:
当接口的请求达到限流条件时,直接拒绝该请求,不再处理。
默认的流量控制方式为直接拒绝模式,当请求的 QPS 超过任意规则的阈值时,新的请求会立即被拒绝,拒绝方式是抛出 FlowException 异常。比较简单,不再演示。
2.2 关联:
当关联的资源达到阈值时,限流自己。即当一个资源的请求达到限流条件时,会影响到与之关联的其他资源,将它们也纳入限流范围。
创建以下两个方法:
@RestController
@RequestMapping("/sentinel")
public class FlowLimitController {
@GetMapping("/A")
public String A() {
return "A..........";
}
@GetMapping("/B")
public String B() {
return "B..........";
}
}
控制台流控规则如下图:
🎯这个配置的规则是,资源A关联资源B,一旦资源B达到阈值,则资源A被限流🎯
针对资源B使用 apipost 模拟一直发送请求:
此时浏览器访问A方法,如下:
2.3 链路:
只记录指定链路上的流量。指定的资源从入口资源进来的流量会被记录,如果达到限流条件,就会进行限流处理。这种模式更加关注特定链路上的流量,而不是单纯基于某个资源的请求次数或响应时间。
根据调用链路入口限流:一棵典型的调用树如下图所示
machine-root
/ \
/ \
Entrance1 Entrance2
/ \
/ \
DefaultNode(nodeA) DefaultNode(nodeA)
上图中来自入口 Entrance1 和 Entrance2 的请求都调用到了资源 NodeA,Sentinel 允许只根据某个入口的统计信息对资源限流。
使用场景:假设有A、B、C三个方法,A、B 都调用了资源C,当我们想方法C达到阈值10,则限制A方法时,控制台规则应该配置如下:
3. 阈值类型
假设你经营着一家餐馆,并且希望在高峰时段控制进入餐馆的顾客数量,以保证服务质量和顾客满意度。
3.1. QPS(Queries Per Second,每秒查询数)阈值类型:
- 假设你设置了每秒最多接受100个顾客进入餐馆的阈值。当餐馆的进入速率超过每秒100人时,Sentinel会拒绝新的进店请求,并可能抛出 FlowException 异常。这个阈值是根据每秒的请求数量进行限制的,无论每个请求需要多少时间来处理。
- 在这个例子中,Sentinel会在每秒的请求量超过100时触发流控,无论每个顾客在餐馆里停留多长时间,只要进店请求超过100,新的请求就会被拒绝。
3.2. 线程数阈值类型:
- 假设你设置了餐馆的最大承载能力为50人,而每个顾客在餐馆里用餐时间为30分钟。你想要确保在餐馆里的人数不超过50,并且有足够的服务员来照顾每个顾客。
- 在这个例子中,你可以将Sentinel的线程数阈值设置为50。当餐馆里的顾客人数超过50时,新的顾客将被拒绝进入。这里的线程数阈值是根据并发处理能力来限制的,每个顾客在用餐期间占用一个线程,当线程数达到阈值时,新的请求将被拒绝。
总结来说,QPS阈值类型是根据每秒的请求数量来限制流量,而线程数阈值类型则是根据并发处理能力来限制流量。选择哪种阈值类型取决于你对流量控制的需求,以及对系统资源的合理利用。