目录
- 一. 微服务的核心知识
- 1.1 雪崩效应
- 1.2 服务隔离
- 1.3 熔断降级
- 1.4 服务限流
- 二. Hystrix介绍
- 三. Hystrix服务熔断的实现方式
- 3.1 Rest 实现熔断
- 3.2 Feign实现服务熔断
- 四.服务熔断Hystrix高级
- 4.1 Hystrix的监控平台
- 4.2 搭建Hystrix DashBoard监控
- 4.2.1 熔断器的状态
- 4.2.1.1 测试熔断
一. 微服务的核心知识
1.1 雪崩效应
在微服务架构中,一个请求需要调用多个服务是非常常见的。如客户端访问A服务,而A服务需要调用B服务,B服务需要调用C服务,由于网络原因或者自身的原因,如果B服务或者C服务不能及时响应,A服务将处于阻塞状态,直到B服务C服务响应。此时若有大量的请求涌入,容器的线程资源会被消耗完毕,导致服务瘫痪。服务与服务之间的依赖性,故障会传播,造成连锁反应,会对整个微服务系统造成灾难性的严重后果,这就是服务故障的“雪崩”效应。
雪崩是系统中的蝴蝶效应导致其发生的原因多种多样,有不合理的容量设计,或者是高并发下某一个方法响应变慢,亦或是某台机器的资源耗尽。从源头上我们无法完全杜绝雪崩源头的发生,但是雪崩的根本原因来源于服务之间的强依赖,所以我们可以提前评估,做好熔断,隔离,限流。
1.2 服务隔离
顾名思义,它是指将系统按照一定的原则划分为若干个服务模块,各个模块之间相对独立,无强依赖。当有故障发生时,能将问题和影响隔离在某个模块内部,而不扩散风险,不波及其它模块,不影响整体的系统服务。
1.3 熔断降级
熔断这一概念来源于电子工程中的断路器(Circuit Breaker)。在互联网系统中,当下游服务因访问压力过大而响应变慢或失败,上游服务为了保护系统整体的可用性,可以暂时切断对下游服务的调用。这种牺牲局部,保全整体的措施就叫做熔断。
所谓降级,就是当某个服务熔断之后,服务器将不再被调用,此时客户端可以自己准备一个本地的fallback回调,返回一个缺省值。 也可以理解为兜底。
1.4 服务限流
限流可以认为服务降级的一种,限流就是限制系统的输入和输出流量已达到保护系统的目的。一般来说系统的吞吐量是可以被测算的,为了保证系统的稳固运行,一旦达到的需要限制的阈值,就需要限制流量并采取少量措施以完成限制流量的目的。比方:推迟解决,拒绝解决,或者者部分拒绝解决等等。
二. Hystrix介绍
Hystrix是由Netflix开源的一个延迟和容错库,用于隔离访问远程系统、服务或者第三方库,防止级联失
败,从而提升系统的可用性与容错性。Hystrix主要通过以下几点实现延迟和容错。
- 包裹请求:使用HystrixCommand包裹对依赖的调用逻辑,每个命令在独立线程中执行。这使用 了设计模式中的“命令模式”。
- 跳闸机制:当某服务的错误率超过一定的阈值时,Hystrix可以自动或手动跳闸,停止请求该服务 一段时间。
- 资源隔离:Hystrix为每个依赖都维护了一个小型的线程池(或者信号量)。如果该线程池已满, 发往该依赖的请求就被立即拒绝,而不是排队等待,从而加速失败判定。
- 监控:Hystrix可以近乎实时地监控运行指标和配置的变化,例如成功、失败、超时、以及被拒绝 的请求等。
- 回退机制:当请求失败、超时、被拒绝,或当断路器打开时,执行回退逻辑。回退逻辑由开发人员 自行提供,例如返回一个缺省值。
- 自我修复:断路器打开一段时间后,会自动进入“半开”状态。
Hystrix提供了两种服务熔断的方式:
- Rest 实现熔断
- Feign 实现熔断
三. Hystrix服务熔断的实现方式
3.1 Rest 实现熔断
- 引入依赖
<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-netflix-hystrix</artifactId>
</dependency>
-
开启熔断
在启动类 中添加 @EnableCircuitBreaker 注解开启对熔断器的支持。
-
配置熔断降级业务逻辑
1> 在想要熔断降级(被保护)的controller上添加
@HystrixCommand
注解
2> 为想要熔断降级(被保护)的方法编写一个回退方法
,该方法与 被保护 方法具有相同的参数与返回值类型,该方法返回一个默认的错误信息。
注意:
熔断的降级方法必须跟被保护方法的相同的参数列表和返回值
一致。
调用者
package cn.itcast.order.web;
import com.netflix.hystrix.contrib.javanica.annotation.HystrixCommand;
import lombok.extern.slf4j.Slf4j;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.web.bind.annotation.GetMapping;
import org.springframework.web.bind.annotation.PathVariable;
import org.springframework.web.bind.annotation.RequestMapping;
import org.springframework.web.bind.annotation.RestController;
import org.springframework.web.client.RestTemplate;
@Slf4j
@RestController
@RequestMapping("order")
public class OrderController {
@Autowired
private RestTemplate restTemplate;
// 1. 在想要熔断降级(被保护)的controller上添加 `@HystrixCommand`注解
@HystrixCommand(fallbackMethod = "testHystrixBack")
@GetMapping("/orderTest/{n}")
public String testHystrix(@PathVariable("n") int n) {
log.info("OrderController into ");
String url = "http://userservice/user/userTest/" + n;
String result = restTemplate.getForObject(url, String.class);
return result;
}
/* Hystrix 为 testHystrix方法编写一个回退方法testHystrixBack,该方法与 testHystrix方法具有相同的参数与返回值类型,该方法返回一个默认的错误信息。
* 降级方法:
* 和需要收到保护方法的返回值一致
* 方法参数一致
* */
public String testHystrixBack(@PathVariable("n") int n) {
log.info("------ order queryByIdBack 服务降级 ------");
return "------ order queryByIdBack 服务降级 ------";
}
}
被调用者
@Slf4j
@RestController
@RequestMapping("user")
public class OrderController {
@GetMapping("/userTest/{n}")
public String userTest(@PathVariable("n") int n) throws InterruptedException {
log.info("UserController into");
if (n==1){
Thread.sleep(1000); // 模拟业务堵塞
}
return "调用成功";
}
}
-
测试
发送请求, http://localhost:8088/order/orderTest/1
发现降级了,没有异常怎么会降级呢?原因是为Hystix的默认超时时长为1
,超过1秒就会发生降级。
-
配置hystrix超时时间
hystrix:
command:
default:
execution:
isolation:
thread:
timeoutInMilliseconds: 2000 #默认是1秒,1秒没有收到其他服务的响应就降级
配置好之后再测试,就可以调用成功了
- 统一的降级方法
1> 在类上添加
@DefaultProperties
注解
@DefaultProperties(defaultFallback = “defaultBack”) //指定公共的降级方法2> 编写统一的降级方法,该方法与 被保护 方法具有
相同的返回值
类型
第一步:
第二步:
/* Hystrix
* 统一降级方法:
* 和需要收到保护方法的返回值一致
* */
public String defaultBack() {
log.info("------ defaultBack 服务降级 ------");
return "------ defaultBack 服务降级 ------" ;
}
- 测试
将休眠时间改为5秒
发送请求,服务 defaultBack 降级了
3.2 Feign实现服务熔断
- 引入依赖
Feign已经继承hystrix,所以无需引入hystrix
<!--feign客户端依赖-->
<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-openfeign</artifactId>
</dependency>
<!--引入HttpClient依赖-->
<dependency>
<groupId>io.github.openfeign</groupId>
<artifactId>feign-httpclient</artifactId>
</dependency>
<!--引入feign的统一api-->
<dependency>
<groupId>cn.itcast.demo</groupId>
<artifactId>feign-api</artifactId>
<version>1.0</version>
</dependency>
- 配置文件(开启Feign对hystrix的支持)
feign:
hystrix:
enabled: true # feign 开启熔断
- 配置FeignClient接口的实现类
基于Feign实现熔断降级,那么降级方法需要配置到FeignClient接口的实现类中
import cn.itcast.feign.clients.UserClient;
import lombok.extern.slf4j.Slf4j;
import org.springframework.stereotype.Component;
/**
* 实现自定义的ProductFeginClient接口
* 在接口实现类中编写熔断降级方法
*/
@Slf4j
@Component
public class UserClientBack implements UserClient {
@Override
public String userTest(int n) {
log.info(" feign 降级了");
return " feign 降级了";
}
}
- 修改FeignClient添加hystrix熔断
Feign客戶端
import cn.itcast.order.back.UserClientBack;
import org.springframework.cloud.openfeign.FeignClient;
import org.springframework.web.bind.annotation.GetMapping;
import org.springframework.web.bind.annotation.PathVariable;
// @FeignClient注解中以fallback声明降级方法
@FeignClient(name="userservice",fallback = UserClientBack.class)
public interface UserClient {
@GetMapping("/user/userTest/{n}")
String userTest(@PathVariable("n") int n);
}
- 测试
四.服务熔断Hystrix高级
我们知道,当请求失败,被拒绝,超时的时候,都会进入到降级方法中。但进入降级方法并不意味着断
路器已经被打开。那么如何才能了解断路器中的状态呢?
4.1 Hystrix的监控平台
- 入口类上开启hystrix
在要监控的项目的入口类上添加注解
@EnableCircuitBreaker // 开启熔断器 开启hystrix
2. 配置文件 暴露端点
#暴露所有端点
management:
endpoints:
web:
exposure:
include: '*'
- 访问
http://localhost:8088/actuator/hystrix.stream
重新访问一下熔断的方法
就会有监控数据了
4.2 搭建Hystrix DashBoard监控
刚刚看了Hystrix的监控,但访问/hystrix.stream接口获取的都是已文字形式展示的信息。很难通过文
字直观的展示系统的运行状态,所以Hystrix官方还提供了基于图形化的DashBoard(仪表板)监控平
台。Hystrix仪表板可以显示每个断路器(被@HystrixCommand注解的方法)的状态。
- 引入依赖
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-actuator</artifactId>
</dependency>
<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-netflix-hystrix</artifactId>
</dependency>
<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-netflix-hystrix-dashboard</artifactId>
</dependency>
- 入口类上开启 DashBoard监控
在启动类使用@EnableHystrixDashboard注解激活仪表盘项目
- 配置文件
#配置代理地址
hystrix:
dashboard:
proxy-stream-allow-list: "localhost"
- 访问
访问地址 http://localhost:8088/hystrix
输入监控断点展示监控的详细数据
显示Loading···,重新访问熔断的方法后,
- 指标说明
4.2.1 熔断器的状态
熔断器有三个状态 CLOSED 、 OPEN 、 HALF_OPEN 熔断器默认关闭状态,当触发熔断后状态变更为
OPEN ,在等待到指定的时间,Hystrix会放请求检测服务是否开启,这期间熔断器会变为 HALF_OPEN 半
开启状态,熔断探测服务可用则继续变更为 CLOSED 关闭熔断器。
- Closed:关闭状态(断路器关闭),所有请求都正常访问。代理类维护了最近调用失败的次数,
如果某次调用失败,则使失败次数加1。如果最近失败次数超过了在给定时间内允许失败的阈值,
则代理类切换到断开(Open)状态。此时代理开启了一个超时时钟,当该时钟超过了该时间,则切
换到半断开(Half-Open)状态。该超时时间的设定是给了系统一次机会来修正导致调用失败的错
误。 - Open:打开状态(断路器打开),所有请求都会被降级。Hystix会对请求情况计数,当一定时间
内失败请求百分比达到阈值,则触发熔断,断路器会完全关闭。默认失败比例的阈值是50%,请求
次数最少不低于20次。 - Half Open:半开状态,open状态不是永久的,打开后会进入休眠时间(默认是5S)。随后断路
器会自动进入半开状态。此时会释放1次请求通过,若这个请求是健康的,则会关闭断路器,否则
继续保持打开,再次进行5秒休眠计时。
4.2.1.1 测试熔断
为了能够精确控制请求的成功或失败,我们在被调用业务中加入一段逻辑:
当n==1时,抛出异常,其余情况都调用成功。
降级方法:
我们准备两个请求窗口:
一个请求:http://localhost:8088/order/orderTest/1,注定失败
一个请求:http://localhost:8088/order/orderTest/2,肯定成功
熔断器的默认触发阈值是20次请求,不好触发。休眠时间时5秒,时间太短,不易观察,为了测试方
便,我们可以通过配置修改熔断策略:
hystrix:
command:
default:
execution:
circuitBreaker:
requestVolumeThreshold: 10 #触发熔断的最小请求次数,默认20秒
sleepWindowInMilliseconds: 10000 #熔断多少秒后去尝试请求 默认5秒
errorThresholdPercentage: 50 #触发熔断的失败请求最小占比,默认50%
解读:
- requestVolumeThreshold:触发熔断的最小请求次数,默认20
- errorThresholdPercentage:触发熔断的失败请求最小占比,默认50%
- sleepWindowInMilliseconds:熔断多少秒后去尝试请求
当我们疯狂访问http://localhost:8088/order/orderTest/1的请求时(超过10次),就会触发熔断。断路器会端口,一切请求都会被降级处理。
此时你访问http://localhost:8088/order/orderTest/2的请求,会发现返回的也是失败。