通常情况下,一个请求可能会调用很多个服务。 如果下游某个服务异常,不能正常返回结果,导致上游所有服务等待,最终可能导致大量服务资源耗尽,造成雪崩。
说简单点,撸代码时,一定要保护好自己的服务,在对其他某个服务发起请求时,要做好容错和降级,不要因为其他服务影响自己的服务。
有一种很简单的方法,可以try catch。 就是调用报错了,不导致自己的服务也报错。 但是呢,这种方式仅仅是吃掉了错误,但请求过程中还是会一直等待,直到超时或者返回错误结果。 而且,每次请求来都依然会调用,如果阻塞太多,也无法解决雪崩问题。
那么,hystrix就来了。它可以实现服务调用的延迟和容错,特点如下:
- 包裹请求:使⽤HystrixCommand包裹对其他服务的调⽤。
- 跳闸机制:当某服务的错误率超过⼀定的阈值时,Hystrix可以跳闸,停⽌请求该服务⼀段时间。
- 资源隔离:Hystrix为每个依赖都维护了⼀个⼩型的线程池(舱壁模式)(或者信号量)。如果该线程池已满, 发往该服务的请求就被⽴即拒绝,⽽不是排队等待,从⽽加速失败判定。
- 监控:Hystrix可以近乎实时地监控运⾏指标和配置的变化,例如成功、失败、 超时、以及被拒绝的请求等。
- 回退机制:当请求失败、超时、被拒绝,或当断路器打开时,执⾏回退逻辑。回退逻辑由开发⼈员 ⾃⾏提供,例如返回⼀个缺省值。
- ⾃我修复:断路器打开⼀段时间后,会⾃动进⼊“半开”状态。
用法:
1、引入依赖
服务消费者⼯程(⾃动投递微服务)中引⼊Hystrix依赖坐标(也可以添加在⽗⼯程中)
<!--hystrix--> <dependency> <groupId>org.springframework.cloud</groupId> <artifactId>spring-cloud-starter-netflix-hystrix</artifactId> </dependency>
2、服务消费者⼯程的启动类中添加熔断器开启注解 @EnableCircuitBreaker
3、定义服务降级处理⽅法,并在业务⽅法上使⽤@HystrixCommand的fallbackMethod属性关联到服务降级处理⽅法(熔断时,会走该方法)。
/* 定义回退方法,返回预设默认值 注意:该方法形参和返回值与原始方法(也就是@HystrixCommand注解的方法)保持一致 */ public Integer myFallBack(Long userId) { return -123333; // 兜底数据 } @HystrixCommand( // 线程池标识,要保持唯一,不唯一的话就共用了,可以使用方法的名字 threadPoolKey = "findResumeOpenStateTimeoutFallback", // 线程池细节属性配置 threadPoolProperties = { @HystrixProperty(name="coreSize",value = "2"), // 线程数 @HystrixProperty(name="maxQueueSize",value="20") // 等待队列长度 }, // commandProperties熔断的一些细节属性配置 commandProperties = { // 每一个属性都是一个HystrixProperty,根据需要定制属性 //超时时间 @HystrixProperty(name="execution.isolation.thread.timeoutInMilliseconds",value="2000"), // 统计时间窗口定义 @HystrixProperty(name = "metrics.rollingStats.timeInMilliseconds",value = "8000"), // 统计时间窗口内的最小请求数 @HystrixProperty(name = "circuitBreaker.requestVolumeThreshold",value = "2"), // 统计时间窗口内的错误数量百分比阈值 @HystrixProperty(name = "circuitBreaker.errorThresholdPercentage",value = "50"), // 自我修复时的活动窗口长度 @HystrixProperty(name = "circuitBreaker.sleepWindowInMilliseconds",value = "3000") }, fallbackMethod = "myFallBack" // 回退方法 ) @GetMapping("/checkStateTimeoutFallback/{userId}") public Integer findResumeOpenStateTimeoutFallback(@PathVariable Long userId) { // 使用ribbon不需要我们自己获取服务实例然后选择一个那么去访问了(自己的负载均衡) String url = "http://lagou-service-resume/resume/openstate/" + userId; // 指定服务名 Integer forObject = restTemplate.getForObject(url, Integer.class); return forObject; }
仓壁模式:
在上面的例子中,我们可以看到,还配置了 threadPoolKey和threadPoolProperties, 也就是线程池的东西。这就是仓壁模式,通过配置threadPoolKey,并保持唯一(可以使用方法名保持唯一,否则,多个hystrix注解的方法就会共用同一个线程池),这样,hystrix就会为对应的方法提供独立的线程池。如下:
1、共用的线程池
2、独立的线程池
所以说简单点,仓壁模式就是可以做到线程池独立。 这样,不会一直创建新线程,也不会担心同一个池中,被别的业务把线程占用完。
工作原理:
对于hystrix注解的方法,hystrix的工作原理是:
- 方法调用其他服务出现问题时,会开启一个时间窗(比如10s)。
- 在这10s内,对问题服务的调用次数,有没有达到设定的最小请求数(比如设置为10次)
- 如果没有达到,回到第1步,重新统计。
- 如果达到,则看失败次数的比例,有没有达到设定值(比如设定50%)
- 如果达到,说明超过一半都失败了,跳闸,不再请求对应的服务。
- 如果没有达到,回到第1步,重新统计。
- 如果跳闸了,还需要时不时的去看看,服务恢复没有。 hystrix的做法是,开启一个活动窗口(默认5s),也就是每隔5s,会让一个请求通过,去访问有问题的服务,如果成功了,就会到第1步重新统计; 如果失败了,就重新执行当前流程。
以上的参数,可以自己配置,比如上面提到的例子中,配置的就是:
8秒钟内,请求次数达到2个,并且失败率在50%以上,就跳闸;跳闸后活动窗⼝设置为3s
commandProperties = { // 每一个属性都是一个HystrixProperty,根据需要定制属性 //超时时间 @HystrixProperty(name="execution.isolation.thread.timeoutInMilliseconds",value="2000"), // 统计时间窗口定义 @HystrixProperty(name = "metrics.rollingStats.timeInMilliseconds",value = "8000"), // 统计时间窗口内的最小请求数 @HystrixProperty(name = "circuitBreaker.requestVolumeThreshold",value = "2"), // 统计时间窗口内的错误数量百分比阈值 @HystrixProperty(name = "circuitBreaker.errorThresholdPercentage",value = "50"), // 自我修复时的活动窗口长度 @HystrixProperty(name = "circuitBreaker.sleepWindowInMilliseconds",value = "3000") },
也可以在配置文件配置,全局生效。
断路监控仪表盘:
就是查看断路具体情况的,多少请求,失败多少等等。 如果想看的话,需要引入依赖:
<dependency> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-starter-actuator</artifactId> </dependency>
然后访问/actuator/hystrix.stream接口即可,但是不直观,全是文字。 这时候,我们可以搭建一个监控台服务。
1、新建服务,引入依赖:
<!--hystrix--> <dependency> <groupId>org.springframework.cloud</groupId> <artifactId>spring-cloud-starter-netflix-hystrix</artifactId> </dependency> <!--hystrix 仪表盘--> <dependency> <groupId>org.springframework.cloud</groupId> <artifactId>spring-cloud-starter-netflix-hystrix-dashboard</artifactId> </dependency> <dependency> <groupId>org.springframework.cloud</groupId> <artifactId>spring-cloud-starter-netflix-eureka-client</artifactId> </dependency>
2、启动类添加@EnableHystrixDashboard激活仪表盘
3、yml中:
eureka: client: serviceUrl: # eureka server的路径 defaultZone: http://lagoucloudeurekaservera:8761/eureka/,http://lagoucloudeurekaserverb:8762/eureka/ #把 eureka 集群中的所有 url 都填写了进来,也可以只写一台,因为各个 eureka server 可以同步注册表 instance: #使用ip注册,否则会使用主机名注册了(此处考虑到对老版本的兼容,新版本经过实验都是ip) prefer-ip-address: true #自定义实例显示格式,加上版本号,便于多版本管理,注意是ip-address,早期版本是ipAddress instance-id: ${spring.cloud.client.ip-address}:${spring.application.name}:${server.port}:@project.version@
4、搜集被监控的服务中的数据,需要在被监控的服务中注册servlet
@SpringBootApplication @EnableDiscoveryClient //@EnableHystrix // 开启Hystrix功能 @EnableCircuitBreaker // 开启熔断器功能 //@SpringCloudApplication 综合性的注解 @SpringCloudApplication = @SpringBootApplication + @EnableDiscoveryClient + @EnableCircuitBreaker public class AutodeliverApplication8090 { public static void main(String[] args) { SpringApplication.run(AutodeliverApplication8090.class,args); } // 使用RestTemplate模板对象进行远程调用 @Bean @LoadBalanced public RestTemplate getRestTemplate() { return new RestTemplate(); } /** * 在被监控的微服务中注册一个serlvet,后期我们就是通过访问这个servlet来获取该服务的Hystrix监控数据的 * 前提:被监控的微服务需要引入springboot的actuator功能 * @return */ @Bean public ServletRegistrationBean getServlet(){ HystrixMetricsStreamServlet streamServlet = new HystrixMetricsStreamServlet(); ServletRegistrationBean registrationBean = new ServletRegistrationBean(streamServlet); registrationBean.setLoadOnStartup(1); registrationBean.addUrlMappings("/actuator/hystrix.stream"); registrationBean.setName("HystrixMetricsStreamServlet"); return registrationBean; } }
5、访问监控台dashboad服务:http://localhost:9000/hystrix,然后在输入框搜索被监控目标:http://localhost:8090/actuator/hystrix.stream
有了上面的仪表盘,我们可以看到一个服务中的具体情况,但是呢,实际项目中有很多的服务实例,如果每次都去手动输入,岂不是很麻烦? 这时候,就需要一个聚合,把所有微服务上的信息聚合到一起,然后在仪表盘上,查看这个聚合即可。
服务搭建:
1、引入依赖:
<!--hystrix turbine聚合监控--> <dependency> <groupId>org.springframework.cloud</groupId> <artifactId>spring-cloud-starter-netflix-turbine</artifactId> </dependency> <!-- 引入eureka客户端的两个原因 1、微服务架构下的服务都尽量注册到服务中心去,便于统一管理 2、后续在当前turbine项目中我们需要配置turbine聚合的服务,比如,我们希望聚合 lagou-service-autodeliver这个服务的各个实例的hystrix数据流,那随后 我们就需要在application.yml文件中配置这个服务名,那么turbine获取服务下具体实例的数据流的 时候需要ip和端口等实例信息,那么怎么根据服务名称获取到这些信息呢? 当然可以从eureka服务注册中心获取 --> <dependency> <groupId>org.springframework.cloud</groupId> <artifactId>spring-cloud-starter-netflix-eureka-client</artifactId> </dependency>
2、配置要聚合的微服务
server: port: 9001 Spring: application: name: lagou-cloud-hystrix-turbine eureka: client: serviceUrl: # eureka server的路径 defaultZone: http://lagoucloudeurekaservera:8761/eureka/,http://lagoucloudeurekaserverb:8762/eureka/ #把 eureka 集群中的所有 url 都填写了进来,也可以只写一台,因为各个 eureka server 可以同步注册表 instance: #使用ip注册,否则会使用主机名注册了(此处考虑到对老版本的兼容,新版本经过实验都是ip) prefer-ip-address: true #自定义实例显示格式,加上版本号,便于多版本管理,注意是ip-address,早期版本是ipAddress instance-id: ${spring.cloud.client.ip-address}:${spring.application.name}:${server.port}:@project.version@ #turbine配置 turbine: # appCofing配置需要聚合的服务名称,比如这里聚合自动投递微服务的hystrix监控数据 # 如果要聚合多个微服务的监控数据,那么可以使用英文逗号拼接,比如 a,b,c appConfig: lagou-service-autodeliver clusterNameExpression: "'default'" # 集群默认名称
3、启动类上添加注解@EnableTurbine
4、访问: 在仪表盘那里,只需要搜索聚合服务的地址就可以看到所有微服务的情况,
http://localhost:9001/turbine.stream