一、概念

hystrix停止更新，理念优秀。

分布式系统面临的问题:

对于复杂的分布式体系，有数十个依赖，依赖不可避免的错误。
服务会出现雪崩，高可用受到破坏。

Hystrix就是用于解决分布式系统延迟和容错的开源库。
保证在一个依赖出现问题，不会导致整体的服务失败，避免级联故障，以提高分布式系统的弹性
如果出现错误，向调用方抛出备选FallBack

1. 功能

服务降级
服务熔断
接近实时监控
服务限流
服务隔离

停止更新进入维护

2. 重要理念

服务降级

服务器出现问题时候，不让客户端持续等待，立刻返回一个友好的提示。fallback.

以下原因会导致服务降级.

程序运行异常
服务熔断触发降级
线程池和信号量打满
程序超时

服务熔断

当访问达到最大访问(简短可以理解为保险丝)，直接拒绝访问，然后调用服务降级方法，返回友好提示。

降级-熔断-恢复

服务限流

秒杀高并发的操作，严禁一窝蜂过来拥挤，有序进行。

二、Hystrix案例

Hystrix一般用于消费端,也就是调用端;

1. 服务降级

什么时候开启服务降级呢？

当被调用服务超时
当被调用服务Down机
当调用这等待时间小于服务端的处理时间

1.1 创建服务端

 <dependencies>
        <!--新增hystrix-->
        <dependency>
            <groupId>org.springframework.cloud</groupId>
            <artifactId>spring-cloud-starter-netflix-hystrix</artifactId>
        </dependency>


        <dependency>
            <groupId>org.springframework.cloud</groupId>
            <artifactId>spring-cloud-starter-netflix-eureka-client</artifactId>
        </dependency>

        <dependency>
            <groupId>com.atjianyi</groupId>
            <artifactId>cloud-api-commons</artifactId>
            <version>1.0-SNAPSHOT</version>
        </dependency>


        <dependency>
            <groupId>org.springframework.boot</groupId>
            <artifactId>spring-boot-starter-web</artifactId>
        </dependency>

        <dependency>
            <groupId>org.springframework.boot</groupId>
            <artifactId>spring-boot-starter-actuator</artifactId>
        </dependency>

        <!--        <dependency>-->
        <!--            <groupId>org.springframework.boot</groupId>-->
        <!--            <artifactId>spring-boot-devtools</artifactId>-->
        <!--            <scope>runtime</scope>-->
        <!--            <optional>true</optional>-->
        <!--        </dependency>-->

        <dependency>
            <groupId>org.projectlombok</groupId>
            <artifactId>lombok</artifactId>
            <optional>true</optional>
        </dependency>
        <dependency>
            <groupId>org.springframework.boot</groupId>
            <artifactId>spring-boot-starter-test</artifactId>
            <scope>test</scope>
        </dependency>
    </dependencies>

创建mould 8001端口，且注册进入eureka

在业务当中添加两个方法：方便我们后续进行服务降级和熔断时候对比。
- ok模拟正常业务
- timeout模拟长流程业务员

1.2 添加客户端

出现客户端相应缓慢，8001同一层次的其他接口被困死，因为在tomcat线程池当中默认只有10个线程。

客户端服务的核心就是调用远程服务。

使用Jemeter测试，压测timeout方法，发现OK方法也出现了问题，相应变慢，我们应该怎么来改善这一问题，这就引入了我们下面要说的Hystrix;

1.3 Hystrix解决

超时导致服务器变慢
出错(程序运行出错)

解决方案:

对方超时，必须有服务降级
对方down机，必须服务降级
对方OK，调用者自己出故障，自己处理降级

@HystrixCommand(fallbackMethod)

EnableCirutBreaker

1.3.1 提供端降级

在 Timeout 业务当中添加注解

  @Override
    @HystrixCommand(fallbackMethod = "timeoutHandler" ,commandProperties = {
            @HystrixProperty(name="execution.isolation.thread.timeoutInMilliseconds",value = "3000") //表示业务处理若超过 3s,则降级，调用方法。
    })
    public String timeout(String id ) {
        int tmm = 3*1000;
        try {
            Thread.sleep(tmm);
        } catch (InterruptedException e) {
            e.printStackTrace();
        }
        return "payment-timeout"+"current Thread "+Thread.currentThread().getId()+"   cID="+id;
    }

    /**
     * 降级回调方法
     * @param id
     * @return
     */
    public String timeoutHandler(String id){
        return "payment-timeout-handler"+"current Thread "+Thread.currentThread().getId()+"   cID="+id;
    }

主启动类当中激活 @EnableCircuitBreaker

@SpringBootApplication
@EnableEurekaClient
@EnableCircuitBreaker
public class HystrixPaymentApplication {
    public static void main(String[] args) {
        SpringApplication.run(HystrixPaymentApplication.class,args);
    }
}

测试结果

由于配置了hystrix容忍 3s 的超时，实际业务需要 5s 所以这里服务进行了降级处理。

现在我们把 timeout() 代码改成如下，在进行测试: 结果显示降级并且调用到了降级方法。

 @Override
    @HystrixCommand(fallbackMethod = "timeoutHandler" ,commandProperties = {
            @HystrixProperty(name="execution.isolation.thread.timeoutInMilliseconds",value = "3000") //表示业务处理若超过 3s,则降级，调用方法。
    })
    public String timeout(String id ) {
        //直接报错，观察是否会进行降级
        int t = 10/0;
        int tmm = 5*1000;
        try {
            Thread.sleep(tmm);
        } catch (InterruptedException e) {
            e.printStackTrace();
        }
        return "payment-timeout"+"current Thread "+Thread.currentThread().getId()+"   cID="+id;
    }

1.3.2 客户端降级

server:
  port: 80
spring:
  application:
    name: cloud-hystrix-order
eureka:
  client:
    register-with-eureka: true    #表示不向注册中心注册自己
    fetch-registry: true   #表示自己就是注册中心，职责是维护服务实例，并不需要去检索服务
    service-url:
      #设置与eureka server交互的地址查询服务和注册服务都需要依赖这个地址
      defaultZone: http://localhost:7001/eureka/
#      defaultZone: http://eureka7001.com:7001/eureka,http://eureka7002.com:7002/eureka

feign:
  hystrix:
    enabled: true
ribbon:
  ReadTimeout: 5000
  ConnectionTimeout: 5000

这里我们将主调用方法的超时容忍设为 1.5s, 而远程调用的长流程业务需要 3s完成，因此，测试一样会降级处理。

 @GetMapping("consumer/payment/timeout/{id}")
    @HystrixCommand(fallbackMethod = "timeoutHandler",commandProperties = {
            @HystrixProperty(name = "execution.isolation.thread.timeoutInMilliseconds",value = "1500") //设置容忍度为1500
    })
    public R timeout(@PathVariable("id")String id){
        R ok = paymentClient.timeout(id);
        return ok;
    }
    public R timeoutHandler(String id){
        R<String> r = new R<>();
        r.setData("consumer-timeoutHandler  id="+id);
        return r ;
    }

然而，上述代码的写法带来的两个问题

代码膨胀：每个方法都有一个hystrixConnmend,若有一百个接口，就得写一百个@hystrix…
代码混乱: 服务降级和正常业务逻辑进行了混淆

针对上面出现的两个问题，我们改写为下面的方法。

1.4 全局服务降级

全局服务降级配置，就是针对需要服务降级的进行通用配置使用 @Defaultproperties()注解进行配置;

再改写消费端如下，配置全局服务降级；

通过上一个配置，我们解决了代码膨胀得问题，接着我们最后写出一套完整通用得服务调用与降级的Demo。

1.5 究极服务降级

在 client 接口当中直接指定降级处理类;

继承 client接口，并且实现方法。

在测试的时候，将服务端(被调用端)关闭，成功调用降级方法！

这样，我们就解决了代码膨胀和代码混乱的问题;

2. 服务熔断

服务降级 -> 服务熔断 -> 链路恢复

断路器就是保险丝，熔断: 应对服务雪崩效应的链路保护机制，当检测节点微服务调用响应正常后，恢复调用链路。

熔点机制通过Hystrix实现
监控微服务调用的状况:
- 5秒20次调用失败，就会启动熔断机制。

熔断是> https://martinfowler.com/bliki/CircuitBreaker.html

2.1 熔断原理

熔断打开: 请求不再进行调用当前服务
熔断关闭: 熔断关闭，不再对服务进行熔断
熔断半开: 部分请求根据规则调用当前服务，如果请求成功且符合规则，则关闭熔断

设计断路器的三个重要参数; 快照时间窗口、请求总数阀值、错误百分比阀值
快照时间窗口: 统计请求和错误数据，默认为10s内
请求总数阀值: 在快照时间窗内，必须满足请求总数才有资格熔断，默认为20;
错误百分比法制: 当请求总数在快照时间内超过阀值，例如在10s内发生30次调用，有15次失败，则断路器打开。

当熔断开启后，直接调用fallback；

2.2 案例

在 payment 业务当中，添加业务方法代码，以便于我们测试熔断机制。

  @HystrixCommand(fallbackMethod = "paymentCircuitBreakHandler",commandProperties = {
            //开启熔断;
            @HystrixProperty(name = "circuitBreaker.enabled",value = "true"),
            //请求次数至少10次
            @HystrixProperty(name = "circuitBreaker.requestVolumeThreshold",value = "10"),
            //在10s中
            @HystrixProperty(name = "circuitBreaker.sleepWindowInMilliseconds",value = "10000"),
            //错误率 60%
            @HystrixProperty(name = "circuitBreaker.errorThresholdPercentage",value = "20")
    })
    public String paymentCirumentBreak(Integer id) {
        if(id<0){
            throw new RuntimeException("不能为负数");
        }
        //
        String rid = UUID.randomUUID().toString().replace("-","");
        return "调用成功: 流水号为: "+rid;
    }
    public String paymentCircuitBreakHandler(Integer id){
        return "调用失败: === 降级处理"+id;
    }

在Controller当中调用Service，并打开浏览器进行测试；
- 测试时候，传入负数参数连续调用n次，后在传入正数，会发现，正数返回的也是服务降级的内容，说明断路器Open;
- 再多次调用正数内容，熔断慢慢恢复到正常状态 closed;
上述熔断过程就是 closed -> open ->halfOpen -> closed 的过程

3. 服务监控

Hystrix还提供了一个准实时的调用监控，以报表的方式或者图形化的方式展现给用户。SpringCloud提供了hystrixDashboard的整合，对监控内容转为可视化界面。

案例

创建Module

   <dependency>
            <groupId>org.springframework.cloud</groupId>
            <artifactId>spring-cloud-starter-netflix-hystrix-dashboard</artifactId>
        </dependency>
        <dependency>
            <groupId>org.springframework.boot</groupId>
            <artifactId>spring-boot-starter-actuator</artifactId>
  </dependency>