设定:A上游系统、B本系统、C下游系统
服务降级
服务降级是从整个系统B的负荷情况出发和考虑的,对某些负荷会比较高的情况,为了预防某些功能(业务场景)出现负荷过载或者响应慢的情况,在B其内部暂时舍弃对一些非核心的接口和数据的请求,而直接返回一个提前准备好的fallback(退路)错误处理信息。这样,虽然提供的是一个有损的服务,但却保证了整个系统的稳定性和可用性。
- 超时:当B的服务因为某种原因响应过慢,B服务主动停掉一些不太重要的业务(如C),释放出服务器资源,增加响应速度!
- 不可用(熔断):当C服务因为某种原因不可用,B不再调用C,而是主动调用本地的一些降级逻辑(默认方法),避免卡顿,迅速返回给用户!
- 限流(就是限流):防止A服务请求太多导致B服务崩溃,所以限制请求的数量,来达到保护B服务的目的,当请求的流量到达一定阈值时,直接拒绝多余的请求,执行降级逻辑
服务熔断
服务熔断的作用类似于我们家用的保险丝,当C下游某服务出现不可用或响应超时的情况时,为了防止整个B系统出现雪崩,暂时停止对该C服务的调用。
熔断2种,一是自己熔断(比如推配置,关闭调用下游的开关),一个是自动熔断(设置一个规则,比如失败率,超过50%就不再调用)。
服务限流
限流是指上游服务A对本服务B请求 QPS 超过阙值时,B系统通过一定的策略(如延迟处理、拒绝处理)对上游服务A的请求量进行限制,以保证本服务不被压垮,从而持续提供稳定服务。常见的限流算法有滑动窗口、令牌桶、漏桶等。
熔断VS降级
相同点:
目标一致 都是从可用性和可靠性出发,为了防止系统崩溃;
用户体验类似 最终都让用户体验到的是某些功能暂时不可用;
不同点:
触发原因不同 服务熔断一般是某个服务(下游服务)故障引起,而服务降级一般是从整体负荷考虑;
实际上,限流和熔断都是降级的一种手段。
正在去BAT的路上修行
已在BAT的A中修行