当涉及到软件发布时,金丝雀发布(灰度发布)、滚动发布和蓝绿发布是常见的策略。它们各自有自己的优缺点、区别和特点。本文将简单介绍:
金丝雀发布(Canary Release)
金丝雀发布有一个有趣的小故事,被称为「金丝雀在矿井」。这个故事用来形象地描述金丝雀发布策略的概念。
故事背景是在过去的煤矿开采中,矿工们面临着一种危险的情况,即有毒气体的积累。由于无法直接检测到这些气体,矿工们需要一种警报机制来提醒他们是否面临危险。他们找到了一种解决方案:带上一只小小的金丝雀。
矿工们将金丝雀放入煤矿,如果气体达到了危险的水平,金丝雀会首先受到影响并死亡,从而警示矿工们立即离开矿井以避免危险。这种警报系统保护了矿工的生命安全。
在软件开发中,金丝雀发布采用了类似的原理。新版本的应用程序首先在一小部分用户或服务器上进行部署和测试,就像金丝雀被放入矿井一样。如果新版本出现了问题,只有少数用户或服务器受到影响,而大多数用户仍在使用稳定的旧版本。这种策略允许开发团队快速获取反馈并进行故障排除,以确保新版本的稳定性和可靠性。
金丝雀发布(Canary Release)的工作原理:
-
选择一小部分用户或服务器:在金丝雀发布中,先从整个用户群体或服务器群体中选择一小部分作为金丝雀群体。
-
部署新版本:将新版本的应用程序或服务部署到金丝雀群体中,而其他用户或服务器仍在使用稳定的旧版本。
-
监控和收集反馈:在金丝雀群体中,密切监控新版本的性能、稳定性和用户反馈,收集指标和数据。
-
评估和决策:基于收集到的指标和反馈,评估新版本的表现。如果新版本良好,可以继续推广至更多用户或服务器。如果出现问题,可以快速回滚到旧版本。
-
扩大范围:逐步扩大新版本的范围,将更多用户或服务器引入新版本的使用,直到完全替代旧版本。
-
优点:
- 通过逐步将流量引导到新版本,降低了风险,因为只有一小部分用户受到影响。
- 可以快速获得新版本的反馈,并及时检测和修复问题。
- 可以进行A/B测试,对比新旧版本的性能和用户体验。
-
缺点:
- 需要额外的设置和配置来处理流量的路由和分发。
- 管理多个版本的代码和环境可能会带来复杂性。
- 需要监控和分析金丝雀实例的性能和健康状态。
-
特点:
- 通过将新版本的一小部分实例引入生产环境,逐步扩大其份额。
- 可以在出现问题时快速回滚到旧版本。
- 可以基于反馈和指标来决定是否继续推广新版本。
灰度发布是金丝雀发布的延伸,是将发布分成不同的阶段/批次,每个阶段/批次的用户数量逐级增加。如果新版本在当前阶段没有发现问题,就再增加用户数量进入下一个阶段,直至扩展到全部用户。
灰度发布可以减小发布风险,是一种零宕机时间的发布策略。它通过切换线上并存版本之间的路由权重,逐步从一个版本切换为另一个版本。整个发布过程会持续比较长的时间, 在这段时间内,新旧代码共存,所以在开发过程中,需要考虑版本之间的兼容性,新旧代码共存不能影响功能可用性和用户体验。当新版本代码出现问题时,灰度发布能够比较快的回滚到老版本的代码上。
滚动发布(Rolling Release)
滚动发布(Rolling Release)的工作原理:
-
划分多个部分:将整个用户群体或服务器群体划分为多个小部分。
-
部署新版本:从第一个部分开始,将新版本的应用程序或服务逐步部署到每个小部分中,同时保留其他部分使用稳定的旧版本。
-
平滑过渡:在部署新版本的过程中,确保新旧版本的兼容性和平滑过渡,逐渐将流量从旧版本切换到新版本。
-
健康检查和监控:对每个部分的新版本进行健康检查和监控,确保其稳定性和可靠性。如果出现问题,可以回滚到旧版本并修复问题。
-
逐步扩展:逐步将新版本部署到所有部分,最终实现全面的升级,替换掉旧版本。
-
红色:正在更新的实例
-
蓝色:更新完成并加入集群的实例
-
绿色:正在运行的实例
-
优点:
- 逐步替换旧版本,无需停机,对用户影响较小。
- 具备横向扩展的能力,可以在升级期间处理更多的请求。
- 出现问题时可以快速回滚到之前的版本。
-
缺点:
- 升级过程可能需要较长时间,特别是对于大型应用或数据量较大的情况。
- 由于同时存在多个版本,可能需要更多的资源来支持。
- 如果出现问题,可能需要额外的操作来解决版本冲突或数据一致性问题。
-
特点:
- 通过逐步替换旧版本的实例来实现平滑升级。
- 通常会设置升级策略和健康检查来确保新实例的稳定性。
- 可以控制升级的速率和顺序,以适应不同的需求。
蓝绿发布(Blue-Green Deployment)有钱人玩的!
蓝绿发布(Blue-Green Deployment)的工作原理:
-
准备两个环境:准备两个完全独立的环境,分别称为蓝环境(Blue Environment)和绿环境(Green Environment)。
-
部署新版本:将新版本的应用程序或服务部署到绿环境中,蓝环境继续运行稳定的旧版本。
-
测试和验证:在绿环境中进行全面的测试和验证,确保新版本的稳定性和可靠性。
-
切换流量:当新版本在绿环境通过测试后,将负载均衡器或路由器的指向切换到绿环境,将流量引导到新版本。
-
回滚和切换:如果出现问题,可以快速切换回蓝环境,回滚到旧版本。同时,修复问题并再次进行测试后,可以再次切换流量到绿环境。
蓝绿发布的特点是通过完全隔离的环境来实现平滑的切换,保证了用户的无缝体验和服务的连续性。
-
优点:
- 完全隔离新旧版本,无需共享资源,对用户影响最小。
- 可以快速切换回旧版本,减少问题造成的影响。
- 可以进行全面的测试和验证,确保新版本的稳定性和可靠性。
-
缺点:
- 需要维护并运行两个完全独立的环境,需要更多的资源。
- 切换过程可能需要一些时间和操作,特别是对于大型应用或数据量较大的情况。
- 需要额外的负载均衡和路由配置。
-
特点:
- 使用两个独立的环境(蓝色和绿色)来承载新旧版本。
- 新版本在绿色环境中进行测试和验证,确保其稳定性和可靠性。
- 切换流量时,将负载均衡器指向新环境,实现无缝切换
服务在滚动更新时,deployment控制器的目的是:给旧版本(old_rs)副本数减少至0、给新版本(new_rs)副本数量增至期望值(replicas)。大家在使用时,通常容易忽视控制速率的特性,以下是kubernetes提供的两个参数:
- maxUnavailable:和期望ready的副本数比,不可用副本数最大比例(或最大值),这个值越小,越能保证服务稳定,更新越平滑;
- maxSurge:和期望ready的副本数比,超过期望副本数最大比例(或最大值),这个值调的越大,副本更新速度越快。
总结:
-
金丝雀发布:适用于需要渐进式引入新版本并进行实时测试和反馈的情况。通过将新版本仅部署给一小部分用户或服务器组,可以降低潜在风险,并在出现问题时快速回滚或修复。
-
滚动发布:适用于大型系统,需确保平滑过渡和稳定性的情况。通过逐步将新版本部署到整个生产环境中的服务器群集,可以减少对用户的影响,并确保新版本的可扩展性和稳定性。
-
蓝绿发布:适用于对可用性和零停机时间有较高要求的系统。通过同时维护蓝色环境(活动生产环境)和绿色环境(用于测试和准备新版本),可以实现无服务中断的部署,并在部署过程中轻松切换流量路由。