记一次自定义starter引发的线上事故复盘

news2025/1/17 0:57:20

前言

本文素材来源于业务部门技术负责人某次线上事故复盘分享。故事的背景是这样,该业务部门招了一个技术挺不错的小伙子小张,由于小张技术能力在该部门比较突出,在入职不久后,他便成为这个部门某个项目组的team leader,同时也拥有review 该项目的权利。(注: 该项目为微服务项目),在某次小张review项目的时候,他发现好几个项目,发现代码有很多重复,于是他就动了把这些重复代码封装成starter的念头,然后也是因为这次的封装,带来一次线上事故。下面就以代码示例的形式,模拟这次事故

代码示例

注: 本文仅模拟出现事故的代码片段,不涉及业务

1、模拟小张的封装的starter

@Slf4j
public class HelloSevice {

    private ThreadPoolTaskExecutor threadPoolTaskExecutor;

    public HelloSevice(ThreadPoolTaskExecutor threadPoolTaskExecutor){
        this.threadPoolTaskExecutor = threadPoolTaskExecutor;
    }

    public String sayHello(String username){
        threadPoolTaskExecutor.execute(()->{
            log.info("hello: {} ",username);
        });
        return " hello : " + username;
    }
}

@Configuration
public class HelloServiceAutoConfiguration {


    @Bean
    public ThreadPoolTaskExecutor threadPoolTaskExecutor(){
        ThreadPoolTaskExecutor threadPoolTaskExecutor = new ThreadPoolTaskExecutor();
        threadPoolTaskExecutor.setCorePoolSize(2);
        threadPoolTaskExecutor.setMaxPoolSize(4);
        threadPoolTaskExecutor.setQueueCapacity(1);
        threadPoolTaskExecutor.setThreadFactory(new ThreadFactory() {
            private AtomicInteger atomicInteger = new AtomicInteger();
            @Override
            public Thread newThread(Runnable r) {
                Thread thread = new Thread(r);
                thread.setName("hello-pool-" + atomicInteger.getAndIncrement());
                return thread;
            }
        });

        return threadPoolTaskExecutor;

    }

    @Bean
    public HelloSevice helloSevice(ThreadPoolTaskExecutor threadPoolTaskExecutor){
        return new HelloSevice(threadPoolTaskExecutor);
    }

}

spring.factories

org.springframework.boot.autoconfigure.EnableAutoConfiguration=\
com.github.lybgeek.thirdparty.autoconfigure.HelloServiceAutoConfiguration

2、模拟有引用小张封装的starter的微服务项目

因为这些微服务中有一些耗时的任务,因此使用了spring的异步。示例如下

@Configuration
public class ThreadPoolConfig {

    @Bean
    public ThreadPoolTaskExecutor threadPoolTaskExecutor(){
        ThreadPoolTaskExecutor threadPoolTaskExecutor = new ThreadPoolTaskExecutor();
        threadPoolTaskExecutor.setCorePoolSize(2);
        threadPoolTaskExecutor.setMaxPoolSize(5);
        threadPoolTaskExecutor.setQueueCapacity(10);
        threadPoolTaskExecutor.setThreadFactory(new ThreadFactory() {
            private AtomicInteger atomicInteger = new AtomicInteger();
            @Override
            public Thread newThread(Runnable r) {
                Thread thread = new Thread(r);
                thread.setName("echo-pool-" + atomicInteger.getAndIncrement());
                return thread;
            }
        });

        threadPoolTaskExecutor.setRejectedExecutionHandler((r, executor) -> System.err.println("记录日志。。。。"));

        return threadPoolTaskExecutor;

    }
}

@Service
@Slf4j
public class EchoService {

    @Async("threadPoolTaskExecutor")
    public void echo(String content){
        log.info("echo -> {} ",content);
        try {
            //模拟耗时操作
            TimeUnit.MINUTES.sleep(2);
        } catch (InterruptedException e) {
            e.printStackTrace();
        }
    }
}

3、和本文有关系的配置内容

spring:
  main:
    allow-bean-definition-overriding: true

4、模拟调用耗时业务代码块示例

@Component
public class BeanCommandRunner implements CommandLineRunner {

    @Autowired
    private EchoService echoService;



    @Override
    public void run(String... args) throws Exception {

        for (int i = 0; i < 6; i++) {
            echoService.echo("content:" + i);
        }

    }
}

相关的代码如上述内容

大家可以思考一下上面的示例有没有什么问题

我们启动一下程序,观察一下控制台
报了一个线程池拒绝异常,而且通过这个异常信息,我们发现这个线程池走是小张封装线程池,而非业务自己定义的线程池。这明显是不正常的,正常的逻辑是业务代码优先级需比公共代码优先高才合理

那如何解决呢?

仅需利用springboot的条件注解即可,在小张封装的starter下做如下改动

@Bean
    @ConditionalOnMissingBean
    public ThreadPoolTaskExecutor threadPoolTaskExecutor(){
        ThreadPoolTaskExecutor threadPoolTaskExecutor = new ThreadPoolTaskExecutor();
        threadPoolTaskExecutor.setCorePoolSize(2);
        threadPoolTaskExecutor.setMaxPoolSize(4);
        threadPoolTaskExecutor.setQueueCapacity(1);
        threadPoolTaskExecutor.setThreadFactory(new ThreadFactory() {
            private AtomicInteger atomicInteger = new AtomicInteger();
            @Override
            public Thread newThread(Runnable r) {
                Thread thread = new Thread(r);
                thread.setName("hello-pool-" + atomicInteger.getAndIncrement());
                return thread;
            }
        });

        return threadPoolTaskExecutor;

    }

修改后,我们在启动一下程序,观察控制台


此时走就是业务自定义的线程池了

为什么加了一个 @ConditionalOnMissingBean就可以了

这就得从springboot的自动装配说起了,springboot的自动装配类继承了org.springframework.context.annotation.DeferredImportSelector,这个接口具有懒加载的功能,当项目启动后,先加载业务自定义的bean,再来加载starter的bean,当我们项目中没有配置

spring:
  main:
    allow-bean-definition-overriding: true

时,项目启动就会直接报类似如下异常

当时他们业务项目因为他们feign没有指定contextId,导致报了上述的异常,业务开发为了省事就直接把
allow-bean-definition-overriding设置成true,这也为后续小张自定义的starter引发的事故埋下了很好的根基。那我们再切回主线,当spring发现有两个一样的bean,且发现allow-bean-definition-overriding为true,后面加载的bean会把前面加载的bean覆盖掉,这也是为啥小张starter的bean会生效。当我们在starter上的bean上加载 @ConditionalOnMissingBean后,因为业务项目的bean已经存在了,starter的bean就不会加载进spring容器了。

我们从技术维度说明了解决方案,我们再从非技术的角度上复盘一下这次事故

复盘

不知道会不会有朋友说,你说那么多,不就加一个@ConditionalOnMissingBean就能解决这个问题,下次注意就好了啊。但据业务技术人反馈当时他们排查了挺久,因为他们业务项目平时没啥并发量,所以小张那个问题就被掩盖住了,而有次他们业务搞了一个营销活动,因为并发上去了,才把问题暴露出来。这侧面也说明项目压测的重要性,不能因为平时没啥并发,就掉以轻心

不懂大家的公司是否也有这样的情况,在我们这边,底下成员代码只能merge request,只有team leader review后,再将代码合并到主干,因为team leader拥有的权限比较大,他写的代码,只要他愿意,直接就能合并到主干了。这次也是因为小张直接将他写的代码推到主干发布,酿成事故。后面我们这边提出了一个方法,就是team leader的代码要由更高级的leader进行走查,但是这个方法我是感觉也不是很好,因为有不少项目组的team leader的老板基本上已经脱离一线,不敲代码了,也不懂能不能行。

其次因为小张入职不久,对业务其实没有完全吃透,因为看到重复的代码,出于技术洁癖,就想去改,出发点是好的,但有句话技术是为业务服务,业务都没搞懂,就去动,有时候会带来意想不到的风险

总结

对自己的不熟悉的项目或者开发公共组件,深思熟虑再动手是很重要的

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/27099.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

计算机外设:显示器是如何工作的?

本节我们将了解计算机的外设之一&#xff1a;显示器的底层工作原理。通过本节&#xff0c;你会知道电脑显示器是如何实时展示我们在计算机上的操作的&#xff0c;比如显示出一张“E”的字符。最后总结了计算机编程的本质&#xff0c;就是人们是通过设计&#xff0c;让字节代表不…

超迷你机械臂机器人,YYDS

真正的大师,永远都怀着一颗学徒的心&#xff01; 一、项目简介 超迷你机械臂机器人&#xff0c;YYDS 核心板&#xff1a; REF核心板 REF底板&#xff08;机械臂底座里面的控制器电路板&#xff09; 步进电机驱动 Peak示教器 文件&#xff1a; 3D模型设计源文件。 20步进…

Python机器学习 | AI芯片调研

AI芯片调研 1、 概念 AI芯片又叫AI加速器,专门用于处理人工智能应用中的大量计算任务的模块。 注意:其他非计算任务仍由CPU处理 2、 背景 神经网络需要大量的矩阵运算,CPU和传统计算架构无法满足对于并行计算能力的需求,需要特殊定制的AI芯片(GPU、TPU、NPU、DPU等等)…

Go Web项目学习之项目结构

风离不摆烂学习日志 Day4 — Go Web项目学习之项目结构 创建项目配置代理 下载加速 go 包代理 GOPROXYhttps://goproxy.cn,direct 本项目学习自&#xff1a; [github.com](https://github.com/gnimli/go-web-mini) 项目结构分层 ├─common # casbin mysql zap validator 等公…

web概述18

JSP JSP是Sun为了解决动态生成HTML文档的技术&#xff0c;通过Servlet输出简单html页面信息都非常不方便。如果要输出一个复杂页面的时候&#xff0c;就更加的困难&#xff0c;而且不利于页面的维护和调试。所以sun公司推出一种叫做jsp的动态页面技术来实现对页面的输出繁锁工…

【设计模式】 - 结构型模式 - 适配器模式

目录标题1. 前言适配器模式1. 概述2. 结构3. 实现3.1 类适配器模式&#xff08; 继承&#xff09;--耦合度高代码实现3.2 对象适配器模式&#xff08;聚合&#xff09;代码实现类适配器与对象适配器的区别4. 适配器模式的优缺点1. 前言 结构型模式描述如何将类或对象按某种布局…

Borland Delphi 2005对Delphi语言的支持

Borland Delphi 2005对Delphi语言的支持 Borland Delphi是Borland Delphi的最新版本&#xff0c;它为用户的Microsoft Windows操作系统和1.1本身的Microsoft.NET Framework版本提供了快速应用程序开发。Delphi Borland 2005被认为具有主要的三个不同的字符&#xff0c;如Win32…

目标检测论文解读复现之十五:基于YOLOv5的光学遥感图像舰船 目标检测算法

前言 此前出了目标改进算法专栏&#xff0c;但是对于应用于什么场景&#xff0c;需要什么改进方法对应与自己的应用场景有效果&#xff0c;并且多少改进点能发什么水平的文章&#xff0c;为解决大家的困惑&#xff0c;此系列文章旨在给大家解读最新目标检测算法论文&#xff0…

关于商业智能BI,今天只谈这五点

数据在当下的价值不断提高&#xff0c;但数据本身只是一种资产&#xff0c;一旦超过一定数据量就很难被人类理解&#xff0c;所以想要利用数据&#xff0c;就必须将数据转化为信息和知识&#xff0c;让管理者看到的是信息&#xff0c;而不是数据堆砌。 之前的文章里写过很多关…

打了10次电话,才总结出来的抖音封号原因分析,能避免大量封号

真正做过视频的人,应该是经常会面对封号 ,如果你号都没有封过,说明你还没有真正开始过 。这个话不是我讲的&#xff0c;是和一个日入3万的大V聊天&#xff0c;他说给我听的。你觉得这话对么&#xff1f;无论任何平台 ,都不会无缘无故封你号 ,平台需要大量的作者去生成内容 ,在符…

马来酰亚胺聚谷氨酸天冬氨酸聚合物药物载顺铂/mPEg-PGA纳米微球的制备

小编在此整理了马来酰亚胺聚谷氨酸天冬氨酸聚合物药物载顺铂/mPEg-PGA纳米微球的制备步骤&#xff0c;与小编一同来看&#xff01; 载顺铂mPEg-PGA纳米微球的制备&#xff1a; 采用生物相容性好,生物可降解的mPEG-PGA聚合物作为药物载体,通过膜透析法制备了负载顺铂纳米微球,以…

CAN总线在OSI模型中层级

ISO14229-1仅规定了应用层的实现&#xff0c;诊断可以基于不同的总线去实施&#xff0c;以基于CAN的UDS最为广泛。本文开始将陆续介绍CAN总线协议的规范与开发。 关联文章&#xff1a;UDS的OSI模型 文章目录OSI模型与CAN的关系在各层中CAN定义事项CAN总线网络ISO11898 和 ISO…

如何保证优秀的医疗器械设计?

如何保证优秀的产品设计?医疗器械设计领域的出现不是一蹴而就的&#xff0c;而是经历了时间的沉淀。 医疗设备的设计责任重大。这些产品有机会改变和拯救生命。它们可以在市场上销售几年或更长时间&#xff0c;这将影响人们管理自己或他人健康的方式。所以&#xff0c;医疗产品…

报错与解决 | 应用程序无法启动0x7b mysql

文章目录报错解决办法成功解决问题报错 根据“MySQL下载安装使用-完整详细步骤”下载安装好MySQL后&#xff0c;以管理员身份启动cmd&#xff0c;输入&#xff1a; "D:\mysql\mysql-5.7.31-winx64\bin \mysqld.exe" --initialize-insecure # 自己的mysql安装目录 …

C语言easyx颜色模块+案例

c语言exsyx学习颜色模型rgbhsvhsv转换为rgb案例 绘制彩虹窗体案例 绘制天空和彩虹画面颜色模型 1.1 什么是RGB颜色模型 不知道你有没有近距离看过各种电子显示屏。若非常近距离的观察电子显示屏&#xff0c;可以发现屏幕居然是由 一个一个的红色、绿色、蓝色的小点组成。 红…

毕业设计 - SSM中药店商城系统(含源码+论文)

文章目录1 项目简介2 实现效果2.1 界面展示3 设计方案3.1 概述3.2 系统流程3.3 系统结构设计4 项目获取1 项目简介 Hi&#xff0c;各位同学好呀&#xff0c;这里是M学姐&#xff01; 今天向大家分享一个今年(2022)最新完成的毕业设计项目作品&#xff0c;【基于SSM的中药店商…

半年销售100万辆 关注比亚迪后300万时代

11月16日&#xff0c;比亚迪第300万辆新能源汽车下线发布在比亚迪全球总部举行&#xff0c;标志着比亚迪成为首个达成这一里程碑的中国品牌。从“第1辆新能源汽车到第100万辆新能源汽车”用时13年、从“100万到200万”用时1年&#xff0c;从“200万到300万”仅用时半年&#xf…

HTML5——周技能检测——菜单编辑——2022年11月22日(考完)

HTML5——周技能检测——菜单编辑——2022年11月22日&#xff08;考完&#xff09; 一、语言和环境 1. 实现语言&#xff1a;HTML5。 2. 开发环境&#xff1a;VScode。 二、要求 1、完成下列菜单显示效果。 2、添加【:hover】选择器&#xff0c;鼠标悬停在文字上方时文字…

全面详解云计算

【导读】本文从企业IT建设发展痛点解析入手,从云计算的标准定义、云平台分类、云计算优劣势分析,到企业规模、业务类型与云平台适用以及企业上云流程简析,全面详解云计算,结合作者的思考和观点,为读者认识云计算提供一个全景式的概貌。 前言 大数据、人工智能、云计算可…

C++ 手动实现双线链表(作业版)

双向链表&#xff0c;并实现增删查改等功能 首先定义节点类&#xff0c;类成员包含当前节点的值&#xff0c; 指向下一个节点的指针和指向上一个节点的指针 //节点定义 template <typename T> class Node { public:Node<T>* prior;T value;Node<T>* next;N…