【项目实战】从零开始设计并实现一个接口异常链路分析器

news2024/11/20 8:34:03

这不是马上要到1024了吗,这不得弄个什么工具给部门项目提提效😯?

1. 背景

在我们服务端应用当中,我们往往会要求更高的性能和更高的稳定性,但实际开发的过程中,可能会出现很多赶时间的情况(也不排除代码水平问题),那么代码就会写的比较随性🤣。

这里我主要想探讨的是 服务的不合理调用链路 对项目造成的影响。

首先介绍一下这里所指的 服务的不合理调用链路,它们包括但不限于以下情况:

  • 同一个接口中反复调用同一个SQL或Dubbo。
  • 接口入参没有做限制,加载大量数据,或某条SQL一次性查询出大量数据。
  • SQL查询速度慢,没有正确使用索引或出现不合理的连表。

其实就是一些耗时操作,它们本来就比较费时间,还要被重复调用,或者是一些不合理的SQL,这很显然是可优化的。优化方法也很明显,限制参数、循环查询改成批量查询、SQL加索引等。

所以现在想要找出那些不合理的代码,怎么找就成了问题的关键。


PS:以下是我和我导师(wingli 的个人主页)的设计方案,与公司业务无关,所以才写成博客进行分享,各位且看且珍惜。(记得点赞关注✍️)

2. 方案选择

经过一上午的研究,得出以下几种方案。

方法

实现方式

优点

缺点

总结

静态代码分析

可以通过idea插件的方式,写一些代码检测逻辑。找出可能存在的不合理代码,约等于一个简单的代码review。

可以在编码期就针对性的做一些提醒,让写代码的人及时调整实现方式。

无法做到运行时处理,无法判断一些运行期可能出现的问题,比如大对象,而且以前的老项目也顾及不到。

应该属于是一个有用但收益相对较低的方案。

分析APM上报的数据

APM会默认采集sql、dubbo、http、redis等调用链路数据,然后上报到ES,我们可以去ES中获取这些数据,然后对这些数据进行分析,寻找不合理的调用链路。

链路调用的数据比较全,而且已经普及到所有项目当中了。

APM采样的数据方式无法兼容我们所有的需求,比如无法判断参数是否过大、是否多次重复调用相同的接口等。

有基础内容,但不完全满足需求。

Java agent埋点

自己做一个采样工具,基于Java agent来实现,在需要被采集信息的方法前后插入代码,实现信息收集。

可自定义程度高,可以完全实现需求。

需要自己实现,有一定的工作量。

可以实现,也能满足需求,就是时间成本会高一些。

拦截器保留慢接口数据

通过拦截请求,判断请求耗时,采集高耗时的接口信息。

实现简单。

可收集的数据少,无法满足需求。如链路中多次调用相同的SQL或者Dubbo,无法收集。

实现简单,但不能满足需求,不如分析APM上报数据。

人工review

自己在写的时候多检查几遍,并且代码评审时部门成员也认真提出不合理调用。

无需代码层面实现,没准还可以提高团队review次数。

更加消耗时间,而且没有保障,如果没注意就错过了,也难以对以前的项目全部进行review

需要消耗大量的人员时间,属于是减效。

综合考虑各种方案的情况,决定通过 agent埋点 的方法来实现。

2.1. Java agent

这块估计很多小伙伴也不太了解,所以跟大家简单介绍一下。先来点官方的:

Java agent 是JVM提供的一种机制,允许开发者在应用程序运行时修改或增强已加载的类和字节码。通过 Java agent,开发者可以在不修改源代码的情况下,对应用程序进行动态的修改、监控和增强。

Java agent 的工作原理是通过在 JVM 启动时,通过命令行参数动态加载一个特殊的 jar 文件,这个 jar 文件被我们称为 Java agent。Java agent 可以用于字节码增强、性能监控、类加载和转换等方面的应用。它为开发者提供了更灵活和强大的工具,用于对 Java 应用程序进行动态修改和增强。

乍一看,感觉有点像Spring AOP,这里讲一下它们的区别:

Java agent 提供了更底层的字节码级别的修改和增强能力,可以在任何 Java 应用程序中使用,而 Spring AOP 是基于代理模式的框架,主要用于在 Spring 容器中对业务逻辑进行增强。

大概就是这样了,如果你还不太清除 Java agent 到底是个什么东西的话,那你就当它是“一种在字节码上进行修改的AOP”

更详细的Java agent教程可以去网上找找其他文章,因为我也不太懂,这里我就不做过多介绍了。

3. 实现方案

3.1. 项目架构

项目架构分为:埋点层、收集层、上报层、持久层、展示层。其中前三层在agent服务当中,后两层在server服务当中,如下图所示:

被检测的服务是使用了 Java agent 进行增强的服务,埋点层、收集层、上报层都是由agent插入到源项目代码当中的,对源代码无侵入性。

3.2. 埋点方案

首先我们需要对每一个请求都进行信息收集,我们把一个完整的请求称为 Transaction ,目前考虑到的请求入口包括:

  • 来自客户端的HTTP请求
  • 来自其他服务调用的Dubbo请求
  • 来自MQ发来的消息消费
  • 来自定时任务的调度事件

其次我们需要收集的信息主要是一些可能比较耗时的操作,我们把每一个操作称为 Span ,主要包括一些涉及到IO的操作:

  • 数据库操作
  • Redis操作
  • Dubbo操作
  • MQ操作
  • 通过HTTP调用三方服务的操作
  • 复杂的计算逻辑

我们在上述每一个入口处和每一个耗时操作前后都通过agent添加埋点,入口前后的埋点用来表示请求的开始和结束,而耗时操作前后的埋点则会获取当前堆栈中的相关数据,这样就构成了第一层【埋点层】。

核心代码示例如下:

public class BadCallDetectTransformer implements ClassFileTransformer {

    private static final CopyOnWriteArraySet<String> enhancedClass = new CopyOnWriteArraySet<>();

    private Instrumentation inst;

    public BadCallDetectTransformer(Instrumentation inst) {
        this.inst = inst;
    }

    public byte[] transform(ClassLoader loader, String className, Class<?> classBeingRedefined, ProtectionDomain protectionDomain, byte[] classfileBuffer) throws IllegalClassFormatException {
        if (className == null) return classfileBuffer;
        className = className.replace("/", ".");

        try {

            //transaction http
            if (className.equals("org.springframework.web.method.support.InvocableHandlerMethod")) {
                if (!enhancedClass.contains(className)) {
                    String beforeCode = TransformerUtils.unShadeIfNecessary("shaded.com.seewo.detect.agent.helper.TransactionHelper.httpTransactionEnter($args,$0);");
                    String afterCode = TransformerUtils.unShadeIfNecessary("shaded.com.seewo.detect.agent.helper.TransactionHelper.httpTransactionExit($args,$0,$_);");
                    classfileBuffer = TransformerUtils.insertMethodBefore("doInvoke", loader, classfileBuffer, beforeCode);
                    classfileBuffer = TransformerUtils.insertMethodAsFinally("doInvoke", loader, classfileBuffer, afterCode);
                    logger.warn("enhanced class:{}", className);
                    enhancedClass.add(className);
                }
            }

            //span mybatis
            if (className.equals("org.apache.ibatis.binding.MapperMethod")) {
                if (!enhancedClass.contains(className)) {
                    //org.apache.ibatis.binding.MapperMethod,org.apache.ibatis.session.SqlSession,java.lang.Object
                    String beforeCode = TransformerUtils.unShadeIfNecessary("shaded.com.seewo.detect.agent.helper.SpanHelper.mybatisSpanEnter($2,$0);");
                    String afterCode = TransformerUtils.unShadeIfNecessary("shaded.com.seewo.detect.agent.helper.SpanHelper.mybatisSpanExit($2,$0,$_);");
                    classfileBuffer = TransformerUtils.insertMethodBefore("execute", loader, classfileBuffer, beforeCode);
                    classfileBuffer = TransformerUtils.insertMethodAsFinally("execute", loader, classfileBuffer, afterCode);
                    logger.warn("enhanced class:{}", className);
                    enhancedClass.add(className);
                }
            }

        } catch (Throwable t) {
            logger.error("enhance class:{} fail.", className, t);
        }
        return classfileBuffer;
    }

}

其中 TransactionHelper 和 SpanHelper 的核心示例代码如下:

/**
 * transaction
 */
public class TransactionHelper {

    public static void httpTransactionEnter(Object[] args, InvocableHandlerMethod invocableHandlerMethod) {
        String mark = "";
        long argLength = -1;
        TransactionData transactionData = null;
        try {

            Method method = invocableHandlerMethod.getMethod();
            Class<?> clazz = method.getDeclaringClass();
            mark = clazz.getName() + "#" + method.getName();

            if (!Collector.shouldBeCollect(mark, TransactionTypeEnum.HTTP, true)) {
                return;
            }

            TransactionHttpData transactionHttpData = new TransactionHttpData();
            RequestAttributes requestAttributes = RequestContextHolder.getRequestAttributes();
            if (requestAttributes instanceof ServletRequestAttributes) {
                String uri = ((ServletRequestAttributes) requestAttributes).getRequest().getRequestURI();
                transactionHttpData.setUri(uri);
            }

            argLength = Utils.toJSONStringWithCatch(args).length();
            transactionData = transactionHttpData;
        } catch (Throwable t) {
            logger.warn("httpTransactionEnter err.", t);
        } finally {
            Collector.transactionEnter(mark, TransactionTypeEnum.HTTP, argLength, transactionData);
        }
    }

    public static void httpTransactionExit(Object[] args, InvocableHandlerMethod invocableHandlerMethod, Object returnObj) {
        String mark = "";
        long resultLength = -1;
        TransactionData transactionData = null;
        try {
            Method method = invocableHandlerMethod.getMethod();
            Class<?> clazz = method.getDeclaringClass();
            mark = clazz.getName() + "#" + method.getName();

            if (!Collector.shouldBeCollect(mark, TransactionTypeEnum.HTTP, false)) {
                return;
            }

            resultLength = Utils.toJSONStringWithCatch(returnObj).length();
        } catch (Throwable t) {
            logger.warn("httpTransactionExit err.", t);
        } finally {
            Collector.transactionExit(mark, resultLength, transactionData);
        }
    }

}

/**
 * span
 */
public class SpanHelper {

    public static void mybatisSpanEnter(Object[] args, MapperMethod mapperMethod) {
        String mark = "";
        long length = -1;
        SpanData spanData = null;
        try {

            Field sqlCommandField = MapperMethod.class.getDeclaredField("command");
            sqlCommandField.setAccessible(true);
            MapperMethod.SqlCommand sqlCommand = (MapperMethod.SqlCommand) sqlCommandField.get(mapperMethod);
            mark = sqlCommand.getName();

            if (!Collector.shouldBeCollect(mark, SpanTypeEnum.MYBATIS)) {
                return;
            }

            String sqlCommandType = sqlCommand.getType().toString();

            length = Utils.toJSONStringWithCatch(args).length();
        } catch (Throwable t) {
            logger.warn("mybatisSpanEnter err.", t);
        } finally {
            Collector.spanEnter(mark, SpanTypeEnum.MYBATIS, length, spanData);
        }
    }

    public static void mybatisSpanExit(Object[] args, MapperMethod mapperMethod, Object returnObj) {
        String mark = "";
        long length = -1;
        SpanData spanData = null;
        try {
            Field sqlCommandField = MapperMethod.class.getDeclaredField("command");
            sqlCommandField.setAccessible(true);
            MapperMethod.SqlCommand sqlCommand = (MapperMethod.SqlCommand) sqlCommandField.get(mapperMethod);
            mark = sqlCommand.getName();

            if (!Collector.shouldBeCollect(mark, SpanTypeEnum.MYBATIS)) {
                return;
            }

            length = Utils.toJSONStringWithCatch(returnObj).length();
        } catch (Throwable t) {
            logger.warn("mybatisSpanExit err.", t);
        } finally {
            Collector.spanExit(mark, length, spanData);
        }

    }

}

3.3. 收集方案

埋点层获取到主要信息后,就调用【收集层】的方法,把这些数据添加到一个临时的缓存中,并通过线程id把前后关联的数据连接起来,以形成一个完整的调用链路,这里可以用 ThreadLocal 来充当这一层的缓存。

收集层接口传入的主要参数应该包括:

  • 方法的类型,DB、Redis、Dubbo、MQ等
  • 方法的唯一标识,用于判断是否多次重复调用了同样的接口
  • 方法的参数长度
  • 其他需要的数据

一个请求开启时,记录初始时间,后续每次收到一条数据,就计算一下距离上次传入数据经过了多久,然后把他们放到当前线程的List内。

当请求结束后,计算出总耗时,同时判断该数据是否需要被上报,并不是所有数据都有上报价值,事实上,大部分的数据都是不需要上报的。

核心代码实现:

public class Collector {

    private static final ThreadLocal<Transaction> transactionThreadLocal = new ThreadLocal<>();

    private static final AtomicInteger atomicInteger = new AtomicInteger(0);

    /**
     * 是否需要收集
     */
    public static boolean shouldBeCollect(String mark, TransactionTypeEnum transactionTypeEnum, boolean isEnter) {
        if (isEnter) {
            // 采样
            return Math.random() < 0.01 && atomicInteger.get() < 100;
        } else {
            Transaction transaction = getTransaction();
            return transaction != null;
        }
    }

    /**
     * 是否需要收集
     */
    public static boolean shouldBeCollect(String mark, SpanTypeEnum spanTypeEnum) {
        Transaction transaction = getTransaction();
        return transaction != null;
    }

    /**
     * 事务开始
     *
     * @param mark                事务标记
     * @param transactionTypeEnum http dubbo mq ...
     * @param length
     * @param transactionData
     */
    public static void transactionEnter(String mark, TransactionTypeEnum transactionTypeEnum, long length, TransactionData transactionData) {
        try {
            // 值判定
            if (StringUtils.isBlank(mark) || length < 0) {
                return;
            }

            Transaction transaction = new Transaction();
            transaction.setTransactionType(transactionTypeEnum.getType());
            transaction.setMark(mark);
            transaction.setStartTime(System.currentTimeMillis());
            transaction.setTransactionData(transactionData);
            transaction.setArgLength(length);

            initTransaction(transaction);
        } catch (Throwable t) {
            logger.warn("transactionEnter err.");
            clearTransaction();
        }
    }


    public static void transactionExit(String mark, long length, TransactionData transactionData) {

        try {
            // 值判定
            if (StringUtils.isBlank(mark) || length < 0) {
                return;
            }

            Transaction transaction = getTransaction();
            if (transaction == null) return;

            // 计算耗时
            transaction.setCostTime(System.currentTimeMillis() - transaction.getStartTime());
            if (transaction.getCostTime() < 20) {
                return;
            }

            transaction.setTransactionData(transactionData);
            transaction.setReturnLength(length);
            // 整合计算数据
            CallStatData linkData = mergeData(transaction);

            // 上报数据
            MessageClient.add(linkData);

        } catch (Throwable t) {
            logger.warn("transactionExit err.");
        } finally {
            clearTransaction();
        }
    }

    /**
     * @param spanData sql的长度, dubbo的方法名,mq的topic
     */
    public static void spanEnter(String mark, SpanTypeEnum spanTypeEnum, long length, SpanData spanData) {
        try {
            // 值判定
            if (StringUtils.isBlank(mark) || length < 0) {
                return;
            }

            Transaction transaction = getTransaction();
            if (transaction == null) return;

            Span span = new Span();
            span.setMark(mark);
            span.setSpanType(spanTypeEnum);
            span.setSpanData(spanData);
            span.setStartTime(System.currentTimeMillis());
            span.setArgLength(length);

            transaction.getSpanList().add(span);

        } catch (Throwable t) {
            logger.warn("transactionExit err.");
            clearTransaction();
        }

    }

    public static void spanExit(String mark, long length, SpanData spanData) {
        try {
            // 值判定
            if (StringUtils.isBlank(mark) || length < 0) {
                return;
            }

            Transaction transaction = getTransaction();
            if (transaction == null) return;

            Span span = transaction.getSpanList().get(transaction.getSpanList().size() - 1);
            span.setCostTime(System.currentTimeMillis() - span.getStartTime());
            span.setReturnLength(length);

        } catch (Throwable t) {
            logger.warn("transactionExit err.");
            clearTransaction();
        }
    }


    private static void clearTransaction() {
        transactionThreadLocal.remove();
        atomicInteger.decrementAndGet();
    }

    private static void initTransaction(Transaction transaction) {
        transactionThreadLocal.set(transaction);
        atomicInteger.incrementAndGet();
    }

    private static Transaction getTransaction() {
        return transactionThreadLocal.get();
    }

}

3.3.1. 收集规则

判断该数据是否需要被收集,我们可以根据该请求的一些指标,来判断它可能的不合理程度,再加上随机采样的一些方法,来决定是否要保留这条数据。

暂且制定一些简单的规则:

  • 请求的执行时长超过2s,收集(耗时过长)
  • 记录每个接口的平均执行耗时,如果单个请求耗时超过平均耗时的5倍,收集(异常情况耗时过长)
  • 请求的相关参数长度超过2000,收集(可能没做接口参数限制或分页查询限制)
  • 调用链路中,出现较多的重复调用,收集(代码层面可能有优化空间)
  • 调用链路中,收集到的span超过50个,收集(代码层面有优化空间)
  • 其他正常流通的数据中,进行低频率动态采样,具体采样规则:
    • 采样基本频率为 1/100
    • 判断当前请求数压力,压力较大时降低频率
    • 判断JVM内存情况,内存不足时,降低频率
3.3.1.1. 保险措施

同时,为了减少服务压力极大和内存严重不足时agent对源系统的影响,我们可以在请求开启时也做一次判断,如果当前压力值过大,我们可以直接放弃对当前链路所有基础数据的保存。

当压力极大时,系统本身就是非常不稳定的,可能所有的接口耗时都会提高非常多,这种情况下可能会导致收集器大量收集信息,从而加速服务的崩溃。

目前测试阶段数据量还比较少,所以基本都是全量收集,这块收集过滤的代码还没实现🤣。

3.3.2. 数据整合

当一条 Transaction 数据确认要被收集时,我们把它进行整合,主要是对 Span 当中的重复数据进行压缩,变成一条独立的数据,这样可以节省很多空间。

目前的话,我们考虑保留的 Transaction 数据包含:

  • 总耗时
  • 多次重复调用的span信息列表
    • span调用次数
    • span调用平均耗时
  • 入参长度
  • 出参长度
  • 请求开始时间

整合完之后就可以发送给下一层了,同时把 ThreadLocal 中的数据也进行清除。

核心代码:

    /**
     * Class: Collector
     * 整合数据
     */
    private static CallStatData mergeData(Transaction transaction) {
        CallStatData callStatData = new CallStatData();

        callStatData.setMark(transaction.getMark());
        callStatData.setCostTime(transaction.getCostTime());
        callStatData.setStartTime(transaction.getStartTime());
        callStatData.setTransactionType(transaction.getTransactionType());
        callStatData.setArgLength(transaction.getArgLength());
        callStatData.setReturnLength(transaction.getReturnLength());
        callStatData.setTransactionData(transaction.getTransactionData());

        SpanCallCountStat countStat = new SpanCallCountStat();
        HashMap<String, SpanStat> statMap = new HashMap<>();

        // 统计调用次数和耗时、参数长度等信息

        for (Span span : transaction.getSpanList()) {
            countStat.addCallCount(span.getSpanType());

            // 使用 type+mark 作为key
            String mapKey = span.getSpanType().getType() + span.getMark();
            SpanStat spanStat = statMap.computeIfAbsent(mapKey, key -> {
                // 初始化
                SpanStat value = new SpanStat();
                value.setMark(span.getMark());
                value.setSpanType(span.getSpanType().getType());
                return value;
            });

            // 添加调用信息
            spanStat.addCallCount(span.getCostTime(), span.getArgLength(), span.getReturnLength());
        }

        callStatData.setCallStat(countStat);
        callStatData.setSpanList(new ArrayList<>(statMap.values()));

        return callStatData;
    }


    /**
     * Class: SpanStat
     * 添加调用次数,参数:耗时、参数长度、返回值长度
     */
    public void addCallCount(long costTime, long argLength, long returnLength) {
        callCount++;

        // 平均执行时间的增量计算公式:(当前执行时间 - 历史平均执行时间 * 当前执行次数) / 总执行次数
        avgCostTime += (costTime - avgCostTime) / callCount;
        maxCostTime = Math.max(maxCostTime, costTime);

        avgArgLength += (argLength - avgArgLength) / callCount;
        maxArgLength = Math.max(maxArgLength, argLength);

        avgReturnLength += (returnLength - avgReturnLength) / callCount;
        maxReturnLength = Math.max(maxReturnLength, returnLength);
    }

注意,到这里还只是简单了做了收集和处理,并没有持久化起来。

如果我们在agent服务中直接进行持久化,那势必会对原服务有较大的影响,不仅要求原服务提供数据源,还要求该数据源中有一张专门的表来供我们存储。

所以我们可以考虑把这部分功能进行分离,创建一个单独的server服务,来完成持久层和展示层的操作,然后所有的agent就统一把数据上报到这个server服务里来。如此,我们就需要一个【上报层】。

3.4. 上报方案

上报数据的方式可以考虑:

上报方式

优点

缺点

HTTP

兼容性好,原项目不需要添加其他依赖,用Java原生类库就可以实现。

性能一般,且需要自己做超时处理等操作

RPC框架

性能比HTTP高,且有完善的框架,可以自动重试、自动熔断

需要依赖RPC框架

MQ

性能高,而且可以享受到MQ的好处,即使server挂了也不影响其他服务

需要依赖MQ

所以性能上的优先级肯定是 MQ > RPC > HTTP,但兼容性方面 HTTP 是最好的。最佳方式肯定是三者都支持,允许服务自定义配置,但默认使用HTTP。

目前我们先考虑实现HTTP的方式,如果整体效果不错,对项目优化有帮助,再考虑实现其他功能。

3.4.1. HTTP上报数据

上报数据相对来说是比较耗时的,我们可以使用 异步+批量上报 的方式来尽可能减少对业务的影响。

当收集层把数据传给上报层的时候,我们先存储到一个临时的容器里,每隔一段时间,再单独用一个线程把这段时间内收到的数据进行批量上报。由于收集层是多线程的,所以这个临时的容器需要用线程安全集合类。

上报数据时所开启的HTTP请求不需要等待服务端的返回,只需要发送成功就好了,如此可以更快的完成上报。

核心代码如下:

public class MessageClient {

    private static final LinkedBlockingDeque<CallStatData> linkDataCache = new LinkedBlockingDeque<>(200);

    private static URL reportUrl;

    public static void add(CallStatData linkData) {
        if (reportUrl == null) {
            return;
        }
        if (linkDataCache.size() > 200) {
            logger.warn("链路检测服务:缓存数据过多,丢弃数据");
            return;
        }
        linkDataCache.add(linkData);
    }

    static {
        try {
            // url初始化
            initUrl();

            if (reportUrl != null) {
                // 定时任务初始化
                initTimer();
            }
            logger.info("链路检测服务:MessageClient初始化完成");
        } catch (Throwable e) {
            logger.error("链路检测服务:MessageClient初始化失败");
            e.printStackTrace();
        }
    }

    /**
     * 上报地址初始化
     */
    private static void initUrl() {
        // url初始化
        String url = System.getProperty("callstat.url");
        if (url == null) {
            String env = System.getProperty("env");
            if (env == null) env = System.getProperty("ENV");
            if (env == null) env = "fat"; // 默认测试环境
            env = env.toLowerCase();
            switch (env) {
                case "dev":
                    url = "http://127.0.0.1:8077/v1/callstat";
                    break;
                case "fat":
                default:
                    url = "xxxxxxx/v1/callstat";
                    break;
            }
        }
        try {
            reportUrl = new URL(url);
        } catch (MalformedURLException e) {
            logger.error("链路检测服务:上报地址初始化失败,{}", e.getMessage());
        }
    }

    /**
     * 定时任务初始化
     */
    private static void initTimer() {
        // 创建定时器任务
        TimerTask timerTask = new TimerTask() {
            @Override
            public void run() {
                MessageClient.start();
            }
        };

        ScheduledExecutorService scheduledThreadPool = Executors.newScheduledThreadPool(1);
        scheduledThreadPool.scheduleAtFixedRate(timerTask, 1, 2, TimeUnit.SECONDS);
    }

    private static void start() {
        if (linkDataCache.isEmpty()) {
            return;
        }
        logger.debug("链路检测服务:开始发送缓存数据,数量:{}", linkDataCache.size());

        // 分离缓存数据
        ArrayList<CallStatData> oldRecords = new ArrayList<>(linkDataCache.size());
        linkDataCache.drainTo(oldRecords);

        // 发送数据
        sendHttpRequests(oldRecords);

        logger.debug("链路检测服务:发送数据结束");
    }

}

3.5. 持久化方案

持久化是在一个独立的server服务中,用来接收所有agent发送的数据。

3.5.1. 直接存

最简单的做法,每一个HTTP请求进来我们都插入一次数据库,就像下面这样:

事实上,我还有一个更好更傻逼的方案!MQ!

3.5.2. MQ自产自销

虽然在agent当中强依赖MQ不好,但我们可以在server服务当中依赖MQ,当server接收到数据时,就发送到MQ中,同时自己也去消费该MQ中的消息,属于是 自产自销

这样做的好处是可以利用到mq的异步、削峰、限流,从而提高server服务的承受能力,在数据量较大的时候应该会有比较好的表现。大概长这样:

目前我们先采用每次请求都直接落库的方案来实现。

3.6. 展示方案

这一步就很简单了,可以根据自己想要的样子来做,数据都已经有了,取出来处理下,然后输出出来就行,我选择使用 easypoi 来生成Excel。

因为数据是无限,但接口是有限的,所以我们在展示的时候,也可以对每一个接口的数据进行聚合。

最后我们统计的内容有:

  • 接口标识
  • 类型
  • 执行次数
  • 平均调用dubbo数
  • 最大调用dubbo数
  • 平均查询sql数
  • 最大查询sql数
  • 平均执行耗时
  • 最大执行耗时
  • 平均入参长度
  • 最大入参长度
  • 平均出参长度
  • 最大出参长度
  • 不合理调用情况span列表

核心代码如下:

override fun getReport(): String {
    val callStatPoList: List<CallStatPo> = callStatMapper.all()
    val callStatDtoList: MutableList<CallStatDto> = ArrayList(callStatPoList.size)
    for (callStatPo in callStatPoList) {
        callStatDtoList.add(toDto(callStatPo))
    }

    // 聚合数据
    val reports = mergeCallStat(callStatDtoList)

    // 挑出异常数据
    val errorReports = reports.filter {
        it.avgCostTime > 500 || it.maxCostTime > 2000 || it.maxArgLength > 1000 || it.maxReturnLength > 1000 || it.maxSpanCallCount > 10
                || it.badSpanList.any { span -> span.maxCallCount > 5 || span.avgCostTime > 200 }
    }.onEach {
        it.badSpanList = it.badSpanList.filter { span -> span.maxCallCount > 5 || span.avgCostTime > 200 }
    }

    // 生成报告
    val exportParams = ExportParams("服务链路报告", "服务链路报告")
    exportParams.type = ExcelType.XSSF
    exportParams.height = 20
    return exportExcel(exportParams, CallStatReport::class.java, errorReports)
}


/**
 * 聚合数据
 */
private fun mergeCallStat(callStatDtoList: List<CallStatDto>): Collection<CallStatReport> {
    val reportMap = HashMap<String, CallStatReport>()

    for (stat in callStatDtoList) {
        val mapKey = stat.transactionType + stat.mark

        val report = reportMap.computeIfAbsent(mapKey) {
            CallStatReport().apply {
                this.mark = stat.mark
                this.transactionType = stat.transactionType
            }
        }

        report.addCallCount(stat.costTime, stat.argLength, stat.returnLength, stat.callStat.dubboCallCount, stat.callStat.sqlCallCount)
        report.addSpanList(stat.spanList)
    }

    return reportMap.values.onEach {
        it.format()
    }
}

3.7. 效果展示

后续可以考虑优化下展示的样式,比如标红异常数据,更加直观的看到那些数据是异常的。

4. 最后

目前我们内部还在试用阶段,如果你觉得不错,可以参考我们的实现思路自己也做一个,没准也能帮你找到一些不合理的代码设计。

虽然但是,这个项目目前还比较简陋,很多地方都不太完善,各位佬有好的建议或者意见都欢迎在评论区提出,我一定积极听取,保证不改。


本来这是我和我导师写的项目,但是看完这篇文章,它也是你的了!

所以

点赞、收藏、关注!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1120231.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

RustDay06------Exercise[91-100]

91.将指针还原成指定类型 因为指针不知道里面具体有什么,所以一般约定打上unsafe 申明开发者自己对该部分可用性负责,且在调试的时候也能起强调作用 // tests6.rs // // In this example we take a shallow dive into the Rust standard librarys // unsafe functions. Fix …

大疆智图(PC):新一代高效率高精度摄影测量软件

大疆智图是一款以二维正射影像与三维模型重建为主的软件&#xff0c;同时提供二维多光谱重建、激光雷达点云处理、精细化巡检等功能。它能够将无人机采集的数据可视化&#xff0c;实时生成高精度、高质量三维模型&#xff0c;满足事故现场、工程监测、电力巡线等场景的展示与精…

42914-2023 铝合金产品断裂韧度试验方法

1 范围 本文件描述了铝合金产品断裂韧度的试验方法。 本文件适用于铝合金轧制板材、挤压棒材、挤压板材、挤压管材、挤压型材和锻件产品的平面应变断 裂韧度和平面应力断裂韧度的测定。 2 规范性引用文件 下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款…

Bootstrap的卡片组件相关知识

Bootstrap的卡片组件 01-卡片介绍及常用场合 Bootstrap的卡片组件&#xff08;Card&#xff09;是一种常用的UI元素&#xff0c;或者也可称为一种常用的结构&#xff0c;用于呈现信息和内容&#xff0c;通常在网页和应用程序中用于以下情况&#xff1a; 博客文章和新闻文章&a…

Linux自有服务与软件包管理

服务是一些特定的进程&#xff0c;自有服务就是系统开机后就自动运行的一些进程&#xff0c;一旦客户发出请求&#xff0c;这些进程就自动为他们提供服务&#xff0c;windows系统中&#xff0c;把这些自动运行的进程&#xff0c;称为"服务" 举例&#xff1a;当我们使…

经管博士科研基础【27】如何判断正定矩阵或者负定矩阵?

在【26】一章中,我们学习到可以通过判断海塞矩阵是正定矩阵或负定矩阵来判断函数的极值问题,为此,我们今天就回顾一下怎么判断海塞矩阵或者说任意一个矩阵是一个正定矩阵或者负定矩阵。 一、正定矩阵的定义 其实,我们可以看到上面的任意非零向量x可以更换为“单位向量”。…

多继承的实例介绍

一、多继承同名覆盖 子类中的成员与父类中的成员同名问题&#xff0c;通过作用域分辨符&#xff08;&#xff1a;&#xff1a;&#xff09;进行限定类的访问&#xff0c;从而实现对不同类中的同名成员各自赋值。 #include<iostream> using namespace std; class A{//父…

一起学数据结构(10)——排序

从本文开始&#xff0c;通过若干篇文章展开对于数据结构中——排序的介绍。 1. 排序的概念&#xff1a; 将一堆杂乱无章的数据&#xff0c;通过一定的规律顺序排列起来。即将一个无序序列排列成一个有序序&#xff08;由小到大或者由大到小&#xff09;的运算。 在数据的排序中…

小微企业需要认定吗?怎么认定?

小微企业在方便人民群众生活&#xff0c;解决就业&#xff0c;活跃市场经济方面发挥了巨大作用。我国对小微企业也有相应的划分标准和税收优惠政策&#xff0c;那么小微企业需要认定吗&#xff1f;认定小微企业需要哪些资料&#xff1f;下面玖邀开业小编给大家做一个简单说明。…

BUUCTF N种方法解决 1

BUUCTF:https://buuoj.cn/challenges 题目描述&#xff1a; 下载附件&#xff0c;解压得到一个.exe文件 密文&#xff1a; 解题思路&#xff1a; 1、双击.exe文件&#xff0c;出现一个错误&#xff0c;切换其他的方法。 2、将KEY.exe文件放到010 Editor&#xff0c;分析这个…

Delphi : 在 SDK 管理器中添加其他 iOS 框架

在用Delphi开发IOS程序时&#xff0c;有时候需要添加其他的iOS框架&#xff0c;也就是说在默认的SDK中没有包含的iOS框架&#xff08;frameworks&#xff09;。 如果您希望利用 Delphi 提供支持之外的 iOS 框架&#xff0c;则需要在 SDK 管理器中添加框架的路径。 为此&#…

使用Python打造微信高效自动化操作教程

引言 在如今数字化时代&#xff0c;人们对于效率的追求越来越强烈&#xff0c;尤其是在工作和学习中。自动化操作成为了提高生产力的有效途径之一&#xff0c;而PyAutoGUI和Pyperclip作为Python中的两个强大库&#xff0c;为我们实现自动化操作提供了便利。本文将向大家介绍如…

抖音热搜榜:探索热门话题的奥秘

抖音热搜榜是抖音平台根据用户观看、点赞、评论、分享等行为数据&#xff0c;综合计算得出的热门话题排行榜。它反映了当前平台上最热门、最受欢迎的话题和内容。抖音热搜榜有以下几个作用和意义&#xff1a; 1. 满足用户需求&#xff1a;抖音热搜榜为用户提供了丰富的热门话题…

前端如何直接上传文件夹

前面写了一篇仿写el-upload组件&#xff0c;彻底搞懂文件上传&#xff0c;实现了选择/拖拽文件上传&#xff0c;我们经常看到一些网站支持直接选择整个文件夹上传&#xff0c;例如&#xff1a;宝塔面板、cloudflare托管、对象存储网站等等需要模拟文件路径存储文件的场景。那是…

每日刷题|贪心算法初识

食用指南&#xff1a;本文为作者刷题中认为有必要记录的题目 推荐专栏&#xff1a;每日刷题 ♈️今日夜电波&#xff1a;悬溺—葛东琪 0:34 ━━━━━━️&#x1f49f;──────── 3:17 &#x1f…

递福巴士是不是骗局呢?

递福巴士的背景介绍 递福巴士是社区服务机构软件。递福巴士是一家提供公益服务的平台&#xff0c;为社区居民提供各种服务和支持的软件。多年来&#xff0c;递福巴士一直致力于社区服务和社会公益&#xff0c;积极推动社区的发展&#xff0c;改善社区居民的生活质量。 递福巴士…

震坤行、西域和京东工业三大工业电商平台API接口详解和说明

一、震坤行 震坤行是中国领先的B2B电子商务平台之一&#xff0c;主要面向全国的制造商、供应商和采购商&#xff0c;提供物流、供应链等。万邦科技联手震坤行&#xff0c;全面拓展电商业务。电商数据API接口平台新增震坤行接口&#xff0c;可帮助客户轻松查询震坤行网站上的商…

Leetcode—34.在排序数组中查找元素的第一个和最后一个位置【中等】

2023每日刷题&#xff08;六&#xff09; Leetcode—34.在排序数组中查找元素的第一个和最后一个位置 实现代码 /*** Note: The returned array must be malloced, assume caller calls free().*/ int lower_bound(int *arr, int numsSize, int target) {// 左闭右开区间[lef…

Windows 下载编译chromium源码

前言 本文介绍如何下载并编译chromium源码。相关前置条件可参考官方文档。 环境 &#xff1a; Windows 11VS 2022 环境设置 打开cmd&#xff0c;设置代理 set http_proxyhttp://127.0.0.1:7890 & set https_proxyhttp://127.0.0.1:7890注意&#xff1a;使用cmd命令行…

设计链表复习

设计链表 class ListNode {int val;ListNode next;public ListNode() {}public ListNode(int val) {this.val val;}public ListNode(int val, ListNode next) {this.val val;this.next next;}}class MyLinkedList {//size存储链表元素的个数int size;//虚拟头节点ListNode…