一、IAST简单介绍
IAST(Interactive Application Security Testing)交互式应用程序安全测试,通过服务端部署Agent探针,流量代理/VPN或主机系统软件等方式,监控Web应用程序运行时函数执行并与扫描器实时交互,高效、精准的安全漏洞,是一种运行时灰盒安全测试技术。在分析并评估了业界主流的几家IAST产品后,发现IAST一般可以提供agent插桩检测、流量代理、流量信使等几种漏洞检测模式,其中除agent插桩模式外,其余几种检测模式与DAST被动漏洞扫描的原理一致,所以本篇文章我们主要分析agent插桩模式。
agent插桩的检测模式,一般分为主动和被动模式。那怎么理解agent插桩模式呢?我们结合JavaAgent技术来做解释。-javaagent是java命令的一个参数,该参数可以指定一个jar包,该jar包内实现了一个premain()方法,在执行正常程序的main()方法会先运行这个premain方法,是一个JVM层做功能增强的机制。说到java的功能增强,可以想到动态代理、Spring AOP、拦截器等技术,这些方式主要是在函数执行前后做一些增强逻辑,而JavaAgent可以直接获取到类加载前的字节码,再结合一些字节码修改技术,从而通过修改字节码来增强函数功能。通过这种方式,我们可以获取类、方法的一些信息,比如类名、方法名、参数、返回值等,同时也可以做一些拦截操作。所以,这项技术通常被用于实现调用链监控、日志采集等组件,而在安全方向的应用,IAST和RASP则是典型例子。
对于IAST来说,agent的检测模式通常被分为被动模式和主动检测模式。在被动模式下,agent可以动态获取一次请求的调用链、数据流等信息,基于获取的信息,IAST可以做一些基于污点追踪的白盒分析,从而检测该次请求的调用链中是否存在漏洞;在主动模式下,agent会hook一些危险函数,当一次请求触发到这些危险函数后,agent会将该次请求发送给IAST server端,并使用DAST能力发送攻击payload做主动验证。基于这些特性,IAST非常适合融入到DevOps的测试环节,在业务测试完成正常功能逻辑测试工作的同时,无感知的进行一些安全漏洞的检测。
IAST被动检测模式
IAST主动检测模式
这里我们主要研究一下IAST被动检测模式的细节,该检测模式也是IAST首推的检测模式。在上文提到,在被动检测模式下,agent主要用来做Web应用程序的数据采集并传至分析引擎,分析引擎做白盒分析。接下来,我们就实际的去实现一个agent,对一次请求做调用链数据采集。
还是以Java为例,实现一个agent需要掌握以下几种技术:
JavaAgent技术。
字节码修改技术。主流的字节码修改工具有javassist、Byte Buddy和ASM等,其中javassit的使用比较简单,ASM则较为复杂且需要对.class文件结构、变量表等底层知识有一定的理解,但是其性能更优。我们这里只是写一个简单讲解一下agent的工作逻辑,所以我们选择使用javassist。
JVM类加载机制。
ThreadLocal
接下来,我们来简单写几个例子介绍一下这几项技术。
二、JavaAgent
前文已经基本介绍了JavaAgent这项技术,而实际实现一个JavaAgent需要以下几个步骤:
定义一个MANIFEST.MF文件,必须包含Premain-Class选项,通常也会加入Can-Redfine-Classes和Can-Restransform-Classes选项。
创建一个Premain-Class指定的类,类中包含premain方法,方法逻辑由用户自己去编写。
将premain的类和MANIFEST.MF文件打成jar包。
使用-javaagent参数,启动要代理的方法。
在执行以上步骤后,JVM会先执行premain()方法,大部分类加载前都通过该方法。
通过上面的步骤,我们来接下来实现一个简单的JavaAgent
2.1 包含premain方法的agent类
先给出一个例子:
解释一下以上代码,在类加载时,JVM会先执行premain()方法,方法中的inst.addTransformer(new DefinTransformer(), true)是添加一个ClassFileTransformer接口的实现类, 该类实现一个transform()方法,该方法中我们可以写一些自己的逻辑。可以看到transform的入参有被加载类的类加载器、类名、字节码等信息,返回类型则是byte[],这样我们可以返回修改后的字节码,之后JVM加载的就是我们修改过后的字节码了,这里我们简单打印一下加载中的类名。
现在我们还缺少一个MANIFEST.MF文件,使用maven插件可以在打包时自动生成。
Premain-Class和Agent-Class写agent类型的全类名即可,如果需要添加其他配置,可在<manifestEntries>中添加对应标签和值,这里不再多做介绍。
2.2 运行agent
写一个用于测试的类并编译成.class。
使用-javaagent参数执行agent包并运行:
输出结果如下:
可以看到不止我们自己编写的测试类,有很多jdk中的类也被打印出来了,可见JavaAgent功能还是比较强大的。
三、Javassist
Javassist可以实现动态创建类、添加类的属性和方法,修改类的方法等操作。这里我们不需要做添加方法、属性等操作,只需要获取类名、方法名、入参、出餐等信息,所以这里仅仅叙述如何获取这些信息,至于其他多的功能,可参考:https://bugstack.cn/md/bytecode/javassist/2020-04-19-%E5%AD%97%E8%8A%82%E7%A0%81%E7%BC%96%E7%A8%8B%EF%BC%8CJavassist%E7%AF%87%E4%B8%80%E3%80%8A%E5%9F%BA%E4%BA%8Ejavassist%E7%9A%84%E7%AC%AC%E4%B8%80%E4%B8%AA%E6%A1%88%E4%BE%8Bhelloworld%E3%80%8B.html
3.1 信息获取
获取类
通过类名获取类的信息,也包括类里面一些其他获取属性的操作,比如:ctClass.getSimpleName()、ctClass.getAnnotations() 等。
获取方法
通过 getDeclaredMethod 获取方法的 CtMethod 的内容。之后就可以获取方法的名称等信息。
方法信息
MethodInfo 中包括了方法的信息;名称、类型等内容。
方法类型
通过 methodInfo.getAccessFlags() 获取方法的标识,判断方法是否为静态方法。因为静态方法会影响后续的参数名称获取,静态方法第一个参数是 this ,需要排除。
入参信息
返回信息
修改方法
四、Agent实现
4.1 写在最前
在实现一个agent前还有几个问题需要注意:
agent隔离加载
因为我们现在需要实现具有一定复杂逻辑的agent,所以我们不可避免的需要引入一些其他jar包做功能实现,而如果我们的agent与正常应用引入了同一个jar包的不同版本,这将发生jar包冲突,对正常应用产生未知影响。
要解决这个问题,我们需要自定义类加载器来加载agent中的类,因为在java中通过不同的类加载器加载同一个类是不一样的,一个类只能引用同一类加载器加载的类及其父加载器加载的类,更多的细节大家也可以去详细了解一下Java的类加载机制,java的很多框架如spring都有实现自己的类加载器实现隔离加载来解决冲突的问题。
所以我们现在需要将这个agent分为两个jar包,一个是agent包,另一个core包。agent包实现一个premain()方法、Tranformer类等,并且使用自定义类加载器加载core包,而core包是我们编写的修改字节码的逻辑。但这样还会有一个问题,我们修改后的正常代码,需要调用core包中的方法,而core包是自定义类加载器加载的,正好代码的类一般是应用类加载器加载的,所以正常代码这时候无法调用core中的方法。所以,还需要将正常代码调用的方法单独拆分出一个jar包,该包使用BootstrapClassLoader加载,该类加载器是类加载器的顶层,其加载的类可以被所有的类加载器加载的类引用,我们将这个jar命名为spy。
标识一次请求的调用链
在解决了一些类加载上的问题后,我们还有一个问题需要解决。因为我们需要对不同请求采集不同的调用链,那么如何当一次请求触发到一个方法后,我们如何标识这次方法调用是属于哪次请求呢?这也是我们方法调用能否形成链路的关键。
这里我们借用ThreadLocal。ThreadLocal叫做线程变量,即ThreadLocal中填入的变量只属于当前线程,我们知道不同的请求实际对应不同的线程,那用独属于当前线程的变量标识一次请求是最合适不过了。
ThreadLocal的使用也比较简单,如下:
4.2 Agent包实现
首先,我们的项目分为三部分,agent、core和spy。
接下来,我们来实现一下agent包里的逻辑,agent主要实现两个类,一个是自定义的ClassLoader,一个是agent入口类。ClassLoader主要重写loadclass方法主要是注意一些jdk本身的类还是需要正常加载,第二就是spy包的类需要使用BootstrapClassLoader加载,其他的就不再多说。agent类实现permain()方法,主要是分别用不同的类加载器加载core和spy两个jar包,以及为instrumentation添加Transformer类。具体如下:
MyClassLoader代码如下:
pom.xml
4.3 spy包实现
spy包主要有两个类,一个是AbstractAspect抽象类,core包里会有一个Aspect继承它,一个是SpyAPI类,它主要是装载Aspect类,为正常程序提供接口从而调用我们Aspect类实现的方法。
SpyAPI类如下:
其中,setSpy()实现装载core包中的Aspect类,atEnter()、atExit()、atExceptionExit()分别在程序进入、退出、异常的时候做不同的方法逻辑修改。
4.4 core包实现
因为core包中的类比较多,我们就挑几个比较重要类和方法讲解。首先是我们自己实现的Transformer中的transform()方法,这里我们可以对需要修改字节码的类做下过滤,如果修改的类比较多的话,项目启动会极其缓慢,且容易发生栈溢出问题,这是一项需要长期优化的工作,所以我们这里选择只对应用程序本身的类进行修改,简单看下效果即可。transform()方法代码如下:
其中BaseAdaptor也是一个抽象类,我们实际还有一个NormalAdaptor的实现类,这里的逻辑如果有一些设计模式基础的话会更容易理解一些。Adaptor类中主要实现一个modifyCode()方法,我们具体来看一下。
这里大部分是javassist的代码,需要注意的有两个地方:第一个是classPool.appendClassPath(spyJarPath);如果没有这行代码的话,会有nopoint错误;第二个是classPool.appendClassPath(new LoaderClassPath(loader));,通常我们插入agent的程序是一个Web,一般都有类似于spring之类的框架,上文我们也提到这些框架也会有自己的类加载器实现类隔离加载,根据双亲委派原则,ClassPool无法获取这些类,所以需要把当前ClassLoader加载的类添加到ClassPool中。接下来到addMethodAspect()方法:
可以看到,该方法主要是执行了一些方法信息等获取,并分别在方法进入、退出、异常的时候做对应的修改。
调用SpyAPI的方法,其实就是调用我们实现的NormalAspect中的方法。这里我们只看一下atEnter()里面的逻辑, 这三个方法是差不多的。
这里大部分逻辑是做一些参数封装,并打印输出。需要注意的是这里用到了ThreadLocal,需要在我们开始记录调用链的入口处做拦截,生成一个TRANSACTION_ID并将其附加到当前线程上,这个TRANSACTION_ID将在atExit()方法做清除。
到这里,我们实现的主要逻辑就已经介绍完毕了。我们为一个springboot项目插桩,简单看下效果。
指定-javaagent参数启动
java -javaagent:./agent-1.0-SNAPSHOT-jar-with-dependencies.jar -jar secexample-1.0.jar
请求效果
存在parameterList字段的记录是进入方法的信息,存在returnType字段的记录是退出方法的信息,我们看到不同请求的traceId也是不一致的,由此可以标识不同请求的调用链。这里由于我们修改的类比较少,形成的调用链比较简单,如果确定好合适的需要修改的类后,则可以看到更详细的调用链条。
五、 写在最后
到这里,本篇文章分析的内容就到尾声了,写这个小demo的时候其实也踩到了很多坑,个别问题花了大量时间解决或是到现在也没能解决,主要是以下几个问题:
框架适配,不同的框架有不同的入口,需要寻找框架合适的入口做traceId的生成和清除,也是一项长期且复杂的工作。
分布式追踪,有些服务是使用分布式、微服务的这种架构,这时候需要对分布式框架的出入口做对应的修改,将当前的traceId到框架请求中,这样调用链才能追踪下去。
javassist的一些问题,javassist还是过于简单了一些,某些方法的bug官方到现在也没有修改,比如获取参数信息attribute.variableName(i),经常会有数组越界的问题,在后续版本更新了attribute.variableNameByIndex(i)方法后,这种情况依然偶有发生,这跟本地变量表有关系,javassist显然是有些情况没能考虑到,还是ASM更靠谱一些。
目前实现的这种traceId标记一次请求调用链还是有一些问题的,如果在一次请求中的代码也启动子线程就会导致一部分调用链的缺失。对于new Thread()创建线程,我们可以通过InheritableThreadLocal将traceId拷贝到子线程中。但如果使用线程池就比较麻烦了,需要去修改线程池相关的类和方法的字节码。
IAST agent需要实现的更多功能,大家可以参考火线洞态IAST,其在github上开源了一个java版本的agent,还是具有比较良好的借鉴意义的。