代码审计之SAST自动化

news2025/1/12 20:59:42

前言:

很久没写文章了,有点忙,落个笔,分享一些捣鼓或说适配好的一些好玩的东西。
脚本工具不开源,给一些思路,希望能给大家带来一些收获。
笔者能力有限,如有错误,欢迎斧正。

正文:

基于代码审计的原理去思考,正则匹配阶段,ast阶段,ir,cfg图阶段,ql查询语言阶段。
联动这四个方向相互的优势去结合做适配好自动化代码审计,去进行处理好soure,sink,调用栈关系。

source,sink分析:

这里的source和sink其实思路笔者采用的是利用第一阶段的正则匹配的思路去做,为什么不用其他阶段去做的原因,因为笔者追求的是非漏报,而后在联动调用栈分析达到完整的代码分析,而不是追求不误报。

基于这种状况去做的话,正则匹配应该是最优解。

2个方面:
1、代码开发简单。
2、不会出现ql,ir,cfg这种的依赖缺失构造不全的情况。如如果是闭源代码的情况下,后面的几种就会出现很多坑点。

调用python去进行正则匹配分析,自动化提取出相关的参数入口点,以及参数变量,危险函数,即可。

source:
如直接匹配常见的getParameter函数以及其他的参数函数即可匹配到常见是source函数
image.png
以及提取出里面的参数变量值
image.png

sink:
同理也调用匹配常见的危险函数即可。
image.png

调用栈分析:

原理思路1:

参考了很多项目以及原理。
目前大多数还是以asm,soot,bcel的思路去做的类,函数,一层调用关系提取分析。
然后结合指针分析,或者jvm栈帧去追踪污点流,最后利用结合一些算法去产生一个完整的调用栈。

像gadgetinspector:
就是利用分析了相关的类,函数,调用关系等,然后利用jvm栈帧确定污点流,最后结合算法产生完整调用栈,输出一个完整的结果。
image.png
image.png
但是经过笔者实测这种方式的污点流追踪对于没有返回值赋值的会导致追踪不到,导致漏报。

基于上面分析的思路我们去可以进行仿写一个类似的工具,结合每个语言的开源解析代码去提取分析出相关的函数,类,调用关系,而后进行数据处理,获取到完整的调用栈。

优势:可批量挖掘,且工具可以自己DIY,如优化算法,优化source,sink限定。
缺点:开发难度会更高,需要关注污点的问题。

如net:

net可以结合dnlib去解析dll代码提取出里面的方法,类,调用关系。而后转深度算法去进行遍历,最后获取到一个完整的调用栈。
image.png
image.png
image.png

java同理:

调用开源的java-callgraph获取到精准的类分析,方法分析,caller分析,而后在结合深度算法获取到一条完整的调用关系。
image.png
image.png

原理思路2:

这种是笔者查看了一个开发的开源项目后,产生的一种思考。
一种多语言通解思路,开发插件,调用引擎的调用关系分析+深度算法 实现获取大量的调用关系。
优势:
1、可适配多种语言,只要引擎可支持该语言的调用分析,即可直接获取。
2、插件开发简单,不用去关注污点等问题了,直接调用引擎的巨大优势实现。
3、由于引擎的强大能力,因此不用担心断的问题。
缺点:
插件不能实现批量自动化挖掘。

如idea的调用关系分析image.png
然后在去开发一个插件,而后转dot进行获取调用关系。
下面调用的方法
调用他的方法:
image.png
他调用的方法:image.png

结合:

然后结合sink,source的代码匹配出常见的危险函数后,在结合上面的调用栈,即可快速挖掘出一条有漏洞的调用链。
且还可以继续做限定,如匹配出哪些地方有source然后结合获取到的调用栈 拼接一个有漏洞的点就可实现自动化出来了。

后言:

有些老哥可能会说,可以直接利用已成熟的工具,如tabby,codeql,joern,soot,bytecodedl,doop这些思路去玩,但是经过笔者实测,这些相关工具对应非开源产品的处理不太友好。
当然也可能是笔者的问题,如果有老哥知道如何解决,望指教。

所以怎么说呢,结合起来用吧,如果是开源产品,挖掘链这种,利用这些工具也还行,但是对于闭源项目或是有缺的项目,或许基于自己的思路会更好。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1635562.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

环形链表题

1.环形链表1 看题:. - 力扣(LeetCode) 思路1:哈希表 遍历所有节点,每次遍历一个节点时,判断该节点是否被访问过。 可以使用哈希表来存储所有已经访问过的节点。每次到达一个节点,如果该节点已…

Qt 6 开源版(免费) -- 安装图解

Qt6起,两项重大改变(并非指技术): 必须在线安装,不再提供单独的安装包主推收费的商业版 当然的,为了培养市场,Qt6还提供了一个免费的:开源版。 开源版相对于收费的商业版&#xf…

《Fundamentals of Power Electronics》——Boost电路及仿真

Boost电路的拓扑结构如下所示: 下面是在simulink中搭建的一个Boost电路的仿真实验平台,其中直流输入电压为100V,电感值为1mH(模拟电阻为1毫欧),电容值为470uF,负载为50欧姆,占空比选择为0.5,开关…

【Qt】QtCreator忽然变得很卡

1. 问题 Qt Creator忽然变得很卡。电脑里两个版本的Qt Creator,老版本的开启就卡死,新版本好一点,但是相比于之前也非常卡,最明显的是在 ctrl鼠标滚轮 放大缩小的时候,要卡好几秒才反应。 2. 解决方案 2.1 方法1 关…

239 基于matlab的EKF(扩展卡尔曼滤波)_UKF(无迹卡尔曼滤波)_PF(粒子滤波)三种算法的估计结果比较

基于matlab的EKF(扩展卡尔曼滤波)_UKF(无迹卡尔曼滤波)_PF(粒子滤波)三种算法的估计结果比较,输出估计误差,并单独对粒子滤波进行估计及其置信区间可视化。程序已调通,可直接运行。 239 EKF(扩展卡尔曼滤波) - 小红书 …

牛客网刷题 | CC1 获取字符串长度

目前主要分为三个专栏,后续还会添加: 专栏如下: C语言刷题解析 C语言系列文章 我的成长经历 感谢阅读! 初来乍到,如有错误请指出,感谢! 描述 键盘输入一个字符串…

redis故障中出现的缓存击穿、缓存穿透、缓存雪崩?

一、背景: 在维护redis服务过程中,经常遇见一些redis的名词,例如缓存击穿、缓存穿透、缓存雪崩等,但是不是很理解这些,如下就来解析一下缓存击穿、缓存穿透、缓存雪崩名词。 二、缓存穿透问题: 常见的缓存使…

update_min_vruntime()流程图

linux kernel scheduler cfs的update_min_vruntime() 看起来还挺绕的。含义其实也简单,总一句话,将 cfs_rq->min_vruntime 设置为: max( cfs_rq->vruntime, min(leftmost_se->vruntime, cfs_rq->curr->vruntime) )。 画个流…

Laravel5.4 反序列化

文章目录 0x01 环境搭建0x02 POP 链0x03 exp0x04 总结 前言:CC 链复现的头晕,还是从简单的 Laravel 开始吧。 laravel 版本:5.4 0x01 环境搭建 laravel安装包下载地址 安装后配置验证页面。在 /routes/web.php 文件中添加一条路由&#xf…

Java核心技术.卷I-上-笔记

目录 面向对象程序设计 使用命令行工具简单的编译源码 数据类型 StringBuilder 数组 对象与类 理解方法调用 继承 代理 异常 断言 日志 面向对象程序设计 面向对象的程序是由对象组成的,每个对象包含对用户公开的特定功能部分和隐藏的实现部分从根本上…

在Primavera P6 中维护自定义活动栏

前言 自从 Henry Gantt 在 1910 年左右提出这个想法以来,以图形方式显示项目进度表并沿时间刻度显示条形图一直延续到当今最复杂和流行的项目进度系统中。在本文中,我们将仔细研究 Primavera P6 Professional 中的甘特图,并探索一些自定义其…

一天狂涨2000亿的谷歌,看到了AI商业化的曙光

“人工智能是有史以来最深刻的平台变革之一,谷歌依旧会成为第一。” -谷歌CEO桑达尔皮查伊 在2024年一季度财报发布后,谷歌盘后涨超10%,终于站稳加入了“2 万亿美元俱乐部”。 从财报数据来看,谷歌一季度总营收805.4…

新手开通抖音小店的时候,必须要注意的6点!建议收藏!

大家好,我是电商小V 今天咱们就来详细的说一下开通抖音小店的时候需要注意的事项,避免咱们在开店的时候踩坑导致店铺后期的正常运营, 第一点:是关于营业执照的问题 营业执照咱们都知道,分为个体和企业的,咱…

正态分布的参数及意义

正态分布,也称为高斯分布,是统计学中最重要的分布之一,具有许多重要的特性。正态分布的参数包括均值(μ)和标准差(σ),有时也使用方差(σ^2)来描述。下面是这…

【快速入门】数据库的增删改查与结构讲解

文章的操作都是基于小皮php study的MySQL5.7.26进行演示 what 数据库是能长期存储在计算机内,有组织的,可共享的大量数据的集合。数据库中的数据按照一定的数据模型存储,具有较小的冗余性,较高的独立性和易扩展性,并为…

[单机]仿官武林外传飞羽完美版本_附带GM工具_虚拟机架设_视频教程

概述 今天给大家带来一款单机游戏架设教程, 仿官武林外传飞羽完美版本 演示视频 [单机]仿官武林外传飞羽完美版本_附带GM工具_虚拟机架设_ 环境准备 windows电脑一台,安装好vmvare12虚拟机 ,安装教程和激活码获取 githubs.xyz/boot?app3…

javase学习01-GUI设计中的菜单条,菜单及菜单项(简单的实现)

目录 一,效果及代码 二,相关内容 1,创建图片资源文件夹 2,菜单初识 3,图标大小设置 4,菜单高度设置 今天学习了Java的GUI(graphics user interface)图形用户界面中的窗口和菜单…

超市购物|基于SprinBoot+vue的超市购物系统(源码+数据库+文档)

目录 基于SprinBootvue的企业人事管理系统 一、前言 二、系统设计 三、系统功能设计 1商品管理 2公告管理 3公告类型管理 四、数据库设计 五、核心代码 六、论文参考 七、最新计算机毕设选题推荐 八、源码获取: 博主介绍:✌️大厂码农|毕设…

FR-TSN4206获得“时间敏感网络产业链名录计划”测试认证证书,TSN交换机助力智能工业发展

TSN技术,即时间敏感网络技术,已成为智能工业、自动驾驶等领域的核心。它通过时钟同步、数据调度等功能,确保低延迟、高可靠性的数据传输。 为推动TSN技术在我国的发展,工业互联网产业联盟联合多家单位启动了“时间敏感网络产业链名…

http1.1和http2.0的同源请求数限制

判断协议版本 :scheme: 在请求头中表示使用的是HTTP/2协议。即 出现 :开头的请求头Chrome 只支持查看 HTTP/1.x 的 Raw Headers,对这种请求,会给出 view source 选项。HTTP2.0不给出。可继续学习 https://www.cnblogs.com/kirito-c/p/10360868.html抓包…