关注它,不迷路。
本文章中所有内容仅供学习交流,不可用于任何商业用途和非法用途,否则后果自负,如有侵权,请联系作者立即删除!
1. 需求
我相信做币圈爬虫的兄弟,或多或少的见过类似下面的混淆js:
大部分的变量名,主要以 "__p_" 开头,分析下来,其实是ob混淆上面再套了一层壳。
再去掉第一层壳以后,发现还套了一层,它的函数如下:
function __p_1295650017_calc(__p_0552970006, __p_6576181459) {
switch (__p_3757655876) {
case 12:
return !__p_0552970006;
case 26:
return -__p_0552970006;
case -29:
return __p_0552970006 + __p_6576181459;
case -6:
return __p_0552970006 - __p_6576181459;
case 57:
return ~__p_0552970006;
case 35:
return __p_0552970006 / __p_6576181459;
case 3:
return __p_0552970006 * __p_6576181459;
case 2:
return typeof __p_0552970006;
case 6:
return void __p_0552970006;
}
}
这个混淆函数很有意思,它有两个形参,函数里面有包含一个全局变量
__p_3757655876,而这个全局变量,又由下面的函数来控制:
function __p_2245858992(a) {
a = __p_3757655876 + (__p_3757655876 = a, 0);
return a;
}
而上面的 混淆函数,它的函数调用有这样的:
__p_1295650017_calc(1940, __p_3757655876 = 26)
函数的结果很明显是 -26;
也有这样的:
__p_1295650017_calc(_0x10e09f(746), "e", __p_2245858992(-29))
函数的结果很明显是 _0x10e09f(746) + "e";
还有一个,就是,对于不同版本的混淆文件,它的这个函数定义是变化着的,如:
function __p_0807818337_calc(__p_9916442306, __p_4970943498) {
switch (__p_3679524284) {
case 13:
return !__p_9916442306;
case 7:
return -__p_9916442306;
case 31:
return __p_9916442306 + __p_4970943498;
case 3:
return __p_9916442306 - __p_4970943498;
case 21:
return ~__p_9916442306;
case 50:
return __p_9916442306 / __p_4970943498;
case -47:
return __p_9916442306 * __p_4970943498;
case 18:
return typeof __p_9916442306;
case 55:
return void __p_9916442306;
}
}
2. 共同点
如果想要写出通用的插件,就得找出它的共同点。先来看看有哪些共同点:
函数名不一样,但都以 _calc 结尾
函数体结构是一样的,但是 每个case 后面的值不一样。
case体是一样的,都是 return 语句。
很快写出代码:
const getCalcFunction =
{
FunctionDeclaration(path)
{
let {scope,node} = path;
let {id,body,params} = node;
let name = id.name;
if (!name.endsWith('calc'))
{
return;
}
}
}
因为整个混淆js,只有它是以 "calc" 结尾的,因此,只需简单的判断一下就可以了。
接下来怎么写呢?
根据每个case 里的return语句来写?
3. 隐藏的彩蛋
观察 每个case里的return语句,拿到在线解析网站上观察,只有两种类型:
BinaryExpression 和 UnaryExpression 类型,而它们有个共同点,都有 operator 这个子节点,即操作符。因此,我们可以使用 一个 Object类型的变量来保存它.即通过每个 case的值 和 operator 来注册一个键值对,保存起来。遍历的时候去取就可以了。
const getCalcFunction =
{
FunctionDeclaration(path)
{
let {scope,node} = path;
let {id,body,params} = node;
let name = id.name;
if (!name.endsWith('calc'))
{
return;
}
let newMap = new Object();
let cases = body.body[0].cases;
for (let eachCase of cases)
{
let {test,consequent} = eachCase;
let value = test.value || -test.argument.value;
let operator = consequent[0].argument.operator;
newMap[value] = operator;
}
console.log(newMap);
}
}
打印结果:
拿到了 case 的值和 它的操作符,再去构造节点就简单了。
这里也许你有个疑问,就是 BinaryExpression 和 UnaryExpression 它们有个共同的操作符: "-",如何区分呢?
当然是根据它函数调用的实参个数来区分了。实参是2个的时候,它肯定是UnaryExpression 类型;实参是3个的时候,它肯定是 BinaryExpression 类型。
文件demo在星球里,请星友们完成后续的还原工作:
https://t.zsxq.com/13Sv5Igr1
今天的文章就分享到这里,后续分享更多的技巧,敬请期待。
欢迎加入知识星球,学习更多AST和爬虫技巧。