JavaScript 逆向技巧总结

本节属于知识总结，只是对思路的梳理，不对具体内容进行展开

JS 逆向可以分为三大部分：寻找入口，调试分析，模拟执行

寻找入口：这是非常关键的一步，逆向在大部分情况下就是找一些加密参数到底是怎么来的，比如请求中的 token ，sign 等参数到底在哪里构造的，这个关键逻辑可能写在某个关键的方法里面或者隐藏在某个关键的变量里面。一个网站加载了很多 JS 文件，那么怎么从这么多 JS 代码里面找到关键的位置，那就是一个关键的问题，这就是寻找入口

调试分析：找到入口后，比如我们可以定位到某个参数可能是在某个方法里面执行了的，那么里面的逻辑究竟是怎样的，里面调用了多少加密算法，经过了多少变量赋值和转换等，这些需要我们先把整体思路整理清楚，以便于我们后面进行模拟调用或者逻辑改写。在这个过程中，我们主要借助于浏览器的调试工具进行断点调试分析，或者借助一些反混淆工具进行代码的反混淆

模拟执行：经过调试分析之后，我们差不多已经搞清楚整个逻辑了，但我们最终目的还是写爬虫，怎么爬取到数据才是根本，因此这里就需要对整个加密过程进行逻辑复写或者模拟执行，以把整个加密流程模拟出来，比如输入一些已知变量，调用之后我们就可以拿到一些 token 内容，再用这个 token 进行数据爬取即可

本节将对以上内容进行梳理

寻找入口

其中包括查看请求，搜索参数，分析发起调用，断点， Hook 等

查看请求

一般来说，我们都是先分析想要的数据到底从哪里来的。比如说对示例网站

https://spa6.scrape.center

我们可以看到首页有一条条数据，这些数据肯定是某个请求返回的，那它究竟是从哪个请求里面来的呢？我们可以先尝试搜索一下

打开浏览器开发者工具，打开 Network 面板，然后点击搜索按钮，比如这里我们搜索 “霸王别姬”

注意: 要把中间的内容刷新出来才搜索，不然什么都搜不到

我们可以看到对应的搜索结果，点击搜索到的结果，我们可以定位到响应结果的位置

这样我们看到了是哪里发起的请求

我们还可以看到请求的参数，比如 token

一般来说，我们可以通过这种方式寻找最初的突破口。如果请求中带有加密参数，就顺着继续找这个参数究竟在哪里生成的。如果没有加密参数，我们就可以直接爬取

搜索参数

前面我们找到了最初的突破口，同时也找到了加密参数 token ，这里我们看看 token 怎么构造出来的

一种简单的方法就是全局搜索。一般来说，参数名大多数情况下就是一个普通的字符串，比如这里叫做 token ，那么这个字符串肯定隐藏在某个 JS 文件中，我们可以尝试进行搜索，也可以加冒号，空格，引号等来配合搜索。因为一般来说这个参数会配合一些符号一起出现，比如我们可以搜 token token: token : "token" 等，我们可以直接调用浏览器调试面板的搜索功能