【探索】机器指令翻译成 JavaScript

news2025/1/5 9:00:26

前言

前些时候研究脚本混淆时,打算先学一些「程序流程」相关的概念。为了不因太枯燥而放弃,决定想一个有趣的案例,可以边探索边学。

于是想了一个话题:尝试将机器指令 1:1 翻译 成 JavaScript,这样就能在浏览器中,直接运行等价的逻辑。

为了简单起见,这里选择古董级 CPU —— MOS 6502。

本系列陆续更新了 8 篇,前面几篇只是理论分析:

  • 跳转处理

  • 流程分割

  • 动态跳转

  • 指令变化

  • 深度优化

原本只打算遐想一下,分析下可行性而已。不过,后来发现实现也不难,于是又补了两篇:

  • 过渡语言

  • 终极目标

6502

MOS 6502 是一款经典的 CPU,在上世纪 80 年代十分流行。

例如 Atari、Apple II,还有国内的文曲星,都配置了这个系列的 CPU。小时候常玩的 FC 红白机,也是相同的指令集。

网上相关的文章也非常多,这里收集了一些:

  • 6502 资源站

  • 6502 指令集

  • 6502 —— 伟大的心

  • 6502 芯片视觉图

甚至还有在线模拟器:

  • 6502asm

  • virtual 6502

  • easy6502

事实上,模拟器的原理是很简单的:读取一条指令,做相应的操作;然后再读取下一条指令。。。参照文档实现即可。

do {
    opcode = memory[pc++]
    switch (opcode) {
        case 0xA9:        // LDA
            ...
        case 0x85:        // STA
            ...
        case 0xE6:        // INC
            ...
        ....
    }
} while (...)

模拟虽然简单,但有个很大的缺点:效率低。模拟一个指令,需要很多额外操作 —— 那些原本是硬件的工作,现在要用软件来完成,显然会慢得多。

不过,我们的目标并非模拟,而是翻译 —— 在程序运行前,把「虚拟指令」翻译成相应的本地「原生指令」,这样就能直接运行,无需模拟,效率自然大幅提升。

在浏览器层面,JavaScript 就是原生指令。那么,能否将 6502 翻译成 JavaScript 呢?下面开始探索。。。

硬件实现

6502 CPU 有三个 8 位寄存器 A、X、Y,我们用 JS 变量来表示:

var A = 0, X = 0, Y = 0;

至于「状态寄存器」SR,为了直观起见,分别用单独的 bool 变量表示每一位:

// SR: NV-BDIZC
// bit 76543210
var SR_N = false,
    SR_V = false,
    ...
    SR_C = false;

其他诸如「栈寄存器」、「指令计数器」,这里暂时先省略。

6502 的地址总线有 16 位,最多能访问 64K 的空间。数据总线 8 位,因此用一个 Uint8Array 就能实现内存:

var MEM = new Uint8Array(65536);

这里假设把整个地址空间都用做 RAM,事实上屏幕、键盘等 IO 交互,还会占用一些地址空间。

尝试翻译

现在,尝试翻译第一条指令:

STA 100

STA 即 “Store A”,将 A 写入存储 —— 写到第 100 号位置。对应的 JS 即:

MEM[100] = A;

很简单吧。下面翻译第二条指令:

LDA #123

LDA 即 “Load A”,给 A 赋值,# 表示立即数。因此,生成的 JS 的就是:

A = 123;
SR_Z = (123 == 0);
SR_N = (123 > 127);

稍了解汇编的都知道,修改寄存器的同时,还得更新状态标志。SR_Z 表示结果是否为零;SR_N 表示最高位(符号位)是否为 1。

这时「翻译」的优势就体现出来了。因为 123 == 0 和 123 > 127 都是常量计算,所以预先就能得出结果:

A = 123;
SR_N = false;
SR_Z = false;

相比模拟,翻译能减少运行时的计算量。如果有多个指令,效果则更明显,例如:

LDX 10
INX

翻译成如下 JS 代码:

这里虽然没有预先计算,但不要忘了,JavaScript 最终还得交给浏览器解析。

如今的浏览器,本身就有很强的优化能力,脚本引擎发现 SR_Z 和 SR_N 重复赋值,并且中间没有使用,于是就将之前的计算优化掉了。因此,最终效率会非常高。

真正困难

通过这几个例子,感觉翻译并不困难。事实上大多数 6502 指令,都可以生成对应的 JS 逻辑。有的很简短,只有一两行;有的较复杂,例如算术加减法。但不管怎样,都是没有障碍的。

但是,有一类指令很难翻译,那就是「跳转指令」。因为不同的层面,流程控制的能力是不一样的。

在 JavaScript 中,流程控制只能以「语块」为单位:

if (...) {
    block 1
} else {
    block 2
}
for (...) {
    break;
    continue;
}

我们最多只能退出语块(break),或者重新进入语块(continue),无法指定从某一行开始运行。

而在 C 语言中,流程控制可以细致到行:

a:  ...
    goto c;
b:  ...
    goto a;
c:  ...
    goto b;

机器指令更底层,因此更灵活。流程控制是以「字节」为单位的,可以跳到任意位置。甚至跳到一个指令的中间:

Address  Hexdump   Dissassembly
-------------------------------
$0600    a9 00     LDA #$00
$0602    4c 01 06  JMP $0601

是将 LDA 的参数 0x00 当成另一个指令(BRK 指令)执行。

更有甚者,还可以跳到栈内存上,将动态数据当成指令执行。如此灵活的特性,又该如何实现?

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/591204.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

chatgpt赋能python:Python中按下某个按键的实现方法

Python中按下某个按键的实现方法 Python是一种广泛应用于各种领域的高级编程语言,可以用于编写各种类型的应用程序和工具。其中,它在游戏开发方面有着广泛的应用。而在游戏开发过程中,按键响应是至关重要的一个组成部分。本文将带领读者了解…

【测试基础01】

本期参考文献: 链接 一、安装mysql 1、安装mysql可以参考链接: 文章 2、安装mysql与python的工具 进行校验,查看是否安装成功 二、创建库 mycursor mydb.cursor() mycursor.execute("CREATE DATABASE ck") 执行语句创建库在mysql库里可以看到…

String字符串

文章目录 String类String常用的字符串处理方法StringBuffer类 StringBufferStringBuffer类中常用的方法StringBuilder类(了解为主)StringTokenzier类(了解为主) final属性,不可扩展,不可子类,不…

C++ list类成员函数介绍

目录 🤔list模板介绍: 🤔特点: 🤔list内存结构图解: 🤔 list的成员函数: 😊list构造函数: 🔍代码示例: 🔍运行结果&…

python图像处理实战(二)—二值化图像与线性变换

🚀写在前面🚀 🖊个人主页:https://blog.csdn.net/m0_52051577?typeblog 🎁欢迎各位大佬支持点赞收藏,三连必回!! 🔈本人新开系列专栏—python图像处理 ❀愿每一个骤雨初…

什么是时间复杂度?

时间复杂度定义:在计算机科学中,时间复杂性,又称时间复杂度,算法的时间复杂度是一个函数,它定性描述该算法的运行时间。这是一个代表算法输入值的的长度的函数。时间复杂度常用大O符号表述,不包括这个函数的…

Python篇——数据结构与算法(第四部分:希尔排序及其讨论、计数排序、桶排序、基数排序)

1、希尔排序 希尔排序(shell sort)是一种分组插入排序算法首先取一个整数d1n/2,将元素分为d1个组,每组相邻两元素之间距离为d1,在各组内进行直接插入排序取第二个整数d2d1/2,重复上述分组排序过程&#xf…

SpringCloud Alibaba Seata 工作机制

SpringCloud Alibaba Seata Seata 工作机制 说明 之所以放在后面说工作机制是因为如果一开始就说的话理解困难 所以我们有了前面的列子和说明我们在结合本节内容会收获的多理解相对容易点 分布式事务过程分析 Seata 分布式事务处理过程-ID三组件模型 debug 梳理: 术语 先…

C++ deque类成员函数介绍

目录 🤔deque模板介绍: 🤔deque特点: 🤔deque内存结构图解: 🤔deque各操作地址指向: 🤔 deque的成员函数: deque构造函数: 🔍代…

C++ 常见集合算法

目录 🤔常见集合算法: 🙂1.set_intersection 容器交集 代码示例: 运行结果: 🙂2.set_union 容器并集 图解: 代码示例: 运行结果: 🙂 3.set_differe…

高速缓存(cache)的原理: 了解计算机架构与性能优化

计基之存储器层次结构 Author: Once Day Date: 2023年5月9日 长路漫漫,而今才刚刚启程! 本内容收集整理于《深入理解计算机系统》一书。 参看文档: 捋一捋Cache - 知乎 (zhihu.com)iCache和dCache一致性 - 知乎 (zhihu.com)C…

【SpringCloud——Elasticsearch(上)】

一、什么是Elasticsearch elasticsearch是一款非常强大的开源搜索引擎,可以帮助我们从海量数据中快速找到需要的内容。 二、倒排索引 1、正向索引 2、倒排索引 3、总结 三、ES和MySQL的区别 四、操作索引库 1、基于Kibana(WEB界面) 以下操作…

jvisualvm ssl远程连接JVM

jvisualvm 远程ssl连接 一、没认证的 JMX连接 (不安全) 这种方式,仅限于测试环境,可以这样操作。生产环境为了安全起见,还是要使用带认证的方式连接。 远程jar包服务 启动时 java -jar [jvm参数] xx.jar添加JVM参数 java -jar -Xmx512M -Xms2…

基于深度学习的高精度汽车自行车检测识别系统(PyTorch+Pyside6+模型)

摘要:基于深度学习的高精度汽车自行车检测识别系统可用于日常生活中检测与定位汽车自行车目标,利用深度学习算法可实现图片、视频、摄像头等方式的汽车自行车目标检测识别,另外支持结果可视化与图片或视频检测结果的导出。本系统采用YOLOv5目…

基于深度学习的高精度野生动物检测识别系统(PyTorch+Pyside6+YOLOv5模型)

摘要:基于深度学习的高精度野生动物检测(水牛、犀牛、斑马和大象)识别系统可用于日常生活中或野外来检测与定位野生动物目标,利用深度学习算法可实现图片、视频、摄像头等方式的野生动物目标检测识别,另外支持结果可视…

Flutter问题记录 - TextField组件多行提示文本显示不全

文章目录 前言开发环境问题描述问题分析解决方案最后 前言 梳理Flutter项目的过程中发现还有一些遗留的TODO没处理,其中有一个和TextField组件相关。 开发环境 Flutter: 3.10.1Dart: 3.0.1 问题描述 TextField组件设置maxLines: null不限制行数,同时…

【文章学习系列之模型】SCALEFORMER

本章内容 文章概况模型结构主要方法多尺度框架跨尺度标准化模型输入编码损失函数 实验结果消融实验跨尺度标准化自适应损失函数 总结 文章概况 《SCALEFORMER: ITERATIVE MULTI-SCALE REFINING TRANSFORMERS FOR TIME SERIES FORECASTING》是2023年发表于ICLR上的一篇论文。作…

硬件工程师-BUCK开关电源设计

一、电感的伏安特性 电感线圈通电之后,会产生磁场,磁场是有一定极性的,而且磁场分布,是一个封闭的回路。在线圈的内部磁力线是比较密集的,磁场的强度是比较强的,外面空气中的的这个磁力线是比较稀疏的&…

【Unity3D】调整屏幕亮度、饱和度、对比度

1 屏幕后处理流程 调整屏幕亮度、饱和度、对比度,需要使用到屏幕后处理技术。因此,本文将先介绍屏幕后处理流程,再介绍调整屏幕亮度、饱和度、对比度的实现。 屏幕后处理即:渲染完所有对象后,得到一张屏幕图像&#xf…

Centos6.5环境Nginx 1.16.1升级到1.24.0版本

一、背景 2023年4月11日,官方发布了Nginx最新稳定版,版本号为 1.24.0。该版本是基于1.23.x(1.23.0 - 1.23.4)开发版的Bug修复,以及一些新特性的加入,而形成的稳定版。安全部门扫描后,发现现场不…