[oeasy]python0022_ python虚拟机_反编译_cpu架构_二进制字节码_汇编语言

news2025/1/24 17:58:30

程序本质

回忆上次内容

  • ​python3​​ 的程序是一个 5.3M 的可执行文件
  • 我们通过which命令找到这个python3.8的位置
  • 将这个python3.8复制到我们的用户目录下
  • 这个文件还是能够执行的
  • 将这个文件转化为字节形态
  • 确实可以转化
  • 但是这个文件我们看不懂啊!!!😭

  • 怎么才能看懂这些东西呢?🤔
  • 这个东西我们确实看不懂
  • 但是有人能看懂
  • 谁呢?

真实的cpu

  • 无论手机还是计算机
  • 最核心器件的器件就是cpu

  • 这个东西是个实实在在存在的实体
  • 这个cpu就能看懂这些字节码吗?

cpu

  • cpu能看懂这些字节码!!!
  • 这些字节码
  • 我们看不懂的
  • cpu能看懂
  • 这是属于cpu的机器语言
  • 这就是cpu的一条条的机器指令(instruction)

  • 机器指令码都是二进制字节形式的
  • 我们尝试把python3.8转化为字节表现形式

反汇编-汇编语言助记符

#先把~/python3对应的机器语言输出为汇编指令形式(反汇编)
objdump -d python3.8 > python3.8.asm
vi python3.8.asm
  • 这次真的可以看懂了
  • 减法(sub)
  • 移动(mov)
  • 这些指令

  • 可以发现当前系统的架构(指令集)是x86-64
  • 这些和我们刚才的字节形态有关系吗?

对比

  • 用vi分窗口分别打开打开python3 和 python3.asm
vi -o python3.8hex python3.8.asm
  • 下图中上半部分是机器语言

  • 上图下半部分是机器语言对应的汇编指令助记符
  • ctrl+j、ctrl+k可以上下窗口切换
  • 我们来试着找找
  • python3.8文件中
  • 机器语言的0101和cpu的汇编指令的对应关系🧐

找到了

  • 下面窗格
  • 先跳到第8行
  • endbr64 意味着 64位结束分支
  • 下面就是第9行

  • 第9行
  • ​/48 83​​ 找到上下的对应关系
  • 也就是第一条执行的汇编指令sub
  • sub对应substract 是减法
  • 汇编指令是计算机 cpu 机器指令的助记符

查找对应关系

  • ​423000​​ 就是初始化(init)的 cpu 开始执行指令的地址
  • 我们在上面查找48 83
  • 看有没有对应的字节
  • /4883 ec08 488b...
  • 在上面的窗格中
  • 搜索这些字节形态

  • 好像找到了对应关系
  • 具体怎么对应的呢?
  • 这台计算机用的是什么指令集呢?
  • 什么是指令集来着?

指令集

  • 指令集就是指令的集合

  • 指令集也叫计算机的架构
  • 不同架构的 cpu 有不同的指令集
  • 我们目前的这个浏览器里面的系统用的是 ​​x86-64​
  • 除此之外 ​​arm​​、​​MIPS​​、​​RISC-V​​ 也是常用的指令集
  • 指令助记符和机器语言到底是则怎么对应的呢?

回到代码

  • 代码会有不同的 ​​section​​ 模块
  • 入口是 ​​init​
  • 作用是初始化​​initialization​

  • 模块里面是具体的指令
  • 比如第一句 ​​48 83 ec 08​
  • 为什么48 83 就可以代表减法
  • 这是谁规定的呢?

查看指令集

  • 这是cpu架构规定的
  • 首先要明确到当前机器的cpu的架构
  • 反汇编里面说是x86-64

  • 到shell里面验证一下

  • 当前机器所用的架构指令集确实是x86-64
  • 这是谁的架构呢?

搜索

  • 不会了就去搜索😄

  • 去intel官网找指令集

查询x86_64指令集

  • 找到cpu的手册
  • ​​https://www.intel.com/content/dam/www/public/us/en/documents/manuals/64-ia-32-architectures-software-developer-instruction-set-reference-manual-325383.pdf​​
  • 可以找到指令和二进制状态之间的关系么?
  • 先要找到x86-64指令集中 48 83 这条指令

  • 注意上图中
  • 100B中的B是0或1
  • 100B可以是1000
  • 也可以是1001
  • 这确实是一条减法指令
  • 而且是8位立即数和寄存器的减法运算

逐步搜索

  • 找起来真的很费劲
  • ​48 83 ec 08​​ 对应 ​​sub $0x8,%rsp​
  • 确实是一条减法指令
  • 确实是8位立即数和寄存器的减法运算

  • 和objdump的结果是一致的
  • 废话!!!😠
  • 除了减法指令sub之外
  • 还有什么别的指令呢?

更多cpu指令

  • 指令那可还有很多的
  • 有运算的
  • 有移位的
  • 加减乘除都有

  • 这些指令的集合就是指令集
  • 指令集就是cpu运行的基础!
  • 这些机器语言的指令不能在别的指令集架构上运行么?

移植 port

  • 想在别的指令集架构上运行程序
  • 就需要移植(port)
  • 移植(port)指的是从一种指令集移植到另一种指令集
  • 从这个词的词源
  • 可以看出欧美的航海文化基础
  • port 港口
  • 也可以看出我们的农耕文化基础
  • 移植

  • 不移植会如何呢?

不移植

  • 这是playstation2的架构图
  • cpu是mips架构的

  • 不移植的话
  • 就是让x86架构的pc
  • 去直接执行这些基于mips架构的的0101... 字节码
  • 就像让一个意大利泥瓦匠看一份中文写成的烹饪书来砌墙
  • 鸡同鸭讲
  • 驴唇不对马嘴
  • 0101的文件执行出来全是乱的
  • 完全不能用
  • 而且不全是软件的问题
  • 也涉及到硬件等方面
  • 可能某个寄存器在新架构中根本就不存在

架构师

  • 这个时候架构师要解决相当多的问题
  • 很不容易的

  • 落实到我们的python3.8游乐场
  • 我们的python3.8就是这样的一系列的cpu指令
  • 可以解释py文件的
  • python3.8 又是如何解释py文件的来着?

python3 执行过程

  • 不管是python3.8这个游乐场
  • 还是hello.py这个python程序
  • 都在我们的硬盘上

  • 先得把文件从硬盘读到内存

python3 执行的过程大致是这样

  • 先把python3.8这个主解释器加载到内存中
  • 然后在x86-64的cpu上执行
  • 模拟出一台python虚拟机

  • 对py文件解释执行
  • 那为什么py程序可以跨架构跨平台呢?

架构的层次

  • 不同架构的 cpu 都可以运行 python
  • risc-v
  • arm
  • x64
  • mips
  • 龙芯

  • 不同系统的环境都可以运行 python
  • win
  • mac
  • linux
  • freebsd

跨架构跨平台原理

  • 由于python3.8 的源文件
  • 被不同的架构的编译器 编译后
  • 被部署到 不同的cpu架构和系统上
  • 所以同样的py文件被加载之后
  • python程序可以对py文件跨架构、跨系统进行解释执行
  • 一次编写到处运行

  • 不同的架构下
  • 汇编指令都不一样
  • 怎么能正确解释执行同样的python程序呢?

跨架构跨平台原理

  • ​/usr/bin/python3.8​​ 本身是二进制文件
  • 是基于当前操作系统当前架构编译出来的
  • 可执行二进制文件
  • 不同的架构有不同的编译器
  • 不同的编译器编译出来的python3.8
  • 是不同的二进制指令序列

  • ​python3.8​​ 构建了一个运行时环境
  • 这个环境可以解释读到的​​python语句​
  • 把​​python语句​​翻译成系统能读懂输入输出
  • 翻译成当前架构能够执行的代码
  • 然后边解释边执行
  • 恭喜您完成了非常烧脑一个实验!
  • 我们去总结吧!!!

总结

  • ​python3​​ 的程序是一个 5.3M 的可执行文件
  • ​python3​​ 里面全都是 cpu 指令
  • 可以执行的那种
  • 我们可以把指令对应的汇编找到
  • ​objdump -d ~/python3 > python3.asm​
  • 汇编语句是和当前机器架构的指令集相关的
  • ​uname -a​​可以查询指令集
  • 我们执行的过程其实就
  • 系统执行​​python3​​这个可执行文件
  • 给了​​python3​​一个参数​​hello.py​
  • ​python3​​对于​​hello.py​​一句句的解释执行
  • 在显示器输出了​​hello world​
  • ​python3​​执行完毕
  • 把控制权交回给 shell
  • 这就是我们执行​​hello.py​​的过程
  • 我想输出个稍微复杂点的东西
  • 可以做下面这个框架标题吗?🤔

  • 我们下次再说!👋
  • 蓝桥->​​https://www.lanqiao.cn/teacher/3584​​
  • github->​​https://github.com/overmind1980/oeasy-python-tutorial​​
  • gitee->​​https://gitee.com/overmind1980/oeasypython​​
  • 视频->​​https://www.bilibili.com/video/BV1CU4y1Z7gQ​​ 作者:oeasy

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/46812.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【应用多元统计分析】上机四五——主成分分析因子分析

目录 一、主成分分析 1.princomp命令 2.screeplot命令 3.【例7.3.3】对【例6.3.3】中的数据从相关矩阵出发进行主成分分析 ​编辑(1)代码 (2)碎石图 (3)散点图 二、因子分析 1.载荷矩阵求解 &…

考CISAW的N个理由!

随着信息科技的飞速发展,互联网的普及,面对信息安全的严峻局势,网络信息安全显得尤为重要,同时近些年来,国家也相继出台一些政策,并推出一些国家认证的资格证书,CISAW认证就是专门针对信息安全保…

深入理解java虚拟机:虚拟机字节码执行引擎(3)

文章目录4. 基于栈的字节码解释执行引擎4.1 解释执行4.2 基于栈的指令集与基于寄存器的指令集4.3 基于栈的解释器执行过程4. 基于栈的字节码解释执行引擎 关于虚拟机是如何调用方法已经讲解完毕,从本节开始,我们来探讨虚拟机是如何执行方法里面的字节码…

【千瓜行研】2022年11.11小红书保健品行业数据研报

2022年双十一营销盛会已落下帷幕,小红书平台保健品行业流量连续3年持续走高,热度破亿! 本期「千瓜行研」重磅推出《2022年11.11保健品行业数据研报(小红书平台)》(文末附完整版下载)&#xff0c…

实再高度为设备高度的100%布局

要实DIV的高度为设备高度的100%&#xff0c;在设置div的高度时需要使用vh单位。效果如下&#xff1a; html代码如下&#xff1a; ------------------------------------------------------------------- <!doctype html> <html> <head> <meta charset&qu…

7个实用有效的营销策略帮助推动跨境电商DTC品牌业务

关键词&#xff1a;DTC品牌、跨境电商 总的来说&#xff0c;直接面向消费者 (DTC) 是消费品中增长最快的渠道。DTC 带来了明显的好处&#xff0c;例如更高的毛利率&#xff0c;能够在受控的品牌自有空间中试用新产品&#xff0c;当然&#xff0c;还可以为您的客户提供他们可能期…

【语音编码】基于matlab ADPCM编解码(Matlab代码实现)

&#x1f468;‍&#x1f393;个人主页&#xff1a;研学社的博客 &#x1f4a5;&#x1f4a5;&#x1f49e;&#x1f49e;欢迎来到本博客❤️❤️&#x1f4a5;&#x1f4a5; &#x1f3c6;博主优势&#xff1a;&#x1f31e;&#x1f31e;&#x1f31e;博客内容尽量做到思维缜…

修改nginx返回的默认的server信息

文章目录1、修改请求响应头中的server信息2、修改nginx返回的默认页面中的server信息通过修改nginx源码来修改nginx返回的默认的server信息。 1、修改请求响应头中的server信息 修改前的代码和响应头中的server信息&#xff1a; 代码文件路径&#xff1a;nginx-1.21.4\src\htt…

APS排程软件与某一知名APS软件整体对比

APS排程软件作为高级计划与排程系统。主要是解决小批量、多品种的复杂生产要求。客户的要求交期越来越准。由于成本不断攀升&#xff0c;所以高产出和低成本也是重要的考量因素。 下面我们就安达发APS软件与某一知名APS做一下整体对比&#xff1a; 1.功能实用性 安达发APS排程…

5G无线技术基础自学系列 | MIMO原理

素材来源&#xff1a;《5G无线网络规划与优化》 一边学习一边整理内容&#xff0c;并与大家分享&#xff0c;侵权即删&#xff0c;谢谢支持&#xff01; 附上汇总贴&#xff1a;5G无线技术基础自学系列 | 汇总_COCOgsta的博客-CSDN博客 对于5G TDD系统&#xff0c; MIMO大幅提…

新手入门:Web安全测试大盘点

随着互联网时代的蓬勃发展&#xff0c;基于Web环境下的应用系统、应用软件也得到了越来越广泛的使用。 目前&#xff0c;很多企业的业务发展都依赖于互联网&#xff0c;比如&#xff0c;网上银行、网络购物、网络游戏等。但&#xff0c;由于很多恶意攻击者想通过截获他人信息去…

经典文献阅读之--PON

0. 简介 作为Transformer在机器视觉领域的爆火&#xff0c;在自动驾驶领域目前很多工作都集中在前视转鸟瞰图的方法中&#xff0c;这里我们来讲2020年一篇经典的论文《Predicting Semantic Map Representations from Images using Pyramid Occupancy Networks》&#xff0c;其…

手把手教你写嵌入式Linux中的Makefile(一)

一、Makefile的引入及规则 使用keil, mdk,avr等工具开发程序时点击鼠标就可以编译了&#xff0c;它的内部机制是什么&#xff1f;它怎么组织管理程序&#xff1f;怎么决定编译哪一个文件&#xff1f; 答&#xff1a;实际上windows工具管理程序的内部机制&#xff0c;也是Make…

【c++基础】第一章 C到C++过度阶段

第一章 C到C过度阶段第一个C程序&#xff1a;使用namespace名字using关键字bool类型string字符串结构体struct结构体成员函数指针的获取方式const关键字&#xff1a;内联函数函数缺省值&#xff1a;函数重载&#xff1a;引用&#xff08;quote)开辟空间第一个C程序&#xff1a;…

UDP-A-D-乙酰氨基葡萄二钠盐;UDP-ALPHA-D-N-ACETYLGLUCOSAMINE, DISODIUM SALT

产品名称&#xff1a;UDP-A-D-乙酰氨基葡萄二钠盐 英文名称&#xff1a;UDP-ALPHA-D-N-ACETYLGLUCOSAMINE, DISODIUM SALT CAS No.&#xff1a;91183-98-1 分子式&#xff1a;C₁₇H₂₅N₃Na₂O₁₇P₂ 分子量&#xff1a;651.32 产地&#xff1a;西安 规格&#xff1a;…

如何在几百万qps的网关服务中实现灵活调度策略

作者 | 加纳斯 导读 说起百度的BFE可能不少人都听说过&#xff0c;但是其实在百度内部还有一个几百万qps的通用网关服务&#xff1a;Janus。截止当前&#xff0c;Janus服务不仅覆盖了百度内部FEED、评论、点赞、关注、直播等十多个中台服务的内网流量&#xff0c;而且为百度app…

【Java】JavaFx桌面编程整理

JavaFX是用于构建富Internet应用程序的Java库。 使用此库编写的应用程序可以跨多个平台一致地运行。 使用JavaFX开发的应用程序可以在各种设备上运行&#xff0c;例如台式计算机&#xff0c;移动电话&#xff0c;电视&#xff0c;平板电脑等。 为了开发具有丰富功能的Client Si…

运动爱好者的专属耳机,轻巧时尚又好用,哈氪无界上手

很多朋友在户外健身的时候喜欢戴上耳机&#xff0c;在音乐的节奏中去运动&#xff0c;现在市面上的运动耳机选择也特别丰富&#xff0c;为了在户外运动更安全&#xff0c;有些朋友会选择骨传导这种不入耳的耳机&#xff0c;上周我看到哈氪出了一款发带耳机&#xff0c;将运动发…

rac/rac one node扩容

某现场部署的cDAS RAC Onde Node超融合架构,2个计算/存储节点,1台仲裁节点 现网架构: 随着业务量增加,准备把仲裁节点加以利用,添加到融合节点的计算存储集群当中,与另外两个融合节点组成三节点的计算存储集群 改造后的架构: 一、配置仲裁节点(第三个计算/存储节点)…

windocs连接麒麟桌面---vnc软件

目录 一、下载vnc 二、麒麟服务器安装VNC远程 三、客户端连接 一、下载vnc客户端 Download VNC Viewer 6.22.826 - free - latest version