C语言:深入补码计算原理

news2025/1/16 8:09:26

C语言:深入补码计算原理

    • 有符号整数存储
      • 原码、反码、补码
        • 转换规则
        • 数据与内存的关系
    • 补码原理


有符号整数存储

原码、反码、补码

有符号整数的2进制表示方法有三种,即原码、反码和补码
三种表示方法均有符号位和数值位两部分,符号位用0表示“正”,用1表示“负”

有符号整数最高位的一位是被当做符号位,剩余的都是数值位。
无符号整数所有的位都是数值位


转换规则

正整数:原、反、补码都相同。

负整数:
原码:直接将数值按照正负数的形式翻译成二进制得到的就是原码。
反码:将原码的符号位不变,其他位依次按位取反就可以得到反码。
补码:反码+1就得到补码。

正数:

int a = 5;

对于int(整形),内存会开辟4个字节来存放a。由于a是正数,第一位符号位为0,数值为5,转化为二进制就是101,高位补0。正数的原反补三码相同。
故:

a 的原码: 00000000 00000000 00000000 00000101
a 的反码: 00000000 00000000 00000000 00000101
a 的补码: 00000000 00000000 00000000 00000101

负数:

int b = -5;

由于在此b是负数,在原码中,第一位是符号位,存放1,表示负数。
反码:符号位不变,保持为1。其余位按位取反,即0变1,1变0.
补码:在反码的情况下加1。
故:

b 的原码: 10000000 00000000 00000000 00000101
b 的反码: 11111111 11111111 11111111 11111010
b 的补码: 11111111 11111111 11111111 11111011

而补码想要变回原码,也是相同的步骤,即先取反后加一。

数据与内存的关系

首先,我们在内存中存储的数据是以补码的形式存储的。我们用代码定义a,b为5-5,然后观察其在内存中的值:
在这里插入图片描述
由于二进制实在难于分辨,可读性非常差,所以编译器在向程序员呈现计算机存储的值的时候,会转为16进制。我们从上图中可见,a的存储是0x00000005即16进制的5。可b的值却不是-00000005。这个fffffffb其实就是-5的补码 11111111 11111111 11111111 11111011的16进制形式,由此可以证明,内存存储有符号整数就是以补码的形式。

那为什么内存要存补码?

  • 可以把符号与数值统一处理,把数字的正负放在码值中,不用额外区分。
  • 可以使加法减法统一处理(CPU只有加法计算器)。

第一点其实是容易理解的,那为什么用补码可以统一加减法呢?我们以下面的代码为例:

int a = 3;
int b = 5;
int c = a - b;

在以上计算过程中,计算机会把3 - 5当作3 + (-5),然后将两个数字的补码相加。

a 的补码: 00000000 00000000 00000000 00000011
b 的补码: 11111111 11111111 11111111 11111011
--------------------------------------------
两者相加: 11111111 11111111 11111111 11111110
上式取反: 10000000 00000000 00000000 00000001
上式加一: 10000000 00000000 00000000 00000010
最后得到的值即为-2

可以看到我们确实以加法的形式,完成了减法的计算。以上代码中,计算机想要完成3 - 5,于是CPU将其转化为了3 + (-5),然后直接将补码相加,然后转回原码,得到的就是正确答案。

我们再来看到一个案例:

int a = 10;
int b = 5;
int c = a - b;

在以上计算过程中,计算机会把10 - 5当作10 + (-5),然后将两个数字的补码相加。

a 的补码: 00000000 00000000 00000000 00001010
b 的补码: 11111111 11111111 11111111 11111011
--------------------------------------------
两者相加: 1 00000000 00000000 00000000 00000101

此时出现了一个问题,那就是进位导致的位数溢出,由于int类型只能存储32位数据,此时超出的数据就会被丢弃
所以计算后实际值是: 00000000 00000000 00000000 00000101也就是5,我们再次完成了计算。

可见,虽然代码是减法,但是在计算机处理的时候,只做了加法运算。这样可以减少计算机硬件的消耗,只需要在CPU内部做好加法的硬件即可。

本博客还要继续探讨,为什么计算机可以通过补码计算统一加减法。


补码原理

现在假设我们有一个十进制计算机,每个bit位可以存储0 - 9十种数据,现在我们有一个可以存储4位数据内存,接下来我们要完成一个计算:

求出50 - 19的结果:

值得注意的是:由于我们只能存储4位数据,所以如果我们计算中发生了溢出,多出来的位要舍弃。

50 的存储:0050
19的存储:0019

接下来我们进行计算:

50 - 19
= 50 + (-19)
= 50 + (-19) + 9999 + 1 - 10000

到这一步,我暂时停止了,因为我要重复申明刚刚的规则:计算中发生了溢出,多出来的位要舍弃

由于计算机只能存储四位,而计算机是一步一步进行计算的,所以中间的每一个变量都要保存下来,而在保存10000时,我们的位数溢出了,要舍弃高位的1,于是上述计算变为:

= 50 + (9999 - 19) + 1 - 0000
= 50 + (9999 - 19 + 1)
= 50 + 9981
= 10031

由于计算机只能存储四位,而在保存10031时,我们的位数溢出了,舍弃高位的1,于是上述计算变为:

= 0031
= 31

50 - 19结果就是31,整个计算过程看起来非常怪异,为什么还能得到正确结果???

首先,我们要计算的是一个减法 50 - 19,于是我把它转化为了加法50 + (-19),但是这依然改变不了它需要进行相减的本质,我们有没有办法把-19转化为一个正数x,让50 + x == 50 + (-19)

在数学界,这就是异想天开,但是我们的数据是存在计算机中的,其实是有可能实现的,而实现它的本质,就在于丢弃溢出位数的功能。

数学角度,10000 + (-19) + 50等于10031,但是从这个只能存四位的内存的角度,10031就是31。也就是说,我们可以给一个负数加上刚好到溢出位数的数字,故意让其溢出,这样就可以50 + (10000 - 19) == 50 + (-19)了。

但是这涉及到一个问题:根本没有四位的内存可以存下10000这个数据,那就更无法在计算机中完成10000 + (-19)了。于是我们将10000拆分为两个4位以内的数字99991,让10000 + (-19)变成9999 + 1 + (-19),这就是计算机可以执行的了。这样你也许就可以看懂以上的算式了。


接下来,我们要把上面的溢出效果带入到一般的二进制计算机中:

现在我们要完成减法:5 - 3,数据都以int类型存储:

那么我们就要先将上式转化为5 + (-3),接着对-3进行一次溢出的计算:

-3的二进制: -00000000 00000000 00000000 00000011(前面有负号)
加上一个刚好溢出的整数: 1 00000000 00000000 00000000 00000000
拆解出两个int可以存储的数字: 11111111 11111111 11111111 11111111 + 1
先让-3 + 11111111 11111111 11111111 11111111
结果:11111111 11111111 11111111 11111100
再+1:11111111 11111111 11111111 11111101

最后我们就可以拿11111111 11111111 11111111 11111101 代替-3进行计算了。
而中途有一个过程:

先让-3 + 11111111 11111111 11111111 11111111
结果:11111111 11111111 11111111 11111100

你有没有发现,这个结果11111111 11111111 11111111 11111100 刚好就是-3的每一位取反?
数学角度来说,-3 + 11111111 11111111 11111111 11111111 是要执行减法的,可是二进制中可以用每一位取反达到同样的效果,而对于计算机而言,对每一个bit位取反并不是什么难事。因此计算机的计算,就是在这一步把减法消除掉的。
其实这就是得到反码的过程,所以反码要求按位取反

而最后一步

再+1:11111111 11111111 11111111 11111101

也就是得到补码的过程:反码 + 1,这是为了补齐前面少的一个数字,凑出刚好溢出的数字。

整个过程都是为了让一个负数转化为一个等效的正数。而之所以要分反码补码,不能一步到位,就是因为刚好差1,内存位数不够无法存储,必须拆一个1出来分两步计算

另外的,因为有符号整数,既可以存正数,也可以存负数,所以拿出第一位当符号位。而符号位不参与计算,因此取反的时候不包括符号位

至此,你应该明白了为什么要用补码的机制存储,也就是利用溢出机制,凑出一个等效的正数,然后再计算


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1506879.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

25改考408最新资讯!拷贝

东北大学 东北大学计算机考研全面改考408 东北大学计算机学院官网:http://www.cse.neu.edu.cn/6274/list.htm 东北大学计算机考研全面改考408 公告原文 东北大学计算机科学与工程学院关于调整2025年硕士研究生招生计算机科学与技术、计算机技术、人工智能专业初试…

NBlog整合OSS图库

NBlog部署维护流程记录(持续更新):https://blog.csdn.net/qq_43349112/article/details/136129806 由于项目是fork的,所以我本身并不清楚哪里使用了图床,因此下面就是我熟悉项目期间边做边调整的。 目前已经调整的功能…

机器学习评价指标(分类、目标检测)

https://zhuanlan.zhihu.com/p/364253497https://zhuanlan.zhihu.com/p/46714763https://blog.csdn.net/u013250861/article/details/123029585 1.1 混淆矩阵 在介绍评价指标之前,我们首先要介绍一下混淆矩阵(confusion matrix)。混淆矩阵…

数据结构小记【Python/C++版】——B树篇

一,基础概念 B树也是一种自平衡搜索树,常用于数据库中索引的实现。 B树和AVL树的区别在于: B树是一种多路平衡查找树,B树的节点可以有两个以上的子节点(AVL树是二叉树,最多只能有两个子节点)。 B树的每个节点可以存…

什么是SSL洪水攻击,有办法处理吗?

相信不少人曾遇到过或是听说过DDOS攻击,分布式拒绝服务(DDoS)攻击指多个系统联合进行攻击,从而使目标机器停止提供服务或资源访问。大致来说,就是让多台电脑向一台服务器发送大量的流量,直到该服务器崩溃掉…

利用GPT开发应用007:警惕人工智能幻觉,局限与注意事项

文章目录 一、人工智能幻觉二、计算案例三、斑马案例四、总结 正如您所见,一个大型语言模型通过基于给定的输入提示逐个预测下一个单词(或标记)来生成答案。在大多数情况下,模型的输出对您的任务来说是相关的,并且完全…

解决Ubuntu 16.04/18.04 图形化界面异常、鼠标光标消失、鼠标变成叉叉等问题

bug场景: 一切从一次换源说起…叭叭叭 这篇文章解决的问题: 1.换源,默认源太慢,换成可用的阿里云的源 2.apt-get failed to …问题 3.图形化异常问题 4.get unmet dependence 问题 5. 鼠标光标消失和鼠标变成叉叉问题。 解决方…

【计算机网络_应用层】https协议——加密和窃密的攻防

文章目录 1.https协议的介绍2. 加密和解密2.1 什么是加密2.2 常见的加密方式2.2.1 对称加密2.2.2 非对称加密 2.3 数据摘要(数据指纹)2.4 数字签名 3. https协议的加密和解密方案一:使用对称加密(❌)方案二&#xff1a…

搜维尔科技:动作捕捉与数字时尚:Wondar Studios欧莱雅项目

来自意大利的Wondar Studios工作室,是一家制作与动作捕捉技术相关软件和内容的公司,其出品的三维角色动画均由专业动捕系统真实录制制作。 我们很高兴与大家分享Wondar Studios最新的动捕项目,该项目带来了身临其境的虚拟现实体验。他们与巴…

加密流量分类torch实践4:TrafficClassificationPandemonium项目更新

加密流量分类torch实践4:TrafficClassificationPandemonium项目更新 更新日志 代码已经推送开源至露露云的github,如果能帮助你,就给鼠鼠点一个star吧!!! 3/10号更新 流量预处理更新 增加了基于splitCa…

JavaScript基础6之执行上下文、作用域链、函数创建、函数激活、checkScope的执行过程、闭包、this

JavaScript基础 执行上下文执行上下文中的属性变量对象全局上下文的变量对象函数上下文执行过程进入执行上下文代码执行思考题 作用域链函数创建函数激活checkScope的执行过程总结 闭包分析闭包 this 执行上下文 执行上下文中的属性 每一个执行上下文都有三个核心属性 变量对…

03-安装配置jenkins

一、安装部署jenkins 1,上传软件包 为了方便学习,本次给大家准备了百度云盘的安装包 链接:https://pan.baidu.com/s/1_MKFVBdbdFaCsOTpU27f7g?pwdq3lx 提取码:q3lx [rootjenkins ~]# rz -E [rootjenkins ~]# yum -y localinst…

Linux学习:权限

目录 1. shell命令的工作原理与存在意义1.1 shell命令解释器存在的意义1.2 shell解释器的工作原理 2. Linux操作系统:用户2.1 什么是用户2.2 用户的切换操作2.3 用户权限划分的意义 3. Linux中权限的种类和意义3.1 什么是权限3.2 sudo指令与短暂提权 4. 文件类型与文…

03-快速上手RabbitMQ的5种消息模型

RabbitMQ RabbitMQ是基于Erlang语言开发的开源消息通信中间件,有几个常见概念 connections(连接): 将来publisher(消息的发送者)或者consumer(消息的接收者)都需要先与MQ建立连接 channel(通道): 建立连接后需要创建通道,生产者和消费者就是基于通道完成消息的发送和接收 ex…

网络安全:OpenEuler 部署 jumpserver 堡垒机

目录 一、实验 1.环境 2.OpenEuler 部署 jumpserver 堡垒机 3.OpenEuler 使用 jumpserver 堡垒机(管理Linux) 4.OpenEuler 使用 jumpserver 堡垒机(管理Windows) 二、问题 1.jumpserver 安装报错 一、实验 1.环境 &#x…

linux paddle For C++环境搭建

paddle介绍 Paddle是类似tesseract的文字识别ocr。因为tesseract-ocr的中文识别效果不好。因此才准备安装Paddle。Paddle最方便的安装方式的使用Python的包管理安装。pip3 install paddlepaddle。但我使用了一下感觉还是用C更加方便,QT OpenCV Paddle应当还不错。…

[Spark SQL]Spark SQL读取Kudu,写入Hive

SparkUnit Function:用于获取Spark Session package com.example.unitlimport org.apache.spark.sql.SparkSessionobject SparkUnit {def getLocal(appName: String): SparkSession {SparkSession.builder().appName(appName).master("local[*]").getO…

1.下载安装ESP32开发环境ESP-IDE

ESP32简介 ESP32介绍 说到ESP32,首先ESP32不是一个芯片,ESP32是一个系列芯片, 是乐鑫自主研发的一系列芯片微控制器。它主要的功能就是支持WiFi和蓝牙, ESP32指的是ESP32裸芯片。但是,“ESP32”一词通常指ESP32系列芯…

python基础练习 特殊回文数

资源限制 内存限制:512.0MB C/C时间限制:1.0s Java时间限制:3.0s Python时间限制:5.0s 问题描述 123321是一个非常特殊的数,它从左边读和从右边读是一样的。   输入一个正整数n, 编程求所有这样的…

RocketMQ、Kafka、RabbitMQ 消费原理,顺序消费问题【图文理解】

B站视频地址 文章目录 一、开始二、结果1、RocketMQ 消费关系图1-1、queue和consumer的关系1-2、consumer 和线程的关系 2、Kafka 消费关系图1-1、partitions和consumer的关系1-2、consumer 和线程的关系 3、RabbitMQ 消费关系图1-1、queue和consumer的关系1-2、consumer 和线程…