基于Booth乘法和Wallace树的乘法器优化思想

news2024/9/24 23:31:22

基于Booth乘法和Wallace树的快速乘法器

为了理解Booth乘法和Wallace数如何让乘法器变得更快:

先考虑不优化的8位乘法器实现,即8个16位数字累积共进行7次加法运算,可以认为一次16位加法用到16个全加器,则共需要112个全加器件,只计算全加器的开销,至少需要112$\times$5=560个门

Booth乘法

Booth乘法的实现依据在于补码乘法可写成以下的形式:
在这里插入图片描述

相比起原始乘法器,每次根据y的一位来决定当前是+x/0,补码乘法则需要每次观察y的两位,以决定下一次加法是+x/-x/0,而Booth乘法则每次观察y的三位,以决定下一次加法是+x/+2x/-x/-2x/0

布斯乘法每次观察完后y右移2位,相当于一次完成了2位y的观察。

因此,我们需要进行加法的操作数,也从原来的8个变成了4个

例子

以4位乘法为例来看看布斯乘法如何减少了操作数的数量

如果提升y的判断位数,是否可以进一步提升乘法器的效率?

否,Booth算法的三位判决在硬件实现中是一个平衡点,如果使用更多位数,虽然理论上可以减少生成的x数量,但增加y带来的复杂性可能会抵消这些好处。

我们使用判断3位的布斯乘法,则实际上减半了操作数的数量

原本是8个16位数字累积共进行7次加法运算,需要112个全加器,经由布斯乘法优化,则仅需要4个16位数字进行3次加法,需要48个全加器

Wallace树

Wallcace树基于半加器和全加器进行优化。

我们认为借用16位加法器来计算仅仅4个16位数字实在是太浪费了。因此我们不再横向地整个把16位数字加起来,而是纵向地,每次只考虑4位数字的加法,在本位产生一个数字,并把进位传递给后面的wallace_4模块

如下是wallace_4模块计算的一个例子。其中每个方框代表着一个wallace_4模块,它接受cin作为输入,计算出本位(S),并把进位©传递给下一位。值得注意的是所有的进位并不只能为1,wallace_4模块会将所有本位处理不了的数字丢给下一个wallace_4

这里必须及时指出,如上图所示的计算过程并不完全准确。实际上,wallace模块不会把所有的进位都传递给下一位,而是如果存在进位,wallace会自己先保留1位,然后剩下的向前传递。原因在我们讲完wallace模块的实现就会知道。

wallace_4实现

如下是wallace_4的实现,输入4位计算数,1位Cin;计算的出本位的1位C和一位S,并将一位进位传递到下一模块

当将共16个wallace_4堆叠起来,就可以执行4个16位数的加法了,计算结果得是两个16位数字:C[15:0]和S[15:0]

因此我们需要16个wallace_4,成本为32个全加器;还需要将C和S相加以得到最终的结果,即一次16位加法,成本仍为48个全加器

为什么采用wallace_4优化得到的成本不变?

因为输入只有4位,太少,导致优化空间不足;wallace树对于器件的优化是log级的,输入越多,优化效果越好。但是我们这里作为例子介绍了wallace树的优化思想,想必读者能够理解了

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1915036.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

创建React 项目的几种方式

①.react自带脚手架 使用步骤: 1、下载 npm i create-react-app -g 2、创建项目命令: create-react-app 项目名称 ②.Vite构建工具创建react步骤:(推荐) 方法一: 1、yarn create vite 2、后续根据提示步…

深度动态IP代理 国内动态IP软件哪个好用

想必大家都用过动态IP产品,什么是动态IP,动态IP就是非固定的静态IP地址,短 时间了频繁波动ip地址,就叫动态IP,因为工作需要用到不同的IP,这时就需要动态IP软件。 今天给大家带来一款深度动态IP软件&#xf…

MySQL安全值守常用语句

一、用户权限设置 1、Mysql中用户是如何定义的 用户名主机域 10.0.0.5110.0.0.%%10.0.0.0/255.255.255.0Db01Localhost127.0.0.1 2、用户创建 create user xinjing% identified by 123 3、用户删除 drop user username;username 是要删除的用户名:如 drop user root…

SpringBoot日常:编码规范之import *

前言 日常开发中,我们在编码过程中会经常忽略import 包的问题,我们会使用import语句中的通配符*来引入整个包中的所有类。尽管这样做能够简化代码编写和阅读,但是过度使用import *也会带来一些坏处,本文将探讨这些问题并给出相应…

在Linux下直接修改磁盘镜像文件的内容

背景 嵌入式Linux系统通常在调试稳定后,会对磁盘(SSD、NVME、SD卡、TF卡)做个镜像,通常是.img后缀的文件,以后组装新设备时,就将镜像文件烧录到新磁盘即可,非常简单。 这种方法有个不便之处&a…

前端面试题41(在JavaScript中,如何实现MVVM的数据绑定?)

在JavaScript中实现MVVM(Model-View-ViewModel)架构下的数据绑定,主要通过观察者模式、发布/订阅模式和数据劫持等技术来完成。下面我将概述几种常见的实现方式,以及如何在不使用框架的情况下手动实现数据绑定。 使用框架实现数据…

防御笔记第四天(持续更新)

1.状态检测技术 检测数据包是否符合协议的逻辑顺序;检查是否是逻辑上的首包,只有首包才会创建会话表。 状态检测机制可以选择关闭或则开启 [USG6000V1]firewall session link-state tcp ? check Indicate link state check [USG6000V1]firewall ses…

MySQL--C_C++语言连接访问

Connector/C的使用 首先需要在mysql官网下载C接口库 解压指令 tar -zxvf 压缩包名 下载并解压好后 但是还有比这更优的做法。 这样子手动安装不仅麻烦,还可能存在兼容性的问题。 其实在我们使用yum安装mysql时,大概率会自动帮我们把其他的环境都安装…

【大模型LLM面试合集】大语言模型基础_NLP面试题

NLP面试题 1.BERT 1.1 基础知识 BERT(Bidirectional Encoder Representations from Transformers)是谷歌提出,作为一个Word2Vec的替代者,其在NLP领域的11个方向大幅刷新了精度,可以说是近年来自残差网络最优突破性的…

分享一个项目模板electron+vue+ts+vite

分享一个项目模板electronvuetsvite GitHub - xiugou798/electron-vue-ts-vite-template: electron-vue-ts-vite-templateelectron-vue-ts-vite-template. Contribute to xiugou798/electron-vue-ts-vite-template development by creating an account on GitHub.https://gith…

C++的异常处理机制

C的异常处理机制 (1)Why(异常处理机制的作用)(2)How(异常机制如何工作)A.抛出异常B.捕获异常C.处理异常D.传递异常 (3)抛出异常A.栈展开B.析构函数和异常C.异常对象 (4)捕获异常(4)处理异常A.构造函数的异常处理B.不抛出异常noexc…

【SWMM】模型概述及软件安装

SWMM模型概述及软件安装 SWMM 模型 (Storm Water Management Model)概述应用 软件安装及下载参考 暴雨管理模型 (Storm Water Management Model,SWMM 模型)是美国环保局为解决日益严重的城市排水问题而推出的暴雨径流管…

凌风云 - 十大网盘资源搜索 Ver 6.0 版正式上线

《凌风云》作为网盘资源专业搜索领域的佼佼者,汇聚了国内十大网盘的丰富资源,凌风云搜索弥补其他搜索引擎可能无法搜索到相关资源的缺陷,作为专业的搜索引擎服务网络平台,您只需输入关键词,通过智能算法精准匹配&#…

C++的介绍与认识

目录 前言 1.什么是C 2.C的发展历史 3.C参考文档 4.C重要性 4.1C特点 4.2编程语言排行榜 4.3 C的应用领域 5.C学习指南 1. 基础知识 2. 面向对象编程(OOP) 3. 泛型编程 4. 标准库(STL) 结束语 前言 学习了C语言的知识…

使用mid360进行fast_lio建图、octomap生成栅格地图

前面我已经实现了fast_lio建图并使用octomap转为三维栅格地图,今天来填上次留的坑 使用Livox-Mid360激光雷达,复现FAST_LIO(保姆级教程)-CSDN博客 这是我上次写的,来复现上次失败的,这个教程:…

【PHP安装内置扩展】

PHP安装内置扩展 1、首先查看php源码以及查询是否有需要的扩展;本次以zlib扩展为例子 2、进入需要安装的扩展目录,执行命令 cd zlib 执行 make clean 清掉之前的安装的残留文件; 不需要的话直接略过,新安装也略过3、运行phpize,执行/usr/local/php/bin/phpize 注意这个路径一…

设计分享—国外后台界面设计赏析

国外后台界面设计将用户体验放在首位,通过直观易懂的布局和高效的交互设计,提升用户操作效率和满意度。 设计不仅追求美观大方,还注重功能的实用性和数据的有效展示,通过图表和图形化手段使数据更加直观易懂。 采用响应式布局&a…

Windows 部署ollama

一、简介 Ollama是在Github上的一个开源项目,其项目定位是:一个本地运行大模型的集成框架,目前主要针对主流的LLaMA架构的开源大模型设计,通过将模型权重、配置文件和必要数据封装进由Modelfile定义的包中,从而实现大模…

[GICv3] 3. 物理中断处理(Physical Interrupt Handling)

中断生命周期 ​​ 外设通过中断信号线生成中断,或者软件生成中断(SGI)。Distributor 和 ReDistributor 配合按照中断分组和中断优先级仲裁后将最高优先级的中断分发到 CPU interface。cpu interface 向中断发送到 PEPE 读取 IAR 寄存器&am…

队列+二叉树广度优先

题目出自力扣-n叉树的层序遍历 我是原始人,递归写出一道题就只有递归思路,开始的想法是写深搜函数,传一个随着层数递增的int参数q,节点空就return,否则遍历所有节点,每个子节点又以q1为层数递归&#xff…