RISC-V基础之浮点指令(包含实例)

news2024/9/27 7:37:32

RISC-V体系结构定义了可选的浮点扩展,分别称为RVF、RVD和RVQ,用于操作单精度、双精度和四倍精度的浮点数。RVF/D/Q定义了32个浮点寄存器,f0到f31,它们的宽度分别为32位、64位或128位。当一个处理器实现了多个浮点扩展时,它使用浮点寄存器的低位部分来执行低精度的指令。f0到f31与程序(也称为整数)寄存器x0到x31是分开的。与程序寄存器一样,浮点寄存器也按照约定用于某些特定的目的

 

RISC-V的浮点指令分为以下几类:
- 浮点加载和存储指令:用来在内存和浮点寄存器之间传输浮点数。例如,FLW指令从内存加载一个单精度浮点数到浮点寄存器,FSW指令将一个单精度浮点数从浮点寄存器存储到内存。
- 浮点计算指令:用来在浮点寄存器之间进行浮点数的加、减、乘、除、平方根等运算。例如,FADD.S指令将两个单精度浮点数相加,FDIV.D指令将两个双精度浮点数相除。
- 浮点转换指令:用来在不同的浮点数格式或整数格式之间转换浮点数。例如,FCVT.S.D指令将一个双精度浮点数转换为一个单精度浮点数,FCVT.W.S指令将一个单精度浮点数转换为一个32位整数。
- 浮点比较指令:用来在浮点寄存器之间进行浮点数的相等、小于、小于等于等比较,并将布尔结果记录在整数寄存器中。例如,FEQ.S指令判断两个单精度浮点数是否相等,FLT.D指令判断两个双精度浮点数是否小于。
- 浮点移动指令:用来在整数寄存器和浮点寄存器之间传输数据,不改变数据的位模式。例如,FMV.X.W指令将一个单精度浮点数从浮点寄存器移动到整数寄存器,FMV.W.X指令将一个32位整数从整数寄存器移动到浮点寄存器。
- 浮点类别化指令:用来判断一个浮点数是否属于某个特定的类别,如正无穷、负无穷、非数字(NaN)等,并将布尔结果记录在整数寄存器中。例如,FCLASS.S指令将一个单精度浮点数的类别编码为一个12位的位向量,并放入整数寄存器。

```riscv
# RISC-V floating-point program to calculate pi
# using the Gregory-Leibniz series
# pi/4 = 1 - 1/3 + 1/5 - 1/7 + ...
# f0: the result (pi)
# f1: the current term
# f2: the denominator
# f3: the sign (-1 or 1)
# f4: the constant 4.0
# f5: the constant 1.0
# f6: the constant -1.0
# t0: the loop counter

.data
    n: .word 1000000 # number of terms to compute

.text
    # initialize registers
    flw f4, =4.0 # f4 = 4.0
    flw f5, =1.0 # f5 = 1.0
    flw f6, =-1.0 # f6 = -1.0
    fmv.s f0, f5 # f0 = 1.0 (result)
    fmv.s f1, f5 # f1 = 1.0 (term)
    fmv.s f2, f5 # f2 = 1.0 (denominator)
    fmv.s f3, f5 # f3 = 1.0 (sign)
    lw t0, n # t0 = n (loop counter)

loop:
    # update the result
    fsub.s f0, f0, f1 # f0 = f0 - f1

    # update the term
    fadd.s f2, f2, f4 # f2 = f2 + 4.0
    fdiv.s f1, f3, f2 # f1 = f3 / f2

    # update the sign
    fneg.s f3, f3 # f3 = -f3

    # update the loop counter
    addi t0, t0, -1 # t0 = t0 - 1

    # check the loop condition
    bnez t0, loop # if t0 != 0, go to loop

    # multiply the result by 4
    fmul.s f0, f0, f4 # f0 = f0 * 4.0

    # return the result in a0
    fcvt.w.s a0, f0 # a0 = (int)f0

这个程序示例是用RISC-V的单精度和双精度浮点指令来计算圆周率近似值的。它使用了Gregory-Leibniz级数,这一般项是(-1)^n / (2n+1),它的和等于pi/4。也就是说,pi/4 = 1 - 1/3 + 1/5 - 1/7 + …。这个程序使用了递归函数来计算这个级数的前n项的和,其中n是一个全局变量,可以在程序中修改。

 

它的功能是将数组中的每个元素加上10,并将结果存回数组中。它的主要步骤如下:

  • 首先,代码在s0寄存器中存放了数组scores的基地址,这个数组有200个元素,每个元素占4个字节。代码还在s1寄存器中初始化了一个循环计数器i为0,在t2寄存器中存放了一个循环终止条件200,在t3寄存器中存放了一个常数10,在ft0浮点寄存器中存放了一个单精度浮点数10.0。
  • 然后,代码进入一个for循环,每次循环都对数组中的一个元素进行操作。循环的条件是i < 200,如果不满足就跳转到done标签处结束程序。
  • 在循环体中,代码首先计算数组中第i个元素的地址,方法是将i左移2位(相当于乘以4),然后加上s0(基地址)。这个地址被保存在t3寄存器中。
  • 然后,代码使用flw指令从t3寄存器指向的内存地址加载一个单精度浮点数到ft1浮点寄存器中,这个浮点数就是scores[i]。
  • 接着,代码使用fadd.s指令将ft1和ft0两个浮点寄存器中的值相加,并将结果保存在ft1中。这相当于执行了scores[i] = scores[i] + 10.0。
  • 然后,代码使用fsw指令将ft1寄存器中的值存储到t3寄存器指向的内存地址中,这相当于将修改后的scores[i]写回数组中。
  • 最后,代码使用addi指令将s1寄存器(循环计数器i)加上1,并跳转到for标签处继续下一次循环。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/838185.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

企业人力资源管理系统servlet+jsp人事招聘培训薪资java源代码mysql

本项目为前几天收费帮学妹做的一个项目&#xff0c;Java EE JSP项目&#xff0c;在工作环境中基本使用不到&#xff0c;但是很多学校把这个当作编程入门的项目来做&#xff0c;故分享出本项目供初学者参考。 一、项目描述 企业人力资源管理系统servletjsp 系统1权限&#xff…

基于面向对象基础设计——里氏替换原则

在Java中&#xff0c;支持抽象和多态的关键机制之一是继承。正是使用了继承&#xff0c;我们才可以创建实现父类中抽象方法的子类。那么&#xff0c;是什么规则在支配着这种特殊的继承用法呢&#xff1f;最佳的继承层次的特征又是什么呢&#xff1f;在什么情况下会使我们创建的…

Python中的copy和deepcopy

一、定义 浅拷贝&#xff1a;创建一个新的对象&#xff0c;不拷贝内部子对象&#xff0c;只拷贝子对象的引用。这意味着&#xff0c;如果原对象的子对象发生变化&#xff0c;拷贝后的对象也会受到影响。 深拷贝&#xff1a;创建一个新的对象&#xff0c;并递归地拷贝原对象的所…

删除这4个文件夹,流畅使用手机无忧

在现代社会中&#xff0c;手机已经成为我们生活中不可或缺的一部分。然而&#xff0c;随着使用时间的增长&#xff0c;我们可能会遇到手机卡顿和内存不足的问题&#xff0c;让我们感到十分困扰。手机卡顿不仅影响使用体验&#xff0c;还可能导致应用程序运行缓慢&#xff0c;甚…

简单高效,教你如何制作食品小程序商城

食品行业的发展越来越繁荣&#xff0c;为了满足人们对食品的需求&#xff0c;许多商家都开始转向线上销售。而制作一个食品小程序商城&#xff0c;不仅可以提高销售效率&#xff0c;还可以增加用户粘性。下面&#xff0c;我们就来详细介绍如何制作食品小程序商城。 首先&#x…

python日志logging的用法

python日志看起比较简单&#xff0c;要用起来稍微有点复杂&#xff0c;基础用法网上也介绍得比较多&#xff0c;下面就最近遇见的问题&#xff0c;作一个简单的介绍。就是在两个以上的python文件中要记录日志&#xff0c;怎么才能实现在一个地方配置&#xff0c;多个地方使用的…

11.函数递归与迭代

递归与迭代 1.什么是递归&#xff1f;2.递归的限制条件3.递归举例3.1 求n的阶乘3.2 顺序打印一个整数的每一位 4.递归与迭代4.1 求第n个斐波那契数&#xff08;递归 不推荐&#xff09;4.2 求第n个斐波那契数&#xff08;迭代 推荐&#xff09;4.3 总结 1.什么是递归&#xff1…

奥威BI—数字化转型首选,以数据驱动企业发展

奥威BI系统BI方案可以迅速构建企业级大数据分析平台&#xff0c;可以将大量数据转化为直观、易于理解的图表和图形&#xff0c;推动和促进数字化转型的进程&#xff0c;帮助企业更好地了解自身的运营状况&#xff0c;及时发现问题并采取相应的措施&#xff0c;提高运营效率和质…

使用socket实现UDP版的回显服务器

文章目录 1. Socket简介2. DatagramSocket3. DatagramPacket4. InetSocketAddress5. 实现UDP版的回显服务器 1. Socket简介 Socket&#xff08;Java套接字&#xff09;是Java编程语言提供的一组类和接口&#xff0c;用于实现网络通信。它基于Socket编程接口&#xff0c;提供了…

【测试学习五】测试类型的划分(重点:白盒与黑盒测试)

目录 一、测试类型的分类 1、按测试对象划分 2、是否查看代码划分&#xff08;重点&#xff09; &#x1f337;&#xff08;1&#xff09;黑盒测试 &#x1f337;&#xff08;2&#xff09;白盒测试 &#x1f337;&#xff08;3&#xff09;灰盒测试 3、按照开发阶段划…

JVM分析工具JProfiler介绍及安装

目录 一、什么是JProfiler&#xff1f; 二、JProfiler 功能结构 1、分析代理 2、记录数据 3、快照 三、安装 一、什么是JProfiler&#xff1f; JProfiler是一个专业的工具&#xff0c;用于分析运行中的JVM内部发生的事情。当您的生产系统出现问题时&#xff0c;您可以…

FileZilla Server同时共享多个目录(手把手教你使用FileZilla Server同时设置多个目录)

网上的基本全是一句话带过怎么共享多个目录&#xff0c;没图很烦&#xff0c;所以我自己就写一个过程 目录 1、创建ftp用户并设置密码 1.1、进入用户管理 1.2、新建用户 1.3、设置密码 2、添加共享的目录 2.1、选择用户添加目录 2.2、给予用户访问权限 2.2.1、客户端访…

小程序服务器配置多大够用?

​  了解小程序服务器的大小和要求对于确保小程序的高效运行非常重要。下面将介绍小程序服务器的大小和要求&#xff0c;帮助您选择合适的服务器。 服务器费用 服务器费用因服务器类型、配置和带宽等因素而异。一般而言&#xff0c;小型小程序服务器的年费用在500元至2000元之…

SpringCloud之微服务API网关Gateway介绍

文章目录 1 微服务API网关Gateway1.1 网关简介1.2 Spring Cloud Gateway介绍1.3 Gateway特性1.4 Gateway核心概念1.4.1 路由1.4.1.1 定义1.4.1.2 动态路由 1.4.2 断言1.4.2.1 默认断言1.4.2.2 自定义Predicate 1.4.3 过滤器1.4.3.1 默认过滤器1.4.3.2 自定义Filter&#xff08;…

2023年第三届工业自动化、机器人与控制工程国际会议 | IET独立出版 | EI检索

会议简介 Brief Introduction 2023年第三届工业自动化、机器人与控制工程国际会议&#xff08;IARCE 2023&#xff09; 会议时间&#xff1a;2023年10月27 -30日 召开地点&#xff1a;中国成都 大会官网&#xff1a;www.iarce.org 2023年第三届工业自动化、机器人与控制工程国际…

【DMA】认识 DMA 及其工作流程

DMA&#xff08;Direct Memory Access&#xff09;&#xff0c;字面意思“直接访问内存”&#xff0c;无需 CPU 干预直接读写内存。传统CPU读写数据时&#xff0c;需要先将要使用的数据保存到 RAM&#xff0c;等要用时再从RAM 加载。 目录 一、传统CPU存取数据 二、认识DMA …

安防视频监控汇聚平台EasyCVR接入Ehome告警,公网快照不显示是什么原因?

智能视频监控汇聚平台TSINGSEE青犀视频EasyCVR可拓展性强、视频能力灵活、部署轻快&#xff0c;可支持的主流标准协议有国标GB28181、RTSP/Onvif、RTMP等&#xff0c;以及支持厂家私有协议与SDK接入&#xff0c;包括海康Ehome、海大宇等设备的SDK等&#xff0c;视频监控管理平台…

openCV图像读取和显示

文章目录 一、imread二、namedWindow三、imshow #include <opencv2/opencv.hpp> #include <iostream>using namespace std; using namespace cv;int main(int argc,char** argv) {cv::Mat img imread("./sun.png"); //3通道 24位if (img.empty()) {std:…

App自动化测试|dom结构和元素定位方式

先来看几个名词和解释&#xff1a; dom: Document Object Model 文档对象模型 dom应用: 最早应用于html和js的交互。界面的结构化描述&#xff0c; 常见的格式为html、xml。核心元素为节点和属性 xpath: xml路径语言&#xff0c;用于xml 中的节点定位&#xff0c;XPath 可在 x…

ABAP 自定义搜索功能 demo1

ABAP 自定义搜索功能 demo1 效果&#xff1a; 双击选中行则为选中对应发票 实现 1定义 定义屏幕筛选参数 SELECTION-SCREEN BEGIN OF SCREEN 9020. SELECT-OPTIONS:s1_belnr FOR rbkp-belnr, s1_gjahr FOR rbkp-gjahr, s1_lifnr FOR rbkp-lifnr, s1_erfna FOR rbkp-erfnam, …