Vitis高层次综合学习——FPGA

news2025/1/17 13:56:48

高层次综合

什么是高层次综合?就是使用高级语言(如C/C++)来编写FPGA算法程序。
在高层次综合上并不需要制定微架构决策,如创建状态机、数据路径、寄存器流水线等。这些细节可以留给 HLS 工具,通过提供输入约束(如时钟速度、性能编译指示、目标器件等)即可生成经过最优化的 RTL。
其主要优势为:
1、提高FPGA算法部署的效率
(1)使用C语言来开发和确认FPGA算法;
(2)使用C语言来仿真RTL设计。
2、算法易于移植。

Vivado 和 HLS

Vitis HLS 工具会将 C 或 C++ 函数综合到 RTL 代码中,以便在 Versal 自适应 SoC、Zynq MPSoC 或 AMD FPGA 器件的可编程逻辑 (PL) 区域内实现。Vitis HLS 与 Vivado Design Suite 紧密集成用于综合与布局布线,并与 Vitis 核开发套件紧密集成用于异构系统级别设计和应用加速。
HLS能够降顺序执行的C语言程序转为并行执行。
如下面的例子:

#include <vector>
#include <iostream>
#include <ap_int.h>
#include "hls_vector.h"
#define totalNumWords 512
unsigned char data_t;
int main(int, char**) {
// initialize input vector arrays on CPU
	for (int i = 0; i < totalNumWords; i++) {
	in[i] = i;
}
compute(data_t in[totalNumWords], data_t Out[totalNumWords]);
	check_results();	
}
void compute (data_t in[totalNumWords ], data_t Out[totalNumWords ]) {
	data_t tmp1[totalNumWords], tmp2[totalNumWords];
	A: for (int i = 0; i < totalNumWords ; ++i) {
		tmp1[i] = in[i] * 3;
		tmp2[i] = in[i] * 3;
	}
	B: for (int i = 0; i < totalNumWords ; ++i) {
		tmp1[i] = tmp1[i] + 25;
	}
	C: for (int i = 0; i < totalNumWords ; ++i) {
		tmp2[i] = tmp2[i] * 2;
	}
	D: for (int i = 0; i < totalNumWords ; ++i) {
		out[i] = tmp1[i] + tmp2[i] * 2;
	}
}

上面的C语言代码在CPU中按顺序执行,当然也可以在FPGA中顺序执行,但是这样就没有发挥FPGA的优势。compute() 函数需重构,以实现基于 FPGA 的加速。
加速有以下方向:
1、compute 函数可先启动,随后再将所有数据传递给它;
2、多个 compute 函数能以重叠方式运行,例如,“for”循环能够在上一次迭代完成前启动下一次迭代;
3、“for”循环内的各项操作都能在多个码字上并发运行,无需逐字执行。

compute() 函数循环 A 将输入值乘以 3,并创建两条独立路径,分别是 B 和 C。循环 B 和 C 执行操作并将数据馈送给 D。这是一种现实状况的简单表示法,您需在其中逐一执行多项任务,这些任务彼此相连形成如下所示网络。
在这里插入图片描述

#include "diamond.h"
#define NUM_WORDS 16
extern "C" {
void diamond(vecOf16Words* vecIn, vecOf16Words* vecOut, int size)
{
	hls::stream<vecOf16Words> c0, c1, c2, c3, c4, c5;
	assert(size % 16 == 0);
	#pragma HLS dataflow
	load(vecIn, c0, size);
	compute_A(c0, c1, c2, size);
	compute_B(c1, c3, size);
	compute_C(c2, c4, size);
	compute_D(c3, c4,c5, size);
	store(c5, vecOut, size);
}}
void load(vecOf16Words *in, hls::stream<vecOf16Words >& out, int size)
{
	Loop0:
	for (int i = 0; i < size; i++)
	{
	#pragma HLS PERFORMANCE target_ti=32
	#pragma HLS LOOP_TRIPCOUNT max=32
	out.write(in[i]);
}
}
void compute_A(hls::stream<vecOf16Words >& in, hls::stream<vecOf16Words >&
out1, hls::stream<vecOf16Words >& out2, int size)
{
	Loop0:
	for (int i = 0; i < size; i++)
	{
	#pragma HLS PERFORMANCE target_ti=32
	#pragma HLS LOOP_TRIPCOUNT max=32
	vecOf16Words t = in.read();
	out1.write(t * 3);
	out2.write(t * 3);
	}
}
void compute_B(hls::stream<vecOf16Words >& in, hls::stream<vecOf16Words >&
out, int size)
{
	Loop0:
	for (int i = 0; i < size; i++)
	{
	#pragma HLS PERFORMANCE target_ti=32
	#pragma HLS LOOP_TRIPCOUNT max=32
	out.write(in.read() + 25);
	}
}
void compute_C(hls::stream<vecOf16Words >& in, hls::stream<vecOf16Words >&
out, int size)
{
	Loop0:
	for (data_t i = 0; i < size; i++)
	{
	#pragma HLS PERFORMANCE target_ti=32
	#pragma HLS LOOP_TRIPCOUNT max=32
	out.write(in.read() * 2);
	}
}
void compute_D(hls::stream<vecOf16Words >& in1, hls::stream<vecOf16Words >&
in2, hls::stream<vecOf16Words >& out, int size)
{
	Loop0:
	for (data_t i = 0; i < size; i++)
	{
	#pragma HLS PERFORMANCE target_ti=32
	#pragma HLS LOOP_TRIPCOUNT max=32
	out.write(in1.read() + in2.read());
	}
}
void store(hls::stream<vecOf16Words >& in, vecOf16Words *out, int size)
{
	Loop0:
	for (int i = 0; i < size; i++)
	{
	#pragma HLS PERFORMANCE target_ti=32
	#pragma HLS LOOP_TRIPCOUNT max=32
	out[i] = in.read();
	}
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/884946.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

ATX

导航 (返回顶部) 1. ATX (Advanced Technology Extended)2. 主板3. 电源 3.1 主要版本简表3.2 更换电源需要考虑的问题3.3 电源效率3.4 80 Plus 4. 退役的电源 4.1 24pin主供电接口4.2 12v的CPU供电接口4.3 12v的PCI-E供电接口4.4 SATA电源接口4.5 D型大4pin接口 1. ATX (Adv…

Android Studio Giraffe控制台乱码

这几天在使用Android Studio Giraffe进行一个App的开发&#xff0c;在项目构建的时候&#xff0c;控制台输出中文都是乱码&#xff0c;看着很不爽&#xff0c;进行了两项配置&#xff0c;中文就可以正常输出了&#xff0c;看起来就爽多了。 第一个配置&#xff1a;点击Help菜单…

冠达管理:A股利好!国家队最新出手!拜登紧急发声

号称“国家队”的大基金二期最新出手。 8月15日晚间&#xff0c;华润微公告&#xff0c;子公司润鹏半导体拟增资扩股并引进大基金二期等外部出资者&#xff0c;本次买卖完成后&#xff0c;润鹏半导体注册资本将由24亿元添加至150亿元。其间&#xff0c;大基金二期持股份额将达2…

uni-app根据经纬度逆解析详细地址

uni-app中的getLocation()方法可以获取到用户当前的地理位置&#xff08;经纬度&#xff09;、速度。 但是返回参数中的address在app中才会显示&#xff0c;小程序中不会显示&#xff0c;所以我们需要进行逆解析其地址&#xff0c;解析出它的地址信息。 1.首先要在腾讯位置服务…

解决多模块内核心模块有接口打包成jar后被依赖并调用遇到的问题(springcloud集成ruoyi.quartz)

项目准备开发个新功能&#xff0c;刚好很喜欢ruoyi写的任务调度&#xff0c;因此想到了集成ruoyi.quartz模块 &#xff0c;遇到了很多问题: 首先因为ruoyi.quartz模块依赖了ruoyi.common模块&#xff0c;因此第一步我需要把common模块一部分依赖项复制到了quartz模块内&#xf…

查看端口号被应用程序占用

打开资源监视器 找到被占用的端口&#xff0c;记住她的PID 打开任务管理器 把占用端口的程序关掉

SAP LTMC 批导创建物料

LTMC这个事务代码是HANA 版本的LSMW。其实就是一个批导工具 我们来用LTMC 来做一下物料的期初批导 1.首先在GUI中输入T-CODE &#xff1a; LTMC 2.输入你的账号密码和客户端之后会进入这个界面 3.点击CREATE 4.在下图框中的位置选择我们要进行的任务 5.download template 6.…

第六章:用FATE从零实现纵向线性回归

第六章 用FATE从零实现纵向线性回归 6.1 数据集的获取与描述6.2纵向数据集切分6.3 纵向联邦训练6.3.1 数据输入6.3.2 样本对齐6.3.3 模型训练 6.4 模型评估 代码 本章利用FATE从零开始实现一个简单的纵向线性回归模型&#xff0c;本章以实验为主。 与第5章一样&#xff0c;本章…

GEWE框架 ipad协议

GEWE框架 是一套完整的的第三方服务平台&#xff0c;包含微信API服务、企微API服务、SCRM系统定制、企微系统定制、服务类软件定制等模块&#xff0c;本文档主要讲述个微API服务相关&#xff0c;以下简称API&#xff0c;它能处理用户微信中的各种事件&#xff0c;提供了开发者…

使用VSCode的 Dev Containers 插件搭配Docker 容器进行开发环境的搭建

需要安装插件 https://marketplace.visualstudio.com/items?itemNamems-vscode-remote.remote-containers 安装Docker 这样做的好处 每一个项目可以运行一个容器&#xff0c;在容器内开发&#xff0c;相关之间node环境隔离&#xff0c;彻底解决本地包版本依赖关错乱问题共用…

日精注塑机联网

不改造程序的话&#xff0c;日精支持输出CSV和txt数据作为其他软件的接口。 改造后可以支持63协议。 在软件层面日精也有专用的软件&#xff0c;可以看到其实设备厂家提供的软件功能已经非常丰富了&#xff0c;但这类软件最大的缺点是只能自己家的机器使用&#xff0c;要想其他…

基于Pytorch构建AlexNet网络对cifar-10进行分类

AlexNet网络是CV领域最经典的网络结构之一了&#xff0c;在2012年横空出世&#xff0c;并在当年夺下了不少比赛的冠军。也是在那年之后&#xff0c;更多的更深的神经网络被提出&#xff0c;比如优秀的vgg,GoogLeNet。AlexNet和LeNet的设计非常类似&#xff0c;但AlexNet的结构比…

获取通达信股票代码接口--通达信逐笔接口(一)

通达信逐笔接口也是能获取股票的逐笔交易数据&#xff0c;但需要提前通达信逐笔接口提前安装通达信软件系统&#xff0c;打开相关的数据权限或者接口使用权限才能执行。一般执行步骤&#xff1a; 1. 初始化接口&#xff1a;在代码中引入相关的库文件并初始化获取通达信股票代码…

每日一题 24两两交换链表中的节点

题目 给你一个链表&#xff0c;两两交换其中相邻的节点&#xff0c;并返回交换后链表的头节点。你必须在不修改节点内部的值的情况下完成本题&#xff08;即&#xff0c;只能进行节点交换&#xff09;。 示例 1&#xff1a; 输入&#xff1a;head [1,2,3,4] 输出&#xff1a…

数据暴涨时代,该如何数据治理?_光点科技

随着信息技术的迅猛发展&#xff0c;数据已经成为现代社会的核心资源。在这个被称为"数据暴涨时代"的时代里&#xff0c;大量的数据源源不断地被产生和积累&#xff0c;但如何有效地管理、分析和利用这些数据成为了一个迫切需要解决的问题。数据治理&#xff0c;作为…

【JVM】如何判定一个对象已死以及“标记-清除”、“标记-复制”、“标记-整理”三种垃圾收集算法

文章目录 0、如何判定一个对象的生死&#xff1f;1、上文提到的引用又是什么1、强引用&#xff1a;2、软引用&#xff1a;3、弱引用&#xff1a;4、虚引用&#xff1a; 2、垃圾收集算法1、标记-清除2、标记-复制优化&#xff1a;&#x1f447; 3、标记-整理 0、如何判定一个对象…

2023雷军年度演讲听后感

&#xff08;点击即可收听&#xff09; 2023雷军年度演讲-文字完整版 2023年8月14号晚,雷军的第四次演讲,热些沸腾 相比前三次演讲,第一次在2020 年 8 月 11 日&#xff0c;以“相信自己&#xff0c;一往无前”为主题进行了分享&#xff0c;第二次,第三次分别是在2021 年和 202…

node 版本与 node-sass node-loader 版本的对应关系

node 版本与 node-sass 版本的对应关系&#xff1a; 其一、查看文档的地址&#xff1a; https://www.npmjs.com/package/node-sass 其二、对应关系的表格&#xff1a; 对应版本 node16 “node-sass”: “6.0.1” “sass-loader”: “10.2.0” node: v14.19.0; node-sass: ^4…

【js】js中apply()、bind()、call()用法

这三个方法的作用基本上相同&#xff0c;用法上有一些不同&#xff0c;下面先对比一下它们的用法&#xff1a; apply&#xff1a;调用一个具有给定 this 值的函数&#xff0c;以及以一个数组&#xff08;或一个类数组对象&#xff09;的形式提供的参数。 语法&#xff1a; ap…

allure相关笔记

allure.epic&#xff1a;最高级别的分类&#xff0c;表示一个大的功能、模块或业务场景。功能模块 allure.feature&#xff1a;表示一个功能模块或业务子场景&#xff0c;位于史诗下。主流程 allure.story&#xff1a;表示一个具体的测试场景&#xff0c;位于特性下。具体主流程…