HLS入门实现一个led灯的闪烁

news2024/11/24 13:05:28

文章目录

  • 前言
  • 一、HLS是什么?与VHDL/Verilog编程技术有什么关系?
    • 1、HLS简介
    • 2、开发流程
    • 3、HLS与VHDL/Verilog编程技术有什么关系?
  • 二、2. HLS有哪些关键技术问题?目前存在什么技术局限性?
    • 1.关键技术问题
    • 2、技术局限性
  • 三、使用 HLS 完成 led 灯闪烁
    • 1、新建工程
    • 2、添加C文件
    • 3、进行C仿真与综合
    • 4、联合仿真
    • 5、补充(位自定义)
    • 6、Modelsim查看信号
    • 7、导出 HLS 工程生成的 IP 核
    • 8、创建 Vivado 工程并导入 HLS 生成的 IP 核
    • 9、将 HLS 产生的 IP 添加到工程当中
  • 四、上板验证
  • 五、总结
  • 六、参考资料


前言

环境:
vivado 2018.3
vscode


一、HLS是什么?与VHDL/Verilog编程技术有什么关系?

1、HLS简介

HLS(High-Level Synthesis),HLS是高层次综合的简称,至于层次的理解。一般分为系统级、算法级、RTL级、门级,开关级。

一般认为RTL级及以下设计是可用的,“层次”即从什么角度去描述想要实现的功能。譬如,a xor b采用门级描述就是a,b是一个异或门的输入;而采用高一点层次描述就是a+b。显然,越低层次的描述越困难

HLS就是从高层次描述,之后综合成可用的网表文件的技术。这里的“高”指采用C、C++等编写程序,而不是传统的HDL语言。然而,实际上Vivado套件中是预先采用Vivado HLS这个软件将C程序转换成为Verilog HDL或者VHDL代码,之后进行下一步操作的,并不是直接综合C代码。

对比:传统的 FPGA 开发,首先写 HDL 代码,然后做行为仿真,最后做综合、时序分析等,最后生成可执行文件下载到 FPGA 使用,开发周期比较漫长。使用 HLS,用高级语言开发可以提高效率。因为在软件中调试比硬件快很多,在软件中可以很容易的实现指定的功能,而且做 RTL仿真比软件需要的时间多上千倍。

2、开发流程

在这里插入图片描述
在这里插入图片描述

可以看到Vivado HLS设计输入包括三部分:C算法描述文件、C算法仿真文件和Directives文件。最终输出结果以IP、DCP或SysGen模型的形式存在。

3、HLS与VHDL/Verilog编程技术有什么关系?

RTL(寄存器传输级别,基于 VHDL/Verilog 语言)逐步发展,但 VLSI 系统的复杂性呈指数级增长,使 RTL 设计和验证过程成为生产力的瓶颈。HLS(高级综合)通过提高抽象级别, 可以减少最初的设计工作量,设计人员可以集中精力描述系统的行为,而不必花费时间来实现微体系结构的细节,且验证被加速、设计空间探索(DSE)更快、定位新平台非常简单、软件工程师可以访问 HLS 等这些好处加在一起,减少了设计和验证时间,降低了开发成本,并降低了进行硬件项目的门槛,因此缩短了产品上市时间,并且在异构系统上使用硬件加速已成为更具吸引力的选择。但是在结果质量(QoR)上,HLS 工具还落后于 RTL。

二、2. HLS有哪些关键技术问题?目前存在什么技术局限性?

1.关键技术问题

1、字长分析与优化:
FPGA 的一个最主要特点就是可以使用任意字长的数据通路和运算。因此,FPGA 的 HLS 工具不需要拘泥于某种固定长度的表达方式,而可以对设计进行全局或局部的字长优化,从而达到性能提升和面积缩减的双重效果。

2、循环优化:
循环优化一直是 HLS 优化方法的研究重点和热点。一个流行的循环优化方法,多面体模型的应用非常广泛,在 HLS 里主要被用来将循环语句以空间多面体表示,然后根据边界约束和依赖关系,通过几何操作进行语句调度,从而实现循环的变换。

3、与Verilog相比,能做到的优化十分有限:
在这里插入图片描述

2、技术局限性

1、难以预测最终性能及资源利用率:
HLS编译器是静态工具,对理解代码的动态特性没有任何帮助。HLS编译器的行为通常难以预测最终的性能和资源利用率。

2、HLS实现简单逻辑较为臃肿:
对于一些简单的逻辑,HLS实现结果较为臃肿。一些简单的逻辑,用HDL实现只需要数十行代码,而HLS的实现结果却相当复杂。

3、HLS对开发人员要求较高:
HLS对开发人员的要求比较高。HLS使用的语言显然不是标准C/C++语言,应该是扩展类C/C++语言。
HLS更适合于已经有现成的、高质量的C算法代码,这时候急需在FPGA上去映射成硬件,非常高效,但是对于有经验的verilog手写设计者,HLS综合工具有时候用得非常麻烦。设计者明知道一个方案是可行的,但是就想不到如何让HLS把C代码变成自己设想的电路。

三、使用 HLS 完成 led 灯闪烁

1、新建工程

  • 打开Vivado HLS并新建一个工程:

在这里插入图片描述

  • 设置工程名及路径:
    在这里插入图片描述
  • 选择器件:

在这里插入图片描述
在这里插入图片描述

2、添加C文件

  • 添加源文件:

右键 Source,点击 New file,在弹出的窗口中,选中我们存放源码的目录后。新建一个 led.cpp 文件和led.h头文件。

在这里插入图片描述

  • 头文件代码:
#ifndef _SHIFT_LED_H_
#define _SHIFT_LED_H_
#define CNT_MAX 100000000
//#define CNT_MAX 100
#define FLASH_FLAG CNT_MAX-2
typedef int led_t;
typedef int cnt_t;
void flash_led(led_t *led_o , led_t led_i);
#endif
  • 源文件代码:
#include "led.h"
void flash_led(led_t *led_o , led_t led_i){
cnt_t i;
for(i=0;i<CNT_MAX;i++){
if(i==FLASH_FLAG){
*led_o = ~led_i;
}
}
}
  • 添加C仿真文件:

右键 Test Bench,选择添加新建文件,在弹出窗口新建一个 test_led.cpp。

在这里插入图片描述

  • C仿真代码:
#include "led.h"
#include <stdio.h>
int main(){
led_t led_i=0x01;
led_t led_o;
const int SHIFT_TIME = 4;
int i;
 for(i=0;i<SHIFT_TIME;i++){
 flash_led(&led_o , led_i);
 led_i = led_o;
 printf("shift_out is %d \n",(int)(led_o&0x01));
 }
 }

3、进行C仿真与综合

  • 设置顶层文件:

点击 project >选择project seethings>选择 synthesis>browser>选择 flash_led 作为顶层函数

在这里插入图片描述
在这里插入图片描述

  • 然后点击 project >Run C simulation进行仿真:
    在这里插入图片描述

在 Console 窗口中,我们可以看到输出的结果时 01 交替变化,证明 C 仿真的结果正确。

  • 点击 Solution>Run C Synthesis >Active Solution进行C综合:

编译器会将 C++代码映射到 RTL 电路

在这里插入图片描述

在 C 综合后的结果中,我们可以查看所占用的资源,设计所需的 Latency,和接口的类型等等。Timing 和 Latency 报告:其中 Latency 指的是,设计电路完成一次任务需要的时间,Interval 指的是两次任务之间的时间间隔。C 综合后的结果还包含许多信息,这里不一 一进行介绍。

  • C综合后生成的Verilog 代码

在这里插入图片描述

4、联合仿真

我们可以通过C/RTL联合仿真来验证映射出来的RTL电路是否正确。需要注意的是Vivado HLS会利用我们的C Testbench 自动生成Verilog Testbench,同时,联合仿真结束过后,我们可以通过使用 Vivado 或者 Modelsim 来查看仿真波形。

  • 点击 Solution > Run C/RTL Cosimulation进行联合仿真:
    在这里插入图片描述
  • 仿真结果:

在这里插入图片描述

在联合仿真时我们也可以观察 Console 打印出来的结果,可以看到通过
C/RTL 联合仿真得到的结果与在 C 仿真时得到的结果一致,仿真通过。

5、补充(位自定义)

对于这个 led 灯闪烁实验,我们可以看到,只需要 1bit 数据位宽就能表示这个变量,而在本次是实验中,我们还是采用的 int 类型来定义的这个数据,从 C 综合 的结果来看,输入的 led_i 和输出的 led_o 仍然是 32 位位宽的。那么 HLS 中有没有办法实现像 FPGA 开发中那样,实现自定义的位宽呢?答案是可以的,接下来,就来对设计进行更改,完成自定义位宽的输入输出。

  • 引入ap_int.h头文件,修改后的头文件如下:
#ifndef _SHIFT_LED_H_
#define _SHIFT_LED_H_
#include "ap_int.h"
#define CNT_MAX 100000000
//#define CNT_MAX 100
#define FLASH_FLAG CNT_MAX-2
// typedef int led_t;
// typedef int cnt_t;
 typedef ap_int<1> led_t;
 typedef ap_int<32> cnt_t;
 void flash_led(led_t *led_o , led_t led_i);
 #endif
  • 对源文件中的函数添加 Directive,来确定接口的类型:
    在这里插入图片描述
  • 分别对输出信号 led_o 进行约束,在 Directive 窗口中右键选中 led_o,led_i选中插入 Directive:
    在这里插入图片描述
    在弹出的窗口进行相应选择
  • led_o:
    在这里插入图片描述
  • led_i:
    在这里插入图片描述
  • 约束成功后代码发生变化:
    在这里插入图片描述
  • 仿真结果依旧正确:
    在这里插入图片描述
  • 综合结果:
    在这里插入图片描述

通过改变数据类型为自定义位宽后,综合生成所需要的触发器与查找表都减少了。

在这里插入图片描述

添加 directive 后综合的接口信号,HLS 已经为输入输出信号添加上了输入输出的有效标志。这样,我们再将来调用这个 IP 的时候,就能够控制它的时序。

最后我们在进行一次联合仿真就进入下一步。

6、Modelsim查看信号

  • Modelsim打开wlf文件观察波形:

具体的路径是 Solution/sim/verilog/flash_led.wlf

在这里插入图片描述

  • 右击选择add wave将定成模块的信号添加到波形窗口:

在这里插入图片描述

  • 波形图:

在这里插入图片描述

我们可以观察到输出输入输入输出信号,和其他一些信号,其中需要重
点关注的信号是上面 C 综合后生成的那些信号。

7、导出 HLS 工程生成的 IP 核

在这里插入图片描述

  • 报错信息:
    在这里插入图片描述

修改系统的时间为2021年之前再次导出即可成功。

8、创建 Vivado 工程并导入 HLS 生成的 IP 核

这里省略了创建Vivado 工程的步骤。

  • 点击 settings:

在这里插入图片描述

  • 然后点击 IP,选中仓库,再点击+号进行添加由 HLS 生成的 IP:

在这里插入图片描述

  • 定位到前面的Solution,选择后系统会自动识别:
    在这里插入图片描述
  • 点击apply>ok添加到仓库:

在这里插入图片描述

  • 验证 HLS 生成的 IP 是否被导入到 Vivado IP 仓库:
    在这里插入图片描述

IP添加成功。

9、将 HLS 产生的 IP 添加到工程当中

  • 双击IP后点击ok生成该IP:
    在这里插入图片描述
  • 向工程中添加一个新的文件,用于完成本次实验,点击 Add file:
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
  • led.v文件:
`timescale 1ns / 1ps
module led(
input wire clk ,
input wire rst_n ,
output wire led_o
);

wire rst ;//同步复位
wire ap_ready ;//当前可以接收下一次数据
 reg ap_start ;//IP 开始工作
 reg led_i_vld ;//输入数据有效
 wire led_o_vld ;
 reg led_i ;//输入的 led 信号
 wire led_o_r ;
 wire ap_done ;
 wire ap_idle ;
 reg [1:0] delay_cnt ;
 assign rst = ~rst_n ;
assign led_o = led_o_r ;

//----------------delay_cnt--------------
always @(posedge clk) begin
if (rst==1'b1) begin
delay_cnt <= 'd0;
end
else if(delay_cnt[1]==1'b0) begin
delay_cnt <= delay_cnt + 1'b1;
end
end

//----------------ap_start---------------
always @(posedge clk) begin
if (rst==1'b1) begin
ap_start <= 1'b0;
end
else if(delay_cnt[1]==1'b1)begin
ap_start <= 1'b1;
end
end

//----------------led_i_vld--------------
always @(posedge clk) begin
if (rst==1'b1) begin
led_i_vld <= 1'b0;
end
else if(delay_cnt[1]==1'b1)begin
led_i_vld <= 1'b1;
end
end

//----------------ap_i------------------
always @(posedge clk) begin
if (rst==1'b1) begin
led_i <= 1'b0;
end
else if(led_o_vld==1'b1)begin
led_i <= led_o_r ;
end
end


flash_led_0 inst_flash_led (
.led_o_V_ap_vld(led_o_vld), // output wire led_o_V_ap_vld
.led_i_V_ap_vld(led_i_vld), // input wire led_i_V_ap_vld
.ap_clk(clk), // input wire ap_clk
.ap_rst(rst), // input wire ap_rst
.ap_start(ap_start), // input wire ap_start
.ap_done(ap_done), // output wire ap_done
.ap_idle(ap_idle), // output wire ap_idle
.ap_ready(ap_ready), // output wire ap_ready
.led_o_V(led_o_r), // output wire [0 : 0] led_o_V
.led_i_V(led_i) // input wire [0 : 0] led_i_V
);
endmodule

  • 添加约束文件:

  • 创建一个top_pin.xdc约束文件:

##############LED define################## 
set_property PACKAGE_PIN P15 [get_ports {led_o}]
set_property IOSTANDARD LVCMOS33 [get_ports {led_o}]
##############Reset define################## 
set_property PACKAGE_PIN P16 [get_ports {rst_n}]
set_property IOSTANDARD LVCMOS33 [get_ports {rst_n}]
##############50M CLK define################## 
create_clock -period 20.000 -name clk -waveform {0.000 10.000} [get_ports clk]
set_property PACKAGE_PIN N18 [get_ports {clk}]
set_property IOSTANDARD LVCMOS33 [get_ports {clk}]
  • 像前面一样添加即可:

在这里插入图片描述

四、上板验证

  • 点击生成bit 流文件:

在这里插入图片描述

  • 生成完成:

在这里插入图片描述

生成bit流后,等待一段时间出现这个弹窗说明生成成功。选择第三个打开硬件管理器。

  • 点击open target :
    在这里插入图片描述
  • Hardware 中有设备显示就说明我们已经连接成功:
    在这里插入图片描述
  • 点击Program device进行烧录:

在这里插入图片描述

  • 点击Program完成下载:
    在这里插入图片描述
  • 效果:

led闪烁


五、总结

此次学习,完成了通过HLS封装一个IP并将他应用到Vivado项目里,实现用高级语言来进行综合,进而映射到RTL电路,最后实现通过软件语言来实现控制硬件。此次原理较为简单,但是步骤繁多需要仔细操作。

六、参考资料

图解Vivado HLS设计流程
HLS编程环境入门
HLS编程环境入门

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/530397.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

第十二章创建模式—享元模式

文章目录 享元模式概述结构 实例优缺点和使用场景使用场景JDK源码解析 结构型模式描述如何将类或对象按某种布局组成更大的结构&#xff0c;有以下两种&#xff1a; 类结构型模式&#xff1a;采用继承机制来组织接口和类。 对象结构型模式&#xff1a;釆用组合或聚合来组合对象…

渗透测试--2.漏洞探测和利用

目录 一.漏洞分类 二.漏洞探测 三.漏洞利用 四.漏洞扫描 1.Nessus 2.Web应用漏洞扫描器——DVWA 五.Metasploit漏洞利用 一.漏洞分类 网络漏洞 系统漏洞 应用漏洞 人为不当配置 二.漏洞探测 渗透测试是一种测试网络、应用程序和系统安全性的方法&#xff0c;旨在发现…

Xilinx FPGA DDR3设计(三)DDR3 IP核详解及读写测试

引言&#xff1a;本文我们介绍下Xilinx DDR3 IP核的重要架构、IP核信号管脚定义、读写操作时序、IP核详细配置以及简单的读写测试。 01.DDR3 IP核概述 7系列FPGA DDR接口解决方案如图1所示。 图1、7系列FPGA DDR3解决方案 1.1 用户FPGA逻辑&#xff08;User FPGA Logic&#…

玩转Google开源C++单元测试框架Google Test系列(gtest)之七 - 深入解析gtest

一、前言 “深入解析”对我来说的确有些难度&#xff0c;所以我尽量将我学习到和观察到的gtest内部实现介绍给大家。本文算是抛砖引玉吧&#xff0c;只能是对gtest的整体结构的一些介绍&#xff0c;想要了解更多细节最好的办法还是看gtest源码&#xff0c;如果你看过gtest源码…

麒麟操作系统软件更新灾难连篇之一:中文输入法消失

今天在麒麟操作系统开QQ总是过一会儿就闪退&#xff0c;于是进软件商店看看是否有更新。 真是不看不知道&#xff0c;一看吓一跳&#xff0c;居然有几十个软件更新&#xff0c;照常理&#xff0c;软件升级后应该是更加好用&#xff0c;于是先把QQ、五笔字型、搜狗输入法等几个常…

centos7.9搭建redis6.0.6哨兵模式

redis6.0.6哨兵模式搭建文档 1.准备工作1.1 ip规划安装依赖&#xff08;三台机器都操作&#xff09;1.3 gcc升级&#xff08;三台机器都操作&#xff09; 2.安装redis&#xff08;三台机器都操作&#xff09;2.1 获取安装包2.2 解压2.3 编译2.4 验证上一步是否正确2.5 安装2.6…

Windows10安装二进制Mysql-5.7.41和汉化

1.创建my.ini [mysqld] ##skip-grant-tables1 port 3306 basedirD:/webStudy/mysql-5.7.41 datadirE:/adata/mysqlData max_connections200 character-set-serverutf8 default-storage-engineINNODB sql_modeNO_ENGINE_SUBSTITUTION,STRICT_TRANS_TABLES [mysql] default-char…

Liunx基础命令 - which命令

which命令 – 查找命令文件 ​ which命令的功能是用于查找命令文件&#xff0c;能够快速搜索二进制程序所对应的位置。如果我们既不关心同名文件&#xff08;find与locate&#xff09;&#xff0c;也不关心命令所对应的源代码和帮助文件&#xff08;whereis&#xff09;&#…

C++中类的静态成员变量与静态成员函数

static声明为静态的&#xff0c;称为静态成员。 不管这个类创建了多少个对象&#xff0c;静态成员只有一个拷贝&#xff0c;这个拷贝被所有属于这个类的对象共享。 静态成员 属于类 而不是对象。 静态变量&#xff0c;是在编译阶段就分配空间&#xff0c;对象还没有创建时&…

ARM-栈帧(一)

ARM 栈帧 本系列均以 corter-A7(armv7-a) 为例 在 ARM 中&#xff0c;通常为满减栈&#xff08;Full Descending FD&#xff09;, 也就是说&#xff0c;堆栈指针指向堆栈内存中最后一个填充的位置&#xff0c;并且随着每个新数据项被压入堆栈而递减。 栈的本质 要理解栈的本…

二叉搜索树、AVL树、红黑树底层源码以及迭代器模拟实现,map/set的封装

这次给大家分享的还是关于二叉树部分的内容&#xff0c;之前的文章已经分享过一些二叉树的基础知识&#xff0c;如果不了解的朋友可以看看&#xff1a;二叉树以及堆和堆排序。普通的二叉树其实是没有什么实际的应用价值的&#xff0c;而map和set大家用过或者听过吗&#xff1f;…

Metasploit Framework(MSF)对Metasploitable2的渗透解析

简介 Metasploitable2虚拟系统是一个特殊的ubuntu操作系统&#xff0c;本身设计目的是作为安全工具测试和演示常见漏洞攻击的环境。 其中最核心是可以用来作为MSF攻击用的靶机。这样方便我们学习MSF框架的使用。 并且开放了很多的高危端口如21、23、445等&#xff0c;而且具有…

李薇:大模型时代的数据变革

Datawhale干货 作者&#xff1a;李薇&#xff0c;上海人工智能实验室 前言 今天&#xff0c;我将向那些希望深入了解大模型的同学们&#xff0c;分享一些关于大模型时代的数据变革的知识。作为上海人工智能实验室OpenDataLab的产品主管&#xff0c;我会介绍我们在开放数据和大…

大数据技术闲侃之岗位选择解惑

前言 写下这篇文章是因为五一节前给群友的承诺&#xff0c;当然按照以往的惯例&#xff0c;也是我背后看到的这个现象&#xff0c;我发现大部分同学在投递岗位的时候都是投递数据分析岗位&#xff0c;其实背后并不是很清楚背后的岗位是做啥的&#xff0c;想想我自己的工作生涯…

用户/用户组管理

用户管理 * useradd 命令添加用户&#xff0c;会在/etc/passwd生成用户信息&#xff0c;信息分为7列&#xff0c;被6个冒号隔开 第一列 username (login name) 第二列 密码&#xff0c;但是该列已经被移除&#xff0c;用x表示&#xff0c;密码信息已经存放在了/etc/shadow文…

Android以aar包形式引入hunter-debug,Java(3)

Android以aar包形式引入hunter-debug&#xff0c;Java&#xff08;3&#xff09; &#xff08;1&#xff09;首先把hunter的master分支代码拉下来&#xff0c;在本地编译&#xff0c; https://github.com/Leaking/Hunterhttps://github.com/Leaking/Hunter此过程主要目的是获得…

理解学习曲线:芯片工作中的平台价值和个人价值

作为一名芯片工程师&#xff0c;从毕业出到步入公司的第一天开始&#xff0c;需要完成一次明显的转变&#xff0c;随着工作的日益开展和项目推进&#xff0c;个人能力的也得到了潜移默化的提升&#xff0c;当我们回看个人的知识/技能成长的曲线时&#xff0c;可能会发现很多的发…

CMake:递归检查并拷贝所有需要的DLL文件

文章目录 1. 目的2. 设计整体思路多层依赖的处理获取 DLL 所在目录探测剩余的 DLL 文件 3. 代码实现判断 stack 是否为空判断 stack 是否为空获取所有 target检测并拷贝 DLL 4. 使用 1. 目的 在基于 CMake 构建的 C/C 工程中&#xff0c;拷贝当前工程需要的每个DLL文件到 Visu…

将nacos从本地切换到远程服务器上时报错:客户端端未连接,Client not connected

报错信息&#xff1a; 09:34:38.438 [com.alibaba.nacos.client.Worker] ERROR com.alibaba.nacos.common.remote.client - Send request fail, request ConfigBatchListenRequest{headers{charsetUTF-8, Client-AppNameunknown, Client-RequestToken65c0fbf47282ae0a7b85178…

android点击事件,跳转界面

Android 事件处理 1&#xff0c;采用在Activity中创建一个内部类定义点击事件 主要xml代码 <?xml version"1.0" encoding"utf-8"?> <LinearLayout xmlns:android"http://schemas.android.com/apk/res/android"xmlns:app"http:…