【GPGPU编程模型与架构原理】第二章 2.1 计算模型

news2025/1/13 7:58:58

  本章介绍以CUDA和OpenCL 并行编程中的一些核心架构概念来展示GPGPU的计算、编程和存储模型。本章还介绍虚拟指令集和机器指令集,逐步揭开GPGPU体系结构的面纱。

2.1 计算模型

计算模型是编程框架的核心,计算模型需要根据计算核心的硬件架构提取计算的共性工作方式。

作为首个GPGPU编程模型,CUDA 定义以主从方式结合SIMT 硬件多线程的计算方式。本节以典型的矩阵乘法为例介绍GPGPU所采用的计算模型。

2.1.1 数据并行和线程

在图形和其他应用中,大量数据具有良好的并行特性。这种数据的并行性使得处理器在计算过程中安全的对数据以一定的结构化方式同时进行操作。

典型例子就是矩阵乘法运算:结果矩阵中的每个元素的计算可以并行的进行。(每个元素都需要进行相同次数的点积运算)
在这里插入图片描述

基于矩阵乘法这一数据并行性,可以设计多个计算单元同时执行矩阵中的点积运算。在GPGPU中,承担并行计算中每个计算任务的计算单元成为线程。每个线程会在一次计算任务过程中,执行相同的指令。

1	从输入矩阵A和B中读取一部分向量a, b
2	for (i = 0; i < N; i++)
3		c += a[i] + b[i];
4	将c写回结果矩阵C的对应位置中

每个线程从从矩阵A 和矩阵B中选取对应的行或列构成向量a和向量b,然后执行向量点积运算,最终将输出结果c保存到矩阵C中。

CUDA和OpenCL的编程模型基于GPGPU架构特点,对SIMT计算模型进行了合理的封装。

  • CUDA引入了线程网格(thread grid)、线程块(thread block)、线程(thread);
  • OpenCL 引入了N维网络(NDRange)、工作组(work-group)、工作项(work-item)等概念,

可以将计算任务灵活的映射到GPGPU层次化的硬件执行单元实现高效的并行,提高了处理器的执行效率。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/19472.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

使用TinyPNG API压缩图片

使用TinyPNG API压缩图片 在撰写论文的时候&#xff0c;美观&#xff0c;大气&#xff0c;上档次的图标能够很好地给自己的论文加分&#xff0c;好的可视化结果也能够让审稿人赏心悦目。但是有时候在可视化图片的时候有可能原始图像过大从而很占内存&#xff1b;这时候就希望能…

Python+Numpy+CV2/GDAL实现对图像的Wallis匀色

Wallis匀色原理&#xff1a; # f(x,y)&#xff1a;Wallis匀色后结果 # g(x,y):输入的待匀色影像 # mg:待处理影像的灰度均值 # mf:参考影像的灰度均值 # sg:待处理影像和的标准偏差 # sf:参考影像的标准偏差 f(x,y)(g(x,y)−mg)⋅(sf/sg)mf匀色代码逻辑解释&#xff1…

从阿里云“数字证书管理服务”申请免费的SSL证书

最近网站的SSL证书即将到期&#xff0c;之前是从FreeSSL申请的证书&#xff0c;而且是通过OpenSSL自己生成CSR文件的方式申请的证书&#xff0c;操作还是比较繁琐。&#xff08;具体参考&#xff1a; https://blog.csdn.net/weixin_42534940/article/details/90745452 &#xf…

一、几种常用的设计模式

设计模式分类 创建者模式&#xff1a;对象实例化的模式&#xff0c;创建型模式用于解耦对象的实例化过程。 常用&#xff1a;单例模式、工厂方法模式、抽象工厂模式、建造者模式 。 不常用&#xff1a;原型模式结构型模式&#xff1a;把类或对象结合在一起形成一个更大的结构。…

Tilemap瓦片资源

1、Tilemap Tilemap一般称之为 瓦片地图或者平铺地图&#xff0c;是Unity2017中新增的功能&#xff0c;主要用于快速编辑2D游戏中的场景&#xff0c;通过复用资源的形式提升地图多样性 工作原理就是用一张张的小图排列组合为一张大地图 它和SpriteShape都是用于制作2D游戏的…

CEAC 之《企业信息化管理》1

&#x1f468;‍&#x1f4bb;个人主页&#xff1a;微微的猪食小窝 欢迎 点赞&#x1f44d; 收藏⭐ 留言&#x1f4dd; 加关注✅! 本文由 微微的猪食小窝 原创 收录于专栏 【CEAC证书】 1综合布线是智能建筑的信息高速公路。 A、正确 B、错误A2直通线的一根双绞线的两端执行不同…

Java基础实战项目-------网上订餐系统

目录 前言 项目需求 项目环境准备 技能点 实现思路 ​编辑 项目总结 完整代码&#xff1a; 前言 已学完Java基础部分的内容&#xff0c;如下 理解程序的基本概念&#xff1a;程序、变量、数据类型 会使用顺序、选择、循环、跳转语句编写程序 会使用数组以及Arrays的…

[附源码]SSM计算机毕业设计智慧教学平台JAVA

项目运行 环境配置&#xff1a; Jdk1.8 Tomcat7.0 Mysql HBuilderX&#xff08;Webstorm也行&#xff09; Eclispe&#xff08;IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持&#xff09;。 项目技术&#xff1a; SSM mybatis Maven Vue 等等组成&#xff0c;B/S模式 M…

[附源码]java毕业设计生产型企业员工管理系统

项目运行 环境配置&#xff1a; Jdk1.8 Tomcat7.0 Mysql HBuilderX&#xff08;Webstorm也行&#xff09; Eclispe&#xff08;IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持&#xff09;。 项目技术&#xff1a; SSM mybatis Maven Vue 等等组成&#xff0c;B/S模式 M…

应急响应-账户排查

用户信息排查 在服务器被入侵之后&#xff0c;攻击者可能会建立相关账户&#xff0c;方便进行远程控制。 主要采用一下几种&#xff1a; 直接建立一个新用户&#xff1b;(有时候为了混淆视听&#xff0c;账户名称和系统常用名相似)激活一个系统中的默认用户&#xff0c;但是这…

ArcGIS计算图斑四至坐标原来这么简单!可不要在走弯路哦

时常我们需要去计算图斑的四至坐标 &#xff08;四至与四至点不一样哦&#xff09; 很多朋友会去求个 最小边界几何 在与原始图斑相交得到点来算四至 这种方法有许多问题 是不可以取的&#xff0c;我们今天来介绍一下 一个简单的字段计算就解决这个问题 然后嫌麻烦 我们…

jtag调试ls1012a linux-5.3内核

1、jtag连接 OK1012A-C jtag引脚如下: 如果jlink的VCC对外输出供电&#xff0c;那么需要关闭&#xff0c;VCC对外供电导致jtag连接不上。使用引脚匹配的转接板连接开发板的jtag插座。使用交叉串口线连接开发板。 2、linux-5.3内核编译 -O0编译修改方法与树莓派4b编译修改方法一…

java基于ssm大学生社团管理系统-计算机毕业设计

系统采用了B/S结构&#xff0c;将所有业务模块采用以浏览器交互的模式&#xff0c;选择MySQL作为系统的数据库&#xff0c;开发工具选择My eclipse来进行系统的设计。基本实现了社团管理应有的主要功能模块&#xff0c;本系统有前台与后台两大功能模块&#xff0c;管理员&#…

【图像隐藏】基于小波变换DWT实现数字水印嵌入提取含各类攻击附matlab代码

✅作者简介&#xff1a;热爱科研的Matlab仿真开发者&#xff0c;修心和技术同步精进&#xff0c;matlab项目合作可私信。 &#x1f34e;个人主页&#xff1a;Matlab科研工作室 &#x1f34a;个人信条&#xff1a;格物致知。 更多Matlab仿真内容点击&#x1f447; 智能优化算法 …

OPT(奥普特)荣摘高工锂电“2022年度创新技术奖”

日前&#xff0c;高工锂电年会暨金球奖颁奖典礼在深圳隆重举行&#xff0c;集结了锂电产业链上下游企业高层领袖&#xff0c;围绕行业新技术、数字工厂、极限智造等共议未来发展之道。 作为锂电行业机器视觉核心供应商&#xff0c;OPT&#xff08;奥普特&#xff09;受邀出席年…

【Java八股文总结】之面向对象

文章目录Java面向对象基础一、面向对象基础1、什么是封装&#xff1f;2、什么是继承&#xff1f;1、子类访问父类2、子类的访问修饰符3、方法重写3、什么是多态&#xff1f;1、Java语言如何实现多态2、什么时候使用多态&#xff1f;4、什么是接口&#xff1f;5、怎么使用接口&a…

Stream

目录 一 函数式接口 1 特点 2 核心函数式接口 1&#xff09; Consumer 2&#xff09; Supplier 3&#xff09; Function 4&#xff09; Predicate 5&#xff09; 扩展&#xff1a;BiFunction 二 Stream 1 stream操作过程 1&#xff09; 中间操作 2&#xff09;终端…

[附源码]java毕业设计汽车票售票系统lunwen

项目运行 环境配置&#xff1a; Jdk1.8 Tomcat7.0 Mysql HBuilderX&#xff08;Webstorm也行&#xff09; Eclispe&#xff08;IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持&#xff09;。 项目技术&#xff1a; SSM mybatis Maven Vue 等等组成&#xff0c;B/S模式 M…

太湖“生态度假式”年会,为您的健康守护,为您的相聚喝彩

最近几年经常听到&#xff0c; 有人说今年最大的目标就是活着&#xff0c; 历经风雨&#xff0c;方知岁月静好的可贵&#xff0c; 这特殊的一年又一年里让大家深觉“健康”的重要&#xff0c; 也让我们更热爱彼此、热爱生活。 倏忽间&#xff0c;2022已至尾声&#xff0c; 又到…

【ASM】字节码操作 工具类与常用类 GeneratorAdapter 介绍

文章目录 1.概述2. GeneratorAdapter2.1 class info2.2 fields2.3 构造方法2.4 方法2.5 特殊方法2.5.1 loadThis2.5.2 getArgIndex2.5.2 box &3. 案例4.总结1.概述 在上一篇文章中:【ASM】字节码操作 工具类与常用类 AdviceAdapter 介绍 打印方法进入 和 方法退出 的参数…