CUDA 冬令营1

news2024/10/1 3:23:39

基本概念

1.CPU的任务:为串行任务优化
2.GPU的任务:为并行任务优化
3.L4T ubuntu:基于NVIDIA Tegra芯片的ubuntu系统(linux for Tegra)
4.Tegra:继承了ARM CPU 和 NVIDIA GPU的处理器芯片
5.X86:高性能,复杂指令,多用于win
6.ARM:低功耗高效率,简易指令集,Linux
7.GPU的产生:CPU的两个瓶颈 存储器墙(IO跟不上)时钟频率墙(散热)

CPU到GPU

所有的处理优化逻辑变成计算核心
在这里插入图片描述
在这里插入图片描述在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

CUDA线程层次

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
block的意义:(为什么不直接用通过grid管理所有的thread)不用直接去分配N个线程 分班去管理 有利于内存管理
GPU上运行函数kernel对应一个Grid,每个Grid内有多个Block,每个Block由多个Thread组成。
执行原理参考1
执行原理参考2
硬件层面:一个DEVICE由多个SM和其他资源组成,一个SM由多个SP(CUDA Core)和其他资源组成
软件层面:一个Grid由多个block组成,Block由多个Thread组成,Block内的Thread可以通过共享内存通信,也可以通过函数同步
线程调度:CUDA的线程调度粒度是32个Thead,即1个Warp,Warp在SP上是随机且多次被调度执行的,Warp的切换开销可以忽略不计。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/128350.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

2023京东年货节全民炸年兽活动最详细规则

2023京东全民炸年兽活动规则 1、活动时间 整体活动时间: 2022年12月26日00: 00: 00–2023年01月15日23: 59: 59 2、活动玩法 (1)玩法一:全民炸年兽瓜分10亿压岁钱 活动时间: 2022年12月26日00: 00: 00–2023年01月15日23: 59: 59 (2) 玩法二:每晚8点分百万红包 活动时间…

Houdini和C4D区别在哪?哪个更好用

Houdini和C4D作为当前软件市场上非常热门的设计软件,现在越来越多的小伙伴开始学习。所以咱们今天就从行业应用、建模、动画和使用难易度等进行多方面对比,帮助小伙伴们更清楚地了解这两款软件—— Houdini作为一款非常受欢迎的3D&VFX制作工具&#…

美国公司是如何搞创新的,又是如何失败的......

PARC,施乐帕洛阿图研究中心,和贝尔实验室媲美的IT界圣地。从这里走出了一大批伟大的发明,直接改变了整个计算机行业。Alto PC ,图形用户界面,所见即所得,以太网,PostScript,面向对象…

复购高,退货低的日本市场成为跨境电商新风口,新手如何快速入局

据统计预测,未来几年将会有越来越多的跨境卖家涌入日本电商市场。但由于在语言、文化和消费习惯上存在一定的差异,很多中国卖家并不熟悉日本的文化与市场需求,也很难在短时间内快速适应日本电商平台的运营规则与服务。 日本作为一个经济发达的…

【PS-选区编辑】变换选区、反向命令、建立工作路径

目录 变换选区 1、位置 2、多种操作 反向命令 1、反选选区:ctrlshifti 2、边界 3、平滑 4、扩展和收缩 5、羽化 建立工作路径 变换选区 1、位置 制作了一个制作了选区后,鼠标右击找到【变换选区】,或在【选择】菜单中找到【变换…

JavaScript 入门基础 - 运算符(三)

JavaScript 入门基础 - 运算符(三) 文章目录JavaScript 入门基础 - 运算符(三)1.什么是运算符2.表达式和返回值3.算术运算符概述4. 赋值运算符5.递增和递减运算符5.1 递增和递减运算符概述5.2 递增运算符5.2.1 前置递增运算符5.2.…

Ajax(1)---了解Ajax和XML

目录 Ajax XML了解 Ajax的特点 HTTP协议请求报文与响应文本结构 HTTP 请求报文 响应报文 Ajax AJAX全称为Asynchronous JavaScript And XML,就是异步的JS和XML通过AJAX可以在浏览器中向服务器发送异步请求,最大的优势:无刷新获取数据。AJAX不是新…

一篇带你彻底弄懂SpringBoot项目jdk版本及依赖不兼容问题

💟💟前言 ​ 友友们大家好,我是你们的小王同学😗😗 今天给大家打来的是 一篇带你彻底弄懂SpringBoot项目jdk版本及依赖不兼容问题 希望能给大家带来有用的知识 觉得小王写的不错的话麻烦动动小手 点赞👍 收…

MySQL 大表优化方案

单表优化 读写分离 缓存 表分区 垂直拆分 水平拆分 兼容MySQL且可水平扩展的数据库 NoSQL 当MySQL单表记录数过大时,增删改查性能都会急剧下降,可以参考以下步骤来优化: 单表优化 除非单表数据未来会一直不断上涨,否则不…

通过Django发送邮件

通过Django发送邮件非常的简单,在Python中已经内置了一个smtplib邮件发送模块,Django在此基础上进行了简单地封装,我们可以在Django的环境中方便的发送邮件。大部分邮件发送成功主要是邮件的参数配置,本文以常用的126邮箱和QQ邮箱…

《2022中国数据智能产业图谱3.0版》重磅发布

‍数据猿出品本次“数据猿行业盘点季大型主题策划活动——《2022中国数据智能产业图谱3.0版》”为2022年度图谱版本的升级更新版,下一次版本迭代将于2023年4月底发布2023年1.0版,敬请期待,欢迎报名。‍数据智能产业创新服务媒体——聚焦数智 …

svn修改提交日志信息

参考:唐小码个人博客 一、svn修改提交的msg信息和作者信息 鼠标右键找到show log> 选择要修改的日志行,第一个是修改作者信息,第二个是修改日志信息 二、svn修改提交的日期信息 修改日期信息的话,你得先有svn服务器的权限&…

光电接收的TIA设计

APD的光电接收电路如下图所示,APD的光电流较SiPM是小很多的,所以需要TIA来做跨阻放大,一般RF电阻要5k到10k左右,光电流一般也就几十uA,这个跨阻放大主要是对Cf大小的选择,Cf的选择主要考虑下面的两点。从放…

【基础强训】day4

一、选择题 &#x1f308;第1题 有以下程序 #include<iostream> #include<cstdio> using namespace std; int main(){ int m0123, n123; printf("%o %o\n", m, n); return 0; } 程序运行后的输出结果是&#xff08;&#xff09; A 0123 0173 B 01…

汇聚数据库创新力量,加速企业数字化转型

2022年12月29日&#xff0c;以“汇聚数据库创新力量&#xff0c;加速企业数字化转型”为主题的openGauss Summit 2022在线上举行。会上&#xff0c;openGauss社区理事会理事长江大勇对外公布了最近社区及生态进展&#xff0c;并宣布推出资源池化架构&#xff0c;实现软硬融合&a…

人脸识别实战教程

人脸识别实战教程 本教程介绍如何使用Alibaba Cloud SDK for Java进行人体属性识别、人体计数和人脸搜索任务。 背景信息 人脸人体识别技术是基于阿里云深度学习算法&#xff0c;结合图像或视频的人脸检测、分析、比对以及人体检测等技术&#xff0c;为您提供人脸人体的检测…

【Java语言】— 运算符、案例:键盘录入

目录运算符1.算术运算符案例&#xff1a;数值拆分2.“”做连接符3.自增自减运算符自增自减的使用事项自增自减的案列4.赋值运算符基本赋值运算符&#xff1a;“”扩展赋值运算符&#xff1a;“”、“-”、“*”、“/”5.关系运算符6.逻辑运算符短路逻辑运算符总结7.三元运算符三…

DAS和NAS

对于有大量数据存储需求的人群可能都听过NAS或者DAS&#xff0c;由两者演化出来的产品也各有不同&#xff0c;但是两者的真正的区别是什么、各有哪些优势和劣势、分别适用哪些人群一直以来也是困扰大家的问题。 DAS全称为直接附加存储(Direct Attached Storage&#xff0c;DAS…

安全用电守护卫士,同为(TOWE)带漏电保护功能桌面PDU插座

随着人民生活水平的提高&#xff0c;人们日常对电的需求量越来越高&#xff0c;尤其是在隆冬季节&#xff0c;很多居民冬季采用电炉、电热毯和空调等取暖&#xff0c;用电负荷较大&#xff0c;一旦出现漏电、过载、短路等问题&#xff0c;很容易引发火灾。据了解&#xff0c;大…

【机器学习】特征工程:时间特征构造以及时间序列特征构造(含源代码理解)

目录&#xff1a;特征工程—时间特征构造以及时间序列特征构造一、前言二、特征构造介绍三、时间特征构造3.1 连续值时间特征3.2 离散值时间特征3.2.1 时间特征拆解3.2.2 时间特征判断3.2.3 结合时间维度的聚合特征四、时间序列特征构造4.1 时间序列聚合特征4.2 时间序列历史特…