Cuda笔记1

news2024/9/28 15:32:40

1、培训001

在这里插入图片描述
在这里插入图片描述
1在这里插入图片描述
1+…+100,CPU是串行执行,GPU是分成几部分同时计算,如1+2+3,4+5+6…

2、培训002

在这里插入图片描述
一来一回
在这里插入图片描述
每种定义有对应的调用位置,和执行位置,不对会报错。
在这里插入图片描述
下图是用NVPROF时间分析
在这里插入图片描述
下图是资源分析
在这里插入图片描述

1) CUDA线程层次

在这里插入图片描述
一个SM执行多个block
在这里插入图片描述
所有线程执行同一个kernel,每个线程处理的数据不一样
在这里插入图片描述
线程在cuda core里面,block以块为单位分配到sm中,grid在device中
![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/b0ebf85958584b2aa17be70d7dcbc1a5.png
如图描述的是:9个block分给3个sm
这张ppt的流程与下面这个图其实是一回事
在这里插入图片描述
在这里插入图片描述
理由:层层分级便于管理,和企业或government管理有点相似。还有个协作,通过共享内存使thread block协作。
在这里插入图片描述
在这里插入图片描述
h_a,h_b指CPU的变量,d_a等指GPU的变量,申请各自的空间。
使用cudaMemcpy函数将cpu的变量传给gpu,然后使用kernel函数计算。
然后将结果送回去给CPU,最后释放
第一步
在这里插入图片描述
第二步,还有个步骤是,cpu通过giga thread将block分配给sm中
在这里插入图片描述
第三步
在这里插入图片描述

2)CUDA线程索引

设置多大?没有规矩,要通过实验!!!

3)CUDA线程分配

在这里插入图片描述
每个线程块的xyz维度最大申请1024,1024,64
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
参考链接:https://www.bilibili.com/video/BV1dq4y1k7RD?p=1《NVIDIA-CUDA-冬令营》

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1409903.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

《统计学习方法:李航》笔记 从原理到实现(基于python)-- 第 2章感知机

文章目录 第 2章感知机2.1 感知机模型2.2 感知机学习策略2.2.1 数据集的线性可分性2.2.2 感知机学习策略 2.3 感知机学习算法2.3.1 感知机学习算法的原始形式2.3.2 算法的收敛性2.3.3 感知机学习算法的对偶形式 实践:二分类模型(iris数据集)数…

爬虫正则+bs4+xpath+综合实战详解

Day3 - 1.数据解析概述_哔哩哔哩_bilibili 聚焦爬虫:爬取页面中指定的页面内容 编码流程:指定url -> 发起请求 -> 获取响应数据 -> 数据解析 -> 持久化存储 数据解析分类:正则、bs4、xpath(本教程的重点) 数据解析原理概述&am…

2024群硕荣誉首响,第十三届公益节斩获企业大奖

2024年1月23日至24日,第十三届公益节在北京顺利举行。 历经多年的探索和实践,公益节已经成为中国公益慈善领域颇具影响力的年度盛事。本届公益节全面恢复线下活动,各大企业齐聚现场,展现社会责任的力量,现场气氛热烈而…

什么是5G RedCap?5G RedCap有什么优势?

5G RedCap(Reduced Capability)是指5G轻量化技术,即通过对5G技术进行一定程度的“功能裁剪”,来降低终端和模组的复杂度、成本、尺寸和功耗等指标,从而“量体裁衣”适配不同的物联需求,实现兼顾物联网系统的…

【送书活动八期】docker容器中登陆并操作postgresql

这里的背景比较简单,因为区块链浏览器使用的是blockscout,blockscout的数据库选择的是postgresql,这些服务组件都是使用的docker容器来管理,今天进行区块链上交易查询的时候,发现数据存在部分问题,因此需要…

大数据信用查询系统能查到什么呢?

在金融助贷行业,大数据有叫大数据信用或者网贷大数据,在申贷的时候,想必大多数人都有听说过,很多人因为大数据不良的原因申贷被拒过,那大数据信用查询系统能查到什么呢?本文就简单为大家总结几点大数据信用查询的内容…

freeRTOS总结(十)消息 队列

1,队列简介(了解) 队列是任务到任务、任务到中断、中断到任务数据交流的一种机制(消息传递) 与全局变量的区别 类似全局变量?假设有一个全局变量a 0,现有两个任务都在写这个变量a 假如 当任务…

三层架构-pc通外网小实验

要求:pc端能上外网(isp) 效果图:pc1(VLAN2)和pc3(vlan3)都能ping通2.2.2.2(R2环回) 代码:#先配置好r1,r2,端口ip # [R1] ip route-static 0.0.0.0 0.0.0.0 10.1.1.2 acl 2000 rule permit source any interface GigabitEthernet0/0/2 nat outbound 2000 …

Android消息推送 SSE(Server-Sent Events)方案实践

转载请注明出处:https://blog.csdn.net/kong_gu_you_lan/article/details/135777170 本文出自 容华谢后的博客 0.写在前面 最近公司项目用到了消息推送功能,在技术选型的时候想要找一个轻量级的方案,偶然看到一篇文章讲ChatGPT的对话机制是基…

Bank_Code_FullName_2020.06.16.xlsx

Bank_Code_FullName_2020.06.16.xlsx 银行联行号和全称 https://download.csdn.net/download/spencer_tseng/88780566 144692条记录,没法子贴上去

抖音VR直播:沉浸式体验一键打通360度精彩

随着5G技术的发展,VR直播近年来也逐步进入到大众的视野中,相比于传统直播,VR直播能够提供更加丰富的内容和多样化的互动方式,让观众更有沉浸感和参与感。现如今,抖音平台也上线了VR直播,凭借沉浸式体验和有…

基于 pytorch-openpose 实现 “多目标” 人体姿态估计

前言 还记得上次通过 MediaPipe 估计人体姿态关键点驱动 3D 角色模型,虽然节省了动作 K 帧时间,但是网上还有一种似乎更方便的方法。MagicAnimate 就是其一,说是只要提供一张人物图片和一段动作视频 (舞蹈武术等),就可以完成图片…

【Kubernetes】深入了解Kubernetes(K8s):现代容器编排的引领者

欢迎来到英杰社区: https://bbs.csdn.net/topics/617804998 欢迎来到阿Q社区: https://bbs.csdn.net/topics/617897397 作者简介: 辭七七,目前大二,正在学习C/C,Java,Python等 作者主页&#xf…

JVM-初始JVM

什么是JVM JVM 全称是 Java Virtual Machine,中文译名 Java虚拟机。JVM 本质上是一个运行在计算机上的程序,他的职责是运行Java字节码文件。 Java源代码执行流程如下: JVM的功能 1 - 解释和运行 2 - 内存管理 3 - 即时编译 解释和运行 解释…

LeetCode.2865. 美丽塔 I

题目 题目链接 分析 闲谈:每次读 LeetCode 的题目描述都要费老大劲,o(╥﹏╥)o 题意:这个其实意思就是以数组的每一位作为最高点,这个点(数字)左右两边的数字都不能大于这个数字(可以等于),…

Qt基础-屏蔽qDebug()、qWarning()调试和警告消息

本文讲解Qt如何-屏蔽qDebug()、qWarning()调试和警告消息 在工程文件.pro里面添加 DEFINES QT_NO_WARNING_OUTPUT\ QT_NO_DEBUG_OUTPUT 如果只想Release版本的时候不打印: Release:DEFINES QT_NO_WARNING_OUTPUT\ QT_NO_DEBUG_OUTPUT 这样只是在Release版本…

想要透明拼接屏展现更加效果,视频源是技术活,尤其作为直播背景

随着科技的飞速发展,视频制作和显示技术也在不断进步。透明拼接屏视频作为一种新型的视频形式,在许多场合都得到了广泛的应用。尼伽小编将深入探讨透明拼接屏视频的制作过程、要求、清晰度,以及目前常作为直播背景的优势。 一、透明拼接屏视频…

Make.com的发送邮件功能已经登峰造极

make.com的发送邮件功能已经做到了登峰造极。 我给你个任务,让你发送个新邮件给谁谁,你一定想到SMTP服务器不就行了。 我给你第二个任务,我让你自动回复一个邮件,注意是回复。 做不到了吧~~!…

【3万字】modbus简易不简单的教程

🎖️Modbus简易不简单的教程 文章目录 🎖️Modbus简易不简单的教程🎫一、简介1.1 Modbus:工业通信的革命1.2 理解标准化通信1.3 Modbus协议的变体 🎀二、例程引入2.1 示例:使用01功能码读取灯的开关状态2.2…

电商一年挣100w的赚钱模型

现在有多少人还不知道电商具体应该怎么干,有多少人还是看了身边的朋友做电商挣钱了也跟着做了。然后做半天没做起来,然后就找各种原因,你看别人每天上架你也上架,别人开车你也开车,别人亏钱你也亏钱,别人赚…