CUDA编程入门系列(七) GPU内存如何管理

news2025/1/16 5:46:50

一、内存使用

        1.CUDA程序会使用GPU内存与CPU内存

        2.CPU内存的分配与释放是标准的,例如new和delete,malloc与free

        3.GPU上内存涉及分配和释放使用CUDA提供的库函数实现

        4.CUDA/GPU内存与CPU内存的互相传输

                这里主要讲全局内存与共享内存的管理

二、CPU内存

         栈:有编译器自动分配释放

        堆:用户自己分配释放

        C: malloc, calloc, free

        C++: new,delete

三、GPU内存

        1.GPU内存有很多种类型,例如全局,纹理,常量,共享,每种内存的管理不一样。

        2.GPU内存也有不同的属性,如1D,2D,3D,锁页,统一内存

        3.CUDA会增加新的内存类型

        全局内存分配与释放

        内存分配
                cudaError t cudaMalloc(void **devPtr, size t size);
        内存释放
                cudaError t cudaFree(void *devPtr);

        Host内存分配释放

        Host内存属于CPU内存,传输速度比普通CPU内存快很多
        内存分配
                cudaError t cudaMallocHost(void **devPtr, size t size);
        内存释放
                cudaError t cudaFreeHost(void *devPtr);

        统一Unified内存分配释放

        Unified内存可以同时被CPU和GPU访问

        内存分配
        cudaError t cudaMallocManaged(void **devPtr, size t size,unsigned int flags = cudaMemAttachGlobal)
                flags=cudaMemAttachGlobal: 内存可以被任意处理器访问CPU和GPU                                        flags=cudaMemAttachGHost:只可以被CPU访问
        内存释放
                cudaError t cudaFree(void *devPtr) ;

        CPU与GPU内存同步拷贝

cudaError t cudaMemcpy(void *dst, const void *src, size t count,cudaMemcpyKind kind)

kind: cudaMemcpyHostToHost, cudaMemcpyHostToDevicecudaMemcpyDeviceToHost, cudaMemcpyDeviceToDevice, orcudaMemcpyDefault  

        其中kind代表拷贝的方向

        CPU与GPU内存异步拷贝,可能会导致冲突。

cudaError t cudaMemcpyAsync(void *dst, const void *src, sizet count,cudaMemcpyKind kind, cudaStream t stream = 0)
kind: cudaMemcpyHostToHost, cudaMemcpyHostToDevice,cudaMemcpyDeviceToHost, cudaMemcpyDeviceToDevice, orcudaMemcpyDefault
stream:如果是非0可能与其他stream的操作有重叠

        共享内存

        共享内存定义在SM中,访问延迟比全局内存低两个数量级,访问速度比全局内存快一个数量级,共享内存定义在线程块中,线程块中每个线程都可以访问,但不可以被其他线程块访问。

        用途:在一个线程块中共享数据,用作用户自己管理的高速缓存。

        共享内存使用方式

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1108105.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

哪些行业需要做等保?

等保适用于各种行业,尤其是对于涉及国家安全、金融、电信、能源、交通、医疗等重点领域的机构和企业更为重要。以下是一些常见的需要进行等保的行业: 政府部门和政府机构:各级政府部门、公安、国防等机构需要对信息系统进行等级保护测评和认证…

嵌入式养成计划-43----QT QMainWindow中常用类的使用--ui界面文件--资源文件的添加--信号与槽

一百零九、QMainWindow中常用类的使用 109.1 菜单栏 QMenuBar 菜单栏 QMenuBar 最多只能有一个 109.2 工具栏 QToolBar 工具栏 QToolBar 可以有多个 109.3 状态栏QStatusBar 状态栏 QStatusBar 最多只能有一个 109.4 浮动窗口QDockWidget 浮动窗口 可以有多个 109.5 代…

医疗图像分割实践NNUnet-V2 基于window10+3090配置。官方数据Task_02

Window10 配置NNUnet完成官方任务分割 NNUnet论文介绍 nnUnet是一个针对医学图像分割提出得一个即开即用的框架,用户只需要按照官方给出的数据要求进行格式转换便可以进行快速的医学图像分割的训练和推演。其更新的V2版本代码变得更加易读和方便使用,并…

GitLab使用webhook触发Jenkins自动构建

1、jenkins安装gitlab插件 在插件管理中,搜索gitlab安装这个插件。 2、job中配置webhook地址和密钥 进入job设置,构建触发器中就可以看到gitlab的webhook配置,复制URL地址和随机令牌至gitlab中 勾选后,就可以展开设置&#xff…

Go语言入门心法(十):Go语言操作MYSQL(CRUD)

Go语言入门心法(一): 基础语法 Go语言入门心法(二): 结构体 Go语言入门心法(三): 接口 Go语言入门心法(四): 异常体系 Go语言入门心法(五): 函数 Go语言入门心法(六): HTTP面向客户端|服务端编程 Go语言入门心法(八): mysql驱动安装报错onnection failed Go语言入门心法(…

黑白棋(Othello, ACM/ICPC World Finals 1992, UVa220)rust解法

你的任务是模拟黑白棋游戏的进程。黑白棋的规则为:黑白双方轮流放棋子,每次必须让新放的棋子“夹住”至少一枚对方棋子,然后把所有被新放棋子“夹住”的对方棋子替换成己方棋子。一段连续(横、竖或者斜向)的同色棋子被…

【黑马程序员】MySQL学习记录二(SQL)案例

案例1(数据类型、DDL、DML、DQL) 根据需求创建表(设计合理的数据类型、长度) 1、设计一张员工信息表,要求如下 create table emp( id INT COMMENT 编号, workno VARCHAR(10) COMMENT 员工工号, name VARCHAR(10) COM…

企业工厂车间台式电脑经常有静电导致开不开机,如何彻底解决?

环境: HP 480G7 Win10 专业版 问题描述: 企业工厂车间台式电脑经常有静电导致开不开机,如何彻底解决? 开机电源指示灯闪,显示器黑屏没有画面开不了机,一般是把主机电源断了,把主机盖打开 把内存条拔了之后长按开机按键10秒以上然后插上内存条开机正常 相对与有些岗…

智慧应急三维电子沙盘系统

1 概述 深圳易图讯科技有限公司(www.3dgis.top)采用大数据、云计算、虚拟现实、物联网、AI等先进技术为支撑,以6博硕团队为核心,研发了智慧应急三维电子沙盘系统,成功案例100。该系统支持高清卫星影像、DEM高程数据、…

vue-pdf多页预览异常,Rendering cancelled, page 1 Error at BaseExceptionClosure xxx

项目开发使用vue-pdf,单页情况预览正常,多页vue-pdf预览异常,第一次预览时,会先弹出异常模态窗口,关闭模态窗口,pdf又是正常显示,报错信息及异常截图如下: 报错信息 Rendering cancelled, page…

使用Vue组件的watch监听-简单计算器

Vue组件的初探 一、浅析 这里做了一个全局的组件vue.component(mycomp,{}) 在<template></template>中写组件&#xff0c;将idcomp1 script中直接template:"#copm1" 其他的部分就是之前所讲的watch来实现简易计算器差不多 <div id"app"&…

6.5 Elasticsearch(五)Spring Data Elasticsearch - 增删改查API

文章目录 1.Spring Data Elasticsearch2.案例准备2.1 在 Elasticsearch 中创建 students 索引2.2 案例测试说明 3.创建项目3.1 新建工程3.2 新建 springboot module&#xff0c;添加 spring data elasticsearch 依赖3.3 pom.xml 文件3.4 application.yml 配置 4.Student 实体类…

SD卡与emmc的异同

eMMC与SD卡的异同&#xff1a; 物理尺寸和接口&#xff1a; eMMC&#xff1a;eMMC是一种嵌入式存储解决方案&#xff0c;通常采用BGA&#xff08;Ball Grid Array&#xff09;封装&#xff0c;焊接在电路板上。它没有标准的物理尺寸&#xff0c;而是以芯片的形式存在。SD卡&…

代理模式(初学)

代理模式 一、什么是代理模式 代理模式&#xff1a;为其他对象提供一种代理以控制对这个对象的访问 二、简单例子 这里面的骏骏就起到了代理的身份&#xff0c;而贵贵则是被代理的身份。 三、代码实现 1、用一个接口&#xff08;GivingGifts&#xff09;来保存送礼物的动作…

链表的概念+MySingleList的实现

文章目录 链表一、 链表的概念1.概念2. 结构 二、MySingleList的实现1 .定义内部类2 .创建链表3. 遍历链表并打印4.查找单链表中是否包含关键字key5.得到链表的长度6.头插法7. 尾插法8.任意位置插入8.删除结点清空 链表 顺序存储&#xff1a;顺序表/ArrayList 优点&#xff1…

Android平台GB28181设备接入模块之SmartGBD

大牛直播SDK研发的Android平台GB28181设备接入SDK&#xff08;SmartGBD&#xff09;&#xff0c;可实现不具备国标音视频能力的 Android终端&#xff0c;通过平台注册接入到现有的GB/T28181—2016服务&#xff0c;可用于如执法记录仪、智能安全帽、智能监控、智慧零售、智慧教育…

C#插入排序算法

插入排序实现原理 插入排序算法是一种简单、直观的排序算法&#xff0c;其原理是将一个待排序的元素逐个地插入到已经排好序的部分中。 具体实现步骤如下 首先咱们假设数组长度为n&#xff0c;从第二个元素开始&#xff0c;将当前元素存储在临时变量temp中。 从当前元素的前一…

【量化交易笔记】9.量化投资理论及一般流程

前言 在第7篇文章中指出&#xff0c;量化交易的主要有两方面应用&#xff0c;基于的数据主要是两个类型&#xff0c;如前面讲的用之前的数据预测股价&#xff0c;这类数据我们可归为纵向研究数据&#xff0c;又称时间序列数据&#xff0c;另一类是横截面数据&#xff0c;以称截…

CleanMyMac X2024免费版苹果电脑杀毒工具

在过去&#xff0c;人们普遍认为苹果电脑不容易受到恶意软件的攻击&#xff0c;因此不需要安装杀毒软件。然而&#xff0c;随着苹果电脑的普及和互联网的发展&#xff0c;苹果电脑也逐渐成为黑客和恶意软件的目标。为了保护苹果电脑的安全&#xff0c;使用一款可靠的苹果电脑杀…

通过SPI传输BMI160数据到nrf528xx

目录 主控和外设之间的联系关键示例可能的bug 主控和外设之间的联系 在完成代码之前&#xff0c;我们手里会有两份代码&#xff0c;一份是nrf528xx的SDK&#xff0c;一份是BMI160传感器的SDK&#xff0c;怎么利用SDK完成我们的需求呢&#xff1f;首先我们要搞明白&#xff0c;…