3.2.cuda运行API-第一个运行时程序,hello-cuda

news2024/11/17 21:21:09

目录

    • 前言
    • 1. hello-cuda
    • 总结

前言

杜老师推出的 tensorRT从零起步高性能部署 课程,之前有看过一遍,但是没有做笔记,很多东西也忘了。这次重新撸一遍,顺便记记笔记。

本次课程学习精简 CUDA 教程-第一个运行时程序,hello-cuda

课程大纲可看下面的思维导图

在这里插入图片描述

1. hello-cuda

我们来开始写第一个 runtime API 的程序

根据 Driver API 的错误代码处理,同样我们也提出了 runtime API 的错误处理

#define checkRuntime(op)  __check_cuda_runtime((op), #op, __FILE__, __LINE__)

bool __check_cuda_runtime(cudaError_t code, const char* op, const char* file, int line){
    if(code != cudaSuccess){    
        const char* err_name = cudaGetErrorName(code);    
        const char* err_message = cudaGetErrorString(code);  
        printf("runtime error %s:%d  %s failed. \n  code = %s, message = %s\n", file, line, op, err_name, err_message);   
        return false;
    }
    return true;
}

第一个完整的调用 runtime API 的程序示例代码如下:


// CUDA运行时头文件
#include <cuda_runtime.h>

// CUDA驱动头文件
#include <cuda.h>
#include <stdio.h>
#include <string.h>

#define checkRuntime(op)  __check_cuda_runtime((op), #op, __FILE__, __LINE__)

bool __check_cuda_runtime(cudaError_t code, const char* op, const char* file, int line){
    if(code != cudaSuccess){    
        const char* err_name = cudaGetErrorName(code);    
        const char* err_message = cudaGetErrorString(code);  
        printf("runtime error %s:%d  %s failed. \n  code = %s, message = %s\n", file, line, op, err_name, err_message);   
        return false;
    }
    return true;
}

int main(){

    CUcontext context = nullptr;
    cuCtxGetCurrent(&context);
    printf("Current context = %p,当前无context\n", context);

    // cuda runtime是以cuda为基准开发的运行时库
    // cuda runtime所使用的CUcontext是基于cuDevicePrimaryCtxRetain函数获取的
    // 即,cuDevicePrimaryCtxRetain会为每个设备关联一个context,通过cuDevicePrimaryCtxRetain函数可以获取到
    // 而context初始化的时机是懒加载模式,即当你调用一个runtime api时,会触发创建动作
    // 也因此,避免了cu驱动级别的init和destroy操作。使得api的调用更加容易
    int device_count = 0;
    checkRuntime(cudaGetDeviceCount(&device_count));
    printf("device_count = %d\n", device_count);

    // 取而代之,是使用setdevice来控制当前上下文,当你要使用不同设备时
    // 使用不同的device id
    // 注意,context是线程内作用的,其他线程不相关的, 一个线程一个context stack
    int device_id = 0;
    printf("set current device to : %d,这个API依赖CUcontext,触发创建并设置\n", device_id);
    checkRuntime(cudaSetDevice(device_id));

    // 注意,是由于set device函数是“第一个执行的需要context的函数”,所以他会执行cuDevicePrimaryCtxRetain
    // 并设置当前context,这一切都是默认执行的。注意:cudaGetDeviceCount是一个不需要context的函数
    // 你可以认为绝大部分runtime api都是需要context的,所以第一个执行的cuda runtime函数,会创建context并设置上下文
    cuCtxGetCurrent(&context);
    printf("SetDevice after, Current context = %p,获取当前context\n", context);

    int current_device = 0;
    checkRuntime(cudaGetDevice(&current_device));
    printf("current_device = %d\n", current_device);
    return 0;
}

运行效果如下:

在这里插入图片描述

图1-1 第一个运行时程序

上述代码展示了使用 CUDA Runtime API 进行 device 和 context 的管理操作。通过调用相应的 API 函数,可以获取设备信息、设置当前设备和获取当前上下文等操作,而无需手动进行驱动初始化和销毁等操作。这样简化了代码,使得使用 CUDA Runtime API 更加方便和易于操作。

对于本节的知识点,你需要掌握:(form 杜老师)

  1. CUDA Runtime 是封装了 CUDA Driver 的高级别更友好的 API
  2. cudaruntime 需要引入 cudart 这个 so 文件
  3. 上下文管理:使用 cuDevicePrimaryCtxRetain 为每个设备设置 context,不再手工管理 context,并且不提供直接管理 context 的 API;任何依赖 CUcontext 的 API 被调用时,会触发 CUcontext 的创建和对设备的绑定;此后任何 API 调用时,会以设备 id 为基准,调取绑定好的 CUcontext;因此被称为懒加载模式,避免了手动维护 CUContext 的麻烦
  4. cuda 的状态返回值,都是 cudaError_t 类型,通过 check 宏捕获状态并处理是一种通用方式。官方案例采用宏,而非这里的函数加宏,函数加宏具有更加好的便利性

CUDA的在线文档地址:

https://developer.nvidia.com/cuda-toolkit-archive

总结

本次课程演示了 runtime API 的使用,当有需要 context 的 API 调用时,runtime API 会自动创建管理 context 无需我们手动操作管理,同时我们也在 runtime API 中添加了和 driver API 一样的错误处理,方便我们调试和排查问题。
text 的 API 调用时,runtime API 会自动创建管理 context 无需我们手动操作管理,同时我们也在 runtime API 中添加了和 driver API 一样的错误处理,方便我们调试和排查问题。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/730167.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

助力打造“先锋城市” 中国数字智能生态大会在深圳举行

随着数字经济的深入发展&#xff0c;以人工智能、大数据、数字孪生等新技术所产生的社会价值日益凸显&#xff0c;以“技术红利”牵引带动“改革红利”&#xff0c;形成广泛共识。 7月5日下午&#xff0c;以供需对接、链接合作为特色的 CDEC2023中国数字智能生态大会深圳站活动…

logstash grok解析Java log实践

针对Java配置的日志格式如下: <property name="log_pattern" value="%d{yyyy-MM-dd HH:mm:ss.SSS} %contextName [%thread] %mm{sessionId} %-5level %logger{50} [%file:%line] - %P{traceId} - %msg%n"/> %d表示日期, %thread表示线程名, %-…

在vue中全局修改滚动条样式

在App.vue中加入以下样式代码&#xff1a; ::-webkit-scrollbar {-webkit-appearance: none;width: 6px;height: 6px; } ::-webkit-scrollbar-track {background: rgba(0, 0, 0, 0.1);border-radius: 0; } ::-webkit-scrollbar-thumb {cursor: pointer;border-radius: 5px;bac…

【MySQL库表操作】

一、数据库Market中创建表customers 1、创建数据库 #创建数据库 mysql> create database Market; mysql> use Market;2、创建数据表 #创建数据表 mysql> create table customers(-> c_num int(11) primary key auto_increment,-> c_name varchar(50),-> c_…

【SQL】查找多个表中相同的字段

--查找字段所在 SELECTbb.TABLE_NAME,bb.COLUMN_NAME ,aa.COLUMN_ID,aa.DATA_TYPE,aa.DATA_LENGTH ,bb.COMMENTS FROMuser_tab_cols aa JOIN user_col_comments bb ONaa.TABLE_NAME bb.TABLE_NAMEAND aa.COLUMN_NAME bb.COLUMN_NAME JOIN dba_objects cc ONbb.TABLE_NAME cc…

Python程序设计——总目录

下面三套课程只是适用人群不同&#xff0c;基本知识点覆盖都是一样&#xff0c;不同人群选择不同的课程学习即可&#xff0c;不必要全都学习&#xff0c;以下是适用人群介绍&#xff1a; Python程序设计&#xff1a;适用于有一定基础且时间充裕的朋友Python基础&#xff1a;适…

Scala的变量和数据类型续篇

Scala的变量和数据类型续篇 文章目录 Scala的变量和数据类型续篇写在前面字符串字符串连接传值字符串插值字符串多行字符串 输入输出输入输出网络 数据类型Java数据类型Scala数据类型 类型转换自动类型转化&#xff08;隐式转换&#xff09;强制类型转化字符串类型转化 写在前面…

SSM学习笔记-------Spring(二)

SSM学习笔记-------Spring&#xff08;二&#xff09; Spring_day021、IOC/DI配置管理第三方bean1.1 案例:数据源对象管理1.1.1 环境准备1.1.2 思路分析1.1.3 实现Druid管理步骤1:导入druid的依赖步骤2:配置第三方bean步骤3:从IOC容器中获取对应的bean对象步骤4:运行程序 1.1.4…

清华大学团队提出一种基于稳态视觉诱发反应的混合脑机接口

更多脑机接口前沿技术&#xff0c;关注公众号&#xff1a;脑机接口社区 近日&#xff0c;清华大学团队提出一种基于脑电图&#xff08;EEG&#xff09;和磁脑电图&#xff08;MEG&#xff09;混合的脑机接口&#xff08;BCI&#xff09;系统的研究&#xff0c;旨在提高BCI性能…

数字电路设计——加法器

数字电路设计——加法器 半加器 半加器只有两个一位宽的输入 a a a 和 b b b &#xff0c;输出 a b ab ab 所产生的本位和 s u m sum sum 和进位 c o u t cout cout。组合逻辑为&#xff1a; S A ⊕ B , C o u t A B S A \oplus B,Cout AB SA⊕B,CoutAB 真值表和原…

选读SQL经典实例笔记02_多表查询

1. 除非有必要&#xff0c;否则不要用UNION代替UNION ALL 2. 查找两个表中相同的行 2.1. 当执行连接查询时&#xff0c;为了得到正确的结果&#xff0c;必须慎重考虑要把哪些列作为连接项 2.2. 当参与连接的行集里的某些列可能有共同值&#xff0c;而其他列有不同值的时候&a…

2.4.cuda驱动API-使用驱动API进行内存分配

目录 前言1. 内存分配总结 前言 杜老师推出的 tensorRT从零起步高性能部署 课程&#xff0c;之前有看过一遍&#xff0c;但是没有做笔记&#xff0c;很多东西也忘了。这次重新撸一遍&#xff0c;顺便记记笔记 本次课程学习精简 CUDA 教程-Driver API 内存分配 课程大纲可见下面…

基于Java生活缴费系统设计实现(源码+lw+部署文档+讲解等)

博主介绍&#xff1a;✌全网粉丝30W,csdn特邀作者、博客专家、CSDN新星计划导师、Java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ &#x1f345;文末获取源码联系&#x1f345; &#x1f447;&#x1f3fb; 精彩专…

【工具】录屏工具Bandicam参数测试(参数设置建议)

一款小而精美的软件&#xff0c;上手特别容易&#xff0c;学习版参见b站up视频&#xff1a;【免费】好用录屏软件推荐&#xff0c;无水印1080P你值得拥有。 我有个需求&#xff0c;要求录屏但视频文件尽可能小但保持基本清晰。 我分别用看视频环境&#xff08;b站学习教程类&…

探索全桥电机驱动模块:实现精确控制与高效驱动

全桥电机驱动模块是一种在现代工程应用中广泛使用的电机驱动方式。对于需要精确控制和高效驱动的场景&#xff0c;如机器人、无人机、电动车等&#xff0c;全桥电机驱动模块提供了理想的解决方案。本文将介绍全桥电机驱动模块的原理和实际应用场景&#xff0c;并对几种常见的全…

【高并发网络通信架构】引入IO多路复用(select,poll,epoll)实现高并发tcp服务端

目录 一&#xff0c;往期文章 二&#xff0c;基本概念 IO多路复用 select 模型 poll 模型 epoll 模型 三&#xff0c;函数清单 1.select 方法 2.poll 方法 3.epoll_create 方法 4.epoll_ctl 方法 5.epoll_wait 方法 6.struct epoll_event 结构体 四&#xff0c;代…

uniapp踩坑之项目:uniapp修改弹窗组件样式

在components文件夹里创建zz-prompt文件夹&#xff0c;再在下面创建index.vue <!--通知弹窗index.vue--> <template><view class"prompt-box" v-if"visible" touchmove"true"><view class"prompt"><view c…

1.8 用户注册_和使用的工具类

步骤1&#xff1a;在common模块下,创建对应的工具类 /** 创建性别枚举(Sex)*/ /** md5加密类(MD5Utils)*/ /** 时间转换格式化类(DateUtil)*/ /** 生成全局唯一主机id (Sid)*/步骤2&#xff1a;在pojo模块下&#xff0c;创建表单封装bo对象 /** 注册表单bo对象 UserBO*/步骤3…

怎么将桌面笔记软件中记录的内容折叠起来或展开显示?

记笔记是一种良好的习惯&#xff0c;不仅可以帮助我们整理思绪&#xff0c;还能有效地记录重要的信息。在现代科技的支持下&#xff0c;一款优秀的笔记软件已经成为我们记录和管理事项的主要工具。特别是一款能够折叠的桌面笔记软件&#xff0c;将会给用户带来更多的便利和效率…

2023.07.07 homework

孩子们有些基础不好&#xff0c;鼓励为主&#xff0c;教他们慢慢搬公式推算&#xff0c;提高准确率就好啦。每一次比上一次好一点点&#xff0c;慢慢找回自信心。 图形结合&#xff0c;话说话&#xff0c;其实数学这玩意&#xff0c;画得好也比较直观 第八题找规律的题目&#…