《cuda c编程权威指南》01- 用gpu输出hello world

news2025/12/13 0:31:12

学习一门新语言的最好方式就是用它来编写程序。

1. 使用cpu输出hello world

2. 使用gpu输出hello world

3. CUDA编程结构

1. 使用cpu输出hello world

hello.cu

#include <stdio.h>

void helloFromCPU()
{
	printf("hello world from cpu!\n");
}

int main(void)
{
	helloFromCPU();
}

2. 使用gpu输出hello world

hello.cu

#include <stdio.h>
#include <cuda_runtime.h>

__global__ void helloFromGPU()
{
	printf("hello world from gpu!\n");
}

int main(void)
{
	helloFromGPU<<<1,10>>>();
}

改用gpu要点：

（1）头文件#include <cuda_runtime.h>;

（2）函数前面加修饰符__global__，使其成为内核函数；

（3）调用时要<<<>>>对内核函数的执行进行配置，这里配置的结果是10个线程运行相同函数。

如果调用时不进行如上加上<<<>>>配置，直接调用：helloFromGPU(); 则会报如下错误。

error a __global__ function call must be configured CudaRuntime1 D:\zxq\code\cuda\CudaRuntime1\CudaRuntime1\hello.cu 11

3. CUDA编程结构

一个典型的CUDA编程结构包括5个主要步骤。

分配GPU内存。
从CPU内存中拷贝数据到GPU内存。
调用CUDA内核函数来完成程序指定的运算。
将数据从GPU拷回CPU内存。
释放GPU内存空间。

上面的例子只有第3步，后面会给出完整的典型cuda程序 .

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/812359.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

《cuda c编程权威指南》01- 用gpu输出hello world

1. 使用cpu输出hello world

2. 使用gpu输出hello world

3. CUDA编程结构

相关文章

Zabbix分布式监控配置和使用

【Golang 接口自动化00】为什么要用Golang做自动化？

【C++进阶之路】多态篇

python速成之循环分支结构学习

AD21原理图的高级应用（六）原理图设计片段的使用

一文了解 Android 车机如何处理中控的旋钮输入？

测试|测试用例方法篇

linux设备驱动的poll与fasync

lib-flexible修改配置适配更多不同分辨率

Python 教程之标准库概览

【Linux】进程篇Ⅱ：进程开始、进程终止、进程等待

动态SQL 语句-更复杂的查询业务需求也能轻松拿捏

【C语言进阶篇】你真的学会数组了嘛？数组笔试题万字解析（上）

ShardingSphere 源码模块介绍

C++那些事之高性能SIMD

【机器学习】Feature scaling and Learning Rate (Multi-variable)

【C++】类和对象-C++运算符重载

在docker中没有vi如何修改docker中的文件

电子词典

【AI网站分享】