OpenCL矢量加法例子

news2026/1/2 3:44:20

1.向量加内核函数

__kernel void vector_add(__global float* A, __global float* B, __global float* C) {
    int id = get_global_id(0);
    C[id] = A[id] + B[id];
}

2.向量加主程序

#include<stdio.h>
#include<stdlib.h>
#ifdef _APPLE_
#include<OpenCL/cl.h>
#else
#include<CL/cl.h>
#endif

#pragma warning( disable : 4996 )

const int ARRAY_SIZE = 1000;

char* ReadKernelSourceFile(const char* filename, size_t* length)
{
	FILE* file = NULL;
	size_t sourceLength;
	char* sourceString;
	int ret;
	file = fopen(filename, "rb");
	if (file == NULL)
	{
		printf("%s at %d :Can't open source file %s.\n", filename);
		return NULL;
	}
	fseek(file, 0, SEEK_END);
	sourceLength = ftell(file);
	fseek(file, 0, SEEK_SET);
	sourceString = (char*)malloc(sourceLength + 1);
	sourceString[0] = '\0';
	ret = fread(sourceString, sourceLength, 1, file);
	if (ret == 0)
	{
		printf("Can't read source %s.\n", filename);
		return NULL;
	}
	fclose(file);
	if (length != 0)
	{
		*length = sourceLength;
	}
	sourceString[sourceLength] = '\0';
	return sourceString;
}
/*
1.创建平台
2.创建设备
3.根据设备创建上下文
*/
cl_context CreateContext(cl_device_id* device)
{
	cl_int errNum;
	cl_uint numPlatforms;
	cl_platform_id firstPlatformId;
	cl_context context = NULL;
	errNum = clGetPlatformIDs(1, &firstPlatformId, &numPlatforms);
	if (errNum != CL_SUCCESS || numPlatforms <= 0)
	{
		printf("Failed to find any OpenCL platforms.");
		return NULL;
	}
	else
	{
		//打印平台信息
		size_t size;

		// get name
		errNum = clGetPlatformInfo(firstPlatformId, CL_PLATFORM_NAME, 0, NULL, &size);
		char* name = (char*)malloc(size);
		errNum = clGetPlatformInfo(firstPlatformId, CL_PLATFORM_NAME, size, name, NULL);
		printf("CL_PLATFORM_NAME:%s\n", name);

		// vendor
		errNum = clGetPlatformInfo(firstPlatformId, CL_PLATFORM_VENDOR, 0, NULL, &size);
		char* vendor = (char*)malloc(size);
		errNum = clGetPlatformInfo(firstPlatformId, CL_PLATFORM_VENDOR, size, vendor, NULL);
		printf("CL_PLATFORM_VENDOR:%s\n", vendor);

		// version
		errNum = clGetPlatformInfo(firstPlatformId, CL_PLATFORM_VERSION, 0, NULL, &size);
		char* version = (char*)malloc(size);
		errNum = clGetPlatformInfo(firstPlatformId, CL_PLATFORM_VERSION, size, version, NULL);
		printf("CL_PLATFORM_VERSION:%s\n", version);

		// profile
		errNum = clGetPlatformInfo(firstPlatformId, CL_PLATFORM_PROFILE, 0, NULL, &size);
		char* profile = (char*)malloc(size);
		errNum = clGetPlatformInfo(firstPlatformId, CL_PLATFORM_PROFILE, size, profile, NULL);
		printf("CL_PLATFORM_PROFILE:%s\n", profile);

		// extensions
		errNum = clGetPlatformInfo(firstPlatformId, CL_PLATFORM_EXTENSIONS, 0, NULL, &size);
		char* extensions = (char*)malloc(size);
		errNum = clGetPlatformInfo(firstPlatformId, CL_PLATFORM_EXTENSIONS, size, extensions, NULL);
		printf("CL_PLATFORM_EXTENSIONS:%s\n", extensions);
	}

	errNum = clGetDeviceIDs(firstPlatformId, CL_DEVICE_TYPE_GPU, 1, device, NULL);
	if (errNum != CL_SUCCESS)
	{
		printf("There is no GPU, trying CPU...");
		errNum = clGetDeviceIDs(firstPlatformId, CL_DEVICE_TYPE_CPU, 1, device, NULL);
	}
	if (errNum != CL_SUCCESS)
	{
		printf("There is NO GPU or CPU");
		return NULL;
	}
	else
	{
		//打印设备信息
		size_t valueSize;
		char* value;
		clGetDeviceInfo(*device, CL_DEVICE_NAME, 0, NULL, &valueSize);
		value = (char*)malloc(valueSize);
		clGetDeviceInfo(*device, CL_DEVICE_NAME, valueSize, value, NULL);
		printf("Device Name: %s\n", value);
		free(value);
	}


	context = clCreateContext(NULL, 1, device, NULL, NULL, &errNum);
	if (errNum != CL_SUCCESS)
	{
		printf(" create context error\n");
		return NULL;
	}
	return context;
}

/*
@在上下文可用的第一个设备中创建命令队列
*/
cl_command_queue CreateCommandQueue(cl_context context,
	cl_device_id device)
{
	cl_int errNum;
	cl_command_queue commandQueue = NULL;
	commandQueue = clCreateCommandQueue(context, device, 0, NULL);
	if (commandQueue == NULL)
	{
		printf("Failed to create commandQueue for device 0");
		return NULL;
	}
	return commandQueue;
}
/*
@读取内核源码创建OpenCL程序
*/
cl_program CreateProgram(cl_context context,
	cl_device_id device,
	const char* fileName)
{
	cl_int errNum;
	cl_program program;
	size_t program_length;
	char* const source = ReadKernelSourceFile(fileName,
		&program_length);
	program = clCreateProgramWithSource(context, 1,
		(const char**)&source,
		NULL, NULL);
	if (program == NULL)
	{
		printf("Failed to create CL program from source.");
		return NULL;
	}
	errNum = clBuildProgram(program, 0, NULL, NULL, NULL, NULL);
	if (errNum != CL_SUCCESS)
	{
		char buildLog[16384];
		clGetProgramBuildInfo(program, device,
			CL_PROGRAM_BUILD_LOG,
			sizeof(buildLog),
			buildLog, NULL);
		printf("Error in kernel:%s ", buildLog);
		clReleaseProgram(program);
		return NULL;
	}
	return program;
}
/*
@创建内存对象
*/
bool CreateMemObjects(cl_context context, cl_mem memObjects[3],
	float* a, float* b)
{
	memObjects[0] = clCreateBuffer(context,
		CL_MEM_READ_ONLY | CL_MEM_COPY_HOST_PTR,
		sizeof(float) * ARRAY_SIZE, a, NULL);
	memObjects[1] = clCreateBuffer(context,
		CL_MEM_READ_ONLY | CL_MEM_COPY_HOST_PTR,
		sizeof(float) * ARRAY_SIZE, b, NULL);
	memObjects[2] = clCreateBuffer(context, CL_MEM_READ_WRITE,
		sizeof(float) * ARRAY_SIZE, NULL, NULL);
	if (memObjects[0] == NULL || memObjects[1] == NULL
		|| memObjects[2] == NULL)
	{
		printf("Error creating memory objects.");
		return false;
	}
	return true;
}
/*
@清除OpenCL资源
*/
void Cleanup(cl_context context, cl_command_queue commandQueue,
	cl_program program, cl_kernel kernel,
	cl_mem memObjects[3])
{
	for (int i = 0; i < 3; i++)
	{
		if (memObjects[i] != 0)
			clReleaseMemObject(memObjects[i]);
	}
	if (commandQueue != 0)
		clReleaseCommandQueue(commandQueue);
	if (kernel != 0)
		clReleaseKernel(kernel);
	if (program != 0)
		clReleaseProgram(program);
	if (context != 0)
		clReleaseContext(context);
}
int main(int argc, char** argv)
{
	cl_context context = 0;
	cl_command_queue commandQueue = 0;
	cl_program program = 0;
	cl_device_id device = 0;
	cl_kernel kernel = 0;
	cl_mem memObjects[3] = { 0, 0, 0 };
	cl_int errNum;

	//1.平台层：查询平台、设备，根据设备创建OpenCL上下文
	context = CreateContext(&device);
	if (context == NULL)
	{
		printf("Failed to create OpenCL context.");
		return 1;
	}

	//2.运行时：获得OpenCL设备,并创建命令队列
	commandQueue = CreateCommandQueue(context, device);
	if (commandQueue == NULL)
	{
		Cleanup(context, commandQueue, program, kernel,
			memObjects);
		return 1;
	}

	//创建OPenCL程序
	program = CreateProgram(context, device, "vecAdd.cl");
	if (program == NULL)
	{
		Cleanup(context, commandQueue, program,
			kernel, memObjects);
		return 1;
	}
	//创建OpenCL内核
	kernel = clCreateKernel(program, "vector_add", NULL);
	if (kernel == NULL)
	{
		printf("Failed to create kernel");
		Cleanup(context, commandQueue, program,
			kernel, memObjects);
		return 1;
	}
	//创建OpenCL内存对象
	float result[ARRAY_SIZE];
	float a[ARRAY_SIZE];
	float b[ARRAY_SIZE];
	for (int i = 0; i < ARRAY_SIZE; i++)
	{
		a[i] = (float)(i + 1);
		b[i] = (float)(i + 1);
	}
	if (!CreateMemObjects(context, memObjects, a, b))
	{
		Cleanup(context, commandQueue, program,
			kernel, memObjects);
		return 1;
	}
	//设置内核参数
	errNum = clSetKernelArg(kernel, 0, sizeof(cl_mem), &memObjects[0]);
	errNum |= clSetKernelArg(kernel, 1, sizeof(cl_mem),
		&memObjects[1]);
	errNum |= clSetKernelArg(kernel, 2, sizeof(cl_mem),
		&memObjects[2]);
	if (errNum != CL_SUCCESS)
	{
		printf("Error setting kernel arguments.");
		Cleanup(context, commandQueue, program,
			kernel, memObjects);
		return 1;
	}
	size_t globalWorkSize[1] = { ARRAY_SIZE };
	size_t localWorkSize[1] = { 1 };

	//执行内核
	errNum = clEnqueueNDRangeKernel(commandQueue, kernel,
		1, NULL,
		globalWorkSize,
		localWorkSize, 0, NULL,
		NULL);
	if (errNum != CL_SUCCESS)
	{
		printf("Error queuing kernel for execution.");
		Cleanup(context, commandQueue, program, kernel,
			memObjects);
		return 1;
	}

	//计算结果拷贝回主机
	errNum = clEnqueueReadBuffer(commandQueue, memObjects[2],
		CL_TRUE, 0,
		ARRAY_SIZE * sizeof(float),
		result, 0, NULL, NULL);
	if (errNum != CL_SUCCESS)
	{
		printf("Error reading result buffer.");
		Cleanup(context, commandQueue, program, kernel,
			memObjects);
		return 1;
	}
	for (int i = 0; i < ARRAY_SIZE; i++)
	{
		printf("i=%d:%f\n", i, result[i]);
	}
	printf("Executed program succesfully.");
	Cleanup(context, commandQueue, program, kernel, memObjects);
	return 0;
}