CUFFT计算一维傅里叶变换
- CUFFT库介绍
- CUFFTW计算一维傅里叶变换
- CUFFT计算一维傅里叶变换
前言:之前实现了CPU运行一维傅里叶变换,最近要改成GPU加速一维傅里叶变换,于是有了此篇作为记录,方便以后查阅。
CUFFT库介绍
CUFFT(CUDA Fast Fourier Transform):CUDA提供了一系列的函数帮助开发者进行快速傅里叶变换的运算。
CUFFT库构成:两个子库分别是CUFFT和CUFFTW。
- CUFFTW:提供了一些接口,使得用户使用FFTW库(CPU快速傅里叶变换库,FFTW3文章有讲解过安装和使用)编写的程序能够运行在GPU上。其实意思就是FFTW CPU编写的代码可以用在CUFFTW GPU,因为它们的接口名字相同。这提高使用FFTW现有代码的可移植性。
- CUFFT:是纯CUDA接口的快速傅里叶变换库。
CUFFTW计算一维傅里叶变换
使用的傅里变换的函数和CPU的FFTW3一摸一样,但是要改动一些地方。
- 在cuda配置的时候,“项目-属性-连接器-输入lib”的部分还要加上cufftw.lib,不然无法解析fftw函数。
- 头文件fftw3.h改成cufftw.h。
- 还要进行GPU内存管理。
- 因为涉及到GPU内存管理所以要写在cu文件下(一开始犯糊涂,直接在cpp文件改了,结果发现和CPU运行的速度一样)。
.cu文件代码:
#include"cuda.cuh"
#include <cuda_runtime.h>
#include<device_launch_parameters.h>
#include <stdio.h>
#include<cufftw.h>
void fftFun(int n, double *in, double* out) {
// FFTW默认使用双精度浮点数,所以这里用double
// 傅里叶变换数据
fftw_complex* DataIn = (fftw_complex*)fftw_malloc(sizeof(fftw_complex) * n);
fftw_complex* DataOut = (fftw_complex*)fftw_malloc(sizeof(fftw_complex) * n);
fftw_plan Plan = fftw_plan_dft_1d(n, DataIn, DataOut, FFTW_FORWARD, FFTW_ESTIMATE);
// 数据从cpu拷贝到gpu
for (int i = 0; i < n; i++) {
DataIn[i][0] = in[i];
}
// 进行傅里叶变换
fftw_execute(Plan);
// 数据从GPU拷贝回GPU
for (int i = 0; i < n / 2; i++) {
out[i] = sqrt(DataOut[i][0]*DataOut[i][0] + DataOut[i][1]*DataOut[i][1])/(n/2);// 计算振幅
}
// 销毁
fftw_free(DataIn);
fftw_free(DataOut);
fftw_destroy_plan(Plan);
return;
}
如何判断CUDA有没有用上,可以在任务管理器中看程序运行后CUDA调用GPU的情况。
CUFFT计算一维傅里叶变换
注意的点:
- 在cuda配置的时候,“项目-属性-连接器-输入lib”的部分还要加上cufft.lib,不然无法解析fftw函数。
- 头文件加上cufft.h。
- 在.cu文件中编写,因为涉及到GPU内存管理。
.cu文件核心函数:
void fftFun(int n, cufftComplex* in, cufftComplex* out) {
// 傅里叶变换数据
// 这里cufftComplex是单精度的,如果要用双精度改为cufftDoubleComplex
cufftComplex* DataIn, * DataOut;
cudaMalloc((void**)&DataIn, sizeof(cufftComplex) * n);
cudaMalloc((void**)&DataOut, sizeof(cufftComplex) * n);
cufftHandle Plan;
cufftPlan1d(&Plan, n, CUFFT_C2C, 1);// 双精度cufftPlan1d(&Plan, n, CUFFT_Z2Z, 1);
// 把CPU数据复制到GPU
cudaMemcpy(in, DataIn, n* sizeof(cufftComplex), cudaMemcpyHostToDevice);
// 傅里叶变换
// CUFFT_FORWARD为正向FFT,CUFFT_INVERSE为逆向FFT
cufftExecC2C(Plan, DataIn, DataOut, CUFFT_FORWARD);// 双精度cufftExecZ2Z(Plan, DataIn, DataOut, CUFFT_FORWARD);
// 把GPU数据复制到CPU
cudaMemcpy(DataOut, out, n * sizeof(cufftComplex), cudaMemcpyDeviceToHost);
// 销毁GPU开辟的东西
cufftDestroy(Plan);
cudaFree(DataIn);
cudaFree(DataOut);
return;
}
.cpp文件main函数
int main()
{
// 输入n,再输入n个要进行傅里叶变换的采样点
int n;
cin >> n;
// CPU的傅里叶变换数据分配内存
// 双精度改为cufftDoubleComplex
cufftComplex* in = (cufftComplex*)malloc(n * sizeof(cufftComplex));
cufftComplex* out = (cufftComplex*)malloc(n * sizeof(cufftComplex));
for (int i = 0; i < n; i++) {
cin >> in[i].x;
in[i].y = 0;
}
fftFun(n, in, out);
// 输出傅里叶变换后的振幅,傅里叶变换左右对称所以只需要n/2个点
for (int i = 0; i < n/2; i++) {
cout << sqrt(out[i].x * out[i].x + out[i].y * out[i].y) / (n / 2) << " ";;// 计算振幅
}
cout << endl;
return 0;
}