😏★,°:.☆( ̄▽ ̄)/$:.°★ 😏
这篇文章主要介绍OpenMP入门。
学其所用,用其所学。——梁启超
欢迎来到我的博客,一起学习,共同进步。
喜欢的朋友可以关注一下,下次更新不迷路🥞
文章目录
- :smirk:1. 并行编程OpenMP介绍
- :blush:2. openmp并行处理for循环
- :satisfied:3. openmp多线程执行效率对比
😏1. 并行编程OpenMP介绍
OpenMP是一种用于并行编程的开放标准,它旨在简化共享内存多线程编程的开发过程。OpenMP提供了一组指令和库例程,可以将顺序程序转换为可并行执行的代码。
OpenMP的核心思想是使用指令来标识出需要并行执行的代码块,并指定如何将工作划分到不同的线程中。开发人员可以在现有的顺序代码中插入特定的指令,以实现并行化。
以下是OpenMP的一些主要特性:
1.指令注释:通过在代码中插入特定的预处理指令,开发人员可以标识出应该并行执行的代码块。例如,可以使用
#pragma omp parallel
指令来创建一个并行区域。2.线程创建与同步:OpenMP自动管理线程的创建和同步。在进入并行区域时,OpenMP会动态地创建一组线程,并在退出并行区域时进行同步。开发人员无需手动管理线程的创建和销毁。
3.工作分配:OpenMP提供了多种方式来将工作划分到不同的线程中。例如,可以使用
#pragma omp for
指令将循环迭代并行化,让不同线程处理不同的迭代。4.共享内存模型:OpenMP使用共享内存模型,允许多个线程之间共享数据。开发人员可以使用shared关键字将变量声明为共享变量,以便多个线程可以访问和修改它们。
5.线程私有变量:除了共享变量外,OpenMP还支持线程私有变量。开发人员可以使用private关键字将变量声明为线程私有,确保每个线程都有自己的副本。
OpenMP广泛用于各种领域的并行编程,包括科学计算、图形处理、机器学习等。它提供了一种相对简单且易于使用的方法来利用多核处理器的计算能力,加速程序的执行。
😊2. openmp并行处理for循环
openmp常用来对代码中的for循环进行并行处理优化:
一个例子如下:
// main.cpp
// 使用并行循环进行向量加法
#include <stdio.h>
#include <omp.h>
#define SIZE 10000
int main() {
int i;
int a[SIZE], b[SIZE], c[SIZE];
// 初始化数组
for (i = 0; i < SIZE; i++) {
a[i] = i;
b[i] = i;
}
#pragma omp parallel for
for (i = 0; i < SIZE; i++) {
c[i] = a[i] + b[i];
}
// 打印结果
for (i = 0; i < SIZE; i++) {
printf("%d ", c[i]);
}
printf("\n");
return 0;
}
例程中使用#pragma omp parallel for
指令来并行化for循环。这个指令告诉编译器将循环分割成多个任务,并由多个线程同时执行。每个线程负责处理循环的一个子集。
编译时启用OpenMP支持,g++ main.cpp -fopenmp
这样程序就可以并发执行,提高运算效率了。
😆3. openmp多线程执行效率对比
openmp可以对一段程序指定不同线程数来优化,下面是一个示例:
#include <iostream>
#include <omp.h>
using namespace std;
void test()
{
for (int i = 0; i < 50000; i++)
{
}
}
int main()
{
float startTime = omp_get_wtime();
//指定2个线程
#pragma omp parallel for num_threads(2)
for (int i = 0; i < 50000; i++)
{
test();
}
float endTime = omp_get_wtime();
printf("指定 2 个线程,执行时间: %f\n", endTime - startTime);
startTime = endTime;
//指定4个线程
#pragma omp parallel for num_threads(4)
for (int i = 0; i < 50000; i++)
{
test();
}
endTime = omp_get_wtime();
printf("指定 4 个线程,执行时间: %f\n", endTime - startTime);
startTime = endTime;
//指定8个线程
#pragma omp parallel for num_threads(8)
for (int i = 0; i < 50000; i++)
{
test();
}
endTime = omp_get_wtime();
printf("指定 8 个线程,执行时间: %f\n", endTime - startTime);
startTime = endTime;
//指定12个线程
#pragma omp parallel for num_threads(12)
for (int i = 0; i < 50000; i++)
{
test();
}
endTime = omp_get_wtime();
printf("指定 12 个线程,执行时间: %f\n", endTime - startTime);
startTime = endTime;
//不使用OpenMP
for (int i = 0; i < 50000; i++)
{
test();
}
endTime = omp_get_wtime();
printf("不使用OpenMP多线程,执行时间: %f\n", endTime - startTime);
startTime = endTime;
return 0;
}
结果如下:
指定 2 个线程,执行时间: 2.098389
指定 4 个线程,执行时间: 1.102295
指定 8 个线程,执行时间: 0.564941
指定 12 个线程,执行时间: 0.375244
不使用OpenMP多线程,执行时间: 3.956543
例程中使用#pragma omp parallel for num_threads(12)
来对程序指定线程数,对这种运算次数多的情况下,提高openmp方法可压缩执行时间到1/4左右,但不能简单通过提高线程数来提高效率。
以上。