学习笔记 —— C++并行库OpenMP

news2025/4/27 21:04:49

Contents

Installation
Implement
- - 1、一个最简单的OpenMP代码：
  - 2、如何规定线程数
  - 2、如何设置OpenMP分配线程的schedule
  - 3、冲突避免机制 --Reduction（规约）
Discovery

写在最前面：
并行化虽好，但并不是所有任务在并行化后都能得到性能的提升！
首先要满足的是所要完成的任务量远大于分配其他线程的消耗。

Installation

一般Ubuntu系统自带

Implement

1、一个最简单的OpenMP代码：

#include <iostream>
#include <omp.h>
using namespace std;
int main(){
    #pragma omp parallel default(none) shared(cout) // This is the parallel region
    {
        int ID = omp_get_thread_num();
        int num = omp_get_num_threads();
        cout << "Hello World " << ID <<  " from " << num << endl;
    }

代码编译：

命令	编译方式
gcc/g++ –fopenmp hello_world.c	gcc
icc/icpc –openmp hello_world.c	intel (linux)
cc –openmp hello_world.c	Cray
pgcc –mp hello_world.c	pgi

2、如何规定线程数

有三种方法，下面是当初的截图，忘了翻译了… 或者问GPT也行。
在这里插入图片描述

2、如何设置OpenMP分配线程的schedule

schedule	description
Static	（默认）Chunk-size固定，线程所执行的chunk固定
Dynamic	Chunk-size固定，线程按需请求chunk执行
Guided	Chunk-size逐渐降低，线程按需请求chunk执行

没法说哪个更好，你每个线程的任务基本一致的话static理论上比较好，如果不一致的话Dynamic和Guided可能更好。针对不同的任务需要自己测试后择优。

更详细介绍的看：
OpenMP的schedule机制

3、冲突避免机制 --Reduction（规约）

OpenMP的reduction指令用于将计算结果从并行循环中的多个线程合并为单个结果。通过使用reduction指令，每个线程都会维护一个私有的变量，并在循环结束时将这些变量组合成单个结果。
支持多种操作符：+、-、*、/、max、min等

使用OpenMP的reduction指令计算向量中所有元素的和的示例：

#include<omp.h>
#include<stdio.h>
#include<stdlib.h>

#define SIZE 10000000

int main() {
    int i;
    double sum = 0.0;
    double *array = (double*) malloc(SIZE * sizeof(double));

    // 初始化数组
    for (i = 0; i < SIZE; i++) {
        array[i] = i * 0.1;
    }

    // 使用OpenMP并行计算数组总和
#pragma omp parallel for default(none) reduction(+: sum)
    for (i = 0; i < SIZE; i++) {
        sum += array[i];
    }

    printf("Sum of array elements = %lf\n", sum);

    free(array);
    return 0;
}

上例中，通过使用#pragma omp parallel for reduction(+: sum)指令，将计算数组所有元素总和的任务划分给多个线程并使用加法操作符(+)将每个线程私有的sum变量的值累加到共享的sum变量中，最终输出结果的正确和最终值。

Discovery

另外经过实验我发现，针对同一代码，使用C编译和C++编译得到的性能是不同的。
如针对下面这个计算圆周率 $\pi$ 的例子：
在这里插入图片描述

相关理论在这：

现在来看下随着使用的线程数增加，我们的运算耗时如何变化：

PC的CPU: AMD 5800H

在这里插入图片描述
C++编译后的性能变化趋势如下：

可以看到，C的结果与我们的预想基本一致，线程数越大运算越快；线程数大到一定程度速度就不怎么增加了。
而C++的结果却出乎意料，但仅就耗时的数量级来看，C++的性能是远高于C的。我暂时还不能解释原因…

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/429095.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

【MySQL学习】MySQL表的操作

【MySQL学习】MySQL表的操作

目录一、表的创建1.1 创建表的语法1.2 案例二、查看表结构三、查看建表语句四、修改表4.1 修改表的语法4.2 修改案例五、删除表一、表的创建 1.1 创建表的语法语法： CREATE TABLE table_name (field1 datatype,field2 datatype,field3 datatype ) character set…

阅读更多...

透视Android系统AMS、PMS和WMS，了解开发中的重要角色

透视Android系统AMS、PMS和WMS，了解开发中的重要角色

原理在Android系统中，AMS（Activity Manager Service）、PMS（PackageManager Service）和WMS（Window Manager Service）是三个重要的系统服务，它们负责管理应用程序的生命周期、处理应…

阅读更多...

Backblaze + Cloudflare + Picgo 打造免费顺畅的图床体验

Backblaze + Cloudflare + Picgo 打造免费顺畅的图床体验

本文xlog地址：https://x.cosine.ren/backblaze-cloudflare-picgo-imgbed hexo 地址：https://ysx.cosine.ren/backblaze-cloudflare-picgo-imgbed 同步发布最近有用到oss存储的需求，跟群友调研了下国内 & 国外的 oss 后，深感找…

阅读更多...

大爽pygame入门教程第一节基础知识

大爽pygame入门教程第一节基础知识

作者自我介绍：大爽歌, b站小UP主 ，编程1对1辅导老师本节掌握要点： 文本, 图形, 键鼠事件，动态展示。一、实现基础窗口 0 - 新建文件新建001.py文件，内容如下 import pygamepygame.init() # pygame 初始化&#x…

阅读更多...

什么是远程桌面连接?如何操作远程桌面?

什么是远程桌面连接?如何操作远程桌面?

随着时代越来越信息化、智能化、自动化，越来越多的企业和个人开始使用远程办公软件进行办公。其中远程桌面连接是一种非常流行的办公方式。那么，什么是远程桌面连接?如何操作远程桌面? 一、什么是远程桌面连接? 远程桌面连接是一种远程访问计算机的…

阅读更多...

nginx缓冲区关闭导致下载失败问题-方案篇

nginx缓冲区关闭导致下载失败问题-方案篇

问题描述导出操作。小于200k的excel正常下载，大于200K的下载失败，异常信息如下: Cannot forward to error page for request [/xx/xx] as the response has already been committed. As a result,the response may have the wrong status code. If you…

阅读更多...

程序员工作久了，都不会好好说人话了...互联网人的....黑话

程序员工作久了，都不会好好说人话了...互联网人的....黑话

原来工作也是会被腌入味的前段时间有位博主吐槽工作太久都不会说人话了这张口的互联网味儿瞬间梦回自己的工位而评论区的网友们表示这不就是”世另我“吗一场关于互联网黑话的"掰头" 就此开始了... 维护厨房 （厨房秒变公司） 新…

阅读更多...

Bagging算法预测银行客户流失率

Bagging算法预测银行客户流失率

Bagging算法预测银行客户流失率描述为了防止银行的客户流失，通过数据分析，识别并可视化哪些因素导致了客户流失，并通过建立一个预测模型，识别客户是否会流失，流失的概率有多大。以便银行的客户服务部门更加有针对性…

阅读更多...

【CSS】使用 CSS 实现三角形 ( 宽高设置为 0 | 设置四个边框宽度 / 样式 / 颜色值 | 兼容低版本浏览器 | 基本示例 | 对话框示例 )

【CSS】使用 CSS 实现三角形 ( 宽高设置为 0 | 设置四个边框宽度 / 样式 / 颜色值 | 兼容低版本浏览器 | 基本示例 | 对话框示例 )

文章目录一、使用 CSS 实现三角形二、使用 CSS 实现三角形代码示例三、使用 CSS 实现对话框代码示例一、使用 CSS 实现三角形使用 CSS 实现三角形步骤 : 首先 , 宽度 / 高度设置为 0 ; /* 宽高设置为 0 像素 */width: 0;height: 0;然后 , 设置 4 个边框 , 每个边框都要设置…

阅读更多...

【软考备战·希赛网每日一练】2023年4月14日

【软考备战·希赛网每日一练】2023年4月14日

文章目录一、今日成绩二、错题总结第一题第二题第三题第四题三、知识查缺题目及解析来源：2023年04月14日软件设计师每日一练一、今日成绩二、错题总结第一题解析： 具有最优子结构特点的问题可以使用动态规划法进行求解。计算m数组中每项的值&am…

阅读更多...

日撸 Java 三百行day28-30

日撸 Java 三百行day28-30

文章目录说明day28-30 Huffman 编码 (节点定义与文件读取)1.建树过程（以图为例）2.哈夫曼树特点3.分析代码过程3.1 抽象成员变量3.2结合文章梳理思路1.读文本2.解析文本内容：3.建树4.生成哈夫曼编码5.编码6.解码4.其他4.1 java 类型强转4.2 ja…

阅读更多...

网络安全相关的知识

网络安全相关的知识

一、什么是IDS？ IDS是英文"Intrusion Detection Systems"的缩写，中文意思是"入侵检测系统"。专业上讲就是依照一定的安全策略，通过软、硬件，对网络、系统的运行状况进行监视，尽可能发现各种攻击…

阅读更多...

TexMaker（Latex编辑器）软件的“文献引用”操作：Xelatex方式运行的操作方法

TexMaker（Latex编辑器）软件的“文献引用”操作：Xelatex方式运行的操作方法

一、说明 1. 针对问题本文主要讲解使用TexMaker进行**.bib的方法**的文献引用时，如何使用Xelatexpdf的方式完成文献引用。某些文章强调使用PDFlatex进行编译，但有时候会因为论文模板不同，无法运行padflatexPDF。所以，这里给出xe…

阅读更多...

常用模块和模板引擎

常用模块和模板引擎

私人博客许小墨のBlog —— 菜鸡博客直通车系列文章完整版，配图更多，CSDN博文图片需要手动上传，因此文章配图较少，看不懂的可以去菜鸡博客参考一下配图！ 系列文章目录前端系列文章——传送门后端系列文章——传送…

阅读更多...

Android---导致OOM的常见原因

Android---导致OOM的常见原因

目录内存溢出OOM 单应用可用的最大内存导致 OOM 的常见原因内存实时监控内存溢出OOM 单应用可用的最大内存 dalvik.vm.heapstartsize，它表示堆分配的初始大小。 dalvik.vm.heapgrowthlimit，它表示单个进程内存限定值。 dalvik.vm.heapsize&#…

阅读更多...

LeetCode每日一题 1023. 驼峰式匹配 --双指针

LeetCode每日一题 1023. 驼峰式匹配 --双指针

Halo，这里是Ppeua。平时主要更新C语言，C，数据结构算法......感兴趣就关注我吧！你定不会失望。 🌈个人主页：主页链接 🌈算法专栏：专栏链接我会一直往里填充内容哒！ &…

阅读更多...

Vue UI组件库(Element UI库)

Vue UI组件库(Element UI库)

1 移动端常用 UI 组件库 1. Vant Vant 4 - 轻量、可定制的移动端组件库 (vant-ui.github.io) 2. Cube UI cube-ui Document (didi.github.io) 3. Mint UI Mint UI (mint-ui.github.io) 2.PC 端常用 UI 组件库 1.Element UI Element - 网站快速成型工具 2.IView UI iView / Vi…

阅读更多...

SpringBoot集成WebSocket实现及时通讯聊天功能!!!

SpringBoot集成WebSocket实现及时通讯聊天功能!!!

1：在SpringBoot的pom.xml文件里添加依赖:  <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-websocket</artifactId> </dependency> 2：在配置中…

阅读更多...

C++简单工厂模式

C++简单工厂模式

目录什么是简单工厂模式简单工厂模式的实现总结什么是简单工厂模式简单工厂模式是一种创建型设计模式，它提供了一种创建对象的最佳方式。在软件开发中，我们经常需要创建各种各样的对象，但是直接使用 new 关键字来创建对象会使代码变得…

阅读更多...

Node http模块

Node http模块

文章目录Node http模块概述创建http服务获取请求报文练习搭建http服务url模块解析url操作url设置响应报文练习搭建网页Node http模块概述 http模块提供了创建 HTTP 服务器和客户端的功能。创建http服务 // 导入http模块 const http require("http");// 创建服…

阅读更多...

推荐文章

最新文章