基本思想
从初始状态S开始,利用规则,生成所有可能的状态。构成树的下一层节点,检查是否出现目标状态G,若未出现,就对该层所有状态节点,分别顺序利用规则。生成再下一层的所有状态节点,对这一层的所有状态节点检查是否出现G,若未出现,继续按上面思想生成再下一层的所有状态节点,这样一层一层往下展开。直到出现目标状态为止。
.算法步骤
(1)把起始节点S线放到queue 表中克祥
(2)如果queue是空表,则失败退出,否则继续。
(3)在queue表中取最前面的节点node 移到 CL OSED 表中。(出队)
(4)扩展node节点。若没有后继即叶节点),则转向(2)循环。
(5)把node的所有后继节点放在queue表的末端。各后继结点指针指向node节点。(入队)
(6)若后继节点中某一个是目标节点,则找到一个解,成功退出。否则转向(2)循环。
omp并行加速:
使用#pragma omp parallel for shared(vis)
#pragma omp parallel for shared(vis, q)
共享数据
使用#pragma omp critical
防止越界。
算法实现:
#include <iostream>
#include <queue>
#include <fstream>
#include <omp.h>
using namespace std;
const int MAXN =4039; // 最大节点数
bool vis[MAXN]; // 标记数组,记录节点是否被访问过
int G[MAXN][MAXN]; // 图的邻接矩阵
//int n; // 节点数
void bfs(int s, ofstream& out) {
queue<int> q;
q.push(s);
vis[s] = true;
while (!q.empty())
{
int u = q.front();
q.pop();
out << u << " "; // 将节点编号输出到文件中
#pragma omp parallel for shared(vis, q)
for (int v = 0; v < MAXN; v++) {
if (G[u][v] && !vis[v]) {
#pragma omp critical
{
q.push(v);
vis[v] = true;
}
}
}
}
}
int main(int argc, char *argv[]) {
int n = atoi(argv[1]); //线程数
ifstream inFile("input.txt"); // 从文件中读取图的信息
int u,v;
while(inFile >> u >> v) //假设每一行插入一条边u->v
{
G[u][v]=1;
}
inFile.close();
ofstream outFile("output_omp.txt"); // 将结果保存到文件中
double starttime = omp_get_wtime();
omp_set_num_threads(n); //设置线程数
#pragma omp parallel for shared(vis)
for (int i = 0; i < MAXN; i++) {
if (!vis[i]) {
bfs(i, outFile);
}
}
outFile.close();
double endtime = omp_get_wtime();
printf("\n并行时间:%lfs\n", endtime - starttime);
return 0;
}
运行结果:
Omp运行结果:
加速比:0.021814/0.014498=1.504621327079597
Omp结果:
数据集下载:数据集
提取码:k3v2
OpenMP基本概念
OpenMP是一种用于共享内存并行系统的多线程程序设计方案,支持的编程语言包括C、C++和Fortran。OpenMP提供了对并行算法的高层抽象描述,特别适合在多核CPU机器上的并行程序设计。编译器根据程序中添加的pragma指令,自动将程序并行处理,使用OpenMP降低了并行编程的难度和复杂度。当编译器不支持OpenMP时,程序会退化成普通(串行)程序。程序中已有的OpenMP指令不会影响程序的正常编译运行。
在VS中启用OpenMP很简单,很多主流的编译环境都内置了OpenMP。在项目上右键->属性->配置属性->C/C++->语言->OpenMP支持,选择“是”即可。
OpenMP执行模式
OpenMP采用fork-join的执行模式。开始的时候只存在一个主线程,当需要进行并行计算的时候,派生出若干个分支线程来执行并行任务。当并行代码执行完成之后,分支线程会合,并把控制流程交给单独的主线程。
一个典型的fork-join执行模型的示意图如下:
OpenMP编程模型以线程为基础,通过编译制导指令制导并行化,有三种编程要素可以实现并行化控制,他们分别是编译制导、API函数集和环境变量。
编译制导
编译制导指令以#pragma omp 开始,后边跟具体的功能指令,格式如:#pragma omp 指令[子句[,子句] …]。常用的功能指令如下:
parallel:用在一个结构块之前,表示这段代码将被多个线程并行执行;
for:用于for循环语句之前,表示将循环计算任务分配到多个线程中并行执行,以实现任务分担,必须由编程人员自己保证每次循环之间无数据相关性;
parallel for:parallel和for指令的结合,也是用在for循环语句之前,表示for循环体的代码将被多个线程并行执行,它同时具有并行域的产生和任务分担两个功能;
sections:用在可被并行执行的代码段之前,用于实现多个结构块语句的任务分担,可并行执行的代码段各自用section指令标出(注意区分sections和section);
parallel sections:parallel和sections两个语句的结合,类似于parallel for;
single:用在并行域内,表示一段只被单个线程执行的代码;
critical:用在一段代码临界区之前,保证每次只有一个OpenMP线程进入;
flush:保证各个OpenMP线程的数据影像的一致性;
barrier:用于并行域内代码的线程同步,线程执行到barrier时要停下等待,直到所有线程都执行到barrier时才继续往下执行;
atomic:用于指定一个数据操作需要原子性地完成;
master:用于指定一段代码由主线程执行;
threadprivate:用于指定一个或多个变量是线程专用,后面会解释线程专有和私有的区别。
相应的OpenMP子句为:
private:指定一个或多个变量在每个线程中都有它自己的私有副本;
firstprivate:指定一个或多个变量在每个线程都有它自己的私有副本,并且私有变量要在进入并行域或任务分担域时,继承主线程中的同名变量的值作为初值;
lastprivate:是用来指定将线程中的一个或多个私有变量的值在并行处理结束后复制到主线程中的同名变量中,负责拷贝的线程是for或sections任务分担中的最后一个线程;
reduction:用来指定一个或多个变量是私有的,并且在并行处理结束后这些变量要执行指定的归约运算,并将结果返回给主线程同名变量;
nowait:指出并发线程可以忽略其他制导指令暗含的路障同步;
num_threads:指定并行域内的线程的数目;
schedule:指定for任务分担中的任务分配调度类型;
shared:指定一个或多个变量为多个线程间的共享变量;
ordered:用来指定for任务分担域内指定代码段需要按照串行循环次序执行;
copyprivate:配合single指令,将指定线程的专有变量广播到并行域内其他线程的同名变量中;
copyin:用来指定一个threadprivate类型的变量需要用主线程同名变量进行初始化;
default:用来指定并行域内的变量的使用方式,缺省是shared。
利用omp_set_num_threads()来设置线程数,
利用#pragma omp parallel sections 声明下面大括号中的语句要并行多线程执行;
利用#pragma omp section 分配线程。