使用MPI-IO并行读写HDF5文件

news2025/4/15 20:09:15

使用MPI-IO并行读写HDF5文件

HDF5支持通过MPI-IO进行并行读写,这对于大规模科学计算应用非常重要。下面我将提供C++和Fortran的示例程序,展示如何使用MPI-IO并行读写HDF5文件。

准备工作

在使用MPI-IO的HDF5之前,需要确保:

  1. HDF5库编译时启用了MPI支持
  2. 程序链接了HDF5的MPI库

C++示例

#include <hdf5.h>
#include <mpi.h>
#include <iostream>
#include <vector>

#define FILE_NAME "parallel.h5"
#define DATASET_NAME "IntArray"
#define DIM0 100  // 全局维度
#define DIM1 100

int main(int argc, char** argv) {
    // 初始化MPI
    MPI_Init(&argc, &argv);
    
    int mpi_rank, mpi_size;
    MPI_Comm_rank(MPI_COMM_WORLD, &mpi_rank);
    MPI_Comm_size(MPI_COMM_WORLD, &mpi_size);
    
    // 初始化HDF5的MPI环境
    hid_t plist_id = H5Pcreate(H5P_FILE_ACCESS);
    H5Pset_fapl_mpio(plist_id, MPI_COMM_WORLD, MPI_INFO_NULL);
    
    // 创建或打开文件
    hid_t file_id = H5Fopen(FILE_NAME, H5F_ACC_RDWR, plist_id);
    if (file_id < 0) {
        file_id = H5Fcreate(FILE_NAME, H5F_ACC_TRUNC, H5P_DEFAULT, plist_id);
    }
    H5Pclose(plist_id);
    
    // 定义数据集维度
    hsize_t dims[2] = {DIM0, DIM1};
    
    // 创建数据空间
    hid_t filespace = H5Screate_simple(2, dims, NULL);
    
    // 创建数据集
    hid_t dset_id = H5Dcreate(file_id, DATASET_NAME, H5T_NATIVE_INT, filespace,
                             H5P_DEFAULT, H5P_DEFAULT, H5P_DEFAULT);
    H5Sclose(filespace);
    
    // 定义每个进程的写入区域
    hsize_t count[2] = {DIM0/mpi_size, DIM1};
    hsize_t offset[2] = {mpi_rank * count[0], 0};
    
    // 选择数据集的超平面
    filespace = H5Dget_space(dset_id);
    H5Sselect_hyperslab(filespace, H5S_SELECT_SET, offset, NULL, count, NULL);
    
    // 创建内存数据空间
    hid_t memspace = H5Screate_simple(2, count, NULL);
    
    // 准备数据 - 每个进程填充自己的部分
    std::vector<int> data(count[0] * count[1]);
    for (size_t i = 0; i < count[0]; ++i) {
        for (size_t j = 0; j < count[1]; ++j) {
            data[i * count[1] + j] = mpi_rank * 1000 + i * count[1] + j;
        }
    }
    
    // 设置集体写入属性
    plist_id = H5Pcreate(H5P_DATASET_XFER);
    H5Pset_dxpl_mpio(plist_id, H5FD_MPIO_COLLECTIVE);
    
    // 并行写入数据
    herr_t status = H5Dwrite(dset_id, H5T_NATIVE_INT, memspace, filespace,
                            plist_id, data.data());
    
    // 清理资源
    H5Dclose(dset_id);
    H5Sclose(filespace);
    H5Sclose(memspace);
    H5Pclose(plist_id);
    H5Fclose(file_id);
    
    // 读取示例 - 类似写入过程
    if (mpi_rank == 0) {
        std::cout << "数据写入完成,开始读取验证..." << std::endl;
    }
    
    // 重新打开文件和数据集
    file_id = H5Fopen(FILE_NAME, H5F_ACC_RDONLY, plist_id);
    dset_id = H5Dopen(file_id, DATASET_NAME, H5P_DEFAULT);
    
    // 分配读取缓冲区
    std::vector<int> read_data(count[0] * count[1]);
    
    // 设置集体读取属性
    plist_id = H5Pcreate(H5P_DATASET_XFER);
    H5Pset_dxpl_mpio(plist_id, H5FD_MPIO_COLLECTIVE);
    
    // 选择相同的超平面
    filespace = H5Dget_space(dset_id);
    H5Sselect_hyperslab(filespace, H5S_SELECT_SET, offset, NULL, count, NULL);
    
    // 并行读取数据
    status = H5Dread(dset_id, H5T_NATIVE_INT, memspace, filespace,
                    plist_id, read_data.data());
    
    // 验证数据
    bool error = false;
    for (size_t i = 0; i < count[0] * count[1]; ++i) {
        if (read_data[i] != data[i]) {
            error = true;
            break;
        }
    }
    
    if (!error && mpi_rank == 0) {
        std::cout << "数据验证成功!" << std::endl;
    }
    
    // 清理资源
    H5Dclose(dset_id);
    H5Sclose(filespace);
    H5Sclose(memspace);
    H5Pclose(plist_id);
    H5Fclose(file_id);
    
    // 结束MPI
    MPI_Finalize();
    
    return 0;
}

Fortran示例

program parallel_hdf5_mpi
    use hdf5
    use mpi
    
    implicit none
    
    integer :: ierr, mpi_rank, mpi_size
    integer(hid_t) :: file_id, dset_id, filespace, memspace, plist_id
    integer(hsize_t), dimension(2) :: dims = (/100, 100/)  ! 全局维度
    integer(hsize_t), dimension(2) :: count, offset
    integer, allocatable :: data(:, :)
    integer :: i, j
    character(len=*), parameter :: file_name = "parallel.h5"
    character(len=*), parameter :: dset_name = "IntArray"
    
    ! 初始化MPI
    call MPI_Init(ierr)
    call MPI_Comm_rank(MPI_COMM_WORLD, mpi_rank, ierr)
    call MPI_Comm_size(MPI_COMM_WORLD, mpi_size, ierr)
    
    ! 初始化HDF5
    call h5open_f(ierr)
    
    ! 设置文件访问属性为MPI-IO
    call h5pcreate_f(H5P_FILE_ACCESS_F, plist_id, ierr)
    call h5pset_fapl_mpio_f(plist_id, MPI_COMM_WORLD, MPI_INFO_NULL, ierr)
    
    ! 创建或打开文件
    call h5fopen_f(file_name, H5F_ACC_RDWR_F, file_id, ierr, access_prp=plist_id)
    if (ierr /= 0) then
        call h5fcreate_f(file_name, H5F_ACC_TRUNC_F, file_id, ierr, access_prp=plist_id)
    endif
    call h5pclose_f(plist_id, ierr)
    
    ! 创建数据空间
    call h5screate_simple_f(2, dims, filespace, ierr)
    
    ! 创建数据集
    call h5dcreate_f(file_id, dset_name, H5T_NATIVE_INTEGER, filespace, &
                    dset_id, ierr)
    call h5sclose_f(filespace, ierr)
    
    ! 定义每个进程的写入区域
    count(1) = dims(1)/mpi_size
    count(2) = dims(2)
    offset(1) = mpi_rank * count(1)
    offset(2) = 0
    
    ! 选择数据集的超平面
    call h5dget_space_f(dset_id, filespace, ierr)
    call h5sselect_hyperslab_f(filespace, H5S_SELECT_SET_F, offset, count, ierr)
    
    ! 创建内存数据空间
    call h5screate_simple_f(2, count, memspace, ierr)
    
    ! 准备数据 - 每个进程填充自己的部分
    allocate(data(count(1), count(2)))
    do i = 1, count(1)
        do j = 1, count(2)
            data(i, j) = mpi_rank * 1000 + (i-1)*count(2) + j
        end do
    end do
    
    ! 设置集体写入属性
    call h5pcreate_f(H5P_DATASET_XFER_F, plist_id, ierr)
    call h5pset_dxpl_mpio_f(plist_id, H5FD_MPIO_COLLECTIVE_F, ierr)
    
    ! 并行写入数据
    call h5dwrite_f(dset_id, H5T_NATIVE_INTEGER, data, count, ierr, &
                   file_space_id=filespace, mem_space_id=memspace, &
                   xfer_prp=plist_id)
    
    ! 清理资源
    deallocate(data)
    call h5dclose_f(dset_id, ierr)
    call h5sclose_f(filespace, ierr)
    call h5sclose_f(memspace, ierr)
    call h5pclose_f(plist_id, ierr)
    call h5fclose_f(file_id, ierr)
    
    ! 读取示例 - 类似写入过程
    if (mpi_rank == 0) then
        print *, "数据写入完成,开始读取验证..."
    endif
    
    ! 重新打开文件和数据集
    call h5fopen_f(file_name, H5F_ACC_RDONLY_F, file_id, ierr, access_prp=plist_id)
    call h5dopen_f(file_id, dset_name, dset_id, ierr)
    
    ! 分配读取缓冲区
    allocate(data(count(1), count(2)))
    
    ! 设置集体读取属性
    call h5pcreate_f(H5P_DATASET_XFER_F, plist_id, ierr)
    call h5pset_dxpl_mpio_f(plist_id, H5FD_MPIO_COLLECTIVE_F, ierr)
    
    ! 选择相同的超平面
    call h5dget_space_f(dset_id, filespace, ierr)
    call h5sselect_hyperslab_f(filespace, H5S_SELECT_SET_F, offset, count, ierr)
    
    ! 并行读取数据
    call h5dread_f(dset_id, H5T_NATIVE_INTEGER, data, count, ierr, &
                  file_space_id=filespace, mem_space_id=memspace, &
                  xfer_prp=plist_id)
    
    ! 验证数据 (这里简化为检查第一个元素)
    if (data(1,1) == mpi_rank * 1000 + 1 .and. mpi_rank == 0) then
        print *, "数据验证成功!"
    endif
    
    ! 清理资源
    deallocate(data)
    call h5dclose_f(dset_id, ierr)
    call h5sclose_f(filespace, ierr)
    call h5sclose_f(memspace, ierr)
    call h5pclose_f(plist_id, ierr)
    call h5fclose_f(file_id, ierr)
    
    ! 关闭HDF5
    call h5close_f(ierr)
    
    ! 结束MPI
    call MPI_Finalize(ierr)
    
end program parallel_hdf5_mpi

编译和运行

对于C++程序:

mpicxx -o parallel_hdf5 parallel_hdf5.cpp -lhdf5 -lz
mpiexec -n 4 ./parallel_hdf5

对于Fortran程序:

mpif90 -o parallel_hdf5 parallel_hdf5.f90 -lhdf5_fortran -lhdf5 -lz
mpiexec -n 4 ./parallel_hdf5

关键点说明

  1. MPI初始化: 必须首先初始化MPI环境
  2. HDF5 MPI属性: 使用H5Pset_fapl_mpio设置文件访问属性
  3. 数据分区: 每个进程负责数据集的不同部分
  4. 超平面选择: 使用H5Sselect_hyperslab选择要读写的区域
  5. 集体操作: 使用H5Pset_dxpl_mpio设置集体I/O模式
  6. 并行一致性: 所有进程必须参与集体操作

这些示例展示了基本的并行读写操作,实际应用中可能需要更复杂的数据分区和访问模式。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2334511.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

[春秋云镜] Tsclient仿真场景

文章目录 靶标介绍&#xff1a;外网mssql弱口令SweetPotato提权上线CSCS注入在线用户进程上线 内网chisel搭建代理密码喷洒攻击映像劫持 -- 放大镜提权krbrelayup提权Dcsync 参考文章 考点: mssql弱口令SweetPotato提权CS注入在线用户进程上线共享文件CS不出网转发上线密码喷洒…

数据集 handpose_x_plus 3D RGB 三维手势 - 手工绘画 场景 draw picture

数据集 handpose 相关项目地址&#xff1a;https://github.com/XIAN-HHappy/handpose_x_plus 样例数据下载地址&#xff1a;数据集handpose-x-plus3DRGB三维手势-手工绘画场景drawpicture资源-CSDN文库

deskflow使用教程:一个可以让两台电脑鼠标键盘截图剪贴板共同使用的开源项目

首先去开源网站下载&#xff1a;Release v1.21.2 deskflow/deskflow 两台电脑都要下载这个文件 下载好后直接打开找到你想要的exe desflow.exe 然后你打开他&#xff0c;将两台电脑的TLS都关掉 下面步骤两台电脑都要完成&#xff1a; 电脑点开edit-》preferences 把这个取…

详解MYSQL表空间

目录 表空间文件 表空间文件结构 行格式 Compact 行格式 变长字段列表 NULL值列表 记录头信息 列数据 溢出页 数据页 当我们使用MYSQL存储数据时&#xff0c;数据是如何被组织起来的&#xff1f;索引又是如何组织的&#xff1f;在本文我们将会解答这些问题。 表空间文…

[Windows] 音速启动 1.0.0.0

[Windows] 音速启动 链接&#xff1a;https://pan.xunlei.com/s/VONiGZhtsxpPzze0lDIH-mR9A1?pwdxu7f# [Windows] 音速启动 1.0.0.0 音速启动是一款桌面管理软件&#xff0c;以仿真QQ界面的形式结合桌面工具的特点&#xff0c;应用于软件文件夹网址的快捷操作。

Hyper-V 虚拟机配置静态IP并且映射到局域网使用

环境 win11hyper-v麒麟v10 配置 编辑文件 vi /etc/sysconfig/network-scripts/ifcfg-eth0文件内容 GATEWAY 需要参考网络中配置的网关地址 TYPEEthernet PROXY_METHODnone BROWSER_ONLYno BOOTPROTOstatic DEFROUTEyes IPV4_FAILURE_FATALno IPV6INITyes IPV6_AUTOCONFyes …

操作系统基础:06 操作系统历史

我们前面已经讲过了操作系统的基本轮廓、启动过程以及系统调用等相关内容&#xff0c;就如同揭开了钢琴的盖子&#xff0c;对操作系统有了初步的表面认识。从现在起&#xff0c;我们要更深入地剖析操作系统&#xff0c;就像分解钢琴一样&#xff0c;探究其各个部分的构成、原理…

【大模型微调】如何解决llamaFactory微调效果与vllm部署效果不一致如何解决

以下个人没整理太全 一、生成式语言模型的对话模板介绍 使用Qwen/Qwen1.5-0.5B-Chat训练 对话模板不一样。回答的内容就会不一样。 我们可以看到例如qwen模型的tokenizer_config.json文件&#xff0c;就可以看到对话模板&#xff0c;一般同系列的模型&#xff0c;模板基本都…

【2025最新】windows本地部署LightRAG,完成neo4j知识图谱保存

之前在服务器部署neo4j失败&#xff0c;无奈只能在本地部署&#xff0c;导致后期所有使用的知识图谱数据都存在本地&#xff0c;这里为了节省时间&#xff0c;先在本地安装LigthRAG完成整个实验流程&#xff0c;后续在学习各种服务器部署和端口调用。从基础和简单的部分先做起来…

14、nRF52xx蓝牙学习(串口 UART 和 UARTE 外设应用)

一、UART 功能描述 串口 UART 也称为通用异步收发器。是各种处理器中常用了通信接口&#xff0c;在 nRF52 芯片中&#xff0c; UART 具有以下特点&#xff1a; ● 全双工操作 ● 自动流控 ● 奇偶校验产生第 9 位数据 串口 UART 的数据发送与接收流程 : ◆硬件配置…

DeepSeek轻松入门教程——从入门到精通

大家好&#xff0c;我是吾鳴。 今天吾鳴要给大家分享一份DeepSeek小白轻松入门指导手册——《DeepSeek 15天指导手册&#xff0c;从入门到精通》。指导手册分为基础入门对话篇、效率飞跃篇、场景实战篇、高手进化篇等&#xff0c;按照指导手册操作&#xff0c;DeepSeek从入门到…

Vue2 老项目升级 Vue3 深度解析教程

Vue2 老项目升级 Vue3 深度解析教程 摘要 Vue3 带来了诸多改进和新特性&#xff0c;如性能提升、组合式 API、更好的 TypeScript 支持等&#xff0c;将 Vue2 老项目升级到 Vue3 可以让项目获得这些优势。本文将深入解析升级过程&#xff0c;涵盖升级前的准备工作、具体升级步骤…

WXJ196微机小电流接地选线装置使用简单方便无需维护

WXJ196微机小电流接地选线装置&#xff0c;能在系统发生单相接地时&#xff0c;准确、迅速地选出接地线路母 线。使用简单方便&#xff0c;无需维护&#xff0c;可根据用户需要将相关信息通过通信接口传给上级监控系统&#xff0c; 适用于无人值守变电站。 2 功能及特点 全新的…

Java第四节:idea在debug模式夏改变变量的值

作者往期文章 Java第一节&#xff1a;debug如何调试程序&#xff08;附带源代码&#xff09;-CSDN博客 Java第二节&#xff1a;debug如何调试栈帧链&#xff08;附带源代码&#xff09;-CSDN博客 Java第三节&#xff1a;新手如何用idea创建java项目-CSDN博客 步骤一 在需要修改…

门极驱动器DRV8353M设计(二)

目录 13.3.4.4 MOSFET VDS 感测 (SPI Only) 13.3.5 Gate Driver保护回路 13.3.5.1 VM 电源和 VDRAIN 欠压锁定 (UVLO) 13.3.5.2 VCP 电荷泵和 VGLS 稳压器欠压锁定 (GDUV) 13.3.5.3 MOSFET VDS过流保护 (VDS_OCP) 13.3.5.3.1 VDS Latched Shutdown (OCP_MODE 00b) 13.…

学点概率论,打破认识误区

概率论是统计分析和机器学习的核心。掌握概率论对于理解和开发稳健的模型至关重要&#xff0c;因为数据科学家需要掌握概率论。本博客将带您了解概率论中的关键概念&#xff0c;从集合论的基础知识到高级贝叶斯推理&#xff0c;并提供详细的解释和实际示例。 目录 简介 基本集合…

NVIDIA AI Aerial

NVIDIA AI Aerial 适用于无线研发的 NVIDIA AI Aerial 基础模组Aerial CUDA 加速 RANAerial Omniverse 数字孪生Aerial AI 无线电框架 用例构建商业 5G 网络加速 5G生成式 AI 和 5G 数据中心 加速 6G 研究基于云的工具 优势100% 软件定义通过部署在数字孪生中进行测试6G 标准化…

OpenCV 关键点定位

一、Opencv关键点定位介绍 关键点定位在计算机视觉领域占据着核心地位&#xff0c;它能够精准识别图像里物体的关键特征点。OpenCV 作为功能强大的计算机视觉库&#xff0c;提供了多种实用的关键点定位方法。本文将详细阐述关键点定位的基本原理&#xff0c;深入探讨 OpenCV 中…

arm_math.h、arm_const_structs.h 和 arm_common_tables.h

在 ​​FOC&#xff08;Field-Oriented Control&#xff0c;磁场定向控制&#xff09;​​ 中&#xff0c;arm_math.h、arm_const_structs.h 和 arm_common_tables.h 是 CMSIS-DSP 库的核心组件&#xff0c;用于实现高效的数学运算、预定义结构和查表操作。以下是它们在 FOC 控…

buuctf sql注入类练习

BUU SQL COURSE 1 1 实例无法访问 / Instance cant be reached at that time | BUUCTF但是这个地方很迷惑就是这个 一个 # 我们不抓包就不知道这个是sql注入类的判断是 get 类型的sql注入直接使用sqlmap我们放入到1.txt中 目的是 优先检测 ?id1>python3 sqlmap.py -r 1.t…