昇思MindSpore学习入门-格式转换

昇思MindSpore学习入门-格式转换

news2026/2/16 17:04:17

MindSpore中可以把用于训练网络模型的数据集，转换为MindSpore特定的格式数据（MindSpore Record格式），从而更加方便地保存和加载数据。其目标是归一化用户的数据集，并进一步通过MindDataset接口实现数据的读取，并用于训练过程。

此外，MindSpore还针对部分数据场景进行了性能优化，使用MindSpore Record数据格式可以减少磁盘IO、网络IO开销，从而获得更好的使用体验。

MindSpore Record数据格式具备的特征如下：

实现数据统一存储、访问，使得训练时数据读取更加简便。
数据聚合存储、高效读取，使得训练时数据方便管理和移动。
高效的数据编解码操作，使得用户可以对数据操作无感知。
可以灵活控制数据切分的分区大小，实现分布式数据处理。

Record文件结构

如下图所示，MindSpore Record文件由数据文件和索引文件组成。

其中数据文件包含文件头、标量数据页、块数据页，用于存储用户归一化后的训练数据，且单个MindSpore Record文件建议小于20G，用户可将大数据集进行分片存储为多个MindSpore Record文件。

而索引文件则包含基于标量数据（如图像Label、图像文件名等）生成的索引信息，用于方便地检索、统计数据集信息。

数据文件中的文件头、标量数据页、块数据页的具体用途如下所示：

文件头：是MindSpore Record文件的元信息，主要用来存储文件头大小、标量数据页大小、块数据页大小、Schema信息、索引字段、统计信息、文件分区信息、标量数据与块数据对应关系等。
标量数据页：主要用来存储整型、字符串、浮点型数据，如图像的Label、图像的文件名、图像的长宽等信息，即适合用标量来存储的信息会保存在这里。
块数据页：主要用来存储二进制串、NumPy数组等数据，如二进制图像文件本身、文本转换成的字典等。

转换成Record格式

下面主要介绍如何将CV类数据和NLP类数据转换为MindSpore Record文件格式，并通过MindDataset接口，实现MindSpore Record文件的读取。

转换CV类数据集

本示例主要以包含100条记录的CV数据集并将其转换为MindSpore Record格式为例子，介绍如何将CV类数据集转换成MindSpore Record文件格式，并使用MindDataset接口读取。

首先，需要创建100张图片的数据集并对齐进行保存，其样本包含file_name（字符串）、label（整型）、 data（二进制）三个字段，然后使用MindDataset接口读取该MindSpore Record文件。

生成100张图像，并转换成MindSpore Record文件格式。

通过MindDataset接口读取MindSpore Record文件格式。

转换NLP类数据集

本示例首先创建一个包含100条记录的MindSpore Record文件格式，其样本包含八个字段，均为整型数组，然后使用MindDataset接口读取该MindSpore Record文件。

生成100条文本数据，并转换成MindSpore Record文件格式。

通过MindDataset接口读取MindSpore Record格式文件。

Dataset转存MindRecord

MindSpore提供转换常用数据集的工具类，能够将常用的数据集转换为MindSpore Record文件格式。

转存CIFAR-10数据集

用户可以通过Dataset.save类，将CIFAR-10原始数据转换为MindSpore Record，并使用MindDataset接口读取。

下载CIFAR-10数据集，并使用Cifar10Dataset加载。

调用Dataset.save接口，将CIFAR-10数据集转存为MindSpore Record文件格式。
通过MindDataset接口读取MindSpore Record文件格式。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1942300.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

基于微信小程序+SpringBoot+Vue的校园自助打印系统(带1w+文档)

基于微信小程序+SpringBoot+Vue的校园自助打印系统(带1w+文档)

基于微信小程序SpringBootVue的校园自助打印系统(带1w文档) 基于微信小程序SpringBootVue的校园自助打印系统(带1w文档) 管理信息可以处理复杂的信息从而提高用户的工作效率，减少失误。所以本基于Vue和微信小程序的校园自助打印系统的开发非常有意义，本系…

阅读更多...

科研绘图系列：R语言TCGA分组饼图（multiple pie charts）

科研绘图系列：R语言TCGA分组饼图（multiple pie charts）

介绍在诸如癌症基因组图谱（TCGA）等群体研究项目中，为了有效地表征和比较不同群体的属性分布，科研人员广泛采用饼图作为数据可视化的工具。饼图通过将一个完整的圆形划分为若干个扇形区域，每个扇形区域的面积大小直接对应其代表的属性在整体中的占比。这种图形化的展示方…

阅读更多...

react入门到实战-day2-7.21

react入门到实战-day2-7.21

昨天晚上刚学完已经一点了，来不及写笔记，主要是想睡觉哈，所以今天补上，我发现效率还挺高的，今天重新做笔记，加固了昨天的知识点，要不以后都这样子哈，学完第二天再写哈，要…

阅读更多...

【MSPM0G3507】CCS-Sysconfig配置按键控制LED(二)

【MSPM0G3507】CCS-Sysconfig配置按键控制LED(二)

1.相关配置主控：MSPM0G3507编译环境：CCS 2.板子以及原理图 3.Sysconfig配置 LED配置一样按键为INPUT DL_GPIO_readPins(GPIO_SWITCHES_PORT, GPIO_SWITCHES_USER_1_PIN)// 读取端口状态类型为uint32_t ，返回的是对应引脚的状态位。比如…

阅读更多...

react中组件间的通信

react中组件间的通信

一、父传子 1.代码展示 import React, { useState } from react;function SonPage(props){ // 子组件const {msg} propsreturn (<div>我是子组件 {msg}</div>) }function App() { // 父组件const [msgText,setMsgText] useState(父传子)return (<div classN…

阅读更多...

四、GD32 MCU 常见外设介绍 (5) TIMER 模块介绍

四、GD32 MCU 常见外设介绍 (5) TIMER 模块介绍

5.1.TIMER 基础知识 TIMER分高级定时器，通用定时器L0，L1，L2和基本定时器。 5.2.硬件连接说明 TIMER 属于片内外设，对于外部硬件设计，只需要单独IO口外接信号线即可。 5.3.GD32 TIMER 外设原理简介（以 G…

阅读更多...

wsl –install 遇到灾难性故障

wsl –install 遇到灾难性故障

windows10 使用wsl 安装Linux系统遇到：灾难性故障解决办法

阅读更多...

VideoAgent: Long-form Video Understanding with Large Language Model as Agent

VideoAgent: Long-form Video Understanding with Large Language Model as Agent

VideoAgent: Long-form Video Understanding with Large Language Model as Agent 基本信息博客贡献人燕青作者 Xiaohan Wang, Yuhui Zhang, et al. 标签 Large Language Model Agent, Long-form Video Understanding, Vision-Language Foundation Models 摘要长视…

阅读更多...

【Drone】drone编译web端防墙策略 | 如何在被墙的状态drone顺利编译npm

【Drone】drone编译web端防墙策略 | 如何在被墙的状态drone顺利编译npm

一、drone编译防墙版本 1、web端drone kind: pipeline type: docker name: ui steps:- name: build_projectimage: node:20-slim depends_on: [clone]volumes:- name: node_modulespath: /drone/src/node_modulescommands:- pwd- du -sh *- npm config set registry https://…

阅读更多...

Anaconda下安装配置Jupyter

Anaconda下安装配置Jupyter

Anaconda下安装配置Jupyter 1、安装 conda activate my_env #激活虚拟环境 pip install jupyter #安装 jupyter notebook --generate-config #生成配置文件提示配置文件的位置： Writing default config to: /root/.jupyter/jupyter_notebook_config.py检查版本&am…

阅读更多...

从PyTorch官方的一篇教程说开去（3.3 - 贪心法）

从PyTorch官方的一篇教程说开去（3.3 - 贪心法）

您的进步和反馈是我最大的动力，小伙伴来个三连呗！共勉。贪心法，可能是大家在处理陌生问题时候，最容易想到的办法了吧？ 还记得小时候，国足请了位洋教练发表了一句到现在还被当成段子的话：“如…

阅读更多...

用Label Studio，让数据标注变得简单而高效

用Label Studio，让数据标注变得简单而高效

Label Studio：精准标注，智能模型的起点- 精选真开源，释放新价值。概览 Label Studio作为数据标注的得力助手，其设计初衷是简化机器学习项目中繁琐的数据准备工作。它提供了一个用户友好的界面，使得即便是非技术用户也…

阅读更多...

SpringMVC实现文件上传

SpringMVC实现文件上传

导入文件上传相关依赖  <dependency><groupId>commons-fileupload</groupId><artifactId>commons-fileupload</artifactId><version>1.3.1</version> </dependency> <dependency><groupId>…

阅读更多...

实现Nginx的反向代理和负载均衡

实现Nginx的反向代理和负载均衡

一、反向代理和负载均衡简介 1.1、反向代理反向代理（reverse proxy）指：以代理服务器来接受Internet上的连接请求，然后将请求转发给内部网络上的服务器，并将从服务器上得到的结果返回给Internet上请求连接的客户端。此时代理服务器对外就表现为一个反向代理服务器。反向代…

阅读更多...

【YOLOv10[基础]】热力图可视化实践① | 支持视频热力图 | 密度热力图 | 论文必备

【YOLOv10[基础]】热力图可视化实践① | 支持视频热力图 | 密度热力图 | 论文必备

本文将进行添加YOLOv10版本的热力图可视化功能的实践，支持视频的热力图可视化。目录一热力图可视化实践① 1 代码 2 效果图在论文中经常可以见到提取的物体特征以热力图的形式展示出来，将特征图以热力图的方式进行可视化在深度学习中有以下的原因： ①强调激活区域，…

阅读更多...

HarmonyOS Next系列之地图组件（Map Kit）使用（九）

HarmonyOS Next系列之地图组件（Map Kit）使用（九）

系列文章目录 HarmonyOS Next 系列之省市区弹窗选择器实现（一） HarmonyOS Next 系列之验证码输入组件实现（二） HarmonyOS Next 系列之底部标签栏TabBar实现（三） HarmonyOS Next 系列之HTTP请求封装和Token…

阅读更多...

常用的网络爬虫工具推荐

常用的网络爬虫工具推荐

在推荐常用的网络爬虫工具时，我们可以根据工具的易用性、功能强大性、用户口碑以及是否支持多种操作系统等多个维度进行考量。以下是一些常用的网络爬虫工具推荐： 1. 八爪鱼简介：八爪鱼是一款免费且功能强大的网站爬虫，能够满足…

阅读更多...

【详细的springboot自动装载原理】

【详细的springboot自动装载原理】

1.默认提供的核心配置模块 springboot提供了 spring-boot-autoconfigure模块，该模块为springboot自动配置的核心模块，它初始化好了很多我们平时需要的配置类，那么有了这些配置类就能生效了吗？得需要一个东西在启动的时候去把它加…

阅读更多...

C++ | Leetcode C++题解之第264题丑数II

C++ | Leetcode C++题解之第264题丑数II

题目： 题解： class Solution { public:int nthUglyNumber(int n) {vector<int> dp(n 1);dp[1] 1;int p2 1, p3 1, p5 1;for (int i 2; i < n; i) {int num2 dp[p2] * 2, num3 dp[p3] * 3, num5 dp[p5] * 5;dp[i] min(min(num2, num3…

阅读更多...

CTF-Web习题：2019强网杯 UPLOAD

CTF-Web习题：2019强网杯 UPLOAD

题目链接：2019强网杯 UPLOAD 解题思路打开靶场如下图所示，是一个注册和登录界面那就注册登录一下，发现是一个提交头像的页面： 试了一下只有能正确显示的png图片才能提交成功，同时F12拿到cookie，base6…

阅读更多...

推荐文章

最新文章