魔搭上创建数据集

魔搭上创建数据集

news2026/2/11 17:18:26

本文将介绍如何在魔搭上创建数据集，首先登录后通过网页创建数据库集。
在这里插入图片描述
通过 git 命令 clone 数据集

在这里插入图片描述
创建数据集，初始化训练数据和测试数据 train.csv，test.csv，注意 csv 的首行为列名称

创建子数据集，魔搭上子数据集就是子目录，创建目录 yy2024

在这里插入图片描述
对子数据集，创建训练集以及测试集数据

最后最重要的是数据集的配置，在 README.md 中添加配置

---
license: Apache License 2.0
configs:
- config_name: default
  data_files:
  - split: train
    path: "train.csv"
  - split: test
    path: "test.csv"
- config_name: yy2024
  data_files:
  - split: train
    path: "yy2024/train.csv"
  - split: test
    path: "yy2024/test.csv"
---

通过代码下载数据集，FORCE_REDOWNLOAD 解决缓存问题，每次都强制下载，subset_name 为子数据集名称。

from modelscope import MsDataset
from modelscope.utils.constant import DownloadMode

ds = MsDataset.load('model1001/ds1',
                    download_mode=DownloadMode.FORCE_REDOWNLOAD,
subset_name='yy2024', 
split='train',
use_streaming=True
)  
print(next(iter(ds)))

总结

魔搭的数据集功能感觉还是没有 HuggingFace 的好用，文档也不详细，好处是魔搭有一个钉钉群有问必答，客服非常有耐心，产品要是在好些就更好了。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2123196.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

智能监控中图像质量增强方法研究

智能监控中图像质量增强方法研究

粗略的构思步骤摘要本文深入探讨了智能监控系统中图像质量增强的关键技术，通过融合深度学习、传统图像处理算法及生成对抗网络（GAN）的优势，提出了一套高效且鲁棒的图像质量提升方案。本文详细描述了技术框架的每一个组成部分，深入剖析了技术原理，并详细阐述了实现步骤…

阅读更多...

leecode100题-双指针-三数之和

leecode100题-双指针-三数之和

给你一个整数数组 nums ，判断是否存在三元组 [nums[i], nums[j], nums[k]] 满足 i ! j、i ! k 且 j ! k ，同时还满足 nums[i] nums[j] nums[k] 0 。请你返回所有和为 0 且不重复的三元组。答案中不可以包含重复的三元组。示例 1： 输入…

阅读更多...

Kubernetes------Service

Kubernetes------Service

目录一、属性说明二、定义和基本配置 1、定义 2、创建Service 2.1、typeClusterIP 2.2、typeNodePort 2.3、固定IP访问三、Service、EndPoint、Pod之间的关系四、服务发现 1、基于Service中IP访问外部服务 2、基于Service中域名访问外部服务五、Ingress的安装和使…

阅读更多...

react js 路由 Router

react js 路由 Router

完整的项目，我已经上传了资料链接起因，目的: 路由，这部分很难。原因是，多个组件，进行交互，复杂度比较高。我看的视频教程 1. 初步使用安装: npm install react-router-dom 修改 index.js/ 或是 main.js 把 App, 用 BrowserRouter 包裹起来 2. Navigate 点击…

阅读更多...

JAVA基础: while循环，for循环，break和continue关键字，数组详解

JAVA基础: while循环，for循环，break和continue关键字，数组详解

1 while循环 while(boolean结果)语句/语句组每次循环做什么事循环条件循环条件改变。循环嵌套在一个循环中，出现了另一个循环。无限循环循环条件永远为真。 int i 10 ; while(i > 0){//....i ; }------------------------- while(true){}2 break关键…

阅读更多...

mysql的整理

mysql的整理

插入数据： INSERT INTO 表名 (字段名1, 字段名2, ...) VALUES (值1, 值2, ...); insert into employee(id,workno,name,gender,age,idcard,entrydate) values(1,1,Itcast,男,-1,123456789012345678,2000-01-01); insert into employee values(3,3,韦一笑,男,38,1…

阅读更多...

如何利用 CSS 渐变实现多样化背景效果

如何利用 CSS 渐变实现多样化背景效果

前言总在平常看到像这样的图片背景是如何实现的呢背景效果的多样性和美观性直接影响用户体验。CSS 渐变为设计师提供了一种强大且灵活的方法来创建引人注目的背景。渐变是颜色之间平滑过渡的效果，通过调整渐变类型和设置，你可以轻松实现从简单到复杂…

阅读更多...

和弦图制作软件有哪些，和弦音乐制作软件推荐

和弦图制作软件有哪些，和弦音乐制作软件推荐

在音乐创作与教学领域，和弦图作为视觉化展现音乐和声结构的工具，扮演着至关重要的角色。随着技术的发展，众多和弦图制作软件应运而生，旨在简化创作流程，提升学习效率。然而，面对琳琅满目的选项，…

阅读更多...

【Linux】多线程：线程控制

【Linux】多线程：线程控制

目录一、创建线程：pthread_create 二、线程终止：pthread_exit、return、pthread_cancel 三、线程等待：pthread_join 四、线程分离：pthread_detach 五、如何创建并使用多线程六、对线程进行封装一、创建线程&#xff1a…

阅读更多...

ModuleNotFoundError: No module named ‘keras.layers.core‘怎么解决

ModuleNotFoundError: No module named ‘keras.layers.core‘怎么解决

问题 ModuleNotFoundError: No module named keras.layers.core，如图所示： 如何解决将from keras.layers.core import Dense,Activation改为from tensorflow.keras.layers import Dense,Activation，如图所示： 顺利运行&#xf…

阅读更多...

中秋快到了，要给哪些国外客户送祝福（附贺卡模板）

中秋快到了，要给哪些国外客户送祝福（附贺卡模板）

马上就要中秋节了，在这里提前祝小伙伴们中秋节快乐，身体健康，阖家团圆，业绩越来越好，公司越来越好，一切都越来越好！ 中秋节是我们非常重要的几个传统节日之一了，除了我们自己庆祝之…

阅读更多...

深入理解Java中的clone对象

深入理解Java中的clone对象

目录 1. 为什么要使用clone 2. new和clone的区别 3. 复制对象和复制引用的区别 4.浅克隆和深克隆 5. 注意事项 1. 为什么要使用clone 在实际编程过程中，我们常常遇到这种情况：有一个对象 A，需要一个和 A 完全相同新对象 B，并…

阅读更多...

【【通信协议之ARP的FPGA实现其一】】

【【通信协议之ARP的FPGA实现其一】】

通信协议之ARP的FPGA实现其一介绍 ARP 协议分为 ARP 请求和 ARP 应答，源主机发起查询目的 MAC 地址的报文称为 ARP 请求，目的主机响应源主机并发送包含本地 MAC 地址的报文称为 ARP 应答。当主机需要找出这个网络中的另一个主机的物理地址时&#xff0…

阅读更多...

点击化学，如何用最简单的试剂叠氮化修饰后用于Click Reaction？

点击化学，如何用最简单的试剂叠氮化修饰后用于Click Reaction？

“点击化学”这一术语由斯克里普斯研究所的K. B. Sharpless 于2001年首次提出，这是一类涉及碳-杂原子间化学键形成的反应，该类反应具有收率高，选择性好的特点。词条“点击”意为将分子片段拼接起来就像将安全带扣环的两部分扣起来一样简单…

阅读更多...

大学英语四六级报名照不通过的原因

大学英语四六级报名照不通过的原因

大学英语四六级报名照不通过的原因 #英语四六级 #大学英语四六级 #大学英语四六级考试 #英语四六级报名照片 #英语四六级考试报名照片

阅读更多...

数仓建模：数仓设计中的10个陷阱

数仓建模：数仓设计中的10个陷阱

目录 0 引言 1 主要内容 1.1 过于迷恋技术，而没有将重点放在业务需求和目标上 1.2 没有或无法找到一个有影响的、平易近人的、明白事理的高级管理人员作为数仓建设的发起人 1.3 将项目处理为一个巨大的持续多年的项目，而不是追求更容易管理的、虽然…

阅读更多...

日光辐射系统室内太阳光模拟器

日光辐射系统室内太阳光模拟器

太阳光模拟器能够为实验室环境提供稳定可靠的光照环境，其作用相当于将自然太阳光“搬进”室内实验室。这对于研究太阳能电池、光伏材料及其他与太阳能相关的设备和材料性能至关重要。 1.氙灯灯泡功率：≥450W； 2.输出光束尺寸：≥22…

阅读更多...

秃姐学AI系列之：实战Kaggle比赛：图像分类（CIFAR-10）

秃姐学AI系列之：实战Kaggle比赛：图像分类（CIFAR-10）

目录准备工作整理数据集将验证集从原始的训练集中拆分出来整理测试集使用函数图像增广读取数据集定义模型定义训练函数训练和验证数据集对测试集进行分类并提交结果准备工作首先导入竞赛需要的包和模块 import collections import math import os i…

阅读更多...

智能优化算法-樽海鞘优化算法（SSA）（附源码）

智能优化算法-樽海鞘优化算法（SSA）（附源码）

目录 1.内容介绍 2.部分代码 3.实验结果 4.内容获取 1.内容介绍樽海鞘优化算法 (Salp Swarm Algorithm, SSA) 虽然名称中提到的是“樽海鞘”，但实际上这个算法是基于群体智能的一种元启发式优化算法，它模拟了樽海鞘（Salps）在海…

阅读更多...

第67期 | GPTSecurity周报

第67期 | GPTSecurity周报

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。在这里，您可以找…

阅读更多...

推荐文章

最新文章