NeurIPS 2024 有效投稿达 15,671 篇,数据集版块内容丰富

news2024/11/27 10:23:35

NeurIPS,全称 Neural Information Processing Systems Conference,是神经信息处理系统的年度学术会议。该会议始于 1987 年,当时名为 NIPS。随着人工智能领域的快速发展,其影响力逐渐扩大,被越来越多的研究者和企业关注并熟知。为了更好地反映会议涵盖的广泛领域,NIPS 于 2017 年正式更名为 NeurIPS。

如今,NeurIPS 已经成为全球人工智能领域最具权威性的学术会议之一,吸引了来自世界各地的学者、企业家和研究人员。

今年是 NeurIPS 举办的第 38 届 (NeurIPS 2024),学术成果盛况依旧。据悉,今年共收到 15,671 篇有效投稿,最终接收了 4,000 篇左右论文。

HyperAI超神经从大会接收的数据集中为大家汇总了 9 个高质量开源数据集,覆盖云层去除、化学光谱、歌声音频、自动驾驶、昆虫标本等多个方面,大家可以按需下载~

点击了解更多顶会信息:
https://go.hyper.ai/vWvAW

NeurIPS 2024 数据集汇总

1、AllClear 公共云层去除数据集

发布机构:康奈尔大学、哥伦比亚大学

预估大小:22.42 GB

下载地址:https://go.hyper.ai/uVwmU

卫星图像中的云层对于下游应用构成了重大挑战,当前云去除研究面临的一个主要问题是缺乏全面的基准测试和足够大且多样化的训练数据集。而 AllClear 是目前最大的公共云层去除数据集,包含 23,742 个全球分布的兴趣区域 (ROIs),覆盖了多样的土地利用模式,总共包含 400 万张图像。

2、Muharaf 手写阿拉伯文数据集

发布机构:北卡罗来纳州立大学、卡斯利克圣灵大学、黎巴嫩历史协会

预估大小:9.83 GB

下载地址:https://go.hyper.ai/HBEuz

Muharaf 数据集是一个专注于手写阿拉伯文识别的机器学习数据集,包含了超过 1.6k 张历史手写页面图像,这些图像由档案阿拉伯语专家转录。每张文档图像都伴随着其文本行的空间多边形坐标以及基本页面元素的信息,旨在推进手写文本识别 (HTR) 领域的技术进步。

3、化学多模光谱数据集

发布机构:IBM Research 、苏黎世大学、 EPFL 、NCCR Catalysis

预估大小:9.7 GB

下载地址:https://go.hyper.ai/sXVdm

该数据集包含了从专利数据中的化学反应中提取的 79 万种分子的模拟 1H-NMR 、13C-NMR、HSQC-NMR 、红外和质谱(正负离子模式)光谱数据。这个数据集的核心价值在于其能够整合多种光谱模态的信息,模拟人类专家分析分子结构的方法,从而有望自动化结构解析,简化从合成到结构确定的分子发现流程。

4、GTSinger 歌声音频数据集

发布机构:浙江大学

预估大小:28.94 GB

下载地址:https://go.hyper.ai/gLb3t

该数据集包含了 80.59 小时的专业录音棚录制的歌声,这些歌声由 20 位专业歌手演唱,覆盖了 9 种不同的语言,包括汉语、英语、日语、韩语等,为研究者提供了一个音色和风格极为丰富的资源库。

5、DrivingDojo 自动驾驶数据集

发布机构:中国科学院、美团、中国科学院香港创新研究院人工智能与机器人中心

下载地址:https://go.hyper.ai/a85sN

该数据集包含约 18k 个视频片段,涵盖北京、深圳、徐州等城市,并在不同的天气条件和日光条件下录制。它不仅包括了加速、紧急刹车、停车启动等纵向操作,还包括了掉头、超车和变道等横向操作。此外,数据集特别设计了包含大量多主体交互轨迹的视频,旨在提升世界模型在复杂驾驶环境中的预测和控制能力。

6、多模态昆虫生物多样性数据集

发布机构:生物多样性基因组学中心、圭尔夫大学、滑铁卢大学等

预估大小:37.71 GB

下载地址:https://go.hyper.ai/narLh

BIOSCAN-5M 数据集包含了超过 500 万昆虫标本的详细信息,显著扩展了现有的基于图像的生物数据集,不仅包括分类标签、原始核苷酸条形码序列、分配的条形码索引号和地理信息,还涵盖了标本大小等多模态信息,旨在理解和监测全球昆虫生物多样性。

7、OpenSatMap 高分辨率卫星数据集

发布机构:中国科学院、中国科学院香港信息系统研究所人工智能与机器人研究中心、腾讯地图和北京邮电大学

预估大小:57.7 GB

下载地址:https://go.hyper.ai/mFXUw

该数据集是一个高分辨率卫星数据集,专为大规模地图构建而设计。其特点是细粒度的实例级注释和高分辨率图像,包含了 3,787 张高分辨率卫星图像,其中不仅包括中国多个城市的图像,还涵盖全球 50 多个城市和 18 个国家的图像。

8、自然物种声音数据集

发布机构:马萨诸塞大学阿默斯特分校、iNaturalist

预估大小:131.26 GB

下载地址:https://go.hyper.ai/R8Ix7

该数据集收集了 230,000 个音频文件,捕捉了来自超过 5,500 个物种的声音,这些声音由全球超过 27,000 名记录者贡献。这个数据集包含了鸟类、哺乳动物、昆虫、爬行动物和两栖动物的声音,音频和物种标签来源于提交给 iNaturalist 的观察记录。

9、MINT-1T 文本图像对多模态数据集

发布机构:华盛顿大学、斯坦福大学、Salesforce Research 等

下载地址:https://go.hyper.ai/l5vvj

该数据集包含 1 万亿个文本标记和 34 亿张图像,其规模是之前最大开源数据集的 10 倍。它不仅包括 HTML 文档,还涵盖 PDF 文档和 ArXiv 论文,其多样性显著提升了科学文档的覆盖率。

10、AudioSetCaps 音频字幕数据集

发布机构:西北工业大学、西安联丰声学技术有限公司、南洋理工大学、中国科学院声学研究所等

下载地址:https://go.hyper.ai/WRZDQ

AudioSetCaps 是一个音频-字幕数据集,数据来源于 AudioSet 、YouTube-8M 和 VGGSound,包含 6,117,099 个 10 秒的音频文件。每个音频文件都附有一个描述性标题,还附有 3 个 Q&A 对作为生成最终标题的元数据(共 18,414,789 对 Q&A 数据)。

以上就是 HyperAI超神经为大家汇总的 NeurIPS 2024 数据集,如果你有想要收录 hyper.ai 官方网站的资源,也欢迎留言或投稿告诉我们哦!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2248351.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Java使用replaceAll替换时不使用正则表达式

前言 public String replaceAll(String regex, String replacement) {return Pattern.compile(regex).matcher(this).replaceAll(replacement);}在使用String.replaceAll() 方法时,由于入参时regex ,而入参刚好是正则表达式的字符该怎么办?我…

计算机毕业设计Hadoop+Spark音乐推荐系统 音乐预测系统 音乐可视化大屏 音乐爬虫 HDFS hive数据仓库 机器学习 深度学习 大数据毕业设计

温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 作者简介:Java领…

途普科技企业知识中台完成华为昇思MindSpore技术认证

近日,北京途普科技有限公司(以下简称“途普科技”)作为华为昇腾大模型方向的应用软件伙伴,核心产品企业知识中台已成功与华为AI框架昇思MindSpore完成相互兼容性认证。这一成就标志着途普科技在AI领域与华为的合作进一步加深&…

自由学习记录(25)

只要有修改,子表就不用元表的参数了,用自己的参数(只不过和元表里的那个同名) 子表用__index“继承”了父表的值,此时子表仍然是空表 一定是创建这样一个同名的变量在原本空空的子表里, 传参要传具体的变…

【Nginx】核心概念与安装配置解释

文章目录 1. 概述2. 核心概念2.1.Http服务器2.2.反向代理2.3. 负载均衡 3. 安装与配置3.1.安装3.2.配置文件解释3.2.1.全局配置块3.2.2.HTTP 配置块3.2.3.Server 块3.2.4.Location 块3.2.5.upstream3.2.6. mine.type文件 3.3.多虚拟主机配置 4. 总结 1. 概述 Nginx是我们常用的…

AIGC-----AIGC在虚拟现实中的应用前景

AIGC在虚拟现实中的应用前景 引言 随着人工智能生成内容(AIGC)的快速发展,虚拟现实(VR)技术的应用也迎来了新的契机。AIGC与VR的结合为创造沉浸式体验带来了全新的可能性,这种组合不仅极大地降低了VR内容的…

学习笔记035——MySQL索引

数据库索引 索引是为了提高数据的查询速度,相当于给数据进行编号,在查找数据的时候就可以通过编号快速找到对应的数据。 索引内部数据结构:B Tree 主键自带索引。 如: insert into user (id, name) values (1,f); insert int…

C语言数据结构-链表

C语言数据结构-链表 1.单链表1.1概念与结构1.2结点3.2 链表性质1.3链表的打印1.4实现单链表1.4.1 插入1.4.2删除1.4.3查找1.4.4在指定位置之前插入或删除1.4.5在指定位置之后插入或删除1.4.6删除指定位置1.4.7销毁链表 2.链表的分类3.双向链表3.1实现双向链表3.1.1尾插3.1.2头插…

计算机网络 网络安全基础——针对实习面试

目录 网络安全基础你了解被动攻击吗?你了解主动攻击吗?你了解病毒吗?说说基本的防护措施和安全策略? 网络安全基础 网络安全威胁是指任何可能对网络系统造成损害的行为或事件。这些威胁可以是被动的,也可以是主动的。…

上海乐鑫科技一级代理商飞睿科技,ESP32-C61高性价比WiFi6芯片高性能、大容量

在当今快速发展的物联网市场中,无线连接技术的不断进步对智能设备的性能和能效提出了更高要求。为了满足这一需求,乐鑫科技推出了ESP32-C61——一款高性价比的Wi-Fi 6芯片,旨在为用户设备提供更出色的物联网性能,并满足智能设备连…

初识java(2)

大家好,今天我们来讲讲java中的数据类型。 java跟我们的c语言的数据类型有一些差别,那么接下来我们就来看看。 一.字面常量,其中:199,3.14,‘a’,true都是常量将其称为字面常量。(…

MMCM DRP动态配置方法(超详细讲解)

一、MMCM 源语介绍 1、调用源语 2、调用Clocking Wizard IP 调用Clocking Wizard IP核选择使用MMCM资源时,IP内部也是调用的MMCM源语。 Clocking Wizard IP中启用MMCM DRP接口方法: 在Clocking Wizard IP中设置分频倍频系数方法: IP核中生…

对于GC方面,在使用Elasticsearch时要注意什么?

大家好,我是锋哥。今天分享关于【对于GC方面,在使用Elasticsearch时要注意什么?】面试题。希望对大家有帮助; 对于GC方面,在使用Elasticsearch时要注意什么? 1000道 互联网大厂Java工程师 精选面试题-Java…

Spring Boot 与 Spring Cloud Alibaba 版本兼容对照

版本选择要点 Spring Boot 3.x 与 Spring Cloud Alibaba 2022.0.x Spring Boot 3.x 基于 Jakarta EE,javax.* 更换为 jakarta.*。 需要使用 Spring Cloud 2022.0.x 和 Spring Cloud Alibaba 2022.0.x。 Alibaba 2022.0.x 对 Spring Boot 3.x 的支持在其发行说明中…

在Vue3项目中引入省市区联动插件

1. 打开HBuilder X 图1 2. 新建一个空项目 文件->新建->项目->uni-app 填写项目名称:vue3demo 选择项目存放目录:D:/HBuilderProjects 一定要注意vue的版本,当前选择的版本为vue3 图2 点击“创建”之后进入项目界面 图3 其中各文件…

STM32C011开发(3)----Flash操作

STM32C011开发----3.Flash操作 概述硬件准备视频教学样品申请源码下载参考程序生成STM32CUBEMX串口配置堆栈设置串口重定向FLASH数据初始化FLASH 读写演示 概述 STM32C011 系列微控制器内置 Flash 存储器,支持程序存储与数据保存,具备页面擦除、双字写入…

JVM详解:垃圾回收机制

java作为大型服务开发的主流语言,其运行会占用大量的内存空间,那么合理的使用有限的服务器资源至关重要。和大多数翻译性语言一样,java的运行环境jvm也内置垃圾回收机制,其通过一些合理的算法组合,定时来对堆中保存的不…

【拥抱AI】如何查看Milvus的使用情况?

查看Milvus的使用情况和性能指标可以帮助你了解数据库的健康状况、性能指标和资源使用情况。以下是一些常用的方法和工具,帮助你全面监控和查看Milvus的使用情况和性能指标。 1. 查看日志 Milvus的日志文件记录了运行时的各种信息,包括错误、警告和调…

基于Netty实现聊天室

前言 了解了Netty的基本功能和相关概念,使用基于Netty实现多人聊天的功能。 需求 1.服务端能够接收客户端的注册,并且接受用户的信息注册 2.服务端能够处理客户端发送的消息,并且根据消息类型进行私发或者广播发送消 3.服务端能够私发消…

利用 Jsoup 进行高效 Web 抓取与 HTML 处理

Jsoup 是一款 Java 的 HTML 解析器,可直接解析某个 URL 地址、HTML 文本内容。它提供了一套非常省力的 API,可通过 DOM,CSS 以及类似于 JQuery 的操作方法来取出和操作数据。 官网:https://jsoup.org/ 中文文档:Jsou…