Younger 数据集:人工智能生成神经网络

news2024/11/8 5:48:37

       设计和优化神经网络架构通常需要广泛的专业知识,从手工设计开始,然后进行手动或自动化的精细化改进。这种依赖性成为快速创新的重要障碍。认识到从头开始自动生成神经网络架构的复杂性,本文引入了Younger,这是一个开创性的数据集,旨在推进人工智能生成神经网络架构 (AIGNNA) 的发展

1 现状

  • 早期手动设计: 早期神经网络架构如 AlexNet, ResNet, LSTM, Transformer 等都是手动设计的,需要大量专家知识和经验。这种方法的创新和灵活性有限,难以适应快速发展的数据和应用场景。
  • 神经架构搜索 (NAS): NAS 通过自动化搜索和优化神经网络架构,提高了设计效率。然而,现有的 NAS 方法仍然依赖于预先定义的宏架构和有限的算子类型,限制了创新空间。
  • 现有基准数据集: 现有的 GNN 基准数据集如 Cora, CiteSeer, PubMed, QM9, ZINC 等,主要包含结构简单、静态的图数据,难以测试 GNN 算法的可扩展性、鲁棒性和泛化能力。

2 数据集介绍

数据集来源: Younger数据集来源于超过174K个真实世界模型,这些模型涵盖了来自不同公共模型中心的30多个任务。包括7,629个独特的架构,每个架构都以有向无环图(DAG)的形式表示,并包含了详细的操作员级别的信息。

Younger 数据集分为三个系列:

  • 完整系列: 包含所有从模型中提取的 DAG,记录了原始模型的来源和 ID。
  • 过滤系列: 去除了同构 DAG 后的异构架构集合。
  • 分割系列: 根据特定实验需求,对过滤系列数据进行分割和处理的版本。

3 数据集构建

Younger 数据集的构建过程主要包括以下四个步骤:

3.1 获取神经网络模型

  • 从四个公开的神经网络模型仓库中获取模型:Kaggle Models, PyTorch Hub, ONNX Model Zoo, Hugging Face Hub。这些仓库包含各种深度学习任务和框架的模型,保证了数据的多样性。
  • 开发自动化工具,定期更新数据,确保 Younger 数据集的时效性。

3.2 将模型转换为 ONNX 格式

  • 使用 ONNX 作为统一表示格式,方便不同深度学习框架之间的模型交换和部署。
  • 使用开源工具如 Optimum 和 tf2onnx 进行模型转换,降低转换成本。

3.3 从 ONNX 模型中提取 DAG

  • 开发工具,将 ONNX 模型转换为 DAG,并去除参数信息,确保数据安全和隐私。
  • 在 DAG 中,节点代表 ONNX 算子,记录详细的配置和超参数;边代表算子之间的数据流。

3.4 过滤数据集

  • 使用 Weisfeiler-Lehman (WL) 图哈希算法,识别并过滤掉同构的神经网络架构,保证数据集中每个架构的唯一性。
  • 最终,从 174K 个真实世界模型中提取出 7,629 个异构的神经网络架构。

4 实验验证

证Younger数据集在人工智能生成神经网络架构(AIGNNA)方面的潜力和有效性,并探索其在现实世界场景中的可行性。

4.1 实验设计

  • 统计分析: 在不同的粒度级别(操作员级别、组件级别和架构级别)进行了统计分析,以展示数据集包含足够丰富的先验知识。
  • 实际应用探索: 探索了局部和全局设计范式的实践应用,证明了数据集在现实场景中的可行性。

4.2 统计分析

从低维度和高维度两个层面分析了 Younger 数据集的统计特性,揭示了数据集的丰富性和挑战性。

4.2.1 低维度统计信息

4.2.1.1 图的节点数和边数分布

  • Younger 数据集中包含的 DAG 结构规模差异很大,从仅包含十几个节点的图到包含数十万个节点的图都有。
  • 与现有的图数据集相比,Younger 数据集具有更广泛的节点数分布,这为 GNN 研究提供了更大的挑战和机遇。

4.2.1.2 常用 ONNX 算子

  • Younger 数据集中包含 184 种 ONNX 算子,涵盖了各种类型的算子,包括张量变形、算术运算、逻辑运算和量化等。
  • 其中,最常用的算子包括 ReLU、Conv、Add、MatMul 等,这些算子是构建神经网络架构的基础。

4.2.2 高维度统计信息

4.2.2.1 嵌入学习

使用 GCN 网络对 DAG 进行嵌入,将 DAG 转换为高维向量表示,以便于分析架构的分布特性。

4.2.2.2 不同粒度分析

  • 算子嵌入: 将每个 DAG 中的所有算子进行嵌入,分析算子的分布特性。
  • 子图嵌入: 将每个 DAG 中的所有子图进行嵌入,分析子图的分布特性。
  • 图嵌入: 将每个 DAG 的所有子图嵌入取平均,得到整个 DAG 的嵌入表示。

4.2.2.3 结果分析

  • 算子嵌入: 训练后的嵌入结果能够将高频算子和低频算子区分开来,但由于数据集中算子类型的多样性,学习过程仍然存在一定的偏差。
  • 子图嵌入: 基线模型能够将不同子图的嵌入表示区分开来,但由于数据集中子图结构的复杂性,子图嵌入的学习效果仍然有待提高。
  • 图嵌入: 不同架构的 DAG 嵌入表示在空间中距离较近,表明数据集涵盖了多种主流架构。同时,相同架构的 DAG 嵌入表示也存在多个点,表明数据集中存在该架构的多种变体。

统计分析结果表明,Younger 数据集具有丰富的统计特性,涵盖了各种类型的神经网络架构和算子。同时,数据集的复杂性和多样性也给 GNN 研究带来了新的挑战。

4.3 实际应用探索

4.3.1 局部设计范式

  • 数据流设计: 使用图卷积网络(GCN)、图注意力网络(GAT)和GraphSAGE等模型在数据流设计范式下验证了神经架构细化的有效性。所有模型在Younger数据集上都取得了良好的性能,这证明了现有的图神经网络更适合预测神经网络架构中的数据流。
  • 操作员设计: 使用五种不同的基线模型进行了十次实验,在操作员设计范式下,尽管所有基线模型都取得了高准确率,但F1分数、精确度和召回率仍然较低。这主要是由于Younger中复杂的图结构,其特征是许多操作员类型的存在。其中,多种类型的操作员出现频率较低,这对实现稳健的多分类性能构成了挑战。

4.3.2 全局设计范式

 从头开始设计神经网络架构是一个开放且复杂的挑战。与神经架构搜索不同,后者将搜索空间限制在预定义的宏观架构内,同时优化微观架构元素以获得特定性能,全局范式寻求从基础开始生成包含详细操作员级元素的全面神经网络架构。

4.4 实验结果

  • 在局部范式下,所有模型在Younger数据集上都表现出良好的性能,其中GCN在所有指标上的表现优于其他模型,除了F1分数。
  • 在全局范式下,采用了使用扩散模型生成图的Digrress图生成模型。由于计算资源的限制和Younger图中节点数量最多可达数十万,我们只选择了节点数量在[1, 300]范围内的架构进行训练。

Younger数据集为AIGNNA提供了一个有前景的基准,通过实验,初步验证了Younger在新领域的神经架构设计方面的潜力和有效性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1861812.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

使用Birdeye访问Sui上加密市场数据

是一个链上加密交易数据聚合器,于2024年4月开始整合Sui数据。 个人DeFi用户可以在Birdeye的首页找到丰富的数据,包括关于主流区块链上的tokens、交易和交易者钱包的详细信息。 Birdeye提供API和WebSockets数据服务,涵盖token价格和其他DeFi…

类和对象(封装、继承、多态、友元)

c面相对象的三大特性为:封装、集成、多态 c 认为万事万物都皆为对象,对象上有其属性和行为 一、类和对象(封装) (一)封装的意义 封装是c面相对象的三大特性之一 封装的意义: 将属性和行为…

HarmonyOS NEXT:华为开启全新操作系统时代

在全球科技浪潮的汹涌澎湃中,华为再次以创新者的姿态,引领了一场关于操作系统的革命。HarmonyOS NEXT,这一由华为倾力打造的分布式操作系统,不仅是对现有技术的一次大胆突破,更是对未来智能生活的一次深邃展望。 Harmo…

AU音频重新混合音频,在 Adobe Audition 中无缝延长背景音乐,无缝缩短BGM

导入音频,选中音频,并且点 New Multitrack Session 的图标 设计文件名和存储路径,然后点 OK 点 Essential Sound 面板点 Music (如果没有这个面板 点菜单栏 Windows > Essential Sound 调出来) 点 Duration 展…

实战案例:如何用ChatGPT生成适合不同领域的高质量文章

随着人工智能技术的飞速发展,生成高质量文章已经不再是难题。特别是OpenAI开发的ChatGPT,更是为写作工作带来了极大的便利。那么,如何用ChatGPT生成适合不同领域的高质量文章呢?本文将通过实战案例,为大家详细讲解这一…

耐盐雾抗腐蚀航空插头插座

航空插头插座概述 耐盐雾720小时航空插头插座是一种专门设计用于抵抗盐雾侵蚀的航空用连接器,广泛应用于航空航天、海洋工程和其他需要高防护级别的领域。这类插头插座不仅具备一般的电气连接功能,还能在含盐较高的环境中长时间工作而不被腐蚀&#xff…

OpenAI禁止国区使用:免费国产大模型等你体验!

OpenAI中国停服 国产大模型免费使用 前言 OpenAI不支持中国区域访问 从6月25日开始,OpenAI 宣布了对中国停止提供 API 服务,毫无疑问的说这给国内的开发者带来了很大的不便,之后他们怎么去使用GPT 这类先进大模型方面遇到了难题。不过近期我们…

算法基础精选题单 动态规划(dp)(背包问题)(个人题解)

目录 前言: 正文: 题单:【237题】算法基础精选题单_ACM竞赛_ACM/CSP/ICPC/CCPC/比赛经验/题解/资讯_牛客竞赛OJ_牛客网 (nowcoder.com) 01背包: NC16693 装箱问题: NC16650 [NOIP2005]采药: NC16666 […

LeetCode刷题之HOT100之最小栈

听歌,做题! 1、题目描述 2、逻辑分析 拿到题目一脸懵,有点看不懂啥意思,看了题解才知道啥意思。要实现在常数时间内检索到最小元素的栈,需要使用一个辅助栈来每次存入最小值。 使用Deque作为栈的实现是因为它提供了…

【Linux】进程信号_1

文章目录 八、进程信号1.信号 未完待续 八、进程信号 1.信号 信号和信号量之间没有任何关系。信号是Linux系统提供的让用户/进程给其他进程发送异步信息的一种方式。 常见信号: 当信号产生时,可选的处理方式有三种:①忽略此信号。②执行该…

C++ 14新特性个人总结

variable templates 变量模板。这个特性允许模板被用于定义变量,就像之前模板可以用于定义函数或类型一样。变量模板为模板编程带来了新的灵活性,特别是在定义泛化的常量和元编程时非常有用。 变量模板的基本语法 变量模板的声明遵循以下基本语法&am…

【Linux网络(一)初识计算机网络】

一、网络发展 1.发展背景 2.发展类型 二、网络协议 1.认识协议 2.协议分层 3.OSI七层模型 4.TCP/IP协议 三、网络传输 1.协议报头 2.局域网内的两台主机通信 3.跨网络的两台主机通信 四、网络地址 1.IP地址 2.MAC地址 一、网络发展 1.发展背景 计算机网络的发展…

ITIL发展之路:从v3到v4的演变与应用

在当今瞬息万变的技术环境中,IT服务管理(ITSM)已成为企业运营的关键支柱。ITIL(Information Technology Infrastructure Library,信息技术基础设施库)作为全球公认的ITSM最佳实践框架,帮助组织在…

AI大模型日报#0625:OpenAI停止不支持国家API、大模型「考上」一本、苹果上新视觉模型4M-21

导读:AI大模型日报,爬虫LLM自动生成,一文览尽每日AI大模型要点资讯!目前采用“文心一言”(ERNIE-4.0-8K-latest)生成了今日要点以及每条资讯的摘要。欢迎阅读!《AI大模型日报》今日要点&#xf…

打电话时可以变声的软件有吗?变声器免费的直接说话的那种,直播要用!

在直播盛行的当下,变声器成为许多主播增加趣味性和神秘感的重要工具。对于想要在直播中尝试不同声音效果的用户来说,寻找一款既方便又免费的变声器软件显得尤为重要。本文将详细介绍11款可以直接说话的免费变声器软件,助你在直播中大展身手。…

【内网穿透】FRP 跨平台内网穿透 支持windows linux x86_64 arm64 端口范围映射

AI提供的资料: FRP(Fast Reverse Proxy)是一个专为内网穿透设计的高性能反向代理程序。以下是一些关于FRP的详细资料,帮助您更好地理解和使用这一工具: 核心特点: 内网穿透:能够将位于内网的…

光伏开发有没有难点?如何解决?

随着全球对可再生能源的日益重视,光伏技术作为其中的佼佼者,已成为实现能源转型的关键手段。然而,光伏开发并非一帆风顺,其过程中也面临着诸多难点和挑战。本文将对这些难点进行探讨,并提出相应的解决策略。 一、光伏开…

Linux内核开发-编写一个proc文件

0.前言 上一章(点击返回上一章)完成了一个内核模块的编写,实现了在内核运行时的动态加载和卸载。 在模块的开发调测过程中或者模块运行过程中,可能需要打印内核模块的变量的值或者想要动态开关模块的运行日志打印,那么…

[word] Word如何删除所有的空行? #职场发展#学习方法

Word如何删除所有的空行? 很多网友从网页复制文字粘贴到word文档后发现段落之间有空行,如果文字不多,手动删除这些空行也没有多少工作量,但是如果文字的字数达到成千上万,一个个手动删除这些空行还是很繁琐的。那么&a…

礼让,不是一昧地退让,而是表达我们的素养、品德

礼 / 让,发心是文明相处,互助互让,是君子之交