全新神经网络:Kolmogorov-Arnold网络更具解释性,有望为物理学家提供新假设

news2024/9/20 9:03:08

  每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

人工神经网络——受生物大脑启发的算法——是现代人工智能的核心,无论是聊天机器人还是图像生成器都依赖于它们。然而,由于其众多神经元,神经网络常常成为黑箱,用户难以理解其内部运作。

研究人员现在创造了一种从根本上新的神经网络方式,在某些方面超越了传统系统。据称,这些新网络不仅更具解释性,而且更准确,即使规模更小。其开发者表示,这种学习简洁表示物理数据的新方法可能帮助科学家发现新的自然法则。

“看到有新的架构出现,真是太好了。”
——约翰霍普金斯大学布莱斯·梅纳德

过去十多年里,工程师们主要通过反复试验来调整神经网络设计。约翰霍普金斯大学的物理学家布莱斯·梅纳德研究神经网络的运行方式,但并未参与这项新工作,该研究于四月在arXiv上发布。“看到有新的架构出现,真是太好了,”他说,尤其是一种从基本原理设计的架构。

可以将神经网络比作神经元(或节点)和突触(或连接那些节点的链接)。在传统神经网络(称为多层感知机,MLP)中,每个突触学习一个权重——一个确定两个神经元之间连接强度的数字。神经元按层排列,一个层的神经元从前一层的神经元接受输入信号,并根据突触连接的强度加权。然后,每个神经元对其输入总和应用一个简单函数,称为激活函数。

在新的架构中,突触扮演更复杂的角色。它们不仅学习两个神经元之间连接的强度,还学习这种连接的完整性质——从输入到输出的映射函数。与传统架构中神经元使用的激活函数不同,这个函数可能更复杂——实际上是一个“样条”或多个函数的组合——并且在每个实例中不同。另一方面,神经元变得更简单——它们只是对所有前置突触的输出求和。这些新网络称为Kolmogorov-Arnold网络(KAN),以研究函数如何组合的两位数学家命名。其理念是,KAN在学习表示数据时提供更大的灵活性,同时使用更少的学习参数。

“这就像一种外星生命,从不同角度看待事物,但对人类来说也容易理解。”
——麻省理工学院的刘子明

研究人员在相对简单的科学任务上测试了他们的KANs。在一些实验中,他们采用简单的物理定律,例如两个相对论速度物体相遇的速度。他们使用这些方程生成输入-输出数据点,然后对每个物理函数,训练一个网络并测试其余数据。他们发现,增加KANs的规模比增加MLPs的规模更快地提高其性能。在求解偏微分方程时,一个KAN比拥有100倍参数的MLP准确100倍。

在另一实验中,他们训练网络根据拓扑结的其他属性预测其标记属性。一个MLP使用约300,000个参数达到了78%的测试准确率,而一个KAN使用仅约200个参数达到了81.6%的测试准确率。

此外,研究人员可以直观地绘制KANs的图,查看激活函数的形状以及每个连接的重要性。他们可以手动或自动修剪弱连接,并用更简单的函数(如正弦或指数函数)替换一些激活函数。然后,他们可以将整个KAN简洁地总结为一个直观的单行函数(包括所有组件激活函数),在某些情况下完全重构生成数据集的物理函数。

“未来,我们希望它能成为日常科学研究的有用工具,”麻省理工学院的计算机科学家、该论文的第一作者刘子明说。“给我们一个我们不知道如何解释的数据集,我们把它交给KAN,它可以为你生成一些假设。你只需盯着大脑(KAN图)看,如果你愿意,还可以对其进行手术。”你可能会得到一个简洁的函数。“这就像一种外星生命,从不同角度看待事物,但对人类来说也容易理解。”

已经有几十篇论文引用了KAN预印本。“我一看到它就觉得非常激动,”阿根廷圣安德烈斯大学的计算机科学本科生亚历山大·博德纳说。在一周内,他和三名同学将KAN与卷积神经网络(CNN)结合,这是一种处理图像的流行架构。他们测试了他们的卷积KANs在分类手写数字或衣物上的能力。最好的卷积KANs在参数使用量减少约60%的情况下,与传统CNN的性能大致相当(两者在数字分类上均达到99%的准确率,在衣物分类上均达到90%)。尽管这些数据集相对简单,但博德纳表示,其他拥有更多计算能力的团队已经开始扩展这些网络。其他人将KAN与在大规模语言模型中流行的Transformer架构结合。

KANs的一个缺点是每个参数的训练时间更长——部分原因是它们无法利用GPU。但它们需要更少的参数。刘子明指出,即使KANs无法取代用于处理图像和语言的巨型CNN和Transformer,训练时间在许多物理问题的小规模下也不会成为问题。他正在研究专家如何将其先验知识插入KANs——例如通过手动选择激活函数——并使用简单界面轻松从中提取知识。未来,他说,KANs可能帮助物理学家发现高温超导体或控制核聚变的方法。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1990969.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

FDE Solver 的 enabled 选项是不开放的

FDE Solver 的 enabled 选项是不开放的 正文正文 在 Mode 工程文件中,只能添加一个 FDE Solver,并且,不同于结构组件,对于结构组件,我们通常可以使用如下脚本将其设置为不启用状态。 比如,我们这里有一个三角型结构。 我们通过如下脚本设置其为不启用状态后, CAD 显示…

准确度与精密度:差异和示例

准确度与精密度:差异和示例 文章目录 一、说明二、准确性的定义三、精度的定义四、飞镖板上的准确度与精确度五、如何记住准确度与精确度六、如何测试准确度和精密度 一、说明 当您依赖数据得出结论时,准确度和精确度是测量的关键属性。这两个概念都适…

Git合并多笔提交为一笔

Git合并多笔提交为一笔 1. 背景 在实际项目开发中,我们会基于生产分支拉出很多需求分支,在需求分支开发完成后再将代码合到生产分支,但随着提交次数越来越多,我们在合到生产分支的时候就得一笔一笔的入库,特别麻烦&a…

day14-测试自动化之Selenium的元素操作、浏览器操作等

一、元素操作 1.1.为什么要学习操作元素的方法? 1).需要让脚本模拟用户给指定元素输入值 2).需要让脚本模拟人为删除元素的内容 3).需要让脚本模拟点击操作 1.2.元素常用操作方法 1).click()点击方法 2).send_keys(value) 输入方法 3).clear(…

手表运动报告生成以及手机展示

一.运动报告组成部分 一般一份运动健康的报告包括以下信息: 1.运动轨迹区。2.报告数据区。(运动总体概览,如距离,时长,训练表现等)3.曲线图表区。(心率曲线,海拔曲线,速度,配速曲线) 二.组成部…

PHP + Laravel + RabbitMQ + Redis 实现消息队列 (三) 消费队列在RabbitMQ和redis中的发布和订阅

发布订阅(Pub/Sub) 对于消息队列传统的模式来说,一个消费者消费一条消息,这条消息被消费之后就不会再次被其它的消费者消费。但是在发布订阅模式中,一条消息是可以被多个消费者消费的,这些消费者其实相当于…

SOMEIP_ETS_021:echoINT8

测试目的: 验证DUT在发送和接收INT8参数时,是否能够保持参数的值和顺序不变。 描述 本测试用例旨在检验DUT在处理包含INT8类型参数的SOME/IP消息时,是否能够正确地发送和接收这些参数,并且确保返回的方法响应消息中的INT8参数值…

QT(C#)-QTabWidget修改字体后Tab页显示不完整的解决方法

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 1、 前言2、问题示例3、解决方法 1、 前言 最近一段时间学习QT的程序开发,遇到了如标题所说的问题,经过查询和摸索找到了解决方法&#xff…

CSP-J 复赛 模拟题6

1.大小写字母互换: 题目描述 由输入给定一个字符串,你的任务是将原字符串中的大写字母转换成其对应的小写字母,还要将原字符串中的小写字母转换成对应的大写字母,其余字符不变。 输出转换之后得到的新字符串。 输入格式 一行…

Flink开发语言大比拼:Java与Scala怎么选好?

在选择Apache Flink的开发语言时,Java和Scala各有优劣,最合适的选择取决于项目需求、团队技能和偏好。 Apache Flink是一个开源流处理框架,广泛应用于实时数据处理场景,如金融交易监控、网络流量分析和用户行为分析等。Flink支持J…

水泵性能参数详解

水泵性能参数之流量 水泵流量是指水泵单位时间内输送液体的体积或重量,用符号Q来表示,常用单位有m/h、m/s、L/s或t/h。 水泵铭牌上标注的流量是这台泵的设计流量,又称额定流量,水泵在额定流量下运行效率最高。 水泵流量计算公式为…

代码随想录训练营 Day23打卡 回溯算法part02 39. 组合总和 40. 组合总和II 131. 分割回文串

代码随想录训练营 Day23打卡 回溯算法part02 一、 力扣39. 组合总和 给你一个 无重复元素 的整数数组 candidates 和一个目标整数 target ,找出 candidates 中可以使数字和为目标数 target 的 所有 不同组合 ,并以列表形式返回。你可以按 任意顺序 返回…

李飞飞亲自撰文,数十名科学家签署联名信,反对加州AI限制法案

AI真的已经危险到要如此监管的地步了吗? 点击访问我的技术博客https://ai.weoknow.comhttps://ai.weoknow.com 在创新的热土硅谷,李飞飞、吴恩达等 AI 科学家正在与监管部门展开一场关于安全与创新的拉锯战。 这场拉锯战的核心是一个名叫 SB-1047 的法案…

云平台部署 FunAudioLLM 语音天花板

FunAudioLLM FunAudioLLM 是阿里开源的语音处理模型,包含 SenseVoice 和 CosyVoice 两个模型。可以实现 5 种语言生成,以及 50 种语言无缝翻译,还能识别语音情绪。 FunAudioLLM:https://github.com/FunAudioLLM CosyVoice开源仓…

【Material-UI】按钮组:垂直按钮组详解

文章目录 一、按钮组概述1. 组件介绍2. 基本用法 二、垂直按钮组的应用场景1. 导航菜单2. 表单操作3. 选项切换 三、按钮组的样式定制1. 变体(Variants)2. 颜色(Colors) 四、垂直按钮组的优势1. 空间利用2. 可读性与易用性3. 视觉…

【网络基础一】几乎不讲任何网络协议细节,搭建网络基本结构

文章目录 问题认识“协议”计算机通信问题技术问题应用问题 协议分层 统编程帮助我们处理数据,网络编程帮助我们获取数据,网络配上我们写的线程池模块很快就搭建起来了。 问题 网卡是文件吗? 是的,所以未来网络通信的本质反馈到编…

Obsidian插件安装与开发

大概背景 事情的起因还是因为做笔记,我喜欢利用插件Obsidian Git自动同步笔记到Gitee,写md文档有个问题就是关于图片如何存储。 我个人习惯是将所有图片都保存到指定的文件夹下,如图👇 由于Obsidian对粘贴图片默认格式为这样的&…

ESXI加入VMware现有集群提示常规性错误

集群内有vSphere6.5和6.7的版本,都开启了EVC 这台老服务器是DELL R710添加时报错,网上查了些资料说要重装ESXI或者关闭EVC等等 最终解决方法是,给这台ESXI配置一个NTP服务器,同步系统时间,之后即可正常加入集群 往期文…

【安卓】文件存储

文章目录 将数据存储到文件中从文件中读取数据 文件存储是Android中最基本的数据存储方式,它不对存储的内容进行任何格式化处理,所有数据都是原封不动地保存到文件当中的,因而它比较适合存储一些简单的文本数据或二进制数据。如果你想使用文件…