用神经网络求解方案

news2025/1/23 13:03:30

在处理密集、计算量大的数学问题时,计算机系统一直是人类最好的朋友。从计算器上的简单计算到 R 中的大型统计运算,这一技术前沿使我们很多人的生活变得更加轻松。

然而,即使是计算机,当数字变成字母并开始涉及代数时,也会出现故障。人们可能希望随着日益复杂的机器学习和人工智能算法的出现,这个问题可以得到解决——但希望和梦想仍然只是希望和梦想……直到现在。

Facebook AI 的优秀员工最近发布了一篇研究论文,他们使用一种称为神经机器翻译的方法“教”计算机如何解微分方程。然而,阅读学术论文对某些人来说可能是一项繁琐的任务,因此这里是对向计算机教授符号数学的实际情况的解构版本。

NSDT工具推荐: Three.js AI纹理开发包 - YOLO合成数据生成器 - GLTF/GLB在线编辑 - 3D模型格式在线转换 - 可编程3D场景编辑器 - REVIT导出3D模型插件 - 3D模型语义搜索引擎 - Three.js虚拟轴心开发包 - 3D模型在线减面 - STL模型在线切割 

1、问题是什么?

神经网络已经存在了很长时间(实际上从 1958 年开始),但直到最近,它们在代数方程求解方面的应用才有了重大进展。

你可能想知道,在这个不断研究和突破的时代,为什么要花这么多时间才能完成看似相当容易的任务。然而,就像神经网络的情况一样,没有什么事情看起来那么简单。

上述陈述几乎完美地总结了这个问题。神经网络一直用于统计数据,使用不同形式的模式识别来学习给定的任务。

传统的模式匹配可以让网络识别出像素的特定排列应该被归类为狗,但不能让它求解多元方程。求解复杂方程需要比泛化更高的精度,而泛化并不是神经网络所做的。

此外,在求解方程时,人类往往会对如何处理特定问题有“直觉”。我们往往对最终解决方案的组成有一个大致的了解,我们的整个思维过程都是为了证明这一点。如果没有直觉或预知能力,计算机系统在解决复杂方程式时基本上会迷失方向。

2、方程式求解 AI 是如何诞生的

让我们深入了解一下,了解研究人员如何实现这一以前不可能实现的壮举。

复杂方程式被视为 NLP(自然语言处理)的一部分,因此,研究人员更倾向于使用 NLP 领域中先前已证明有效的技术来解决这个问题。接下来是利用神经机器翻译 (NMT) 将问题转化为解决方案的天才之举。

听起来很奇怪,但提出的方法效果出奇地好,与基于代数的方程式求解软件(如 Matlab 或 Mathematicia)相比,速度和准确性显著提高。

2.1 将方程式转换成句子

NLP 技术通常应用于单词或单词序列以生成适当的输出。研究人员决定用于解决此问题的 NMT 技术本质上是一个序列到序列 (seq2seq) 神经网络。

seq2seq 模型本质上将一个单词序列作为输入,并输出一个具有某种含义的序列。因此,要将方程式应用于 seq2seq 模型,研究人员首先需要将它们转换为单词序列。

为了实现这一点,研究人员决定采用两步方法。最初,开发了一个系统,该系统本质上是解开提供的方程式并将其放在树状结构中。

这种“树状结构”成功地为符号方程式提供了一个更易于理解的视角,然后将其扩展为一种可以与所提出的 seq2seq 模型很好地配合的形式。

树的结构是这样的:常量和变量成为叶子,而运算符充当内部节点,连接树的不同分支。继续使用方程式句子类比,数字和变量可以看作是句子中的名词,而运算符本质上充当动词。

这种方法帮助研究人员利用了强大的 seq2seq NMT 模型,该模型以前用于句子和单词序列;只是这次,单词被变量和运算符取代了。

2.2 训练提出的模型

鉴于这是一种通过深度学习解决方程式的全新方法,因此没有为此特定目的而精心挑选的数据集。这是训练模型时面临的首要挑战——没有任何数据就无法训练模型。

为了确保准确性,研究人员决定创建自己的数据集,其中包含特定问题,以确保模型在测试时的准确性。在整理数据时,我们发现了一个有趣(且相当令人沮丧)的问题:由于方程最终会被积分(或微分),所以并非所有方程都有解。因此,数据集需要完全新颖,即以树的形式重构已解方程的示例。

研究人员在数据采集和积累过程中注意到一个有趣的现象:最终,数据集归结为问题-解决方案对,这与翻译成其他语言的词库相似。最终的训练数据集包含数百万个示例。

训练过程的下一阶段需要将此数据集应用于所提出的模型。因此,数据集在 seq2seq Transformer 模型架构上进行训练,该架构具有八个注意力头和六层。Transformer 通常用于翻译任务,网络本质上是将问题转化为解决方案。

3、这个模型真的有效吗?

现在你对底层机制有了更多的了解,你可能会想知道计算机程序是否真的可以将微分方程转化为它们的解。为了测试这个模型,研究人员为其提供了 5,000 个未见过的方程(即不属于训练数据的方程),并迫使模型识别模式并求解方程。

经测试,该模型对积分问题的准确率高达 99.7%,对一阶和二阶微分方程的准确率分别为 94% 和 81.2%,令其他传统方程求解器相形见绌。

相比之下,Mathematicia 对基于积分的问题取得了第二好的结果,准确率为 84%,而对一阶和二阶微分方程的准确率分别为 77.2% 和 61.6%。与其他软件相比,该模型在 0.5 秒内成功给出了最大预测,而其他软件则需要几分钟或完全超时。

Charton 和 Lample 提出了一个有趣的观察,即该模型有时会为一个问题预测多个解决方案。考虑到开发该模型的翻译方法,这完全是有道理的,因为对于给定的单词序列,通常存在多个翻译(具有不同的含义)。

4、下一步是什么?

Charton 和 Lample 提出的模型目前只能解决单变量方程。但这并不是人们在阅读《下一步是什么?》时想到的。

当然,这项工作让我们深入了解了神经网络可以以非传统方式应用的方式。这些不断发展的模型被设计得坚定而聪明,这两个特质有利于揭示现有学术和实践数学方法中的盲点。

该模型通过以最疯狂的方式应用 NLP 技术,提出并实现了一项长期以来被认为对神经网络来说不可能完成的任务。这项研究为更广阔的视角和大量的开放式问题打开了大门,这些问题最终可能会被愿意冒险的人以完全非正统的方式解决。


原文链接:用神经网络求解方程 - BimAnt

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1970573.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

微信公众号使用介绍

写在前面,楼下有个医生小姐姐想做个公众号,整理了一份文档入门用 一 订阅号和服务号区别 1.1 关于功能上的差异 订阅号(Subscription Account) 定位:主要用于提供信息传播和互动,适合媒体、个人博主、机…

一文全面了解HPC高性能计算平台是什么、怎么选型?高性能计算平台CHPC 都能做什么?

一. 概述 随着技术的发展和数据量的爆炸性增长,企业面临的挑战日益复杂,对计算能力的需求也在不断增加。这些问题的解决超出了传统计算方法的能力范围,高性能计算(HPC)正是为解决这类问题而生。 高性能计算&#xff…

【Linux】Linux下的日志(日常级)

日志是日后工作中非常重要的一部分,现在写一份简单的日志项目可以帮助我们熟悉并理解原理。 目录 设计思路:一些实现细节:代码:日志的使用方法: 设计思路: 图示是我们的最终目的。 设计一个类&#xff0…

是否掌握数据结构对于IT职业发展至关重要?

算法跟代码实现有时候是两回事,在开始前刚好我有一些资料,是我根据网友给的问题精心整理了一份「数据结构的资料从专业入门到高级教程」, 点个关注在评论区回复“888”之后私信回复“888”,全部无偿共享给大家!&#…

Cesium 限高分析

Cesium 限高分析 原理:ClassificationPrimitive贴模型的运用 效果图

兼容性最好的模拟器,主要为高端平板设计

一、简介 1、蓝叠安卓模拟器是BlueStacks公司推出的全球知名Android模拟器。它可能是兼容性最好的模拟器,主要为高端平板设计,加入了图形硬件加速,并与AMD合作。 二、下载 1、文末有下载链接,不明白可以私聊我哈(麻烦咚咚咚&#…

新迪天工CAD,国际水平的国产三维CAD软件

新迪数字 定位:国际领先的三维CAD软件厂商 使命:掌握核心技术,推动中国创造 愿景:让每个工程师使用中国CAD 上海新迪数字技术有限公司是一家拥有国际先进水平三维CAD核心技术的国产工业软件厂商,由国际工业软件领域知…

今日头条爬虫(zhanzhang.toutiao.com)IP及UA,真实采集数据

​ 一、数据来源: 1、这批今日头条爬虫(zhanzhang.toutiao.com)IP来源于尚贤达猎头网站采集数据; ​ 2、数据采集时间段:2023年10月-2024年7月; 3、判断标准:主要根据用户代理是否包含“zhanzhang.toutiao.com”和…

职场进阶还是智商税?一文看六西格玛绿带培训的真面目

随着企业对精细化管理需求的日益增长,六西格玛绿带培训逐渐成为职场人士争相追逐的热门课程。它不仅能够帮助学员掌握先进的质量管理工具,还能培养逻辑思维、数据分析能力以及团队合作精神,这些都是现代职场不可或缺的软实力。 职场助力or智商…

小程序商品图片有什么要求

在当今信息化的社会中,无论是组织活动、培训课程还是社交聚会,高效、准确地收集报名信息并进行有效匹配显得尤为重要。为此,我们开发了一款全新的报名匹配工具,旨在帮助活动组织者轻松管理报名流程,同时确保参与者能够…

机器学习 第8章-集成学习

机器学习 第8章-集成学习 8.1 个体与集成 集成学习(ensemble learning)通过构建并结合多个学习器来完成学习任务,有时也被称为多分类器系统(multi-classifersystem)、基于委员会的学习(committee-based learning)等。 图8.1显示出集成学习的一般结构:先产生一组“…

day15 Java基础——包机制

day15 Java基础——包机制 Java包机制是一种组织和管理类和接口的方式,通过将相关的类和接口放入同一个包中,可以避免命名冲突,提高代码的可重用性和可维护性。包采用层次化的命名空间,以点号分隔,如java.util。使用i…

标题:组合式API:优化Vue代码结构的艺术

摘要: 在Vue 3中,引入了组合式API,它提供了一种新的方式来组织组件逻辑。虽然组合式API带来了更高的灵活性和可维护性,但开发者也面临着代码组织和可读性的挑战。本文将探讨如何有效地利用组合式API,优化Vue代码结构&a…

深化理解电子商务领域的“二清”风险与合规路径

在电子商务的快速发展中,“二清”风险成为了不容忽视的话题。这一现象不仅触及金融监管红线,还潜藏诸多风险,包括资金安全、信息泄露、合规性挑战以及监管盲点。鉴于“二清”问题的复杂性与潜在危害,电商平台必须采取有效措施&…

FPGA知识基础之--500ms计数器,边沿检测,按键消抖

目录 前言一、边沿检测1.1 使用背景1.2 方法:打拍法1.2.1 背景1.2.2 原理1.2.3 上升沿 二、计数器2.1 原理2.2 RTL代码 三、按键消抖 前言 一、边沿检测 1.1 使用背景 在我们设计电路时,经常会遇到需要继续检测上升沿和下降沿的电路,因此需…

劳动仲裁经验篇【赶紧收藏】

【劳动仲裁】纯经验干货分享,点个关注防止需要时找不到! 当公司决定搞你心态,变相逼退你时,无非就那么些手段,只要你能正确应对,并做好收集证据的准备,就不住畏惧。合理利用法律的武器维护自身…

大模型书籍电子书上新 |《图技术与大模型在多领域的应用》

资料目录及介绍: GraphGPT: 大语言模型的图结构指令微调 GraphGPT旨在使大语言模型理解图结构数据,执行图相关任务如节点分类和链接预测。面对图数据多样性和大模型能力迁移的挑战,GraphGPT探讨了图输入方法、模型对齐及推理能力增强等解决…

重生奇迹MU 从不孤军奋战

重生奇迹MU的世界里,每个职业都有自己的独特魅力和优势。本文将讲述圣导师和弓箭手在游戏中的表现,他们不仅拥有强大的个人实力,更擅长与队友协作奋战,成为团队推进的重要力量。无论你选择哪个职业,与他们一起并肩作战…

【pikachu靶场】之ITOver Permission越权漏洞

一、水平越权: 查看一下提示 里面有用户名和密码,,后面要用。。 登录一个用户 在地址栏里可以看到lili用户名直接被显示到了里面,可以直接在这里修改切换到其他的用户。 修改用户 我修改用户为lucy后,就看到了lucy…

【教程】Python语言的地球科学常见数据——MODIS土地利用数据的处理

读取多年土地利用数据、裁剪长江流域土地利用、分析长时间序列长江流域土地利用变化。 地覆盖动态产品包括标志着季节性周期的植被生长、成熟和衰老的时间层。MODISTerraAqua 组合土地覆盖产品包含了五个不同的士地覆盖分类方案,通过监督决策树分类方法得出。主要的…