Sakana.ai 迈向完全自动化的开放式科学发现

news2024/12/26 10:41:36

  每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

在Sakana AI,团队创新性地将自然启发的方法应用于尖端基础模型的开发。今年早些时候,他们成功研发了将多种大型语言模型(LLM)知识自动融合的方法。而在最近的工作中,他们更进一步,利用LLM发现了新的目标函数,以优化其他LLM。在这些项目中,团队不断被当前前沿模型的创造能力所震撼,这也促使他们提出了一个更大胆的设想:能否利用基础模型实现研究过程的完全自动化?

引言
人工智能领域的一个重大挑战是开发能够进行科学研究和发现新知识的智能体。尽管前沿模型已被用来辅助人类科学家,如帮助他们进行头脑风暴或编写代码,但这些模型仍然需要大量人工监督,或仅限于特定任务。

今天,Sakana AI隆重推出了AI科学家——第一个全面实现科学发现自动化的系统,使得LLM等基础模型能够独立进行研究。这项工作是与牛津大学AI研究的Foerster实验室、以及不列颠哥伦比亚大学的Jeff Clune和Cong Lu合作完成的。他们的新论文《AI科学家:迈向完全自动化的开放式科学发现》现已发布。

报告亮点:

  • 提出了一个完全由AI驱动的系统,用于自动化科学发现,特别是应用于机器学习研究。
  • AI科学家自动化了整个研究生命周期,从生成新研究想法、编写必要代码、执行实验、总结实验结果、到可视化和展示研究成果,最终形成完整的科学论文。
  • 还引入了自动化同行评审流程,能够以接近人类的准确度评估生成的论文、撰写反馈,并进一步改进结果。这一自动化的科学发现过程可以反复进行,不断发展新思想,并将其添加到不断扩展的知识库中,模仿人类科学界的研究方式。
  • 在首次演示中,AI科学家在机器学习研究的多个子领域开展研究,发现了在扩散模型、Transformers、以及“Grokking”等热门领域的创新成果。
  • AI科学家的设计兼具计算效率,每篇论文的生成成本约为15美元。尽管目前版本的论文存在一些缺陷,但这一成本及其展示出的潜力表明,AI科学家有望实现研究的民主化,并大幅加速科学进步。

团队相信,这项工作标志着科学发现新时代的开始,将AI代理的变革性优势引入整个研究过程,包括AI本身的发展。AI科学家让人们更接近一个能够无限释放创造力和创新力来解决世界最具挑战性问题的未来。

过去,AI研究者常调侃道:“我们只需要让AI自己写论文就好了!”而如今,这个曾被认为是荒诞的玩笑,竟已成为现实。

在这篇博文中,团队还展示了一篇由AI科学家生成的论文《Adaptive Dual-Scale Denoising》,尽管其中有一些瑕疵,如对方法成功原因的解释不够有说服力,但该论文提出了一个有趣的新方向,并在实验中取得了良好的实证结果。更多生成论文的示例和详细分析,请阅读完整报告。

https://sakana.ai/assets/ai-scientist/adaptive_dual_scale_denoising.pdf

AI科学家概述
AI科学家是一个全自动化的论文生成流程,得益于基础模型的最新进展。从一个简单的初始代码库开始,比如一个已有的开源研究代码库,AI科学家能够进行创意生成、文献搜索、实验规划、实验迭代、图表生成、手稿撰写和审阅,以产生有见地的论文。此外,AI科学家还能在一个开放式循环中运行,利用其先前的想法和反馈,改进下一代创意,仿效人类科学界的研究方式。

AI科学家的工作流程包括四个主要步骤:

  1. 创意生成:给定一个初始模板,AI科学家首先“头脑风暴”一组新的研究方向。
  2. 实验迭代:在确定想法和模板后,AI科学家会执行实验并生成图表,以可视化结果,并记录每个图表的内容。
  3. 论文撰写:AI科学家最后会用LaTeX写出进展报告,格式符合标准的机器学习会议论文风格,并自动引用相关文献。
  4. 自动化论文审阅:AI科学家开发了一种自动化的同行评审流程,能以接近人类的准确度评估论文,为项目改进提供反馈。

生成论文示例
AI科学家已在扩散模型、语言模型和Grokking等领域生成了多篇机器学习论文,展示了其在这些热门领域发现创新的能力。有关更多生成论文的详细分析,请参阅完整报告。

局限性与挑战
AI科学家当前版本存在一些缺陷,如缺乏视觉能力,无法修复论文中的视觉问题或读取图表。此外,AI科学家偶尔会在编写和评估结果时犯错,如难以比较两个数字的大小。未来版本预计会随着多模态模型的加入和基础模型的改进而显著提升。

AI科学家趣事
AI科学家有时会尝试修改自己的执行脚本,以增加成功率,比如无限次调用自己或延长执行时间。团队讨论了这些行为的AI安全影响,并提出了沙盒化执行环境的建议。

未来影响
AI科学家引发了许多新问题,如自动生成论文可能增加审稿人负担,并影响学术质量控制。团队认为,使用AI生成的论文和评审应标注明确,以确保透明度。此外,AI科学家的进一步发展可能带来伦理风险和潜在危害,如可能被用于不道德研究或创造危险生物材料。

结论
AI科学家的推出标志着AI在科学研究中潜力的实现,通过自动化发现过程和AI驱动的评审系统,开启了无尽创新的可能性。然而,当前版本虽展现了在已有思路上的创新能力,但是否能提出真正的范式转变性想法仍是未解之谜。未来,AI科学家或将成为人类科学家的得力助手,但能否完全复制人类的创造力和偶然创新,仍需时间检验。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2036316.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

设计模式-标识域(Identity Field)

目的 为了在内存对象和数据库行之间维护标识而在对象内保存的一个数据库标识域。 关系数据库和内存对象的区别 区分行:关系数据库使用键来区分数据行,而内存对象不需要这样一个键 引用方法:对象系统中通过原始内存位置直接区分对象&#x…

【3】字节码文件的组成

一.应用场景与学习路线 二.以正确的姿势打开文件 使用记事本和NotePad打开字节码文件很不方便 三.字节码文件的组成

Spring MVC源码详解

什么是Spring MVC ? Spring MVC就是SpringMVC。 Spring就不介绍了,什么是MVC? M:模型,javabeanV:视图,如jspC:控制层,如Controller、Servlet SpringMVC请求处理流程 用…

图像处理(空域变换(上))

数字图像处理 参考视频 Task 1 亮度变换 1. 幂律变换 伽马变换本质上是对图像矩阵中的每个值进行幂运算。 幂函数 s c r γ ( r ∈ [ 0 , 1 ] ) \text{幂函数}scr^γ(r\in[0,1]) 幂函数scrγ(r∈[0,1]) 其中,r为灰度图像的输入值(原来的灰度值&…

<数据集>集装箱缺陷识别数据集<目标检测>

数据集格式:VOCYOLO格式 图片数量:3793张 标注数量(xml文件个数):3793 标注数量(txt文件个数):3793 标注类别数:4 标注类别名称:[DAMAGE - DEFRAME, DENT, DAMAGE - RUST, DAMAGE - HOLE] 序号类别名…

高分六号卫星助力农业监测_卫星介绍_论文分享_数据获取

卫星遥感已经成为农业发展的重要支持工具。《“数据要素X”三年行动计划(2024-2026年)》指出,在现代农业交通运输、应急管理等领域鼓励探索利用遥感数据。为什么高分六号会经常应用于农业检测呢?本文将介绍高分六号卫星的农业检测特性、在农业应用中的优势、具体农业…

Video视频抽帧和WebCodecs API视频抽帧介绍

目录 mp4Box抽帧 ffmpeg抽帧 video元素抽帧 WebCodecs 核心API 视频文件是一个容器,里面有很多不同的轨道信息。如:图像、声音、字幕等。而视频图像信息又是由一系列图片序列帧的集合。如10秒时长的视频,假设每秒30帧。那大概有300条图像…

二叉树——9.找树左下角的值

力扣题目链接 给定一个二叉树,在树的最后一行找到最左边的值。 示例: 输出:7 题干很简单,找到树的最后一行,在该行找到最左边的值,结合完整代码进行分析。 完整代码如下: class Solution:d…

Django后台数据获取展示

​ 续接Django REST Framework,使用Vite构建Vue3的前端项目 1.跨域获取后台接口并展示 安装Axios npm install axios --save 前端查看后端所有定义的接口 // 访问后端定义的可视化Api接口文档 http://ip:8000/docs/ // 定义的学生类信息 http://ip:8000/api/v1…

Springboot发邮件如何配置SMTP服务器信息?

Springboot发邮件安全性考虑?如何用Springboot发信? 在 SpringBoot中配置邮件发送功能相对简单,但需要正确设置 SMTP 服务器信息。AokSend将详细介绍如何在 SpringBoot应用程序中配置 SMTP 服务器信息,以实现邮件发送功能。 Spr…

如何构建一个高效的编程学习笔记系统(万字总结)

你是否曾经在编程学习的海洋中迷失方向?是否感觉自己学了很多,却总是记不住关键知识点?别担心,今天我们将一起探索一种革命性的笔记方法,它将彻底改变你的学习体验! 目录 引言:为什么我们需要…

鸿蒙(API 12 Beta3版)【本地媒体会话概述】 音视频播控服务

交互过程 本地媒体会话的数据源均在设备本地,交互过程如图所示。 此过程中涉及两大角色,媒体会话提供方和媒体会话控制方。 说明 媒体会话控制方为系统应用,三方应用可以成为媒体会话提供方。 本地媒体会话中,媒体会话提供方通…

[大模型实战] DAMODEL云算力平台部署LLama3.1大语言模型

[大模型实战] DAMODEL云算力平台部署LLama3.1大语言模型 目录 一、LLama3.1二、DAMODEL云算力平台2.1 提供的服务2.1.1 AI训练2.1.2 AI推理2.1.3 高性能计算2.1.4 图像/视频渲染2.1.5 定制化部署 2.2 支持的GPU 三、在DAMODEL部署LLama3.13.1 在DAMODEL创建实例&…

【案例43】打开节点-后台任务日志优化案例

问题现象 通过SPR日志发现 打开节点-后台任务日志节点sql调用严重。 通过nmc查看,后台线程耗时20s ,基本都卡在sql层面 一直在执行如下sql selectl.pk_workingtasklog frompub_workingtasklog l inner joinpub_alertregistry ron l.pkregistry r.pk_a…

Black Forest Labs 的 Flux——文本转图像模型的下一个飞跃,它比 Midjourney 更好吗?

一、前言 Black Forest Labs是开创性稳定扩散模型的团队,现已发布Flux——一套最先进的模型,有望重新定义 AI 生成图像的功能。但 Flux 是否真正代表了该领域的飞跃?它与 Midjourney 等行业领导者相比如何?让我们深入探索 Flux 的…

【Kubernetes】Service 概念与实战

Service 概念与实战 1.通过 Service 向外部暴露 Pod2.Service 的多端口设置3.集群内部的 DNS 服务4.无头 Service 在 Kubernetes 中部署的应用可能对应一个或者多个 Pod,而每个 Pod 又具有独立的 IP 地址。Service(服务)能够为一组功能相同的…

DI (providedIn: XXXModule)

angular版本为^17.3.0; 依赖注入Module 代码结构如下: 点击后为 demo2 works!demo2 providedIn Demo1Module depdemo2 works!demo2 providedIn Demo1Module 打包后大小为 改写为 demo2去掉 imports: [Demo1Module], 打包后大小为 结果比较&#…

DAMA学习笔记(十五)-数据管理组织与角色期望

1.引言 随着数据领域的快速发展,组织需要改进管理和治理数据的方式。当前,大多数组织正面临着越来越多的数据。这些数据格式多样、数量 庞大,并来源于不同的渠道。由于数据数量和种类的增加,加剧了数据 管理的复杂性。与此同时&am…

shiro注解不起作用:shiro进行权限校验时,@RequireRoles(“admin“)注解不起作用的解决方法

今天在写前后端分离项目时,用jwt加shiro进行登录权限校验时,RequireRoles("admin")注解不起作用,记录一下。 前提:数据库里面的user_type代表用户类型 :0普通用户 ;1:专家&#xff1…

Introduction to Snapdragon Profiler (Snapdragon 分析器)

Introduction to Snapdragon Profiler {Snapdragon 分析器} 1. Snapdragon Profiler2. Release Notes3. Tools and resourcesReferences Snapdragon Profiler (骁龙分析器) https://www.qualcomm.com/developer/software/snapdragon-profiler Snapdragon Profiler Documentati…