胤娲科技:“斯坦福最新研究揭示:‘AI科学家‘创新能力获百位学者高分认可“

news2025/1/11 18:50:21

35ddbbac80fcfc0e0961a76e13a87329.jpeg

在科技浪潮的汹涌推动下,人工智能(AI)正以惊人的速度重塑着我们的世界,其影响力已远远超出了最初的设想。


最近,一篇关于自动化AI研究的论文在网络上引起了轩然大波,其核心观点犹如一颗重磅炸弹,震撼了整个科研界:在某些科研领域,LLM(大型语言模型)生成的研究思路竟然比专家级的人类研究者更加新颖且富有创意!


这一发现不仅颠覆了我们对AI能力的传统认知,更预示着AI在科研与创意领域即将开启的新篇章。

0b7a6edb6758ee13b4263da8ba7cc0cf.jpeg


那么,这项来自斯坦福大学的研究究竟得出了什么样的结论呢?

f35c8d1108a35837a8865cb452fdc7af.jpeg

LLM:科研创新的催化剂

斯坦福大学的研究团队通过一项精心策划的实验,向我们展示了LLM在科研创新方面的非凡潜力。


他们邀请了上百位NLP(自然语言处理)领域的专家参与实验,让其中一部分专家撰写创新研究想法,而另一部分专家则对LLM和人类生成的想法进行盲测。


实验中,研究团队采用了claude-3-5-sonnet-20240620这一先进的LLM模型,通过给定研究主题(如提升LLM事实性并降低其幻觉的提示方法),让LLM生成一系列对Semantic Scholar API的函数调用,从而生成研究思路。


该研究使用的研究主题有 7 个:偏见、编程、安全性、多语言、事实性、数学和不确定性。下表是各个主题的想法数量:

80a83a6deb437e1d9a279cd108a645af.jpeg

研究过程如下图所示:

71a42d030a13097bbd01a77d735be6f4.jpeg

这里我们不细说其详细的设置和评估过程,详见原论文。总结起来就是比较人类专家与 AI 智能体生成的科研思路的新颖程度。我们直接来看结论。


根据该团队思路评分(Idea Ranking)规则,他们对人类和 AI 提出科研思路进行了打分,见图 2 和表 7:

f19e70082fadf6ec7c4239bc9fcc1ad3.jpeg

实验结果令人震惊:无论是在新颖度、激动人心程度,还是在整体评价上,LLM生成的想法都显著优于人类专家。


这一发现不仅挑战了我们对人类创新能力的自信,更揭示了AI在科研创新中的巨大潜力。当科研工作者面临思维瓶颈或灵感枯竭时,


或许只需向LLM提出一个研究主题就能在短时间内获得一系列新颖且富有启发性的思路。这种能力无疑将极大地加速科研进程,推动科学边界的不断拓展。


创新工具的崛起:AI助力无限创意


随着AI技术的不断进步,越来越多的创新工具应运而生,它们正逐步改变着我们的创意生成方式。从Cursor构建的多智能体AI研究者,


到基于LLM和因果图谱自动生成心理学假设的研究项目,再到印度科学学院开发的主动构思界面,这些工具无不展示了AI在创意生成方面的卓越能力。


也有人分享了自己的一项相关研究,表示可以使用 LLM 和因果图谱自动生成心理学假设,并生成比 GPT-4 和博士生表现都好:

c26d69b3cca62425b087e0d39fbd63d4.jpeg

近日,印度科学学院(Indian Institute of Science,IISc)的研究者发现,AI 在设计创意方面也比人类更有想法。


具体来说,AI 可通过一种新的人工智能会话式「主动构思」(Active Ideation)界面来生成新创意。


作为一种创意构思生成工具,它可帮助新手设计师缓解一部分的初始延迟和构思瓶颈。

01e92a7234263cf36cbd94e0d32994cc.jpeg

具体来说,这是一种动态、交互、上下文响应式方法,通过大型语言模型(LLM)主动参与,为不同的设计问题生成多个潜在创意陈述。论文称之为「主动构思场景」,它有助于促进基于对话的持续互动、对上下文敏感的对话以及多产的构思生成。


在当前的很多研究设计中,从书面信息到基于关键词的在线资源检索的转变至关重要。这强调了文本在转变思维模式和通过发展高级设计语言促进系统化构思方面的重要性。下表 1 总结了最常用的传统构思技术、其过程、局限性、涉及的认知原则以及在产生创意方面的预期结果。

5e6a2a25a2b397b2d36b43c0c91f3d91.jpeg 


以主动构思界面为例,它利用生成式预训练Transformer(如GPT)和交互式情绪板,为设计师提供了一个直观、高效、动态的创意生成平台。通过自然语言交互和上下文响应式的方法,GPT能够根据用户输入生成创意陈述,而情绪板则提供了快速记录这些想法的手段。


32b1c8e458ae22bc061f2e354d9b49d4.jpeg


这种交互式的创意构思方式不仅有助于新手设计师缓解构思瓶颈,还能显著提升创意的多样性和新颖性。可以预见的是,在未来,这类创新工具将成为创意产业中不可或缺的一部分,为艺术家、设计师等创意工作者提供更加高效、便捷的创意生成方式。

b9699e47263e9b928d2815c020b19cf0.jpeg

AI创意的未来展望

长久以来,创新被视为人类独有的能力之一,是机器难以触及的禁区。然而,随着LLM等AI技术的不断发展和完善,这一观念正在逐渐发生改变。


AI在科研创新和创意生成方面的突破不仅让我们看到了其巨大的潜力所在,更预示着一个全新的创意时代的到来。

5c546ace774fbad06ad86b34c64c8663.jpeg

在未来,AI将不再仅仅是人类的辅助工具或模仿者,而是成为真正的创意伙伴和合作者。它们将能够与人类共同探索未知领域、挑战传统观念、创造前所未有的艺术作品和科学成果。


随着AI技术的不断进步和应用场景的不断拓展,我们有理由相信:在不远的将来,AI科学家、AI导演、AI设计师等新型职业将不断涌现;


他们的作品将不仅限于模仿人类,更将超越人类的想象和创造力;AI的创意之路将为我们开启一个更加丰富多彩、充满无限可能的未来世界。

165b23d7ccb4d62790c37625b0af8ae8.jpeg

结语

人工智能的广泛引用不仅是对科研与创意领域的革新,更是对人类智慧与创造力的深刻拓展。它让我们看到了未来的无限可能,也让我们更加坚信:在人工智能的助力下,人类将能够创造出更加辉煌、更加美好的未来。


237bb1dd3f21a5bc5dee024d14c3b71e.jpeg


让我们携手并进,共同迎接这个充满挑战与机遇的智能时代吧!在未来的征途中,让我们以更加开放的心态、更加创新的思维、更加紧密的合作,共同书写属于人类与AI的辉煌篇章!

6b99e383000f2e3b87e9ea9e4d7a68ca.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2131390.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Redis 篇-深入了解基于 Redis 实现消息队列(比较基于 List 实现消息队列、基于 PubSub 发布订阅模型之间的区别)

🔥博客主页: 【小扳_-CSDN博客】 ❤感谢大家点赞👍收藏⭐评论✍ 文章目录 1.0 消息队列的认识 2.0 基于 List 实现消息队列 2.1 基于 List 实现消息队列的优缺点 3.0 基于 PubSub 实现消息队列 3.1 基于 PubSub 的消息队列优缺点 4.0 基于 St…

2009-2023年上市公司华证esg评级、评分年度数据(含细分项)

2009-2023年上市公司华证esg评级、评分年度数据(含细分项) 1、时间:2009-2023年 2、来源:整理自wind 3、指标:证券代码、年份、证券简称、评级日期、综合评级、综合得分、E评级、E得分、S评级、S得分、G评级、G得分…

《论负载均衡技术在Web系统中的应用》写作框架,软考高级系统架构设计师

论文真题 负载均衡技术是提升Web系统性能的重要方法。利用负载均衡技术, 可将负载(工作任务) 进行平衡、分摊到多个操作单元上执行, 从而协同完成工作任务, 达到提升Web系统性能的目的。 请围绕“负载均衡技术在Web系统中的应用”论题&…

《计算机组成原理:探索数字世界的基石》

《计算机组成原理:探索数字世界的基石》 在当今数字化的时代,计算机已经成为人们生活和工作中不可或缺的一部分。而要深入理解计算机的运作,就必须掌握计算机组成原理。 计算机组成原理是一门研究计算机硬件系统的学科,它涵盖了…

Linux-Curl使用

在 Linux 中,curl是一个强大的命令行工具,用于从服务器或其他 URL 地址获取数据或与网络服务进行交互。 对于自己写不明白的curl,可以使用postman、apipost等接口工具生成curl请求,用于测试 # 下载单个文件 默认将输出打印到标准…

Zabbix监控k8s云原生环境

传统监控的本质就是收集、分析和使用信息来观察一段时间内监控对象的运行进度,并且进行相应的决策管理的过程,监控侧重于观察特定指标。是随着云原生时代的到来,我们对监控的功能提出了更多的要求,要实现这些功能,就要…

python画图|3D垂线标记

在前述学习过程中,我们学习了二维坐标上的垂线标记画图,链接如下: python画图|垂线标记系列_python画点相对x轴的垂线-CSDN博客 也学习了3D作图基本方法: python画图|3D图基础教程-CSDN博客 现在我们尝试将这二者结合&#x…

自定义WPF滑块样式-Slider

在Windows应用程序开发中,滑块(Slider)是一个非常常见且有用的控件。它可以让用户通过拖动滑块来选择一个范围内的值。然而,WPF或UWP应用程序中的默认滑块样式可能并不总是符合我们的设计需求。因此,我们需要自定义滑块…

华为OD机试 - 伐木工 - 动态规划(Java 2024 E卷 200分)

华为OD机试 2024E卷题库疯狂收录中,刷题点这里 专栏导读 本专栏收录于《华为OD机试(JAVA)真题(E卷D卷A卷B卷C卷)》。 刷的越多,抽中的概率越大,私信哪吒,备注华为OD,加…

可以实时引入模块

缺点:循环会有点问题,不能死循环,最好在python脚本中起一个计时器 解释器在执行时时同步的,所以会见界面卡住,使用多个线程可以解决这个问题 或者使用 C的异步 一个完整的IDLE 麻烦,得把pyshell.py 弄能才能从tk 改到qt 内嵌到 dock

三维坐标变换

(一些困惑梳理记录) “坐标转换”的区分 1、坐标系基底变换 2、目标描述向量变换 总的来说, A属于1、坐标系基底变换, B中所述方法,可用于1、坐标系基底变换,也可用于2、目标描述向量变换&#xff0c…

文生视频算法

文生视频 Sora解决问题:解决思路: CogVideoX解决问题:解决思路: Stable Video Diffusion(SVD)解决问题:解决思路: 主流AI视频技术框架: Sora Sora: A Review on Backg…

SpringBoot项目请求返回json空字段过滤

接口返回的json中有的字段可能是为空的,我们不希望他为空的还返回,如下例子: 解决方案:只需要加一个配置类就行: import com.fasterxml.jackson.annotation.JsonInclude; import com.fasterxml.jackson.databind.Dese…

【每日刷题】Day120

【每日刷题】Day120 🥕个人主页:开敲🍉 🔥所属专栏:每日刷题🍍 🌼文章目录🌼 1. 413. 等差数列划分 - 力扣(LeetCode) 2. 978. 最长湍流子数组 - 力扣&…

知识图谱增强在 360 文档知识问答及管理中的应用实践

主要内容包括以下几大部分: 360 文档云知识管理/问答应用场景 KG 在文档 RAG 问答中的应用 KG 在文档标准化、层次化、结构化应用 KG 与 LLM 在文档场景下的挑战及展望 问答环节 01 360 文档云知识管理/问答应用场景 首先来介绍一下 360 文档云知识管理问答的…

K1计划100%收购 MariaDB; TDSQL成为腾讯云核心战略产品; Oracle@AWS/Google/Azure发布

重要更新 1. 腾讯全球数字生态大会与9月5日-6日举行,发布“5T”战略,包括TDSQL、TencentOS、TCE(专有云 )、TBDS(大数据)、TI (人工智能开发平台)等 ( [2] ) ; 并正式向原子开源基金…

【无人机设计与控制】基于PID控制的四旋翼无人机系统Matlab仿真

摘要 本文基于PID控制设计了一种四旋翼无人机控制系统,并通过Matlab进行仿真验证。研究了姿态控制和位置控制的性能,仿真结果表明该系统在稳定性和响应速度方面具有良好的表现。本文的主要贡献是验证了PID控制器在多轴飞行器控制中的有效性,…

基于mongodb+flask(Python)+vue的实验室器材管理系统

实验室器材管理系统是一个现代化的、高度集成的软件解决方案,它结合了Flask作为后端框架,MongoDB作为数据库,以及Vue.js作为前端用户界面,专为优化和精简实验室设备及耗材的管理流程而设计。此系统旨在为实验室管理员、研究人员和…

3.C++入门(内联函数,c++11,auto,范围for,nullptr)

⭐本篇文章为C学习的第三篇:主要了解内联函数和部分c11新特性 ⭐本人c代码的Gitee仓库:c学习 橘子真甜/yzc的c学习 - 码云 - 开源中国 (gitee.com) 一. 内联函数 以inline修饰的函数称为内联函数,编译的时候c编译器会在内联函数的地方展开&a…

AI 平台 formulabot 介绍

AI 平台 formulabot 介绍 FormulaBot.com 是一个基于人工智能的数据分析平台,旨在简化数据处理和分析任务 主要功能 数据分析与可视化: Formula Bot 提供工具来分析、可视化和转换数据,使用户能够快速理解数据背后的信息。公式生成: 用户可以通过自然…