人工智能能够通过所有[创造力测试]

news2024/11/23 11:51:32

沃顿商学院教授Ethan Mollick @emollick 分享了三篇新的实验性论文,证明了AI在实际情境中的创造力。

https://www.oneusefulthing.org/p/automating-creativity

“GPT-4 现在在替代用途测试中击败了 91% 的人类,在托伦斯创造性思维测试中击败了 99% 的人类。”

“讽刺的是,人工智能本来应该只有逻辑,没有想象力。”

“突然之间,人工智能能够通过所有[创造力测试]”

Ethan Mollick称:“我们得到的人工智能不再是全是逻辑的,而是能够编造信息、参与(看似)情感讨论,并且具有极强的创造力。

三篇论文表明人工智能产生的想法通常被认为比人类提出的想法更有创意、更有用。而且,有时候你不需要复杂的提示就能得到好的想法。

沃顿的一项重要研究将ChatGPT-4与一门流行的创新课程的学生进行了比较。研究人员使用人类评委评估创意质量,并发现ChatGPT-4产生了更多、更便宜、更好的想法。

自动化创造力 现在有强有力的证据表明,人工智能可以帮助我们变得更有创新性。

伊桑·莫利克 2023年8月13日

生成型人工智能的核心讽刺在于,人工智能本应是完全逻辑而没有想象力的。

然而我们得到的却是那些捏造信息、参与(看似)情感讨论并且极具创造力的人工智能。而这个最后的事实让许多人感到深深的不安。

需要明确的是,创造力没有一个统一的定义,但研究人员已经开发出一些有缺陷的测试来广泛地衡量人类产生多样化和有意义的想法的能力。

这些测试有缺陷并不是什么大问题,直到突然间,人工智能竟然能够通过所有这些测试。

但是现在,GPT-4在创造力的替代用途测试中击败了91%的人类,在托伦斯创造性思维测试中超过了99%的人类。

我们正在耗尽人工智能无法胜任的创造力测试。

虽然这些心理测试很有趣,但是将人类测试应用于人工智能可能会有挑战。

总是有可能人工智能之前已经接触过类似测试的结果,只是在重复答案(尽管这些研究中的研究人员已经采取措施来降低这种风险)。

当然,心理测试并不一定是人工智能在现实世界中能够提出有用想法的证据。

然而,在过去的几周里,我们从三篇新的实验性论文中了解到,人工智能确实可以在涉及现实世界意义的情况下具有创造力。

我想简要讨论一下这些论文,然后根据它们的结果提供一些关于如何利用人工智能进行创意生成的实际建议。

实际中的人工智能创意

这三篇论文中的每一篇都直接比较了在受控实验中由人工智能提供的创意与人类的创意努力。

第一篇重要的论文来自沃顿商学院的同事们。他们组织了一个创意生成比赛:将ChatGPT-4与一个历史上产生许多创业公司的热门创新课程的学生进行对比。

研究人员Karan Girotra、Lennart Meincke、Christian Terwiesch和Karl Ulrich使用人类评委评估了创意质量,并发现ChatGPT-4比学生们生成了更多、更便宜和更好的创意。

从商业角度来看,更令人印象深刻的是,外部评委对于由人工智能生成的创意的购买意图也更高!在评委评选的40个最佳创意中,有35个来自ChatGPT。

第二篇论文进行了一项广泛的众包比赛,要求人们根据循环经济的要求提出基于重用、回收或共享产品的商业创意。

研究人员(Léonard Boussioux、Jacqueline N. Lane、Miaomiao Zhang、Vladimir Jacimovic和Karim R. Lakhani)随后让评委评价了这些创意,并将其与GPT-4生成的创意进行了比较。

人工智能和人类生成的创意的整体质量水平相似,但在可行性和影响方面,人工智能被评为更好,而人类则生成了更多的新颖创意。

最后一篇论文做了点不同的事情,专注于创意写作的想法,而不是商业想法。

Anil R. Doshi和Oliver P. Hauser的研究比较了独自撰写短篇小说的人与使用人工智能提供3-5个可能主题的人之间的差异。

再次,人工智能表现出色:在AI的帮助下,人类创作的故事被判定为比单独由人类创作的故事更具新颖性和更有趣。

然而,有两个有趣的注意事项。

首先,最有创造力的人最少受到人工智能的帮助,其次,人工智能的想法通常被认为与彼此更相似,而不是由人类生成的想法。

但需要注意的是,这仅仅是将人工智能用于生成一小部分想法,而不是用于写作任务。

比较了三篇论文中人类与人工智能生成的创意的关键图表

alt

那么这意味着什么呢?阅读这些研究,似乎有一些明确的结论:

人工智能可以在现实生活中的实际情况下生成创意。它还可以帮助人们生成更好的创意。

人工智能生成的创意比大多数人能想出来的更好,但非常有创造力的人(至少目前是如此)会击败人工智能,而且可能从使用人工智能生成创意中受益较少。

当前一代人工智能生成的想法之间存在更多的相似性,而大量的人类生成的想法之间存在更多的相似性。

所有这些都表明,在创新中,人类仍然扮演着重要的角色...但是如果不将人工智能纳入这个过程,特别是那些认为自己没有高度创造力的人,他们将是愚蠢的。

那么,我们应该如何利用人工智能来帮助生成创意呢?幸运的是,这些论文以及其他关于创新的研究提供了一些建议。

为创意提供启示

人们常常陷入一个误区,认为您必须善于用特定的措辞来引导人工智能,以使其能够完成任务。

但在创意生成方面,事实并非如此。在将人工智能与众包比较的论文中,作者测试了三种类型的提示:

基本的提示陈述问题,更高级的提示赋予人工智能一个人物角色,使其更像是一个人类解决者("您是一个位于欧洲的技术与创意专业人士。"),以及一个非常高级的提示,要求人工智能以特定著名专家的视角思考。

尽管这些组之间存在一些差异,但没有一种方法明显占优势。因此,我不会过于担心提示的确切措辞,您可以进行实验,看看哪种方法可能效果最好。

实际上,简单的提示似乎效果不错。例如,关于创新比赛的论文为了提供上下文,提供了一个简单的系统提示:

您是一个有创意的企业家,希望产生新的产品创意。该产品将面向美国的大学生。它应该是一种实体商品,而不是服务或软件。

我想要一个能够以低于50美元的零售价出售的产品。这些只是创意。产品尚未存在,可能也不一定明确可行。

对所有创意进行编号并给予名称。名称和创意由冒号分隔。并且还提供了第二个用户提示:请分别生成十个创意作为十个独立的段落。

创意应以40-80字的段落形式表达。他们多次重复这个过程,因为产生大量的创意是有用的。

他们还比较了使用GPT-4提示和使用少样本学习的价值。少样本学习很容易实现 - 您只需在要求它生成创意之前,为人工智能提供您想要看到的结果类型的示例(“少样本”而不是“零样本”学习,即不提供示例)。

尽管使用少样本方法,人工智能生成了更多、更好的创意,但差异在统计上并不显著。

同时,我通常仍然建议使用少样本技术,因为它们似乎在主观上有所帮助,其他研究发现它们很有价值,并且它们很容易实现。

作为区别,我举了一个例子,我要求Claude 2生成15个适合Y Combinator(著名的加速器)的原创创业想法。

这是一种零样本方法。然后我尝试了一个少样本方法,我给了人工智能一个包含400个最近的Y Combinator创业公司的列表,每个公司都有一个句子的描述,并提示:

这里有400个来自Y Combinator的最新创业想法。从趋势出发,然后生成15个将这些概念结合在一起的原创想法。您可以看到区别,以及我为什么更喜欢少样本方法。

除了这些建议,我还有一些建议。首先,不仅仅要求人工智能生成想法,还要使用限制条件。

一般来说,与大多数人的期望相反,当人工智能受到最严格的限制时,它最擅长生成想法(人类也是如此!)。

迫使它给出不太可能的答案,您将找到更多原创组合,可能解决了原创性问题。您可能想要这样问:您是问题解决和创意生成的专家。

当被要求解决问题时,您会提出新颖创意。这是您的第一个任务:告诉我AI(或者是超级英雄、宇航员或任何其他奇特职业)可能如何做____的10种详细方法。描述每种方法的细节。

alt

您还可以使用其他技巧,利用人工智能可以产生逼真但有趣的材料的方式,并将其作为创造力的种子。

考虑要求它生成虚假访谈的文字:例如,创建一个产品设计师和牙医之间的访谈记录,讨论牙医所遇到的问题。

或者要求它描述不存在的产品:带我走进一个拥有令人兴奋的新功能的虚构新水泵的界面。这方面有一些技巧可以通过实验来学习,您应该随意在评论中分享其他有效的提示技巧。

人工智能作为创意引擎

我们仍然不知道人工智能实际上能够有多原创,我经常看到人们争论L LM(大型语言模型)不能产生任何新的想法。

对我来说,越来越清楚的是,至少在实际中而非哲学上,这是不正确的观点。

在现实世界中,大多数新想法并不是来自虚空;它们是基于现有概念的组合,这就是为什么创新学者长期以来一直强调在生成想法时重新组合的重要性。

alt

而LLMs在这方面非常擅长,它们在意想不到的概念之间充当连接机器。

它们通过生成令人类似但可能对人类来说没有联系的令牌之间的关系来进行训练。加上人工智能输出的随机性,结果就是一种强大的创造能力。

从实际角度来看,现在我们在想法方面的局限性要比以往任何时候都要小得多。

即使那些不认为自己有创意的人,现在也可以访问一个可以生成比大多数人类更具创新性的概念的机器(虽然不是最具创造力的人)。

以前,只有少数人拥有产生好创意的能力,而现在则有很多人。这是人类创造力景观的一个令人惊讶的变化,可能使执行而不是原始创造力成为未来创新的更有区别的因素。

本文由 mdnice 多平台发布

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/877212.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

每天一道leetcode:1466. 重新规划路线(图论中等广度优先遍历)

今日份题目: n 座城市,从 0 到 n-1 编号,其间共有 n-1 条路线。因此,要想在两座不同城市之间旅行只有唯一一条路线可供选择(路线网形成一颗树)。去年,交通运输部决定重新规划路线,以…

网络安全专业术语英文缩写对照表

因在阅读文献过程中经常遇到各种专业缩写,所以把各种缩写总结了一下。 因能力有限,错误在所难免,欢迎进行纠错与补充:https://github.com/piaolin/CSAbbr 渗透相关 缩写全称解释备注XSSCross Site Script Attack跨站脚本攻击为…

前端食堂技术周刊第 94 期:TS 5.2 RC、从零实现 RSC、Redux 迁移至 ESM 之旅、HTML 满汉全席

美味值:🌟🌟🌟🌟🌟 口味:葡茉美式 食堂技术周刊仓库地址:https://github.com/Geekhyt/weekly 大家好,我是童欧巴。欢迎来到前端食堂技术周刊,我们先来看下…

揭秘国产操作系统的黄金测试利器:探索开源测试工具的神秘世界

揭秘国产操作系统的黄金测试利器:探索开源测试工具的神秘世界 文章目录 1.前言2.国产操作系统现状的深度解析3.国产操作系统的质量保障神器(开源测试工具)4.开源测试工具的重要性5.国产操作系统如何利用开源测试工具进行黄金测试6.国产操作系统的开源测试工具整合方…

python安装第三方包时报错:...\lib\site-packages\pip\_vendor\urllib3\response.py...

安装redis第三方包: pip install redis报错现象: 解决方法:使用以下命令可成功安装 pip install redis -i http://pypi.douban.com/simple --trusted-host pypi.douban.com

IT运维:使用数据分析平台监控深信服防火墙

概述 深信服防火墙自身监控可以满足绝大部分需求,比如哪个应用占了最大带宽,哪个用户访问了哪些网站?这里我们为什么使用鸿鹄呢?因为我们要的是数据的处理和分析,比如某个用户在某个事件都做了哪些行为,这个…

OpenCV图像处理——轮廓检测

目录 图像的轮廓查找轮廓绘制轮廓 轮廓的特征轮廓面积轮廓周长轮廓近似凸包边界矩形最小外接圆椭圆拟合直线拟合 图像的矩特征矩的概念图像中的矩特征 图像的轮廓 查找轮廓 binary,contours,hierarchycv.findContours(img,mode,method)绘制轮廓 cv.drawContours(img,coutours…

找不到mfc140u.dll怎么办?mfc140u.dll丢失怎样修复?简单三招搞定

最近我遇到了一个问题,发现我的电脑上出现了mfc140u.dll文件丢失的错误提示。这个错误导致一些应用程序无法正常运行,让我感到非常困扰。经过一番研究和尝试,我终于成功修复了这个问题,并从中总结出了一些心得。 mfc140u.dll丢失原…

Claude2 Api接入方案

一,实现目标 接入钉钉机器人支持群聊和私聊 网上看了很多方案,因为Claude的api申请难度非常大,大部分都是说使用Slack,但是Slack只能免费使用一个月。作为一个完美主义怎么可能允许这样的事情发生。何如处理,抓网页。…

基于Redis实现全局唯一Id

微信公众号访问地址:基于Redis实现全局唯一Id 推荐文章: 1、使用原生Redis命令实现分布式锁 ​ 2、为什么引入Redisson分布式锁? 3、SpringBoot整合多数据源,并支持动态新增与切换(详细教程) 4、Sprin…

【计算机网络】Udp详解

前言 上几文章我们讲解了应用层协议Http和Https,要知道应用层协议有很多,这些都是程序员自己定制的,而真正要传输的时候,是要在操作系统的传输层进行的,今天我们就来学习一下传输层协议Udp的 标识一个通信 要进行跨…

黑马项目一阶段面试 自我介绍篇

面试官你好,我叫xxx,是来自xxxx的本科毕业生。我通过招聘网站/内推/线下招聘了解到的贵司,我具有扎实的Java后端的基础功底,基本掌握JavaSE、JavaEE流行技术的使用,并且我比较好学,心态也很乐观积极&#x…

docker nginx ssl设置

使用docker运行nginx,配置代理,和ssl设置,进行https访问 一 准备 本次在centos环境中 1.已安装docker,docker-compose 2.运行了一个后端服务容器,提供基本的接口访问【可选】 3.一个域名(已经解析到服…

Linux命令200例:date用于显示和设置系统的日期和时间

🏆作者简介,黑夜开发者,全栈领域新星创作者✌。CSDN专家博主,阿里云社区专家博主,2023年6月csdn上海赛道top4。 🏆数年电商行业从业经验,历任核心研发工程师,项目技术负责人。 &…

MongoDB 更新文档(更新数组对象中的元素)

之前我们介绍了如何更新文档,并简单的介绍了更新文档时可以使用选项进行指定当更新内容不存在时,可以进行新增文档。具体可以参考: MongoDB 更新文档(更新一条文档)https://blog.csdn.net/m1729339749/article/details/129983304 最近遇到了…

Android实现超出固定行数折叠文字“查看全文“、“收起全文“

先上效果图 分析问题 网上有很多关于这个的代码,实现都过于复杂了,github上甚至还看到一篇文章600多行代码,结果一跑起来全是bug。还是自己写吧!!! 如果我们需要换行的"查看全文"、"收起全…

用汇编指令求两个数的最大公约数 求for循环实现1~100

1.用汇编指令求两个数的最大公约数 2.用汇编指令求for循环实现1~100

【校招VIP】测试计划之黑盒测试白盒测试

考点介绍: 黑盒测试&白盒测试是大厂和三四线公司校招的必考点。黑盒是以结果说话,白盒往往需要理解实现逻辑。现在商业项目的接口测试往往以白盒为主,也就是需要测试同学自己观察和修改数据库的值进行用例的测试。 但是无论采用哪种测试方…

尚硅谷大数据项目《在线教育之离线数仓》笔记001

视频地址:尚硅谷大数据项目《在线教育之离线数仓》_哔哩哔哩_bilibili 目录 P003 P004【数仓概念讲的颇为详细】 P018 P019 P020 P021 P022 P023 P024 P003 时间切片:时间回溯,找回以前的数据。 P004【数仓概念讲的颇为详细】 核心架…

华为OD机试 - 数据最节约的备份方法 - 二分查找(Java 2023 B卷 100分)

目录 一、题目描述二、输入描述三、输出描述四、解题思路解题思路如下:解题思路分析: 五、Java算法源码六、效果展示1、输入2、输出3、说明 华为OD机试 2023B卷题库疯狂收录中,刷题点这里 一、题目描述 有若干个文件,使用刻录光盘…