人工智能能够通过所有[创造力测试]

沃顿商学院教授Ethan Mollick @emollick 分享了三篇新的实验性论文，证明了AI在实际情境中的创造力。

https://www.oneusefulthing.org/p/automating-creativity

“GPT-4 现在在替代用途测试中击败了 91% 的人类，在托伦斯创造性思维测试中击败了 99% 的人类。”

“讽刺的是，人工智能本来应该只有逻辑，没有想象力。”

“突然之间，人工智能能够通过所有[创造力测试]”

Ethan Mollick称：“我们得到的人工智能不再是全是逻辑的，而是能够编造信息、参与（看似）情感讨论，并且具有极强的创造力。

三篇论文表明人工智能产生的想法通常被认为比人类提出的想法更有创意、更有用。而且，有时候你不需要复杂的提示就能得到好的想法。

沃顿的一项重要研究将ChatGPT-4与一门流行的创新课程的学生进行了比较。研究人员使用人类评委评估创意质量，并发现ChatGPT-4产生了更多、更便宜、更好的想法。

自动化创造力现在有强有力的证据表明，人工智能可以帮助我们变得更有创新性。

伊桑·莫利克 2023年8月13日

生成型人工智能的核心讽刺在于，人工智能本应是完全逻辑而没有想象力的。

然而我们得到的却是那些捏造信息、参与（看似）情感讨论并且极具创造力的人工智能。而这个最后的事实让许多人感到深深的不安。

需要明确的是，创造力没有一个统一的定义，但研究人员已经开发出一些有缺陷的测试来广泛地衡量人类产生多样化和有意义的想法的能力。

这些测试有缺陷并不是什么大问题，直到突然间，人工智能竟然能够通过所有这些测试。

但是现在，GPT-4在创造力的替代用途测试中击败了91%的人类，在托伦斯创造性思维测试中超过了99%的人类。

我们正在耗尽人工智能无法胜任的创造力测试。

虽然这些心理测试很有趣，但是将人类测试应用于人工智能可能会有挑战。

总是有可能人工智能之前已经接触过类似测试的结果，只是在重复答案（尽管这些研究中的研究人员已经采取措施来降低这种风险）。

当然，心理测试并不一定是人工智能在现实世界中能够提出有用想法的证据。

然而，在过去的几周里，我们从三篇新的实验性论文中了解到，人工智能确实可以在涉及现实世界意义的情况下具有创造力。

我想简要讨论一下这些论文，然后根据它们的结果提供一些关于如何利用人工智能进行创意生成的实际建议。

实际中的人工智能创意

这三篇论文中的每一篇都直接比较了在受控实验中由人工智能提供的创意与人类的创意努力。

第一篇重要的论文来自沃顿商学院的同事们。他们组织了一个创意生成比赛：将ChatGPT-4与一个历史上产生许多创业公司的热门创新课程的学生进行对比。

研究人员Karan Girotra、Lennart Meincke、Christian Terwiesch和Karl Ulrich使用人类评委评估了创意质量，并发现ChatGPT-4比学生们生成了更多、更便宜和更好的创意。

从商业角度来看，更令人印象深刻的是，外部评委对于由人工智能生成的创意的购买意图也更高！在评委评选的40个最佳创意中，有35个来自ChatGPT。

第二篇论文进行了一项广泛的众包比赛，要求人们根据循环经济的要求提出基于重用、回收或共享产品的商业创意。

研究人员（Léonard Boussioux、Jacqueline N. Lane、Miaomiao Zhang、Vladimir Jacimovic和Karim R. Lakhani）随后让评委评价了这些创意，并将其与GPT-4生成的创意进行了比较。

人工智能和人类生成的创意的整体质量水平相似，但在可行性和影响方面，人工智能被评为更好，而人类则生成了更多的新颖创意。

最后一篇论文做了点不同的事情，专注于创意写作的想法，而不是商业想法。

Anil R. Doshi和Oliver P. Hauser的研究比较了独自撰写短篇小说的人与使用人工智能提供3-5个可能主题的人之间的差异。

再次，人工智能表现出色：在AI的帮助下，人类创作的故事被判定为比单独由人类创作的故事更具新颖性和更有趣。

然而，有两个有趣的注意事项。

首先，最有创造力的人最少受到人工智能的帮助，其次，人工智能的想法通常被认为与彼此更相似，而不是由人类生成的想法。

但需要注意的是，这仅仅是将人工智能用于生成一小部分想法，而不是用于写作任务。

比较了三篇论文中人类与人工智能生成的创意的关键图表

那么这意味着什么呢？阅读这些研究，似乎有一些明确的结论：

人工智能可以在现实生活中的实际情况下生成创意。它还可以帮助人们生成更好的创意。

人工智能生成的创意比大多数人能想出来的更好，但非常有创造力的人（至少目前是如此）会击败人工智能，而且可能从使用人工智能生成创意中受益较少。

当前一代人工智能生成的想法之间存在更多的相似性，而大量的人类生成的想法之间存在更多的相似性。

所有这些都表明，在创新中，人类仍然扮演着重要的角色...但是如果不将人工智能纳入这个过程，特别是那些认为自己没有高度创造力的人，他们将是愚蠢的。

那么，我们应该如何利用人工智能来帮助生成创意呢？幸运的是，这些论文以及其他关于创新的研究提供了一些建议。

为创意提供启示

人们常常陷入一个误区，认为您必须善于用特定的措辞来引导人工智能，以使其能够完成任务。

但在创意生成方面，事实并非如此。在将人工智能与众包比较的论文中，作者测试了三种类型的提示：

基本的提示陈述问题，更高级的提示赋予人工智能一个人物角色，使其更像是一个人类解决者（"您是一个位于欧洲的技术与创意专业人士。"），以及一个非常高级的提示，要求人工智能以特定著名专家的视角思考。

尽管这些组之间存在一些差异，但没有一种方法明显占优势。因此，我不会过于担心提示的确切措辞，您可以进行实验，看看哪种方法可能效果最好。

实际上，简单的提示似乎效果不错。例如，关于创新比赛的论文为了提供上下文，提供了一个简单的系统提示：

您是一个有创意的企业家，希望产生新的产品创意。该产品将面向美国的大学生。它应该是一种实体商品，而不是服务或软件。

我想要一个能够以低于50美元的零售价出售的产品。这些只是创意。产品尚未存在，可能也不一定明确可行。

对所有创意进行编号并给予名称。名称和创意由冒号分隔。并且还提供了第二个用户提示：请分别生成十个创意作为十个独立的段落。

创意应以40-80字的段落形式表达。他们多次重复这个过程，因为产生大量的创意是有用的。

他们还比较了使用GPT-4提示和使用少样本学习的价值。少样本学习很容易实现 - 您只需在要求它生成创意之前，为人工智能提供您想要看到的结果类型的示例（“少样本”而不是“零样本”学习，即不提供示例）。

尽管使用少样本方法，人工智能生成了更多、更好的创意，但差异在统计上并不显著。

同时，我通常仍然建议使用少样本技术，因为它们似乎在主观上有所帮助，其他研究发现它们很有价值，并且它们很容易实现。

作为区别，我举了一个例子，我要求Claude 2生成15个适合Y Combinator（著名的加速器）的原创创业想法。

这是一种零样本方法。然后我尝试了一个少样本方法，我给了人工智能一个包含400个最近的Y Combinator创业公司的列表，每个公司都有一个句子的描述，并提示：

这里有400个来自Y Combinator的最新创业想法。从趋势出发，然后生成15个将这些概念结合在一起的原创想法。您可以看到区别，以及我为什么更喜欢少样本方法。

除了这些建议，我还有一些建议。首先，不仅仅要求人工智能生成想法，还要使用限制条件。

一般来说，与大多数人的期望相反，当人工智能受到最严格的限制时，它最擅长生成想法（人类也是如此！）。

迫使它给出不太可能的答案，您将找到更多原创组合，可能解决了原创性问题。您可能想要这样问：您是问题解决和创意生成的专家。

当被要求解决问题时，您会提出新颖创意。这是您的第一个任务：告诉我AI（或者是超级英雄、宇航员或任何其他奇特职业）可能如何做____的10种详细方法。描述每种方法的细节。

您还可以使用其他技巧，利用人工智能可以产生逼真但有趣的材料的方式，并将其作为创造力的种子。

考虑要求它生成虚假访谈的文字：例如，创建一个产品设计师和牙医之间的访谈记录，讨论牙医所遇到的问题。

或者要求它描述不存在的产品：带我走进一个拥有令人兴奋的新功能的虚构新水泵的界面。这方面有一些技巧可以通过实验来学习，您应该随意在评论中分享其他有效的提示技巧。

人工智能作为创意引擎

我们仍然不知道人工智能实际上能够有多原创，我经常看到人们争论L LM（大型语言模型）不能产生任何新的想法。

对我来说，越来越清楚的是，至少在实际中而非哲学上，这是不正确的观点。

在现实世界中，大多数新想法并不是来自虚空；它们是基于现有概念的组合，这就是为什么创新学者长期以来一直强调在生成想法时重新组合的重要性。

而LLMs在这方面非常擅长，它们在意想不到的概念之间充当连接机器。

它们通过生成令人类似但可能对人类来说没有联系的令牌之间的关系来进行训练。加上人工智能输出的随机性，结果就是一种强大的创造能力。

从实际角度来看，现在我们在想法方面的局限性要比以往任何时候都要小得多。

即使那些不认为自己有创意的人，现在也可以访问一个可以生成比大多数人类更具创新性的概念的机器（虽然不是最具创造力的人）。

以前，只有少数人拥有产生好创意的能力，而现在则有很多人。这是人类创造力景观的一个令人惊讶的变化，可能使执行而不是原始创造力成为未来创新的更有区别的因素。

本文由 mdnice 多平台发布

人工智能能够通过所有[创造力测试]

相关文章

每天一道leetcode：1466. 重新规划路线（图论中等广度优先遍历）

网络安全专业术语英文缩写对照表

前端食堂技术周刊第 94 期：TS 5.2 RC、从零实现 RSC、Redux 迁移至 ESM 之旅、HTML 满汉全席

揭秘国产操作系统的黄金测试利器：探索开源测试工具的神秘世界

python安装第三方包时报错：...\lib\site-packages\pip\_vendor\urllib3\response.py...

IT运维：使用数据分析平台监控深信服防火墙

OpenCV图像处理——轮廓检测

找不到mfc140u.dll怎么办？mfc140u.dll丢失怎样修复？简单三招搞定

Claude2 Api接入方案

基于Redis实现全局唯一Id

【计算机网络】Udp详解

黑马项目一阶段面试自我介绍篇

docker nginx ssl设置

Linux命令200例：date用于显示和设置系统的日期和时间

MongoDB 更新文档(更新数组对象中的元素)

Android实现超出固定行数折叠文字“查看全文“、“收起全文“

用汇编指令求两个数的最大公约数求for循环实现1~100

【校招VIP】测试计划之黑盒测试白盒测试

尚硅谷大数据项目《在线教育之离线数仓》笔记001

华为OD机试 - 数据最节约的备份方法 - 二分查找（Java 2023 B卷 100分）