对话Midjourney创始人:图片仅是起步,人工智能将全面改变学习、创意和组织。

news2024/11/18 2:27:21

ChatGPT狂飙160天,世界已经不是之前的样子。

新建了人工智能中文站https://ai.weoknow.com
每天给大家更新可用的国内可用chatGPT资源

 发布在https://it.weoknow.com


图片

关注我


Midjourney 是一家神奇的公司,11 人改变世界,创造伟大的产品。

注定会成为 Pre AGI 初年的佳话。

「我从未想过要一家公司,我想要的是一个家。」

智源大会上,我们对话了 Midjourney 创始人 David Holz

图片

MidJourney 是当下最炙手可热的图片生成引擎,在 OpenAI 的 DALL·E 2 和开源模型 Stable Diffusion 等激烈竞争下,目前仍保持着多种风格生成效果的绝对领先。
 

张鹏

欢迎 David,我想这是你第一次与中国的粉丝交流,你可以借此机会向他们问好。

David Holz

哈喽大家好,Midjourney 可能还没有正式进入中国,但是如果你们已经用上了 Midjourney 的话,我希望大家都可以拥有好的体验。
 

图片

创业驱动力

解放人类的想象力

在过去的20年里,我结识了许多国内外的创业者。我发现他们有一些共同之处,他们都拥有强烈的驱动力,这种驱动力促使他们不断地从无到有地探索创造。

我想了解一下,在你创立MidJourney的时候,你的动力是什么?在那个时刻,你渴望的是什么?

David Holz

我从来没有想过要创办一家公司。我只是想要一个「家」(home)。

我期望在未来的10到20年里,能够在Midjourney这里创造出我真正关心并且想要为这个世界带来的东西。

我经常思考各种各样的问题。也许我不能解决每个问题,但是我可以做出一些尝试,从而让大家都能更有能力地解决问题。

因此,我试图思考如何解决问题,如何创新。我觉得,这可以概括为三点。首先,我们需要反思自己:我们渴望什么?问题是什么?

接着,我们需要构想:我们的前进方向在哪里?有什么可能性?

最后,我们必须协调合作,与他人合作,共同实现我们的构想。

我认为,在人工智能领域,将这三个方面结合起来有很大的机会,并创造出重要的基础设施,使我们更善于解决问题。在某种程度上,人工智能应该能够帮助我们自我反思、更好地构想未来的方向,并帮助我们更好地联系并合作。

我们可以一起完成这些事情,并将它们融合到某种单一的框架中。我认为这将改变我们创造事物和解决问题的方式。这就是我想做的 big thing。

我认为有时候(我们先做的)图片生成可能会让人感到困惑,但在许多方面,图片生成是一个已被认可的概念。Midjourney 已经成为了一个超级想象力的集合,数百万人共同探索着这个空间的可能性。

在未来几年里,会有机会进行更多的视觉和艺术探索,这可能会超过所有先前历史的探索总和。

这并不能解决我们所面临的所有问题,但我视之为一次测试,一次实验。若我们能够在视觉领域探索成功,那么我们也有可能在其他领域做到同样的事情。我认为,所有需要我们共同探索和思考的事物,都可以通过类似的方式来解决。

因此,当我思考着如何开始解决这一问题时,我们提出了许多想法,建立了很多原型。然而,突然间,人工智能领域出现了突破性的进展,特别是在视觉方面。我们意识到这是一个绝无仅有的机会,能够创造出一些前所未有的东西。这激励着我们去尝试。

我们相信,也许不久的将来,这一切都将融汇在一起,形成非常特别的成果。现在,这只是一个开端。
 

张鹏

因此,生成图片只是第一步,而你的最终目标是解放人类的想象力。这是否是激发你创立Midjourney的目标?

David Holz

我十分喜欢富有想象力的事物,同时也希望这个世界能涌现更多的创意。每天都能接触到疯狂的想法,这实在是太有趣了。

连续创业经验

如何更好地创业

张鹏

许多人第一次认识你时并不是通过Midjourney,而是通过Leap Motion(David的上一家创业公司)。

我强烈感觉到,对你来说这两个项目可能存在一些关联,无论是驱动力还是心态方面,我不确定我的理解是否正确。

但我想问的是,你在Leap Motion的经验是否对你创办Midjourney有所帮助?

David Holz

从多个角度来看,我从Leap Motion中学到了许多东西,比如如何建立大型研究团队、如何解决以前未解决的问题,以及如何深入思考人们如何与技术互动。

我们不仅仅考虑速度、成本和规模,而是考虑我们如何合作、如何共同前进。这一点非常重要,也是Leap Motion的核心理念之一。

尽管Leap Motion和Midjourney有一些相似之处,比如它们都迅速发展并吸引了人们的想象力,但我认为它们也有一些真正的不同之处。在Leap Motion中,我们花费了大量时间来建立早期的生态系统。

在硅谷,当时有一种信念,即你应该先构建一个生态系统,就像iPhone一样。但我认为我们共同学到的是,也许你首先应该建立一个真正受人们喜爱的好产品。然后,当你完成了这个产品后,你可以开始着手构建生态系统。
 

对于很多企业家来说,在早期构建生态系统可能会分散他们的注意力,我也是如此。因此,Midjourney 所做的一个很重要的不同的事情,就是专注于构建真正每个人都可以使用的东西。

以前,我常常用“我能否亲手完成”来评估自己的能力。因为我的父亲是外科医生,他总是能够做到。我们都有灵巧的双手。

但现在,我更多地在思考,卡车司机是否会喜欢使用Midjourney?有很多卡车司机在使用Midjourney,对我来说这太棒了,这意味着我们的产品更受欢迎了。


 

新理解知识

历史知识成为创造的力量

张鹏

这很有趣。我们通常说空口无凭,给我看你的代码(Idea is cheap, show me the code)。但现在,想法似乎才是唯一重要的东西。

只要你能通过一系列优秀的 Prompt 表达你的想法,AI 就可以帮助你实现。所以,学习和创造的定义是否正在改变?你怎么看?
 

图片

David Holz

我觉得一个有趣的事情是,当你给人们更多的时间去创造时,他们也会对学习本身更感兴趣。

举例来说,美国有一种名为装饰艺术的流行艺术风格。我以前从未对这种艺术感兴趣,直到有一天,我能够通过简单的指令创作出这种艺术风格的作品,我突然对它产生了浓厚的兴趣,并渴望了解更多有关其历史的信息。

我觉得这是很有趣的一点,当历史成为你可以立即用起来并让你更简单地去创造的东西时,我们反而会对历史更感兴趣。

如果用户交互界面能够变得足够优秀,让用户感觉到人工智能已成为我们思维的延伸。AI仿佛成为我们身体和思想的一部分,与历史也在某种程度上紧密相连,而我们也将与历史紧密联系在一起。这实在是非常有趣。

当我们询问用户他们最想要什么时,通常排在前几位的回答是他们渴望学习材料。他们不仅仅是想要学会如何使用工具,还希望了解艺术、历史、相机镜头、光线,渴望掌握所有可用于创造的知识和概念。

以前,知识只是过往的历史,但现在,知识成为了创造的力量。

知识在当下就能立即发挥出更大的作用,人们都渴望获得更多的知识。这可太酷了。

面对恐慌

开放地思考自己的能力

张鹏

在中国,我们的用户来自不同的背景,他们可能具有不同水平的艺术创作能力。就像我这样的用户正在努力制作更好的图片,但我听说许多画家和设计师担心他们会被人工智能取代。

为了确保每个人都能从人工智能中获得帮助,而不感到困惑或被边缘化,Midjourney可以采取哪些措施呢?
 

David Holz

在中国,对于那些尚未踏上艺术之旅的人来说,Midjourney 提供了独特的机会。

他们开始思考:我喜欢什么?我的审美观是怎样的?我认为什么是美的?

专业艺术家可能需要几十年的时间才能达到的高度,而现在每个人都可以做到。我们发现,人们深入反思,这几乎像是艺术的治疗,让人思考他们的生活、面对的挑战、可能发生的好事或坏事,这具有深远的意义。

我认为大多数使用它的人都有这些个人体验,它并不是竞争性或商业性的。我们发现,大多数人使用它只是出于自我娱乐,甚至不会分享他们生成的图片。

在专业领域,它变成了增强你创造力的放大器,现在你可以制作漫画、电影或视频游戏。

如果你是一个普通人,第一次在你的生活中思考美,那么艺术家现在可能在思考,如何创造整个世界和宇宙的故事。以前他们从未能够做到。

因此,它拓展了每个人的创造力边界

普通人拥有更多的能力,专业人士也拥有更多的能力。有时我们很难意识到这一点,因为现在的用户界面都设计得很简单。但它们有潜力变得更加复杂、更强大,并且可以具备许多我们迟些时候会看到的功能。

AIGC的魅力

就是艺术的魅力

张鹏

也许人工智能不仅仅是用来处理单张图片的工具,它可以帮助人们处理更为复杂的任务。因为在过去,当我们讨论创造力时,其中涉及许多要素:是否具备创造的渴望?要创造何种想法?还需要实际行动能力,将想法付诸实践。

然而,有时候,如果能够释放创造欲望、伟大的思想和复杂的概念,人工智能可以提供帮助。这或许正是人工智能可以为人们带来的力量,不仅局限于图像处理。对吧?

David Holz

这是一个非常个人化的过程,需要反思,起初我们并不知道。

一开始,我看着这些由人们生成的图片,却不明白他们的用意。

有人生成了一张狗在天堂的图片。

我问他为什么要做一张狗在天堂的图片?他说那是因为他的狗刚刚去世了。

我感到很难过。他说这(图片)让他感觉好些了。

人们使用它的目的几乎就像艺术疗法一样。他们思考着事情,反思着他们的生活,试图弄清楚自己是谁。我认为这是非常个人化的,非常重要的,这是一些人类历史上,大多数人都没有机会做的。只有非常少数的人有机会这样做。

我认为这非常美,能够让每个人都能够做到这一点。

张鹏

是的,Midjourney 不仅仅是我们的业务或者工作流里的一个工具,它已经成为了我们生活中的一个新元素。

11人传奇

未来五年会出现更多

张鹏

Midjourney 之所以如此美妙,是因为它将神奇的技术传递给了一千万人。而我知道你的团队只有 20 个人,几个月之前还只有 11 个人。你们没有销售团队,没有市场团队,其中还有一些是在校生。

我很好奇,这是 AI 时代的创业公司组织形式的新范例吗?

图片

我相信未来会出现这样的情况。我们确实是采取这种组织形式比较早的公司之一。

我们也有一些优势,比如我拥有丰富的团队建设经验,声誉良好,能够获取大量的算力,并且我们很早就开始着手了。

一些普通的创业公司可能没有这些条件。

但我认为在几年后,随着人们学会如何组建研究团队,算力的压力逐渐减小,以及人们对如何打造优秀的人工智能产品的理解越来越深入,我们将会看到许多类似的公司出现。

也许我们是第一批这样做的公司,但也许在5年后,这种情况将变得非常普遍。

通用vs垂直

AGI时代MJ会成为什么?

张鹏

你担心 Midjourney 今天做的事情,有一天会被发展的 AGI 能力所覆盖吗?会发生什么?

像 Midjourney 这样的垂直产品的未来是什么?

David Holz

我不知道。这是个大谜团。

其中一种方式是,我们可能会与其他实验室合作,我们制作眼睛,他们制作耳朵,我们制作不同的部分,然后将它们组合起来。这种情况可能会发生。

我们创造想象力,他们负责制作语言部分,然后我们将它们结合起来。

因此,我们将共同研究这个问题。还有一种可能性,即存在几乎擅长一切的AGI,但也有一些专业化的部分。世界上仍然有许多专业人士。

我还认为在人机界面方面可能会出现很多问题,不仅仅是关于制作美丽的图片,而是关于帮助个人探索自我以及他们的需求。这不仅仅是AGI的问题,而更多地涉及如何与人类进行交互。

最佳的用户界面不仅限于语言,AGI可能会向我们提问。实际上,用户界面将呈现许多图像,并尝试以不同方式理解人类,这将是一种全新的艺术,全新的人类理解理论,AI将努力帮助人们澄清他们的需求。

我们还没有考虑到这些方面。AGI能够做任何事情,但我认为在未来的大部分情况下,可能仍然会存在许多专业化。

社区的力量

一起探索 AI Copilot

张鹏

你认为Midjourney永远会保持垂直产品,还是会成为一些通用产品?

你已经表明了你的使命是解决人类意识想象力问题,不仅仅局限于图片。

David Holz

有一些很有趣的东西,我们正在做社区,如何让一群人一起探索一个很大的空间。

我们正在尝试创造这样的事情,在未来的一两年里,Midjourney 可能会成为世界上几乎所有视觉探索的地方,因此我认为有非常有趣的东西。

即使我们从未做过其他事情,如果我们只是世界上所有视觉探索的地方,我认为这是一项业务,但我认为我们无论做什么,视觉探索都将适用于其他领域。

试图创造这些数百万人的超级思维团队来共同解决问题非常有趣。我不认为任何一个 AGI 能够取代数百万人,但我认为可能会有 AI 参与,可能会有数百万人和数百万个 AI 一起工作,但我认为将有许多代理和许多参与方,我认为每个人的观点都有所不同,这有助于理解问题。

张鹏

许多被称为AI从业者的人,都非常担心他们的产品会被新技术所替代。你是否也有同样的担忧,担心Midjourney今天所做的事情有一天会被不断发展的AGI能力所取代?对于类似Midjourney这样的产品,未来可能会是怎样的?
 

David Holz

找到有价值的东西或值得解决的问题,保持专注,同时保持开放的心态是解决这个问题的一方面。

另一方面,创造出来的 AGI 技术或者产品,他们仍然会和我们共同生存在同一个社会里,我们可以用 AI 去不断地创造新的东西,我们可以去定义在这个社会里 AI 要如何和我们协作去创造。

这就是我们正在做的事情,让大家一起去探索和共创

用视觉方式,现在在某些方面还显得很原始,但在其他方面,它可能是测试的最佳方式,因为你可以看到一切。

你可以真正看到它。然而,如果我们尝试用诗歌来表达同样的概念,我认为它也会同样有趣,只是有些难以理解。

或者,如果我们尝试用引擎或任何其他科学方法来实现这一目标,你无法成为科学家,因为我们找不到100万个科学家,但是有100万人制作图片则相对容易找到。

因此,更多的问题是考虑AI与人类整个社会心智的互动模式。目前,大多数情况下是人类利用AI来创造,但我认为在未来,AI将会与人类共同思考和创造,那将会非常有趣。

也许在某个时候,我们甚至无法分辨一个想法到底是来自人类还是来自AI。

好胜心太强

是人性的弱点

张鹏

当然,近来对于人工智能的安全性和各个方面的竞争引起了很多关注和担忧。与此同时,继续扩大和改进当前的大型模型仍然面临挑战。你对人工智能领域未来发展持何看法?你将如何平衡不同观点,甚至是不同政府的利益?
 

图片

David Holz

首先,我觉得人性的一个弱点可能就是好胜心太强。

实际情况是,这个世界充满了各种机遇和挑战,可以说每个问题和挑战都隐藏着机遇。我们面对着众多机遇,有时甚至无需竞争就能抓住它们。因此,我不会过多考虑与谁竞争的问题。世界上有太多需要做的事情,我只会尽力创造我认为美好和令人惊叹的事物。

在中国,我发现人们总是团结协作。从某种角度看,这种方式与人工智能的原理有些相似。因为它也是一种社区化的东西,从我们这里学习,然后再将学到的能力反馈给我们。这是一种非常注重协作和社区精神的方式。

我认为竞争有时并不是一件好事,甚至有时候追求成为某个领域的最佳也有违技术本身的本质。此外,我们也可以从东方文化中学到很多东西。在我所在的地方,人们担心技术和人工智能是否足够可信。但另一方面,大家又希望世界变得更智能一些,这样就能帮助我们创造和解决更多的问题。

我在中国时发现,人们会因为你做的创造性的事情而认为你很酷,他们也希望自己能像你一样变得酷。如今,人们都意识到人工智能的强大能力,我们可以共同努力,为每个人提供基础设施和能力,以建设我们的生活环境。

10年后

一个神奇的未来

张鹏

最后一个问题,如果我们展望未来10年的数字世界,你认为今天人类世界中哪些事情不可避免地会发生变化?

David Holz

我认为十年后一个人的创造力可能比当下一群人的都更强大,所以当他们汇聚在一起时,将能做出我们现在无法去想象的事情。

这些力量将创造一个美好的世界。

大家对未来美好的幻想将在某种程度上把每个人联系在一起,使我们不再畏惧未来,而是对未来的到来感到更加兴奋。

一个神奇的未来肯定在前方等待着我们,充满着美好。因此,怀着这样的想法前行才是实现那个美好世界的最佳方式。当然,也许还有一些我尚未完全理解和想象到的事情,但我相信(对于未来十年)这就是我们应该怀有的感觉。
 

张鹏

我赞同你的想法。

未来的确有许多美好的事情等待我们去实现,但同时,我们也需要思考如何防止不好的事情发生。今天和你的交谈给了我很多启发,非常感谢你的分享!
 

图片


图片


关注我


ChatGPT狂飙160天,世界已经不是之前的样子。

新建了人工智能中文站https://ai.weoknow.com
每天给大家更新可用的国内可用chatGPT资源

 发布在https://it.weoknow.com


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1540617.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

并发编程-Synchronized介绍(结合源码和hostpot说明)

目录 一、Synchronized 概述 二、Synchronized在并发编程中解决的问题 2.1 解决原子性问题 2.1.1 问题代码 2.1.2 执行结果 2.1.3 优化代码 2.1.4 测试结果 2.1.5 优化代码分析 2.1.5.1 编译java源文件程序 2.1.5.2 查看编译文件 2.1.5.3 分析编译文件 2.2 解决可见…

windows安装ssh

一、下载ssh https://github.com/PowerShell/Win32-OpenSSH/releases/download/v8.1.0.0p1-Beta/OpenSSH-Win64.zip 二、安装ssh 解压到C:\Program Files\OpenSSH-Win64 配置环境变量 把 C:\Program Files\OpenSSH-Win64 加到path环境变量里面 C:\Program Files\OpenSSH-Win64&…

百度文心一言(ERNIE bot)API接入Android应用

百度文心一言(ERNIE bot)API接入Android应用实践 - 拾一贰叁 - 博客园 (cnblogs.com) Preface: 现在生成式AI越来越强大了,想在android上实现一个对话助手的功能,大概摸索了一下接入百度文心一言API的方法。 与AI助手交换信息的…

elementary OS7 Ubuntu 22.04中硬盘挂载报错

elementary OS7 Ubuntu 22.04中硬盘挂载报错 背景目标思路解决方法 背景 上周末安装elementaryos7的过程中将windows10的引导文件搞丢了,这两天准备修复一下,保险期间将固态硬盘上的文件备份到移动硬盘上,备份过程中出现报错的问题&#xff…

DUKPT流程简析

文章目录 一、DUKPT流程简析 一、DUKPT流程简析 接着上一篇文章DUKPT讲 依旧引用上图,我们单看POS和Acquirer Host这两个结点之间(其它结点之间的处理,基本类似): Acquirer在布放POS到商场时,已经提前给…

【C语言进阶篇】文件操作(上)

【C语言进阶篇】文件操作(上) 🥕个人主页:开敲 🔥所属专栏:C语言 🌼文章目录🌼 1. 为什么使用文件? 2. 什么是文件? 2.1 程序文件 2.2 数据文件 2.3 文件名…

dubbo 源码系列之-集群三板斧---负载均衡(二)

在上一课时我们了解了 LoadBalance 接口定义以及 AbstractLoadBalance 抽象类的内容,还详细介绍了 ConsistentHashLoadBalance 以及 RandomLoadBalance 这两个实现类的核心原理和大致实现。本课时我们将继续介绍 LoadBalance 的剩余三个实现。 LeastActiveLoadBala…

模拟实现 atoi 函数

一、函数介绍 原型 int atoi(const char *nptr); 二、使用atoi 三、使用发现 可以发现:会先过滤掉空格,还能识别正负号,当第一次遇到正负号了,后面没接着是数字就返回0, 如果45 5aa 结果是45,说明前面识…

Pytorch CUDA Reflect Padding 算子实现详解

CUDA 简介 CUDA(Compute Unified Device Architecture)是由NVIDIA开发的一种并行计算平台和应用编程接口(API),允许软件开发者和软件工程师使用NVIDIA的图形处理单元(GPU)进行通用计算。自2007…

2024年C语言最新经典面试题汇总(11-20)

C语言文章更新目录 C语言学习资源汇总,史上最全面总结,没有之一 C/C学习资源(百度云盘链接) 计算机二级资料(过级专用) C语言学习路线(从入门到实战) 编写C语言程序的7个步骤和编程…

Chapter 17 Input Filter Design

Chapter 17 Input Filter Design 在switching converter前面我们总想加一个input filter, 这样可以减少输入电流的谐波EMI(conducted electromagnetic interference). 另外, Input filter可以保护converter和负载不受输入电压瞬态变化的影响, 从而提高了系统稳定性. 如下图所…

BEVFormer v2论文阅读

摘要 本文工作 提出了一种具有透视监督(perspective supervision)的新型鸟瞰(BEV)检测器,该检测器收敛速度更快,更适合现代图像骨干。现有的最先进的BEV检测器通常与VovNet等特定深度预训练的主干相连,阻碍了蓬勃发展…

C++命名空间和内联函数

目录 命名空间 内联函数 概述 特性: 命名空间 在C/C中,变量,函数和和类这些名称都存在于全局作用域中,可能会导致很多冲突,使用命名空间的目的是对标识符的名称进行本地化,避免命名冲突或名字污染&…

鸿蒙OpenHarmony开发实战:【MiniCanvas】

介绍 基于OpenHarmony的Cavas组件封装了一版极简操作的MiniCanvas,屏蔽了原有Canvas内部复杂的调用流程,支持一个API就可以实现相应的绘制能力,该库还在继续完善中,也欢迎PR。 使用说明 添加MiniCanvas依赖 在项目entry目录执行…

由浅到深认识Java语言(21):Math类

该文章Github地址:https://github.com/AntonyCheng/java-notes 在此介绍一下作者开源的SpringBoot项目初始化模板(Github仓库地址:https://github.com/AntonyCheng/spring-boot-init-template & CSDN文章地址:https://blog.c…

UE像素流公网(Windows、Liunx)部署无需GPU服务器

@TOC 前言 之前有个前端地图服务项目要改成UE来渲染3D,有需要在云服务器上多实例运行,所以就先研究了Windows版本的像素流云渲染,后来客户的云服务器是Linux版CectOS系统,加上又有了一些后端服务在上面运行了不能重装成Windows,所以就又着手去研究了Linux系统的云渲染。…

【动手学深度学习】深入浅出深度学习之PyTorch基础

目录 一、实验目的 二、实验准备 三、实验内容 1. 数据操作 2. 数据预处理 3. 线性代数 4. 微积分 5. 自动微分 四、实验心得 一、实验目的 (1)正确理解深度学习所需的数学知识; (2)学习一些关于数据的实用…

SLAM算法与工程实践——CMake使用(4)

SLAM算法与工程实践系列文章 下面是SLAM算法与工程实践系列文章的总链接,本人发表这个系列的文章链接均收录于此 SLAM算法与工程实践系列文章链接 下面是专栏地址: SLAM算法与工程实践系列专栏 文章目录 SLAM算法与工程实践系列文章SLAM算法与工程实践…

第28章 ansible的使用

第28章 ansible的使用 本章主要介绍在 RHEL8 中如何安装 ansible 及 ansible的基本使用。 ◆ ansible 是如何工作的 ◆ 在RHEL8 中安装ansible ◆ 编写 ansible.cfg 和清单文件 ◆ ansible 的基本用法 文章目录 第28章 ansible的使用28.1 安装ansible28.2 编写ansible.cfg和清…

springboot+vue考试管理系统

基于springboot和vue的考试管理系统 001 springboot vue前后端分离项目 本文设计了一个基于Springbootvue的前后端分离的在线考试管理系统,采用M(model)V(view)C(controller)三层体系结构&…