作者 | 闫辉 责编 | 朱珂欣
出品 | CSDN(ID:CSDNnews)
对于程序员而言,常常能在新赛道上创造出无限的奇迹。
随着今年 8 月 Stable Diffusion(SD)的正式开源,AI-Generated Content(AIGC)再次成为了超级热点。作为一种利用人工智能技术来生成内容的形式,AIGC 被认为是继 PGC、 UGC 之后的新型内容创作方式。
那么,AIGC 技术的发展对业界产生了什么样的变化?对程序员有什么别样的意义?在新的浪潮到来之际,程序员又将如何把握?
在本期《开谈:程序员创富系列》访谈中,我们邀请到了创新谷暨追梦者基金联合创始人余波,无界版图首席研究员& AI 艺术负责人刘秋杉,CSDN 博客专家、AI 领域优质作者王浩 ,在 CSDN 战略合作总监闫辉的主持下,围绕 AIGC 的技术和商业模式的变化进行了讨论。本文也将从 AIGC 的创业者和 AI 技术专家的视角出发,对程序员 AI 创富的相关话题进行讨论。
不同视角下的 AIGC
闫辉: IT 圈有句老话,人们总是高估新技术出现的第一个五年,但会低估第二个五年。AI 技术出现后,经历了很多次起落,有投资创业火热的时候,也有商业模式难以寻觅的时候。对于 AIGC 领域,大家可以站在不同的视角,谈及自己的感受。
余波: 从投资者的角度来看,近几年全世界投资圈都没什么热点,直到 8 月份 SD 横空出世冒出来。如果有人关注该领域,就会发现它已经发展了很多年,也有很多论文。虽然早期玩家坚信有巨大价值,但一直没有破圈,普通小白用户和消费者也没有加入。
8 月份,SD 除了代码开源,还把数据集和其他很多东西都开源了。随后,红杉、光速等整个科技投资基金相继参与了这项不计成本的投资。
AI 和比特币很相似,有很大的波动性。这背后有强大的生命力,有技术的原因,更多的原因是可以打造循环起来的经济体系。
从开发者角度看,AIGC 有可能是最近五年里,新技术趋势里增长曲线最猛的。和移动互联网发展趋势的感觉很像,几个程序员开发一个小应用放在应用商店里,莫名其妙就火了。这就是符合大潮流和大趋势的,能够变大的特征。我相信这帮科技 VC 应该是察觉到了“机遇”,才会有所行动。
刘秋杉: 从创业者的角度来看,AI 很类似区块链,经常有大的起落,但每次落下都是一个更高的发展,都是从很小的点产生颠覆性创新。
简单来讲,就是一个图片引发了全球跟随的热潮。就像有了区块链,就可以去做很多去信任的东西。AIGC让我们解放了图片的生产力,能改变生活中许多场景,大到智能辅助驾驶、AI 艺术训练、骨科医生 X 光的解决方案,这也是支撑我们坚定不移的把这个创业项目做下去的原因。
王浩: 从技术工程师的角度来看,我认为 AI 视觉开创了新领域,现在 AI 领域太卷了,尤其视觉领域特别卷。AIGC 火了后,除了给技术工程师带来了很多灵感,也为博士、硕士提供了更多的研究方向。
对于非 AI 算法工程师,能将 AIGC 应用到很多新领域和新产品,例如教育领域,根据不同人的兴趣,在不同的场景中去学习。另外,对芯片行业也产生了影响,使其有优化和发展的空间。
AIGC 的“前世今生”
闫辉:过去,很多程序员没有关注和了解 AIGC 领域,请各位嘉宾谈谈之前发生了什么?正在发生什么?
余波: 因为自己做投资,在很多年前我就关注了 AIGC 领域。
今年 8 月份,看见许多社区里谈论 AIGC 的人多起来,一些程序员开始对话、在发帖和讨论。没过多久,无界版图公司创始人就在朋友圈里发这些内容(就是无界版图的内测)。于是,我也马上要了一个内测资格,发现这帮小兄弟真的很猛,就像当初移动互联网创业的程序员一样,几乎每天一个版本。
不止程序员,玩艺术的设计师群体也拼命在讨论一些训练,例如通过提示语可以生成一些图片。AIGC 如果只有程序员自己玩,打动不了消费者,因为没美感的图片无法打动人心。不过 AIGC 确实能创造很多照片,设计师这种艺术工作者可以从中挑选出能打动人心的图片,吸引力是很大的。
然后,AIGC 领域就出现了一级引爆、二级引爆、三级引爆的过程。
先有论文,然后有人做出来代码,有人包装。整个链条的传播力很强。尤其是朋友圈里,有一些人既不是程序员也不是美工,也能生成许多有趣的内容。事实上,时下很多项目都要补贴、烧钱,特别无趣,很少有类似于 AIGC 这样有趣的项目。大家在思考:这个浪潮里,我有什么可以做的吗?
AIGC 带来了新希望,程序员或许就能找到一个特别小的垂直点、利益点、创富点。在全世界的开源社区中已经有这样的势头了, AIGC 降低了技术门槛,有特别多有创意的人能够在垂直的小领域里边找到机会。
刘秋杉: 之前做 NFT 领域,接触海外的数字文化、数字藏品项目很多,这些项目都会借助 AI 生产符合元宇宙和 Web3 特性的图片。当时看到很多海外项目用 AIGC,感觉市场主要是数字产品,估计百亿美金的规模。之前对抗网络生成人脸还是很简单的,很多是像素级别的。
今年 4 月份,第一次接触 Diffusion 模型,效果完全胜过之前的模型,能实现元宇宙的设想,而不仅仅是数字产品的辅助性功能。
所以,我们就成立了一个专项小组,结识了很多海外资源。到今年 8 月份,SD比 DD 更能够生成万事万物,除了时间上会大幅度缩减,效果、可控性、艺术美感也上了好几个数量级。这样的差距,让全球的兴起了新浪潮。也是从那一刻开始,我们公司投入了大量的研发、运营,做了新项目。在中国范围内是最早的一批之一,而且把事业和竞争的标的放在海外。从 9 月份到现在,一直在产品化演进的过程中。
AIGC 领域,让大家都看到了新希望。过去,中国互联网分为两大势力,一个是中国互联网巨头统治的商业场景。比如大家都活在抖音的叙事背景里,通过抖音去直播和电商。另一个就是区块链,但区块链在中国没有很好的土壤,虽然区块链不是由巨头主导,但给普创业者的机会不是很多。到了AIGC时代,我们看到了一个在中国能光明正大的创业机会,同时又可以摆脱巨头的束缚。
例如,元宇宙出现后,很多人认为它是个虚的概念,但有了 AI 后,大家可以在元宇宙中创造虚拟的生产资料,获得各种娱乐体验,相当于把过去的有限游戏变成了一个无限游戏。同时,这就给我们创业者的机会越来越多,给普通消费者的消费场景也越来越多。目前看来,很多人愿意在 AIGC 上创业以及付费,说明 AIGC 领域是有效的增量市场。
王浩: 虽然我做视觉,但我对AIGC领域接触比较晚。今年 SD 模型出来之后,我发现个人也可以应用了。于是,我跑了两个模型,一个是SD,一个是百度的文心大模型,用来可以生成一些图像。
开源与 AIGC 生态的发展
闫辉:SD 的开源是有扩散效应的,核心是搞开源的程序员,外层是艺术设计师的加持,让用户能够参与到里面。目前,大家认为 AIGC 整个生态里面到底有多少种角色呢?
余波: 我认为 AIGC 整个生态会尝试以前移动互联网里的所有角色。移动互联网行业里,有内容的生产和消费、PGC、UGC,还有社交内容的生产,每个环节都有人尝试。对于程序员而言,生态很重要,而成熟的生态对程序员的创富更有利。只要有开放平台接口,程序员都可以利用先天优势搞一下,这属于成本低并有正向激励的机会。
刘秋杉: 我认为最底层的逻辑,还是创作者经济商业模式。从 PC 时代到抖音时代,全民创作后带来很多流量,流量形成经济系统。要么把流量变现,要么通过流量聚集一个小生态,在小生态中进行其他商业模式的尝试。本质上是创作者经济网络。我们的生产平台发布后,很多抖音用户也能借此生产抖音上看到的图片,带来前所未有的成就感和体验感。他们从旁观者成为了参与者,成为创作者经济中的一员。
利用 AIGC ,生产力得到很大的提升,也使得生产关系得到改进和变革。技术会带来认知差,但有认知差就有机会。艺术家可以比普通人能够生产更好的图片,但他们也不是最顶级的 AIGC 生产者。顶级生产者或许不懂艺术设计,但他们精通关键词,其中可能有研究语法的程序员群体,研究透彻后能够比艺术家用 AI 更精准描述画面。也有可能是艺术家,把艺术经验结合技术研究也能生产很好的图片。还有可能诞生新的分工角色 - 提示词工程师。
AIGC 生态中还能诞生很多小生态,例如提示词的交易网站,AIGC 的教育网站等衔接大众和 AIGC 的服务。
王浩: 程序员群体转行的机会不多,但每次技术的诞生,都会带来转行机会。抓住机会对个人来讲就是质的飞跃,这是机会也是挑战。成功上车的行业可能会实现创业成功,或者收入或职位的提升。我认为,AIGC 对程序员是非常不错的机会,尤其是元宇宙行业能与 AIGC 很好的结合。
闫辉: 刚刚大家提及了 Stable Diffusion 的开源。未来,开源模式使更多的程序员愿意去尝试使用,让更多人给项目做贡献。那么,大家怎么看待开源带给 AIGC 的动力?
余波: SD 的大开源非常重要,因为人工智能的训练推理模型在里面,大开源可以让社区大神能够做出杰出的贡献。即便不是大神,也可以在个人垂直领域里为项目做出贡献。
众人拾柴火焰高,大开源的模式,将会对大家都有利。通过开源机制打造全民参与的浪潮,或许大家能创造出更多的好东西。所以千万不要搞小圈子。SD 口号就是“ By the people,For the people ” 。
刘秋杉: SD 不仅是技术开源,还有算法开源、训练数据库开源了,这是 SD 生态里最有价值的部分,记录了海量的图文匹配信息,都来自互联网资料,把具有美感、美学价值的图片和文本匹配出来,因此训练库的价值是非常大的。
民间有个类比,这个运动更像90年代 Windows 跟 Linux 阵营的对抗。当时, Windows 庙堂之高称霸世界,只有微软能够去研制。直到 Linux 的出现,全面开源内核、开源模块、开源动态链接库、开源 UI,形成了全世界范围内的基金会。中国的互联网和云计算都离不开这一套开源体系。
SD 模型相当于操作系统的价值。过去操作系统和IT技术改变了我们的生活,实现虚拟的生活,虚拟的生产。将来操作系统是由AI模型来去主导的,因为AI模型也能赋能 IT 流程的改进。比如新模型就可以改变办公,帮助你去实现Word 编辑功能,甚至生成视频。
现在,像 PS 这种凌驾于传统操作系统之上的工具都会集成 AI ,不仅可以去用传统的工作流,也可以用 AIGC 的逻辑去设计图像,把工作流变得更高效。支撑起这些插件运转的就是最底层的 SD 操作系统,或者叫 AIGC 操作系统。
SD 最基本的开源,引发了生成万物的全面繁荣。大家不应该忽视开源对消费者的价值,因为开源也在改造行业,不仅是图片行业和版权行业、抖音带来的视频短视频行业。图片版权会带来很多商业摩擦,限制传播性。
无版权是一种运动。这是 SD 带来的更大开源-版权开源。就是把所有生成的图片到版权都归用户所有,这意味着全世界任何人人都可以拿着图片进行商用,无偿,不需要去许可。这让 SD 在全球范围内,在普通的用户消费者人群中获得了传播。SD 释放了大规模模型的力量去创造公共物品领域。从今天开始,我们人类再去构建新时代的公共物品,这个公共物品一定会产生新的发展动力。
王浩: AI 几乎所有内容都是开源的,各行各业的人把工作成果拿出来开源,给了行业标准来衡量模型。是一代又一代的人把代码开源出来,才有了如今的 AI 。AI 的发展速度非常快,给生活带来翻天覆地的变化,这也得益于开源。
目前,获取知识都是从通过开源的代码来获取的。SD 之前很多模型也做了大规模、多模型的训练,精度很高,训练样本迁移都有很高的成绩。但这些项目的数据集并没有开源,只是开源了代码,因此没有火起来。
AI 核心其实是数据,并不是模型。给了数据集,创作更加轻而易举。SD 的开源,给算法工程师带来的收益还是比较大的。程序员群体其实是非常愿意去帮助别人,愿意去开源的,AIGC 按照开源模式发展,未来想必会更上一个台阶。
如何利用 AIGC 创富?
闫辉:最后请各位嘉宾总结一下,关于程序员利用 AIGC 的创富建议。
余波: 程序员群体是多种多样的,我的建议分一下几种情况:
如果你就想赚点儿小钱儿,可以对 AIGC 进行包装和封装,通过定制化服务给甲方做点项目也能养家糊口。
如果你年轻一点,没有养家糊口的压力,就要向王浩学习多做贡献,所有的贡献和付出都会有回报的,要有信心。
如果你再激进一点,在这个大潮中早期进入并持续参与。不管是从东边儿,还是从西边儿,你一定会找到属于你自己的利益。
刘秋杉: 国内有一帮人享受到区块链的红利,很大一部分是程序员。就是因为他们最早是对以太坊技术非常的着迷,所以他们一定会买。对程序员来说,一旦有风口来了,扎进去之后,不论到哪里,我相信未来不会去辜负他们。
10 月份之前,AIGC 更多是与消费者、与艺术家与创作者有关。那时程序员还没有拥有太多机会,主要是因为国内商业竞争非常激烈,程序员的动作是没有商业价值的,大家只会使用大公司的产品。
现在,真正有价值的工作一定来自于开放模型和垂直模型。SD 和 DD 虽然很大,但只是提供了大开源框架。相当于有了 Linux,之后还需要上面很多应用。我们发现一个很奇妙的现象,那就是大家对垂直模型的需求越来越多。
随着进入 AIGC 的人越来越多,用户需求也变得五花八门,我们公司每天都接到成百上千的需求,询问能不能做中国风的模型,能不能做婚礼上的卡通人物模型。这些问题都来自垂直模型的构建。
就像移动互联网时代,乔布斯把 iPhone 做到了极致,但上面仍然需要众多的APP 。所以接下来,给程序员的窗口打开了。程序员一定会收到很多需求,不仅来自于市场,也来自于像我们的平台。大家可以把模型提交到平台,就像App Store 上传 App 一样。几百万消费者使用了模型,就可以获得平台的分成。程序员的商业价值就出现了。我们也希望 CSDN 向所有程序员们发出呼吁,去搞开放模型和垂直模型。
王浩: 作为一个程序员,每个行业里面的程序员都会了解自己的行业和业务。
一方面,如果找到和 AIGC 的结合点,会形成很多创业机会和商业模式。
另一方面,我也呼吁大家训练模型中要遵守法律,不要训练不合法的模型。因为AI开发者很容易越界,有时为了炫耀能力,会训练一些不合法的模型,这会给整个行业带来负面影响。
闫辉: 非常感谢三位嘉宾的分享,每一个人通过自己不同的背景与角度,让我们对 AIGC 有了新的认知。关于 AIGC 的长期价值,短期如何参与,它带来的商业模式,几位嘉宾也提供一些方法论和框架,希望能给更多的程序员和读者有启发。
未来,如何在 AIGC 领域真正做到创富,还需要“理论结合实践”,在紧跟浪潮,抓住时代机遇的同时,也不忘记探索!
☞腾讯文档企业版正式发布;曝苹果 AR/VR 头显将运行 xrOS 操作系统;Chrome 108 正式版发布|极客头条
☞挑战 Google 搜索?OpenAI 发布最强 AI 对话系统 ChatGPT
☞这 11 种编程语言,还“活着”吗?