伟大的公司只需要十一人

news2024/12/24 9:07:27

在生成式AI、云计算等技术逐渐抹平大企业与中小企业之间的技术、成本差距后,各企业真正比拼的,只剩下人才、创意与执行力。

目前,随着AI技术的快速迭代,各种基于AIGC(人工智能内容生成)技术的产品不断涌向社会,而其中最普遍的,则莫过于大量的AI绘图模型,如Midjourney、Dreambooth、Novel AI和Stable Diffusion等。

虽然AI绘图领域,看似进入了百花齐放的时代,但目前业内的顶流,仍然是Midjourney和Stable Diffusion为代表两大龙头。

今年4月,Midjourney进一步宣布推出针对二次元、动漫风格的绘图模型Niji-journey V5。

这一模型与以往最大的不同,就是它能“取代”高级原画师了。

凭借着出众的造型张力和色彩使用、以及丰富的风格化表现力,Niji V5不光看傻一众吃瓜群众,甚至惊艳了业内画师,让人直呼其已经具有了大师插画的味道。

之所以能够如此质变,一大原因在于相较此前版本,Niji V5 支持了风格化(stylize)参数设置。

简而言之,在该版本下,用户只需使用风格化命令,就能引用不同艺术家设计风格产出图片。

在Niji V5的助力下,人们轻易地生成了许多“大师级”的作品。

Niji V5产出图片的品质相当优秀,几乎覆盖市面上的常见风格。在此基础上,使用者只需要微调设计,基本能够达到大部分优秀高级原画的工作需求。

如此出色的技术,不禁让人对其背后的Midjourney公司产生了强烈的兴趣。

实际上,虽然Midjourney和Stable Diffusion同为当前AI绘画的两大领军者,但其当下的境遇却有着天壤之别。

Stable Diffusion背后的明星公司——Stability AI,目前正面临严重的财政困境,由于没有明确的盈利途径,公司正面临倒闭的危机。

相较之下,Midjourney却运行得风生水起,凭借着付费订阅的商业模式,Midjourney不仅获得了每年1 亿美元的营收,并且在Discord上已经积累了1000多万用户。

同为开发绘画AI的团队,Midjourney是怎么取得今天的成就的呢?

1

延伸人类想象力

虽然Midjourney在不融资的情况下就实现了盈利,但从创建的背景来看,创始人大卫·霍尔茨(David Holz),并不像那种钻进钱眼里的人。

他为Midjourney设立了一个非常不“铜臭”的宗旨:AI 不是现实世界的复刻,而是人类想象力的延伸。

而这样充满科幻色彩的宗旨,和大卫的背景、经历有着很大的关系。

MidJourney的创始人大卫·霍尔茨

作为一个数学专业的博士生,大卫曾在大学期间研究激光雷达、大气科学和火星任务,可谓是一个涉猎甚广,且充满好奇心的“怪才”。

经过了广泛的探索后,大卫似乎找到了自己真正的兴趣所在,于是,在2010年便创立了一家研发手部跟踪技术为主的公司——Leap Motion。

然而,由于与之相关的VR/AR技术一直不成熟,Leap Motion也始终没能做出有具体应用场景的产品。

大卫之前研发的手部追踪产品

最终,2019年,大卫把 Leap Motion 公司卖给了竞争对手 Ultrahaptics。随后,他成立了一个工作室来探索新的机会,

恰巧在这时,AI在生成艺术方面取得了突破。

Transformer架构的出现,彻底改写了图像合成的历史。从此,多模态深度学习整合了NLP和计算机视觉的技术,成为图像合成的艺术方法。

于是,借着生成式AI的东风,大卫创建了Midjourney。

公司团队成员仅11人,其中1位创始人、8位研发人员、1位法务、1位财务。

在公司的构成中,完全没有产品经理、市场销售人员,除了创始人、两个支持性岗位(法务、财务),80%的人员都是研发人员。

而作为中坚力量的研发成员,一半(4位)都是尚未毕业的本科生。

虽然这四位本科生都有一些实操甚至是创业经历,但是确实经验有限,而且也非毕业顶尖名校。

剩下来的几位研发人员,都有着比较丰富的职业经历。

在聚拢人才后,大卫也进一步明确了自己对于Midjourney的理念。

大卫将公司Logos 设计成了一艘在波浪中航行的帆船,意为水既危险,又是文明的驱动力。

懂得如何与水一起生活和工作的人类,将有能力在水中游泳、做船、筑坝发电,从而更好的生活,因此,大卫认为AI是人类想象力的引擎。

然而,在当时生成式AI的竞争格局上,有这类“雄心壮志”的团队,可不只Midjourney一家。

例如Stable Diffusion的母公司 Stability.AI,在创立时也声称要将自己的使命定格为成为世界领先的开源AI公司,并发扬将AI共享于全世界的理念。

然而,口号喊得震天响,理念终归是不能当饭吃的啊。

情怀满满的大卫,之后是怎么解决一系列公司融资、盈利的问题的呢?

2

开源VS闭源

从今天来看,Midjourney的盈利模式看上去十分简单,即通过付费订阅的商业模式,按月向用户收取费用,其标准有3种套餐,分别是10/30/60美元/月。

不过,这样的模式要想行得通,得解决两大关键问题:

1.凭什么让用户产生付费的意愿?

2.大模型训练所需要的高昂成本怎么解决?

先来说说第一点,实际上,当AI图像生成技术开始方兴未艾之时,很多使用者并不觉得这种技术是需要“付费”的。

原因就在于,当时像Stable Diffusion这样的行业龙头,为了吸引大量的开发者,最大程度的把模型用起来,因此采取了开源的模式。

和Dall·E、Midjourney不同,Stable Diffusion是完全免费、不限次数、任何人都可用的。

虽然对硬件有着一定要求,但也能在几秒钟内生成高清图像。

这样的好处在于,开源社区会齐心协力地完善模型文档,共同解决技术难题。这使得代码的迭代速度非常快,优化效率远远高于闭源系统。

但缺点也很显而易见,那就是商业化不够直接,可能为别人“做了嫁衣”。

而相较之下,Midjourney却采用了不那么开放的“闭源系统”。

如果说闭源系统真的有什么好处,那就是针对性更强了。

因为模型闭源,并通过庞大的用户量积累了独有的数据集,可以根据用户需求不断地针对性训练模型,长期来看更有利于建立竞争壁垒。

在探索用户需求这点上,大卫采取了产品上线后边测试边改进的办法。

例如Midjourney模型最开始很慢,需要20分钟才能出一张高质量的图片。后来团队推出了一个做15秒生产图片,但是质量没那么高的版本,

经过多轮测试,团队了解到,速度和质量其实都只是表象,因为不同用户的选择,实际上是多维度的。

在针对用户需求进行调整后,无论是创意行业设计者,还是普通爱好者,都能通过Midjourney满足自身的绘画需求。

除了了解用户需求外,在使用流程方面,Midjourney也并不像Stable Diffusion需要本地部署,操作十分便捷,对显卡和硬件性能也几乎没有要求。

虽为闭源,但Midjourney在使用难易度上,却更像一个“亲民”的大众产品。

于是,Midjourney 获得大量用户后,养成了用户使用习惯,且在开启付费订阅后就进一步加强了用户粘性。

3

算力难题

刚才提到,Midjourney在硬件方面,对用户几乎没什么要求。而这样的原因,则是由于Midjourney所有的图片都是在云上完成并训练的。

但如此庞大的云计算量,必然需要高昂的成本,这就回到了刚才的第二个问题:

在没有融资的情况下,在云上进行大模型训练所需要的高昂,该成本怎么解决?

实际上,大卫解决这个问题的方式很简单,也很不可思议。

当大卫需要找到一个云供应商提供10,000个GPU时,他直接给云供应商的负责人发了封电子邮件,结果对方就直接给到了这些资源,完全不需要风险投资。

看到这儿,也许有人惊得下巴都掉了,这种事在现实中真的可能吗?

当然,供应商并不是抽风了,而是看中了大卫之前的成就和声誉。

大卫之前的创业已经获得了声誉,大卫打从创办Leap Motion的时候起就有一个观点,他觉得技术的最大限制不是规模、成本或速度,而是人们如何与之互动。

Leap Motion的手势互动是一个尝试,到了Midjourney这里,他开始使用更短的绘画关键词(prompt)来催动AI产出。

这样的理念,吸引了每一个了解大卫的人,也让他得到了云供应商的支持。

然而,在获得了供应商的鼎力支持后,大卫也仍然要面对算力捉襟见肘的问题。

从成本来说,Midjourney大约10%的云成本用于训练,90%是用户制作图像的推理。所以几乎所有的成本都在制作图像上。

为解决这一点,Midjourney在世界上八个不同的地区,设立了自己的服务器,比如韩国、日本或荷兰等,在每个时区的夜间,当地人都在睡觉,没有人使用GPU。Midjourney就可以充分利用这些算力,实现GPU负载平衡。

实际上,这种依靠云端服务器来降低成本、加快模型训练的做法,与目前腾讯训练大模型的策略十分相似。

在算力已经愈发成为大模型训练瓶颈的今天,如果在训练开发环节,直接调用云端的大模型和AI算力资源,完成后一键分发到用户终端上,就可以大大降低成本,减少工作量。

因此,Midjourney “云上计算”的这一步棋,着实是摸准了时代的方向。

互联网的演进之路,已经说明,无论To B还是To C行业,都在追求越来越集约精简的终端硬件、越来越低门槛的交互入口、越来越轻盈的软件应用。

所以说,大模型从云入端,是模型服务商实现商业化的必争之地。

4

总结

从Midjourney看似不可思议的创业经历,我们可以发现,在这次AIGC时代的浪潮中,能够脱颖而出的企业、团队,未必是财大气粗的头部大厂。

因为在生成式AI、云计算等技术逐渐抹平大企业与中小企业之间的技术、成本差距后,各企业真正比拼的,只剩下人才、创意与执行力。

而这也是为什么, Midjourney这类仅有寥寥十几人的小团队能脱颖而出的原因。因为这样依靠少数尖端人才组建的团队,具有大企业所没有的灵活性、创见和魄力。

而这类小团队的创意、灵感,若要真正在市场、社会中扎下根,就离不开对用户多样化、个性化需求的追踪。

这是因为,AIGC技术的“泛用性”,决定了其绝不是针对某一行业、人群,或是某一类企业的技术。

只有在这多样化的需求中,尽可能地满足不同层级用户的特定需求,一款产品才能真正地具有长远的生命。

既服务所有人,又不忽视每一个特殊的人,这或许就是Midjourney成功的最大原因。

本文源自:“AI新智能”公众号

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/563761.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

pytest自动化测试框架和unittest自动化测试框架的区别

目录 Unittest vs Pytest 用例编写规则 用例前置与后置条件 断言 测试报告 失败重跑机制 参数化 用例分类执行 实例演示 前后置区别 参数化区别 总结 python的单元测试框架经常使用的是unittest,因为它比较基础,并且可以进行二次开发&#xf…

分布式事务的21种武器 - 3

在分布式系统中,事务的处理分布在不同组件、服务中,因此分布式事务的ACID保障面临着一些特殊难点。本系列文章介绍了21种分布式事务设计模式,并分析其实现原理和优缺点,在面对具体分布式事务问题时,可以选择合适的模式…

时间序列预测 | Matlab基于最小二乘支持向量机LSSVM时间序列预测,LSSVM时间序列预测

文章目录 效果一览文章概述部分源码参考资料效果一览 文章概述 基于最小二乘支持向量机LSSVM多维时间序列预测LSSVM多变量时间序列预测,matlab代码 评价指标包括:MAPE、MAE、RMSE和R2等,代码质量极高,方便学习和替换数据。要求2018版本及以上。 部分源码 %----------------…

如何落地中台架构

大家好,我是易安!今天我分享下如何落地中台架构。 前台和后台 讲中台之前,我们先来理解下前台和后台,这样,你才能更清楚中台的定位。 前台 比较好理解,指的是 面向C端的应用,比如像微信、淘宝这…

数字音频接口I2S-PDM-TDM-PCM

主要分类:模拟、数字(I2S、PCM、PDM、TDM) 模拟音频,就是功放输出的,驱动音箱和喇叭的音频。模拟麦克风采样回来的数据也是模拟音频。通常会有单端或差分两种信号。 数字音频,不能直接驱动喇叭&#xff0…

混剪功能开发——抖音账号矩阵系统源码解析

抖音是目前国内非常流行的短视频平台之一,用户数量庞大,更是吸引了许多企业和个人在上面开设账号,通过发布内容来进行流量变现。但是,在一个账号发布内容的同时,管理员又需要同时关注多个账号,对账号的管理…

vs code 配置net 开发环境.并搭配vs相似的解决方案面板

由于在本人在Linux22.04下安装Rider 一直处于卡死系统状态.不得不使用该方式 以下为安装步骤 安装 VS code https://code.visualstudio.com/Download 安装 mono https://www.mono-project.com/download/stable/#download-lin 安装 NET SDK https://learn.microsoft.com/zh…

目录层次结构中区分不同功能的RPM包,同时只有一份共享的repodata

使用本地的yum源有几个潜在的好处: 更快的下载速度: 本地yum源通常位于本地网络上,因此可以通过局域网快速获取软件包,而不需要依赖互联网连接。这样可以提供更快的下载速度,节省时间和带宽消耗。 离线访问&#xff1…

实验12 卷积神经网络

1. 实验目的 ①掌握深度学习的基本原理; ②能够使用TensorFlow实现卷积神经网络,完成图像识别任务。 2. 实验内容 ①设计卷积神经网络模型,实现对Mnist手写数字数据集的识别,并以可视化的形式输出模型训练的过程和结果&#xf…

Qt--事件过滤器

写在前面 Qt中的事件过滤器(Event Filter)是一种机制,用于拦截并处理特定类型的事件。但和Qt–事件分发器一文中提到的事件分发器有些区别。 事件过滤器的工作原理 这里同样使用一个简单的示例图帮助理解: 这里假设有一个Widget父窗口,该…

服务间的通信(RestTemplate +Ribbon+Feign):

服务之间的依赖: 其实根据上图我们发现会员管理服务其实是依赖于我们图书的这个服务的,那么为什么要依赖于图书这个服务呢,因为会员服务想要进行借阅图书的时候,必须要对图书模块的图书的库存等做校验才可以,所以membe…

在 Kubernetes 上实现高速应用交付

原文作者:NGINX 原文链接:在 Kubernetes 上实现高速应用交付 转载来源:NGINX 官方网站 NGINX 唯一中文官方社区 ,尽在 nginx.org.cn 运行于 Kubernetes 之上的应用需要一个经过验证的生产级应用交付解决方案。NGINX Ingress Cont…

边缘计算AI硬件智能分析网关V1版的接入流程与使用步骤

我们的AI边缘计算网关硬件——智能分析网关目前有两个版本:V1版与V2版,两个版本都能实现对监控视频的智能识别和分析,支持抓拍、记录、告警等,在AI算法的种类上和视频接入上,两个版本存在些许的区别。V1的基础算法有人…

【ChatGPT】《吴恩达 x OpenAI Prompt Engineering教程中文笔记》- 知识点目录

《吴恩达 x OpenAI Prompt Engineering教程中文笔记》 🐳 在开始编写提示词之前的一些设置 不同的temperature会影响模型的理性和想象力,这里告诉我们: Low:例如GPT4,更加适合确定性的问答任务Hight:例如…

non-protected broadcast场景分析及解决

non-protected broadcast场景分析及解决 在两个app之间互相送消息使用BroadcastReceiver,有时在运行过程中在logcat工具中会发现大片的飘红消息。 要消除这些错误信息,需要在广播的 Sender 和 Receiver 做部分的修改。 错误信息分析 由于 发送端 的 M…

忆享聚焦|ChatGPT、AI、网络数字、游戏……近期热点资讯一览

“忆享聚焦”栏目第十四期来啦!本栏目汇集近期互联网最新资讯,聚焦前沿科技,关注行业发展动态,筛选高质量讯息,拓宽用户视野,让您以最低的时间成本获取最有价值的行业资讯。 目录 行业资讯 1.科技部部长王志…

上海亚商投顾:沪指跌1.28%失守年线 大金融板块集体走弱

上海亚商投顾前言:无惧大盘涨跌,解密龙虎榜资金,跟踪一线游资和机构资金动向,识别短期热点和强势个股。 市场情绪 三大指数今日继续调整,沪指超1%逼近3200点,尾盘失守年线,创业板指较为抗跌。大…

你收藏了那些实用工具类网站?

今天来给大家分享几个众多网友们推荐的,宝藏工具类网站 uIGradients https://uigradients.com/#Flickr 专业的渐变色配色工具网站,配色什么的非常全,也可以按照自己的想法来选择搭配,还能直接获得对应渐变配色的CSS代码&#xff…

水表自动抄表系统有什么功能

水表自动抄表系统是一种新型的智能化管理系统,它可以自动采集水表的数据,并且实时上传到管理平台,实现了水表的实时监测和管理。该系统具有以下几个主要功能: 1.自动抄表功能 水表自动抄表系统可以实现自动采集水表的数据&#x…

【学习笔记】Windows 下线程同步之互斥锁

目录 前言环境简介相关函数CreateMutex Wait 函数ReleaseMutexCloseHandle 其他互斥锁的名字未命名互斥锁的同步互斥锁的意外终止临界区对象 参考 前言 本文所涉及的同步主要描述在 Windows 环境下的机制,和 Linux 中的同步机制有一定的联系,但注意并不…