今天分享的是AI系列深度研究报告:《AI产业前瞻报告:探讨GPTs背后的产业逻辑:拉开AIGC应用生态的帷幕》。
(报告出品方:光大证券)
报告共计:13页
1、GPTs 拉开 AIGC 应用生态的帷幕
1.1、 OpenAl 发布会重磅推出 GPTS,将定制化模型从ToB 推广到 ToC
美国东部时间 2023 年 11 月 6 日,penAl 举办了首届开发者大会 Open AlDevDay,发布了 GPT-4 Turbo、GPTs、Assistants API 等一系列更新。其中可定制个性化 ChatGPT 的 GPT 功能受到了广泛的关注。
GPTs 无需代码即可自由训练定制化模型,大幅降低应用产品开发门槛。ChatGPT Plus 和企业版用户可以利用 GPTs 创建个性化定制的 ChatGPT,引入外部知识和技能组合,用于工作学习和生活的不同场景。GPTs 无需代码,仅通过自然语言交互即可创建。
1)由 GPT-4 Turbo 的多态能力提供支持。GPT-4 Turbo 相比 GPT-4 进行了优化,以更便宜的价格实现了更优秀的性能和更快的响应速度,并且能够提供 DALL·E 3 支持的多模态能力。
2) 即将推出GPT store。OpenAl 计划推出 GPT Store 来收录用户开发的 GPTS,并为开发者提供 GPTs 的交流平台,个性化定制的 ChatGPT 可以公开共享或在 GPTStore 中出售。
GPTs与 ChatGPT Plugins 异曲同工,与 MaaS 服务相辅相成。
1)GPTs 与 ChatGPT Plugins 的异同点: OpenAl 于 23M7 推出的 ChatGPTPlugins 插件系统同样提供第三方资料的支持,使 GPT-4 具备更多垂类领域的专业能力。但从实际体验上来讲,ChatGPT Plugins 仅在通识模型 GPT-4 无法很好解答时才会调用插件,外部资源与使用体验较为割裂,而 GPTs 训练出的定制化模型将专业知识固化在模型内,使用体验更加自然。
2)GPTs 与 Maas 服务的关联: 微软、亚马逊、谷歌等云供应商提供围绕大模型生命周期的 MaaS 服务,包括大模型 API 接口、模型训练调优服务,以及聊天机器人和代码助手等 AI 辅助工具。MaaS 服务的主要受众群体是有意向开发AIGC 应用的 B 端客户,B 端客户的付费意愿较强、商业模式较为稳定,因此MaaS 服务具备早期商业化落地的潜力。例如,微软的 Azure OpenAI 服务于23M4 即开始正式收费,亚马逊的 AWS Bedrock 服务于 23M10 开始付费测试而 GPTs 主要面向 C 端客户,付费意愿和付费上限较低。
定制化模型从 ToB 推广到 ToC,虽然 C 客户付费上限相对较低,但对于AIGC 应用端乃至整个A 产业的良性发展意义量大。截至 2023 年 11 月 16 日距离 OpenAl 发布会结束仅 10 天,市面上已经出现大量受欢迎的定制化ChatGPT。目前官方公布的 GPTS 和 GPT Store 的商业模式仍不完善,相比MaaS 服务的 B 端客户,付费上限也较低,但 C 端用户具备较高的灵活性,能够在短时间内开发出大量基于定制化 ChatGPT 的 AIGC 应用工具。
创意的进发是AI 产业发展早期的重要动力。虽然 ToC 用户开发的 AIGC 工具可能相对不成熟,但大量开发者孵化的创意和灵感对行业的良性健康发展起到积极作用,能促进 AIGC 产品的早期宣传和推广,为更成熟的商业化应用产品莫定基础。
1.2、GPTs: 充分利用 AIGC 的特点,实现交互式和非标准化的功能
我们认为,随着 GPTs 化大量创意,AIGC 应用区别于传统产品的核心竞争力已逐渐明确。AIGC 应用产品设计的关键点在于如何将生成式 AI 与工作、学习生活等场景相结合,在过去几个月国内外企业的探索中,主流思路是将聊天机器人或 AIGC 工具与原有产品相结合,降低使用门槛、提高工作效率,但并未改变原有产品的标准化功能。随着 GPTs 将设计 AIGC 应用的能力推广到广大ToC 用户,涌现出大量的原生 AIGC 应用维形,与传统应用的区别也随之浮现。
从几种常见 GPTs 类型中,我们归纳了 AIGC 功能与传统应用的主要区别:
1)工具类GPTs:相比传统工具类用,AIGC 工具的优在于“非标准化”以 ConvertAnything 为例,这是一个专精格式转换的 ChatGPT,可以在图片音频、视频、PDF 等格式间自由转换,支持批量上传、文件压缩和文件下载功能。市面上格式转换的应用软件很多,但大部分传统软件只能提供预设好的标准化功能,而 ConvertAnything 可以提出较为复杂和定制化的命令,如“将PDF 文件转化成视频,每页 PPT 播放 5秒”。
ConvertAnything 的性能仍不完备,但其产品形态具备较大的潜力。例如,用户想将 PDF 文件转换成视频,标准化的格式转换产品一般不具备类似的功能。而 ConvertAnything 会针对用户要求进行现场编程,将 PDF 文件先转换成图片格式,再转换成视频格式,在这个过程中用户可以提出各种定制化的需求。由于 ConvertAnything 的性能还不完善,若在编程过程中出现 bug 也会触发代码错误分析,将后台代码输出供用户检查。
2)专业领域 GPTs:可针对垂类行业的某一细分领域进行定制化训练,无需进行标准化产品的开发。对于某些垂类行业的细分领域,用户的需求多种多样,往往难以形成一个标准化的应用产品,而使用 GPT 训练对应的定制化模型可以弥补这类市场的空白。
Data Analysis: OpenAl 官方发布的 16 款 GPTS之一,可以上传 Excel 或其他数据文件,不需要给出具体的要求,即可对该数据进行分析,归纳总结出结论并生成可视化的图表。在得到数据分析结果后,还可以针对某方面细节进行针对性提问。
Market Analyst: 专门针对图表分析和技术分析进行训练,可以针对股价走势图进行技术分析,提出进入与退出的时间点建议。
3)设计类 GPTs;相比传统文生图模型,设计类 GPTS 的优势在于领城专精和特定风格。设计类 GPTs 的定制化空间较小,更偏向于在调用 DALL·E 3 文生图模型的基础上进行微调,而对某一领域更加专精,例如:
Draw-a-ul: 可以根据粗略绘制的 UI,直接生成 HTML 代码并在浏览器访问。
DesignerGPT;可直接根据自然语言描述生成网站。
Cartoonify Me:可将人物照片转化成某个卡通风格,如辛普森一家。
4)生活娱乐 GPTs:挥酒创造力,将AIGC 带入生活的各个角。
PyGameMaster: 与传统聊天机器人不同,PyGameMaster 会主动询问游戏制作需要的元素,如故事背景、故事大纲、背景图片、流程选择逻辑等。即便无任何游戏开发经验,对如何开发游戏没有什么灵感,也可以在 PyGameMaster的指引下从无到有开发出一款游戏。
MessiMagic: 由推特用户@geepytee 创建的足球解说 GPTs,可在传统的 AI配音基础上,加入足球解说特有的特征。例如,在梅西进球时,AI 配音的语气会突然激情,并加入“梅西”、“进球”等呐喊。展望未来各种场景的定制化AI 配音不断完善,将有利于加快自媒体、制片人等内容创作者的创作速度,进一步促进文娱产业的繁荣。
2、 投资建议:时势造英雄,英雄创时代
2.1、类比微软的操作系统和谷歌的搜索引擎,OpenAl能否开启新的生态入口?
在软件时代起步期,微软凭借薄利多销和捆绑销售的方式迅速扩大 Windows操作系统的市场份额。 纵观微软的公司战略,对行业趋势的判断和正确的商业策略是取得成功的关键。微软的公司战略相对保守,微软往往不是技术上的先驱者,也不是产品形态最优秀的创新者,但正确的时间点做出正确的选择,使其把握住互联网产业的浪潮,成功抢占市场先机。例如,早期微软在操作系统技术上落后于苹果,但通过捆绑销售和薄利多销迅速推广,与多家硬件厂商达成合作,凭借开放性和兼容性实现对 PC 操作系统的垄断。
相比微软,谷歌则把提住搜索引擎和移动端操作系统的市场先机。受 2000 年微软反垄断诉讼和互联网泡沫破烈影响,微软陷入了一段时间的迷茫期,在互联网业务的起步相对迟缓,当谷歌利用搜索引擎创造出可观的流量生态和在线广告市场时,微软在 2008 年收购雅虎失败,在 2009 年推出的 Bing 搜索引擎也未能撼动谷歌搜索引擎的地位。谷歌并非搜索引警的先驱者,但它通过前期的技术优势与其他搜索引擎拉开差距,在互联网产业起步期培养了消费习惯。
随着规模效应的到来,生态入口往往无需保持技术和产品的绝对领先。在微软与苹果对电脑操作系统的竞争中,起决定性作用的不是谁的操作系统使用体验更好,而是哪个操作系统能兼容更多的软件,同样,在社交软件的选择过程中用户考虑的往往不是哪个社交产品更好用,而是其他人在用什么社交产品,这也成为了 Facebook、微信等国内外知名社交平台持续拓展用户的基础。
对于 AIGC产业来说,早期技术领先相对更加重要,但抢占生态入口也是关键的一环。区别于操作系统、搜索引擎、社交平台等同质化严重的生态入口,AIGC 应用产品的特殊性在于对大模型性能的要求非常高,但用户的付费意愿并非随着大模型性能增强而线性提升,而是要求大模型性能达到某个闻值,才能产生较强的付费意愿。这决定了 AIGC的态入口与大模型性能高度定,因此OpenAl 及与其深度合作的微软更有望抢占市场先机。而随着基于 OpenAl大模型开发的 AIGC 应用越来越多,AI 生态基本成熟后,即便 OpenAl 无法一直维持大模型性能的超前优势,也可以凭借对生态入口的学握和对用户消费习惯的培养来维持可观的市场份额。
以领先的大模型性能为基础,以建立 AI 生态入口为起点,有望创造与操作系统和搜索引警相媲美的商业价值。类比软件时代微软对操作系统的垄断,互联网时代谷歌对搜索引擎、Meta 对社交网络的垄断,新业态的生态入口往往能产生极高的潜在价值。GPTs 拉开了 AIGC 应用生态的帷幕,美股科技巨头争相布局AIGC的重要目的是把握 AI 时代的流量入口。
投资建议:类比软件时代微软对操作系统的垄断,互联网时代谷歌对搜索引擎.Meta 对社交网络的垄断,新业态的生态入口往往能产生极高的潜在价值。1)外公司投资建议:建议关注 AI 技术积累深厚,积极推进多模态大模型和Agent 等前沿技术研发,或与 OpenAl、Anthropic 等领先大模型提供商建立紧密合作关系的公司,建议关注微软、谷歌、Meta、亚马逊。
2)国内公司投资建议:国内互联网行业受海外公司垄断的影响较小,对于AIGC 生态入口的抢占有望独立于 OpenAl、微软等美股大厂,将面临更广阔的市场空间。建议关注有望成为 AIGC 生态流量入口、具备平台分发优势、用户流量池和深厚技术储备的大厂,推荐腾讯控股,关注百度-S、阿里巴巴-SW。
2.2、“黑箱”和“副驾驶”有望在 AIGC 应用的发展中成为两个并行不悖的趋势
我们认为,生成式A 应用的发展趋势存在“黑箱”和“副驾驶”两个方向。决策式AI 已成为主流技术的一部分,而以 GPT 为代表的生成式A 最大的优势在于对自然语言的精准理解与内容生成。因此,AIGC 的应用也呈现出两个趋势:
趋势一:加强 AI 的“黑箱”属性,使之代理更复杂的工作,减少人类的介入。在过去 AI 往往作为一个底层技术为上层的产品提供支持,让用户无法直接感受到 AI 的存在,如搜索引擎、电商、广告、视频网站的算法推荐等。而生成式 AI具备更强大的通识能力和推理能力,能更大程度地代替人类工作。例如,Agent 可以将简单的指令拆分成细小的步骤并依次执行,从而代替人类做出决策,具备较高的智能化水平。以 OpenAl 在 DevDay 发布会上推出的低代码开发工具AssistantAPI 为例,Assistant API 引入持久无限长的线程,只需给出自然语言描述并勾选启用工具,即可轻松构建AI应用程序。AssistantAPI 更新了多款新工具,包括:
1)代码解释器:可以生成图形和图表、处理文件、解决代码和数学问题等,
2)检索:使用模型之外的知识来增强功能,
3)函数调用:可以一次性调用多个函数合并输出。
投资建议:建议关注已提前布局 AWS Bedrock Agent 的亚马逊,以及其他为企业开发AIGC 应用提供算力租赁和 MaaS 服务的云提供商,位于 AIGC 应用端产业链的上游位置,企业客户付费意愿高,商业化路径清晰,包括 AzureOpenAl 商业化进展较快的微软、同样提供 MaaS 服务的谷歌和 Salesforce。
2)趋势二:让A 作为人类的“副驾驶”,帮助人类提高工作效率,辅助人类更好地进行决策。微软 CEO 纳德拉认为,生成式 A 真正的价值是从全自动的“驾驶员”转变为一个“副驾驶”,并以“Copilot”命名微软旗下的 AIGC 生产力工具,包括Al 代码助手 Github Copilot、A办公助手 Microsoft 365Copilot、操作系统 A 助手 Windows Copilot 等。海外科技公司推出的 AIGC 应用产品中,作为“副驾驶”降低使用门槛、提升使用效事是一个重要的趋势。GPTs 就是一个典型的例子,它以 ChatGPT 为基础创建了一个低代码的开发工具,使不具备编程基础的人也可以轻松地开发自定义 ChatGPT。同样,Salesforce、Adobe 等 SaaS 公司同样针对自身的业务推出了聊天机器人、低代码平台等 AIGC 应用。