2023年 ChatGPT 研究报告

news2024/11/15 15:25:12

第一章 行业概况

ChatGPT是由OpenAI 团队研发创造,OpenAI是由创业家埃隆·马斯克、美国创业孵化器Y Combinator总裁阿尔特曼、全球在线支付平台PayPal联合创始人彼得·蒂尔等人于2015年在旧金山创立的一家非盈利的AI研究公司,拥有多位硅谷重量级人物的资金支持,启动资金高达10亿美金;OpenAI的创立目标是与其它机构合作进行AI的相关研究,并开放研究成果以促进AI技术的发展。

图 OpenAI发展历程

资料来源:资产信息网 千际投行 OpenAI官网 国泰君安证券研究

GPT模型是一种自然语言处理(NLP)模型,使用多层变换器(Transformer)来预测下一个单词的概率分布,通过训练在大型文本语料库上学习到的语言模式来生成自然语言文本。从 GPT-1 到 GPT-3 智能化程度不断提升,ChatGPT 的到来也是 GPT-4 正式推出之前的序章。

根据UBS发布的研究报告显示,ChatGPT在1月份的月活跃用户数已达1亿,成为史上用户数增长最快的消费者应用。根据Similar Web的数据,1月份平均每天有超过1300万名独立访问者使用ChatGPT,是去年12月份的两倍多。

由于ChatGPT包含了更多主题的数据,能够处理更多小众主题。ChatGPT能力范围可以覆盖回答问题、撰写文章、文本摘要、语言翻译和生成计算机代码等任务。ChatGPT嵌入了人类反馈强化学习以及人工监督微调,因而具备了理解上下文、连贯性等诸多先进特征,解锁了海量应用场景。

截止2023年2月15日,iFinD ChatGPT 成分股个数为12。

图 ChatGPT成分股

资料来源:资产信息网 千际投行 iFinD

第二章 商业模式和技术发展

2.1 商业模式

2022年以来,AIGC(AI 生成内容)、ChatGPT的“出圈”显示出预训练大模型性能进步迅猛,行业进入大模型主导的创新周期。

图 AI大模型产业链 

资料来源:资产信息网 千际投行 华泰研究

从全流程视角来看,以ChatGPT为代表的的AI大模型产业企业,首先自行生产或购入算力基础设施等设备,其次通过自主基础模型研发、模型优化与改进两步骤完成模型调教和软件优化,最终对成品软件进行出售,通过产品运营和商业落地,提升专业用户生产力。

1)算力基础设施:AI云服务由现有云服务厂商提供,为AIGC提供算力服务。大算力芯片的主要玩家为英伟达等海外半导体巨头,国内厂商正在追赶。

2)基础模型研发:高成本和高技术壁垒导致科技巨头与科研机构成为主要玩家。科技巨头的基础模型研发成果可内化为公司一系列业务提供支持。

3)模型优化与改进:对模型进行行业化改造,提供API或改造后的模型。实际上这一功能由产业链上一环节的基础模型研发或者下一环节的应用软件层承担,尚未看到仅从事这一环节的公司。

4)应用软件:强调产品运营和商业落地能力,类似SaaS公司。这一环节在国内外已经涌现出较多初创公司,其价值在于提升专业用户生产力,商业模式将主要来自于订阅制收费,因此衡量指标与SaaS公司一致,为ARR(年度经常性收入)。以中美付费意愿差异导致的SaaS发展差异为鉴,国内的AIGC应用软件层商业模式能否得到验证尚需观察。

利润影响因素:

  • 软件成品的价格。价格越高,盈利能力越强

  • 基础设施的价格。比如算力支持系统等,直接关系到盈利水平,这部分属于可变成本。

  • 厂房设备折旧、人工费、运营费、运输费等。这些成本费用相对来说比较刚性。

  • 研发成本、模型研发及训练成本。模型在产出前的调教、训练和反复测试,与企业的研发能力直接相关。

  • 后续运营维护费用。这部分成本在成品销售后影响企业的经营成本。

图:大模型训练成本估算

资料来源:资产信息网 千际投行 iFinD 华泰研究

2.2 技术发展

1、自然语言技术处理效能提升:ChatGPT 属于自然语言处理领域,与早期的自然语言技术相比,ChatGPT 采用大模型进行训练,并加入人工反馈增强学习(RLHF)方法,实现了效果的明显提升。

2017 年后,应用范围最广的是BERT 和GPT 模型以及在这些模型基础上做出的改进模型。随着人工反馈增强学习(RLHF)方法的加入,模型能够在与人类标注者互动时通过人类的反馈进行强化学习。人类标注者则可对初始模型生成的结果进行修改、比较和排序,帮助模型进行训练。ChatGPT 在效果上取得重大突破,在语言生成领域形成优势。

2、AI应用场景创新:ChatGPT 属于生成式AI,相比于分析型AI,不局限于已有的内容,已在文艺创作,代码处理,营销等多个创造性场景内得到应用。

生成式AI 应用于创造性工作。AI 可分为生成式AI 和分析型AI,其中分析型AI(Analytical AI),主要在给定数据的情况下,通过分析找出规律和关系,并在此基础上生成报告或给出建议。比如通过追踪客户行为以刻画用户画像,并基于此进行个性化推荐,实现精准营销;通过收集城市中传感器的大量数据并分析,预测天气及环境污染情况,从而帮助相关部门进行政策制定。

不同于分析型AI 局限于分析已有内容,生成式AI(Generative AI)可以通过学习已有数据和信息生成多种形式的新的内容,在创造性工作的领域进行应用,目前生成式AI 的应用主要包括生成文本、图像、对话、音视频、代码、3D 等。

3、商业化潜力创新:ChatGPT 用户突增彰显商业化潜力,内容生成或成ChatGPT 重要应用。据报道,ChatGPT 从 0 到 100 万用户数仅花费 5 天,速度远超其他平台。从活跃用户角度,据Similarweb,2023 年1 月期间,ChatGPT 平均每天约有1300 万独立访客,超出22 年12月一倍。用户数量的快速扩大反映了ChatGPT 具备较强的商业化潜力。

图 NLP自然语言处理技术发展历程

资料来源:资产信息网 千际投行 华泰研究

2.3 政策监管

行业主管部门及管理体制

国家发展和改革委员会及国家工业和信息化部对该行业进行宏观调控。自律组织为中国软件行业协会、中国人工智能产业发展联盟、中国人工智能学会。

相关政策

ChatGPT作为人工智能与机器学习领域的重要应用,对于实现服务业高质量发展,提升业务服务智能化水平具有重要意义。十九大以来,为了促进相关行业高质量发展,推动布局先进制造业服务业、推动产业结构优化、推动产业发展智能化水平提升,从国家到地方均出台了一系列扶持政策,为好耶高质量发展提供了良好保障。

表 国家主要政策及指导性方案

资料来源:资产信息网 千际投行

第三章 行业估值、定价机制和全球龙头企业

3.1 行业综合财务分析和估值方法

图 指数PE/PB

资料来源:资产信息网 千际投行 iFinD

图 指数市场表现

资料来源:资产信息网 千际投行 iFinD

行业估值方法可以选择市盈率估值法、PEG估值法、市净率估值法、市现率、P/S市销率估值法、EV企业价值法、EV/Sales市售率估值法、RNAV重估净资产估值法、EV/EBITDA估值法、DDM估值法、DCF现金流折现估值法、红利折现模型、股权自由现金流折现模型、无杠杆自由现金流折现模型、净资产价值法、经济增加值折现模型、调整现值法、NAV净资产价值估值法、账面价值法、清算价值法、成本重置法、实物期权、LTV/CAC(客户终身价值/客户获得成本)、P/GMV、P/C(customer)、梅特卡夫估值模型、PEV等。

图 主要上市公司估值对比

资料来源:资产信息网 千际投行 iFinD

3.2 行业发展的驱动因子

技术创新

Transformer 架构+RLHF,NLP 领域迎来新突破。当前Transformer架构成为主流,AI及NLP已经进入基于Transformer 架构的GPT 及BERT影响力将进一步扩大。BERT 模型在结构上是一个多层的双向 Transformer 的Encoder 模型,GPT 是由12 个Transformer 中的Decoder 模块经修改后组成。

相比来说,BERT 模型的核心优势在于自然语言理解,GPT 模型的核心优势在于自然语言生成。BERT的改进模型有RoBERTa、ALBERT 等,GPT 的改进模型有GPT2、GPT3、ChatGPT 等。随着人工反馈增强学习(RLHF)方法的加入,模型能够在与人类标注者互动时通过人类的反馈进行强化学习,推动在语言形成领域形成新优势。

需求拉动

当前以ChatGPT技术为代表的新型AI技术属于生成式AI,生成式AI(Generative AI)可以通过学习已有数据和信息生成多种形式的新的内容,在创造性工作的领域进行应用,目前生成式AI 的应用主要包括生成文本、图像、对话、音视频、代码、3D 等。生成型AI的发展将带动下游需求的快速增长,从而拉动行业发展。

商业化发展迅速

ChatGPT用户突增彰显商业化潜力,ChatGPT从0到100万用户数仅花费5天,速度远超其他平台。国内外巨头持续发力布局AIGC。AIGC(AIGeneratedContent)指由人工智能生成的内容,包括文本、图像、音频、3D等多种类型,具有高效及自动化生产的特点。近年来谷歌、亚马逊、百度等国内外巨头持续布局AIGC,相关应用的落地迅速推动相关技术商业化运用,拉动行业发展。

事件驱动

图 ChatGPT综合新闻指数

资料来源:资产信息网 千际投行 iFinD

3.3 行业风险分析

表 常见行业风险因子

资料来源:资产信息网 千际投行

(1)宏观经济波动:后疫情时代国内经济恢复状况未知,产业变革及新技术的落地节奏或将受到影响,宏观经济波动还可能对IT 投资产生负面影响,从而导致整体行业增长不及预期。

(2)下游需求增长不及预期:下游在具体技术的应用及数字化需求不及预期,对中上游的拉动作用有限,行业增长不及预期。

(3)应用中存在的伦理等风险:AI技术的应用可能存在对个人隐私的侵犯、对伦理方面的侵犯,如何界定相关技术的应用范围、如何制定相关的隐私保护政策和约束性法律法规尚处于未知。

3.4 竞争分析

图 SWOT分析

资料来源:资产信息网 千际投行 iFinD

3.5 中国主要参与企业

中国企业主要参与者有阿里巴巴[BABA.N]、百度[BIDU.O]、知乎[ZH.N]、极光[JG.O]等。

1、阿里巴巴[BABA.N]:阿里巴巴集团控股有限公司,也称为阿里巴巴,是一家专门从事电子商务、零售、互联网和技术的中国跨国科技公司。该公司于28年1999月1日在浙江杭州成立,通过门户网站提供消费者对消费者(C2C)、企业对消费者(B2C)和企业对企业(B7B)销售服务,以及电子支付服务、购物搜索引擎和云计算服务业务。它在全球众多业务领域拥有并经营着多元化的公司组合。

2、百度[BIDU.O]:百度公司是一家专门从事互联网相关服务、产品和人工智能(AI)的中国跨国科技公司,总部位于北京市海淀区。它是世界上最大的人工智能和互联网公司之一。百度拥有全球第二大搜索引擎,在中国搜索引擎市场占有76.05%的市场份额。2007年100月,百度成为第一家被纳入纳斯达克10指数的中国公司。百度成为第一家加入美国计算机伦理联盟“人工智能伙伴关系”的中国公司。

3、极光[JG.O]:极光成立于2011年,是中国领先的客户互动和营销科技服务商。成立之初,极光专注于为企业提供稳定高效的消息推送服务,凭借先发优势,已经成长为市场份额遥遥领先的移动消息推送服务商。随着企业对客户触达和营销增长需求的不断加强,极光前瞻性地推出了消息云和营销云等解决方案,帮助企业实现多渠道的客户触达和互动需求,以及人工智能和大数据驱动的营销科技应用,助力企业数字化转型。

3.6 全球重要竞争者

全球主要非中国企业有微软[MSFT.O]、谷歌[GOOG.O]、亚马逊[AMZN.O]、英伟达[NVDA.O]、META[META.O]、LivePerson[LPSN.O]、BuzzFeed[BZFD.O]等。

1、微软[MSFT.O]:微软公司是一家美国跨国技术公司,生产计算机软件、消费电子产品、个人计算机和相关服务。总部位于华盛顿州雷德蒙德的微软园区,微软最著名的软件产品是Windows系列操作系统,Microsoft Office套件以及Internet Explorer和Edge网络浏览器。其旗舰硬件产品是Xbox视频游戏机和Microsoft Surface触摸屏个人电脑系列。

2、谷歌[GOOG.O]:谷歌有限责任公司是一家美国跨国技术公司,专注于在线广告、搜索引擎技术、云计算、计算机软件、量子计算、 电子商务、人工智能[9]和消费电子产品。它被称为“世界上最强大的公司”,由于其在人工智能领域的市场主导地位、数据收集和技术优势,它被称为世界上最有价值的品牌之一。

3、LivePerson[LPSN.O]:LivePerson是一家开发对话式商务和人工智能软件的全球技术公司。LivePerson总部位于纽约市,最出名的是Conversational Cloud的开发商,这是一个允许消费者与品牌进行消息的软件平台。

第四章 未来展望

十四五时期国家政策推动,推动相关行业快速发展。以“十四五”规划及《关于扩大战略性新兴产业投资培育壮大新增长点增长极的指导意见》为代表的一系列政策文件,大力推动人工智能、机器学习等相关行业快速发展,积极推动新兴产业发展、积极布局未来产业,成为国家推动经济转型与高质量发展的关键内容。

技术落地,商用化速度加快。ChatGPT 从 0 到 100 万用户数仅花费 5 天,速度远超其他平台。从活跃用户角度,据Similarweb,2023 年1 月期间,ChatGPT 平均每天约有1300 万独立访客,超出22年12月一倍。国际上大厂商积极落地技术,2022年11月,亚马逊宣布与AI制图平台StabilityAI合作,成为其首选云合作伙伴,同时为其提供亚马逊Tradium芯片;2021年4月,华为诺亚方舟实验室联合多部门推出首个2000亿参数中文预训练模型盘古α;2023年2月,百度官宣类ChatGPT大模型新项目文心一言(英文名ERNIE Bot)。相关技术商用化速度加快,推动下游行业深刻变革。

多领域开花,深度推动行业变革。以ChatGPT为代表的一系列技术,在办公领域、教育领域、机器人领域等重点领域集中发力,同时协同推进在医疗、电商、安防、工业制造、金融等多领域应用,显著推动行业发展智能化、高效化水平提升,推动行业变革。

Cover Photo by Om siva Prakash on Unsplash

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/358460.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

最简单得方法解决TCP分包粘包问题

如何用最简单的方法解决TCP传输中的分包粘包问题? 首先需要说明一点,分包粘包等等一系列的问题并不是协议本身存在的问题,而是程序员在写代码的时候,没有搞清楚数据的边界导致的。 看个简单的例子,TCP客户端不断的向服…

SAP 解析固定资产的减值功能

SAP固定资产的减值功能 若固定资产出现减值迹象,也就是固定资产的可收回金额小于账面价值时,就要计提固定资产减值准备。 分录: 借:资产减值损失(损益科目) 贷:固定资产减值准备(资…

骨传导耳机是不是智商税?骨传导耳机真的不伤耳吗?

很多人对骨传导耳机是具有一定的了解,但是对骨传导耳机还是有一定的刻板印象,那么骨传导耳机到底是不是智商税呢?主要还是要从骨传导耳机传声原理上讨论。 骨传导耳机是属于固体传声的一种方式,通过骨骼传递声音,在使用…

一种基于强化学习的自动变道机动方法

文章目录摘要前言相关的工作方法论动作空间奖励函数设计Q学习仿真结果结论摘要 变道是一项至关重要的车辆操作,需要与周围车辆协调。建立在基于规则的模型上的自动换道功能可能在预定义的操作条件下表现良好,但在遇到意外情况时可能容易失败。在我们的研…

谈一谈正向代理和反向代理?

谈一谈正向代理和反向代理?什么是代理服务器(Proxy Serve)?为什么使用代理服务器?什么是正向代理什么是反向代理正向代理和反向代理的区别正向代理的应用反向代理的应用什么是代理服务器(Proxy Serve&#…

android kotlin 协程(四) 协程间的通信

android kotlin 协程(四) 协程间的通信 学完本篇你将会了解到: channelproduceactorselect 先来通过上一篇的简单案例回顾一下挂起于恢复: fun main() {val waitTime measureTimeMillis {runBlocking<Unit> {println("main start") // 1 // …

学会这些Jmeter插件,才能设计出复杂性能测试场景

为什么要使用jmeter线程组插件呢&#xff1f; jmeter自带的线程组插件模拟的压测场景非常有限&#xff0c;当需要模拟复杂压测场景的时候&#xff0c;推荐大家使用jmeter线程组插件。 如何下载jmeter线程组插件呢&#xff1f; 早期版本的jmeter可以针对我们需要的扩展功能&a…

软考案例分析题精选

试题一&#xff1a;阅读下列说明&#xff0c;回答问题1至问题4&#xff0c;将解答填入答题纸的对应栏内。某公司中标了一个软件开发项目&#xff0c;项目经理根据以往的经验估算了开发过程中各项任务需要的工期及预算成本&#xff0c;如下表所示&#xff1a;任务紧前任务工期PV…

大规模 IoT 边缘容器集群管理的几种架构-1-Rancher+K3s

前文回顾 大规模 IoT 边缘容器集群管理的几种架构-0-边缘容器及架构简介 &#x1f4da;️Reference: IoT 边缘计算系列文章 Rancher K3s 简介 Rancher&#xff1a; Kubernetes 统一管理平台&#xff0c; Rancher 是为采用容器的团队提供的一个完整的软件栈。它解决了管理多个…

PCI设备驱动初探(仅仅是内核部分,不是具体设备驱动)

在操作系统中&#xff0c;声卡、网卡之类的设备驱动并不像硬盘、鼠标、键盘等等驱动直接编写就行了。它们是建立在内核PCI驱动基础上的&#xff0c;也就是说这类设备通过PCI总线与系统通信。所以要编写这类的驱动首先要构造一个PCI设备的内核驱动&#xff0c;这样我们才能继续正…

Hive学习——DDLDML语句

目录 一、Hive数据类型 (一)Hive基本数据类型 (二)Hive的基本数据类型转换 (三)Hive集合数据类型 (四)文本文件数据编码 (五)读时模式 (六)Hive数据结构 二、DDL&DML命令 (一)数据库操作 1.创建数据库 2.查看数据库 3.修改数据库 4.删除数据库 5.切换(使用)指…

【LeetCode】No.225. 用队列实现栈 -- Java Version

题目链接&#xff1a;https://leetcode.cn/problems/implement-stack-using-queues/ 1. 题目介绍&#xff08;225. 用队列实现栈&#xff09; 请你仅使用两个队列实现一个后入先出&#xff08;LIFO&#xff09;的栈&#xff0c;并支持普通栈的全部四种操作&#xff08;push、t…

回文子串的数量[寻找回文子串的完整思路过程]

寻找回文子串的完整思路过程前言一、回文串的数量二、动态规划1、完整思考过程2、go总结参考文献前言 回文字符串&#xff0c;就是从左遍历和从右遍历的字符是相同顺序的&#xff0c;转换一下&#xff0c;就是该字符串是对称的。寻找回文子串面临两个直接的问题&#xff0c;1-…

pytorch深度学习案例(二)——航拍街道语义分割

数据集 使用的数据集是kaggle的Semantic segmentation of aerial imagery 其数据的组织形式为 项目结构 utils dataConvert.py dataConvert中主要包含数据的变换过程 函数作用loadColorMap用于加载标签的颜色映射voc_colormap2label获取颜色标签到数值标签的映射关系voc_…

黑马Spring学习笔记(二)——注解开发

目录 一、纯注解开发 1.1 实现步骤 1.2 小结 二、注解开发依赖注入 2.1 自动装配 2.1.1 Autowired——按照类型注入 2.1.2 Qualifier——按照名称注入 2.1.3 Value——简单类型注入 2.2 注解读取properties配置文件——PropertySource 三、注解开发管理第三方B…

【基础算法】差分

&#x1f339;作者:云小逸 &#x1f4dd;个人主页:云小逸的主页 &#x1f4dd;Github:云小逸的Github &#x1f91f;motto:要敢于一个人默默的面对自己&#xff0c;强大自己才是核心。不要等到什么都没有了&#xff0c;才下定决心去做。种一颗树&#xff0c;最好的时间是十年前…

Kotlin 33. CompileSdkVersion 和 targetSdkVersion 有什么区别?

CompileSdkVersion 和 targetSdkVersion 有什么区别&#xff1f; 在 build.gradle (Module) 文件中&#xff0c;我们通常会看到 CompileSdkVersion 和 targetSdkVersion 的使用&#xff0c;比如下面是一个完整的 build.gradle (Module) 文件&#xff1a; plugins {id com.and…

JavaScript随手笔记---比较两个数组差异

&#x1f48c; 所属专栏&#xff1a;【JavaScript随手笔记】 &#x1f600; 作  者&#xff1a;我是夜阑的狗&#x1f436; &#x1f680; 个人简介&#xff1a;一个正在努力学技术的CV工程师&#xff0c;专注基础和实战分享 &#xff0c;欢迎咨询&#xff01; &#…

0基础学习diffusion_model扩散模型【易理解的公式推导】

0基础学习diffusion_model扩散模型【易理解的公式推导】一、概述二、扩散过程(已知X0求Xt)三、逆扩散过程(已知Xt求Xt-1)1。算法流程图四、结论五、损失函数六、心得体会&#xff08;优缺点分析&#xff09;一、概述 DDPM论文链接&#xff1a; Jonathan Ho_Denoising Diffusion…