麦肯锡:中国生成式AI市场现状和未来发展趋势

news2024/11/25 14:59:57

本文来自《麦肯锡中国金融业CEO季刊》,版权归麦肯锡所有。该季刊主要围绕生成式AI(以下简称“GenAI”)主题,通过4大章节共8篇文章,全面深入分析了GenAI对各主要行业的影响、价值链投资机会、中国GenAI市场现状和未来趋势以及企业如何布局GenAI,从而真正挖掘其价值。

随着ChatGPT的火爆出圈,GenAI成为各行各业关注和热议的话题。全球科技巨头和AI厂商纷纷下场,唯恐错过此番科技盛宴。行业翘楚和媒体将GenAI浪潮类比昔日的移动互联网机遇,认为它将对全球经济和各个行业带来深远影响,企业也将迎来重大变革机遇。

GenAI蓬勃发展产业规模也在高速增长,投资者纷纷入局。2022年GenAI市场收入为400亿美元,预计2027年及2032年将分别达到3,990亿美元和13,040亿美元,2022~2032年复合增长率达42%。

中国市场,2022年规模约人民币660亿元,2020~2025年复合增速将达到84% ,2025年中国GenAI市场将占全球市场规模(2,170亿美元)的14%。

在这里插入图片描述

由于内容较多一共178页,下面主要为大家介绍中国GenAI市场现状和未来趋势。

市场规模

2022年全球GenAI市场整体收入为400亿美元,预计2027年及2032年将分别达到3990亿美元和1.3万亿美元,2022~2032年复合增长率高达42%。

到2025年,GenAI产生的数据将占所有生成数据的10%(2021年仅为1% 2)。

在这里插入图片描述

预计2022~2035年全球市场规模增量主要来源于训练侧硬件、广告应用和软件。其中,在训练侧硬件方面的增量约4,440亿美元,仅GenAI基础设施服务(GenAI as a service)一项,增量就有2,448亿美元,年复合增长率将达到60%;

在广告应用方面,相关年复合增长率将达到125%,增量达1924亿美元;而软件方面,在约2,800亿美元的增量中,GenAI助理软件增量可观,达890亿美元,年复合增长率有望达到70%。

在这里插入图片描述

2022年中国GenAI市场规模约人民币660亿元,预计2020~2025年复合增速将达84%,到2025年将占全球市场规模(2,170亿美元)的13%。

与此同时,近两年国内GenAI融资市场热度持续上升,前十大融资事件总规模达8.7亿美元。

其中,某领先的端到端AI制药公司、光某大模型初创公司等头部企业获得逾2亿美元的单笔融资,多轮融资累计规模分别超3亿美元、2.5亿美元。

在这里插入图片描述

技术栈

(一)专用硬件:基础建设资源受限,但国产化进程不断加速。

由于无法获得高端GPU(图形处理器)芯片A100与H100,国内大模型研发机构在算力上遭遇瓶颈。为应对上述困境,中国本土芯片研发厂商加强科研,在算力技术上实现重要突破。

目前,中国市场可以获得的A800 GPU芯片,传输速度仅为顶尖产品A100的70%。由于AI技术发展高度依赖先进GPU,需借助芯片进行大量模型训练和扩展,部分国内科研机构和科技企业因此受到较大影响,尤其在目前大模型参数量快速膨胀、算力需求显著增加的情况下。

在这里插入图片描述

为了应对算力瓶颈,国内领先算力芯片公司力求在产品端实现突破。例如,国内某量产商业人工智能芯片厂商,在头部大型云服务提供商旗下一款知识增强大语言模型产品中,实现了对部分业务场景的部署。

某专注于通用GPU芯片及解决方案研发及销售的高科技公司和另一计算机图形芯片设计公司则希望开发出接近高端芯片性能的产品。

全球领先的ICT(信息与通信)基础设施和智能终端提供商旗下的人工智能处理器则被用于内部大模型开发训练。

目前,国产GPU的算力规模大多在1000TOPS以内,上述某计算机图形芯片设计公司已能达到2000TOPS,但距离国际领先的H100芯片高达4000TOPS的算力仍有一定差距。

(二)云平台:全球竞争格局趋同,未来国内GenAI厂商将依赖云平台完成模型训练与调整。

在云平台领域,国内和海外市场均呈现头部厂商占据绝对主导地位的垄断格局。2022年,国内四家头部厂商占据国内79% 4的市场份额;在海外市场,截至2023年一季度,前三大厂商占据全球65%的市场份额。

通用大模型需要海量数据作训练用途,但中文网站数量从全球来看占比仅为1.4% (英文网站占比达54% ),可用作训练的公开中文语料库(含文本、图片、视频等素材)往往数量有限、质量不均。

与此同时,国内用户在网站和移动端App产生的海量数据,基于保护用户隐私的原因,大部分也未能应用在大模型训练上,对模型训练的效率和精度都造成不利影响。

尽管在训练数据上受到诸多限制,中国通用大模型技术仍然不断追赶国际领先水平,参数规模紧跟国际领先水准并实现快速提升。

在这里插入图片描述

相较于适用于多领域、多任务的通用大模型,行业大模型更依赖于开发者对垂直场景的理解和海量行业数据支持,在算力受限的背景下,行业大模型更有可能成为中国GenAI厂商的制胜赛道。

就行业大模型而言,国内市场正呈现差异化竞争格局:某头部互联网大厂的行业大模型根植于游戏、广告、内容创作等多媒体领域,成为提升广告和游戏场景创作效率的生产力工具;

国内前三的超大规模云服务商开发的产业级知识增强大模型则凭借其对中文语言的强大理解能力,赋能汽车行业售后服务与知识库构建、医疗行业单据识别、社科行业版权保护与词条管理等;

某全球领先的ICT(信息与通信)基础设施和智能终端提供商旗下的包含NLP、CV、多模态和科学计算的中文大模型则在工业物流、新药研发、气象预测等领域得到广泛应用。

(三)基础模型:通用大模型数量可观,行业大模型可能是国产GenAI的出路。

在通用大模型方面,截至2023年5月,中国已发布79个10亿参数级以上的大模型,在大模型发布数量上位居全球第二,仅次于美国。在全球模型发布数量前十的GenAI大模型厂商中,中国研发机构及厂商占据4席。

通用大模型需要海量数据作训练用途,但中文网站数量从全球来看占比仅为1.4% (英文网站占比达54% ),可用作训练的公开中文语料库(含文本、图片、视频等素材)往往数量有限、质量不均。

在这里插入图片描述

与此同时,国内用户在网站和移动端App产生的海量数据,基于保护用户隐私的原因,大部分也未能应用在大模型训练上,对模型训练的效率和精度都造成不利影响。

尽管在训练数据上受到诸多限制,中国通用大模型技术仍然不断追赶国际领先水平,参数规模紧跟国际领先水准并实现快速提升。

(四)模型库和工具:国内外围绕开源模型,涌现出大模型工具独立厂商。

海外市场围绕可自由调整代码的开源模型,已涌现出一批独立厂商,可实现模型训练和微调、模型部署、模型应用开发等细分技术功能。随着国内GenAI市场的不断发展,各种开发和维护工具等也将逐渐成熟。

(五)应用:中国创业公司尚处于早期阶段,聚焦领域相对集中。

中国GenAI领域的创业公司融资轮次靠前,集中在天使轮到Pre-A轮之间,融资金额大多小于1亿元人民币,正处于方兴未艾的发展初期,行业潜力巨大。

其中,某全球领先的跨国科技公司旗下的人工智能聊天机器人作为准独角兽企业,于2022年11月完成10亿元A+轮融资,投后估值约10亿美元。

在这里插入图片描述

反观海外GenAI行业,科创企业规模体量相对较大,涌现出多家细分应用领域独角兽企业,其中某总部位于伦敦的全球化AI研究型企业估值高达38亿美元。

在这里插入图片描述

中国GenAI垂直应用领域主要聚焦文本、图像和音视频生成,海外市场则在上述领域以外出现了大量基于GenAI的开发平台、数据分析平台及代码编写平台,其原因在于海外以早期程序语言(如COBOL)编写的系统较多,许多企业面临较高编程人力成本,因此对编程辅助软件有较高需求。

在这里插入图片描述

同时,目前中国GenAI企业目标客群多为终端用户,而海外市场存在大规模企业客户群体,随着中国SaaS市场成熟以及企业付费意愿提升,预计国内文本生成和图像生成初创企业将快速拓展至企业客户市场。

商业化应用

中国GenAI行业的商业化应用呈现出两大特点:一是行业分布集中,主要集中在商业化发展较成熟的优势产业;二是大部分企业尚处于积极探索自身商业模式的早期阶段。

(一)中国GenAI应用集中于商业化发展成熟的优势产业

中国GenAI企业利用国内垂直场景优势,将GenAI优先应用于商业化基础设施较完善的新兴行业中;而欧美同行则利用当地成熟的SaaS市场,将GenAI应用到高科技、通信及各种传统行业(如医疗、教育等),应用范围更加广泛。

在国内,GenAI应用发展最迅速的领域包括电商、传媒、娱乐和游戏,尤其是数字虚拟人和电商视频营销,而大部分传统行业(如金融、能源、教育等)仍处于小规模试点阶段。

GenAI应用得以在互联网电商平台蓬勃发展,原因在于中国拥有优质的电商和供应链生态以及庞大的消费者群体,为GenAI应用落地提供了契机。

典型的行业应用案例包括视频行业的某生成式AI的3D短视频内容厂商、电商行业的某领先GenAI视频大模型研发企业以及游戏行业的某互联网平台旗下的游戏与AI研究和应用机构等。

上述企业中,生成式AI的3D短视频内容厂商能够基于文本生成3D视频内容,并通过抖音、快手、B站等短视频平台进行推广,极大提高了短视频内容生产者的创作效率;

GenAI视频大模型研发企业则深耕电商行业,以AI生成虚拟人主播,赋能各行业、各品牌电商;游戏与AI研究和应用机构则利用人工智能打造AI陪玩、AI竞技机器人,并通过自然语言技术赋予非玩家角色人设,使其能够在游戏中与玩家互动对话。

(二)中国市场GenAI商业模式尚在探索中

目前,大部分中国市场的GenAI创业公司刚刚完成标准化产品输出,开始进入初级商业化探索阶段,市场上主流的商业模式包括云资源售卖、模型API调用、SaaS收费、素材收费等。

由于国内企业对软件的付费意愿不高、市场有待进一步培育,以及企业对SaaS部署方式存在数据安全方面的顾虑,大规模应用GenAI的商业模式仍有待探索。

在欧美市场,SaaS付费订阅模式已基本成熟,一众海外GenAI企业纷纷构建起可持续的SaaS商业模式。

风险管理

GenAI赋能各行各业的同时,也带来了诸如公平性受损、侵犯知识产权、信息泄露、恶意使用、安全威胁、模型幻觉及第三方风险等负面影响和挑战。其中,模型幻觉、恶意使用、信息泄露三大风险值得重点关注。

在这里插入图片描述

恶意使用:不当使用模型输出可能会带来欺诈、虚假信息传播等负面影响,中国GenAI应用丰富、用户群体庞大,所面临的恶意使用风险较为突出,但由于国内在实名认证,内容合规,和打击虚假信息等方面落实到位,有利于追溯恶意使用源头,从而防范和控制相关风险。

信息泄露:用于模型训练的隐私或敏感信息可能会被GenAI应用作为输出内容,同时人工智能模型存储系统内的个人信息也可能面临网络攻击和泄漏,因此需要在内部部署数据、又处于强监管下的重点行业和企业,需要主动防范信息泄露风险。

安全威胁:不仅负责任的AI(RAI-Responsible AI)受到监管和企业关注,安全的AI(SAI-Securing AI)也逐渐进入企业和公众视野,特别是AI系统全生命周期安全保护。有效的AI威胁管理直接影响到防范信息泄露和恶意使用。近期全国信息安全标准化技术委员会起草了相关评估规范和标准,为算法提供者给与了机器学习算法生命周期安全指导意见7,也可为监管评估提供参考。

模型幻觉:模型输出结果不符合事实。模型幻觉普遍存在于国内外所有的GenAI模型和应用,但因为国内大模型的研发经验和技术实力尚有提升空间,且中文语料相比英文更为复杂,让模型幻觉问题变得更加棘手。

为规范GenAI的应用,中国早在2022年已经开始布局AI相关监管,例如2022年3月发布了互联网信息服务算法推荐管理规定,2022年11月发布了互联网信息服务深度合成管理规定。

2023年7月,国家网信办联合国家发展改革委、教育部、科技部等7部门发布《生成式人工智能服务管理暂行办法》,对模型训练过程中可能涉及的数据歧视、知识产权保护、个人隐私及肖像权保护等作出明确规定,行业监管框架进一步完善。

放眼海外,美国国家标准与技术研究院于2023年1月发布了AI风险管理框架,着力为AI开发,治理,和运营提供风险控制最佳实践。欧盟则于2023年6月通过《人工智能法案》授权草案,对不同等级的人工智能所承担的责任和义务进行划分,通过风险定级来实现分层治理,并着力推动跨产业的人工智能立法,以进一步防范人工智能可能带来的多重风险。

结语

当下全球人工智能市场正处于高速增长阶段,本文从市场规模、技术栈、商业化应用和风险管理四大维度,对国内外GenAI行业的发展现状和趋势进行了深入浅出的分析。

尽管目前国内外市场在诸如大模型开发、应用布局、商业模式等多个领域都存在较大差异,我们看到中国GenAI行业正在不断追赶国际领先水平,预计未来中国GenAI相关技术和应用将逐渐成熟,并进一步探索出适合自身发展的商业模式。

四位作者介绍

曲向军,是麦肯锡全球资深董事合伙人,中国区金融机构咨询业务负责人,常驻香港分公司;

韩峰,是麦肯锡全球董事合伙人,常驻深圳分公司;

胡艺蓉,是麦肯锡全球副董事合伙人,常驻上海分公司;

王喆宸,是麦肯锡咨询顾问,常驻上海分公司。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1040512.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

YTM32的LINFlexD实现UART功能详解

文章目录 引言简介原理与机制同UART模式相关的寄存器时钟与波特率数据缓冲区发送过程接收过程 软件参考文献 引言 初看YTM32B1ME的手册时,一眼看上去,竟然没有找到UART模块的章节,心想这车规MCU的产品定义也太激进了,直接把工业和…

阿里云服务器使用教程(从购买到配置再到搭建自己的网站)

阿里云服务器使用教程包括云服务器购买、云服务器配置选择、云服务器开通端口号、搭建网站所需Web环境、安装网站程序、域名解析到云服务器公网IP地址,最后网站上线全流程,阿小云分享阿里云服务器详细使用教程: 目录 阿里云服务器使用教程 …

Python爬虫爬取豆瓣电影短评(爬虫入门,Scrapy框架,Xpath解析网站,jieba分词)

声明:以下内容仅供学习参考,禁止用于任何商业用途 很久之前就想学爬虫了,但是一直没机会,这次终于有机会了 主要参考了《疯狂python讲义》的最后一章 首先安装Scrapy: pip install scrapy 然后创建爬虫项目&#…

广东MES系统实现设备管理的方法与功能

在生产车间中,可以借助MES系统来完成设备管理。下面来看看借助MES系统实现设备管理比较常见的具体方法与功能: 1.在线监控和数据采集:MES系统能够与车间设备相连接,在线实时监控设备的运行状态和运行指标。凭借传感器、物联网产品…

【教程】Ubuntu自动查看有哪些用户名与密码相同的账户,并统一修改密码

转载请注明出处:小锋学长生活大爆炸[xfxuezhagn.cn] 目录 背景说明 开始操作 修改密码 背景说明 有些用户为了图方便或者初始创建用户默认设置等原因,会将密码设置为与用户名相同,但这就使得非常不安全。甚至如果该用户具有sudo权限&#…

力扣26:删除有序数组中的重复项

26. 删除有序数组中的重复项 - 力扣(LeetCode) 题目: 给你一个 非严格递增排列 的数组 nums ,请你 原地 删除重复出现的元素,使每个元素 只出现一次 ,返回删除后数组的新长度。元素的 相对顺序 应该保持 …

virtualbox安装的linux虚拟机安装并启动Tomcat过程(结合idea操作)记录,并使用宿主机访问页面

virtualbox安装的linux虚拟机安装并启动Tomcat过程(结合idea操作)记录,并使用宿主机访问页面 参考教程地址linux版本Tomcat下载地址上传解压 启动TomcatVirtualBox虚拟机本地可访问宿主机尚未可以访问关闭防火墙宿主机可以访问 参考教程地址 …

构建自己的物料解决方案——构建物料库,实现前端设计

01: 数据拦截简化数据获取流程 /** * 响应拦截器: * 服务端返回数据之后,前端 .then 之前被调用 */ service.interceptors.response.use((response) > {const { success, message, data } response.dataif (success) {return data}// TODO&#xff…

顺序读写函数的介绍:fscanf fprintf

目录 函数介绍: fprintf: 将结构体变量s的成员列表内容写入文件中: 文件效果:已经进行了格式化,3.140000是最明显的效果,因为float需要补齐0来补充精度 和printf的对比: 不同之处&#xff…

基础排序算法

插入排序(insertion sort) 插入排序每次循环将一个元素放置在适当的位置。像抓牌一样。手里的排是有序的,新拿一张牌,与手里的牌进行比较将其放在合适的位置。 插入排序要将待排序的数据分成两部分,一部分有序&#…

ddd扬帆

简介 读取了一篇“产品代码都给你看了,可别再说不会DDD”较为清晰了解了:领域驱动设计,整洁架构和事件驱动架构的架构思想落地实践,特做记录读后感,可以直接跳到正文阅读原文 正文 以下正文... 构建自己的软件大厦 …

【C++】C++11——可变参数模板和emplace

可变参数模板的定义方式可变参数模板的传值计算可变参数模板参数个数参数包展开方式递归展开参数包逗号表达式展开参数包 emplace插入 可变参数模板是C11新增的最强大的特性之一,它对参数高度泛化,能够让我们创建可以接受可变参数的函数模板和类模板。 在…

(a)Spring注解式开发,注册组件的@Repository,@Service,@Controller,@Component使用及说明

注解扫描原理 通过反射机制获取注解 Target(value {ElementType.TYPE})// 设置Component注解可以出现的位置,以上代表表示Component注解只能用在类和接口上 Retention(value RetentionPolicy.RUNTIME)// 设置Component注解的保持性策略,以上代表Comp…

社区团购美团和多多买菜小程序购物车

概述 微信小程序购物车列表demo 详细 需求 显示食物名称、价格、数量。 点击相应商品增加按钮,购买数量增加1,点击食物减少按钮,购买数量减一 显示购买总数和总金额 查看当前购买的商品 效果图(数据来自本地模拟) 目录结构 实现过程 主要wxml <view classfoods>…

工具篇 | H2数据库的使用和入门

引言 1.1 H2数据库概述 1.1.1 定义和特点 H2数据库是一款以 Java编写的轻量级关系型数据库。由于其小巧、灵活并且易于集成&#xff0c;H2经常被用作开发和测试环境中的便利数据库解决方案。除此之外&#xff0c;H2也适合作为生产环境中的嵌入式数据库。它不仅支持标准的SQL…

饮料生产线Modbus协议转换网关的应用介绍

在饮料生产线设备数据采集和控制系统中&#xff0c;MODBUS网关是一种非常重要的设备。它可以将不同设备之间的通讯协议转换为统一的MODBUS协议&#xff0c;从而实现数据采集和指令下达。在本文中&#xff0c;我们将介绍如何使用MODBUS网关采集饮料生产线设备数据并下达指令。 在…

知识库搭建保姆级教程,如何从0到1完成知识库搭建

在这个信息爆炸的时代&#xff0c;如何获取、整理和应用知识成为了我们个体价值和企业核心竞争力打造的重要表现&#xff0c;搭建一个高效的知识库可以提升我们企业的竞争力&#xff0c;必要时还能快速切换赛道&#xff0c;开展一个新的领域。 今天我们将结合HelpLook 来与你一…

基于C++实现的3D野外赛车驾驶游戏源码+项目文档+汇报PPT

项目介绍&#xff1a;本项目实现了一个户外场景下的赛车游戏&#xff0c;可以通过键盘控制赛车的移动&#xff0c;视角为第二人称视角。场景中有汽车&#xff0c;建筑&#xff0c;道路&#xff0c;天空等物体&#xff0c;拥有光照和阴影的效果。通过粒子系统模拟尾气效果&#…

Kubernetes组件和架构简介

目录 一.概念简介 1.含义&#xff1a; 2.主要功能&#xff1a; 3.相关概念&#xff1a; 二.组件和架构介绍 1.master&#xff1a;集群的控制平面&#xff0c;管理集群 2.node&#xff1a;集群的数据平面&#xff0c;为容器提供工作环境 3.kubernetes简单架构图解 一.概…

Windows迁移文件的快速方法

文章目录 1.简单比较2.传输方法介绍&#xff1a;有线&#xff08;直连网络&#xff09;3.传输方法介绍&#xff1a;无线热点传输4. 共享文件夹的设置5.挂载共享文件夹 1.简单比较 方法传输速度有线传输接近900Mb无线热点传输接近500MbU盘传输基本上不超过100Mb 2.传输方法介绍…