商汤科技AGI这些年:上半场「基建」,下半场「变现」

news2025/1/16 8:43:03

【潮汐商业评论/原创】

纵观一次次科技革命引领的生产力变革,都绝非一蹴而就,而是在不断的技术突破中,找到产业的落脚点,再回归到社会应用中去。

当下的人工智能也是如此。今年以来,大模型和生成式AI作为重要的科技突破,刷新了大众对人工智能的认知,也为AI的商业化落地打开了广阔空间。

其中,以商汤科技为代表的龙头企业凭借着布局深耕多年构筑的竞争壁垒,在令人眼花缭乱的新技术、新产品比拼中脱颖而出。

前路漫漫亦灿灿,上下求索终有得。近日,商汤公布了2023年中期业绩,大模型驱动全线业务升级,生成式AI相关收入多倍增长。

潮汐商业评论也从商汤集团这些年的发展历程中,探寻到这个全球领先的人工智能软件公司通向AGI的扎实路径,商汤AGI从「基建」走向「落地」的过程中,在「变现」上迈进一大步。

01 基建先行,当看「执牛耳者」

任何一个龙头企业,都是在行业浪潮汹涌中沉浮而起的。

2010年前后,大数据、云计算、互联网、物联网等信息技术的迅猛发展,推动人工智能大幅跨越科学与应用之间的技术鸿沟,图像分类、语音识别、知识问答等一系列智能技术实现重大突破,AI进入全面影响人类生活的阶段。

直到2022年底,聊天机器人ChatGPT正式发布,再次刷新人工智能技术应用的新高度,作为其背后重要技术支撑的大模型,在全球掀起了关注热潮。

为什么大模型如此重要?简单点说,一个模型通常由输入、算法(计算)、输出组成,大模型的优势在于参数量足够大,能够包含各种各样的变量,假若把大模型视为一位“智者”,它的见识越多,即数据维度多,泛化能力就越好,解决问题的效果也越好;与此相应,大模型通用能力就越强,处理各种类型的单个问题成功率也就越高。

这正是当前AI领域所急需的重要能力。目前,各行各业对AI场景提出大量需求,尤其是出现的很多长尾问题,表现为差异化、碎片化和细节化需求。

但这些与真实世界拟合度极高的需求,对AI基础设施提出了一般厂商难以满足的要求,如指数级增长的算力工程能力、高复杂度的识别算法模型,以及强大的深度学习通用模型。

而这类新兴产业的基础设施建设,需要源源不断的资金、人力和技术投入,当大模型浪潮来临之际,乘势而上、一展所长的往往都是龙头企业。

以头部AI企业商汤为例,今年4月,商汤发布了“日日新”大模型体系,推出自然语言处理、内容生成、自动化数据标注、自定义模型训练等多种大模型及能力。

这背后,商汤已经在AI新基建的路上走了多年。2019年,商汤率先建设了SenseCore商汤AI大装置,建立了一套工程化体系来支撑大模型敏捷、低成本及大批次地迭代。

首先是先进的算力基础设施,在商汤的持续升级下,目前,SenseCore上线GPU数量从2万7千块提升至3万块,算力规模提升20%达到6 ExaFLOPS,为日益增长的大模型训练提供可靠、先进的算力供应,今年以来,1000多个参数量数十亿至上千亿的大模型在此之上完成训练。

其次是海量的有效数据集,多年的模型开源和商业化实践为商汤积累了大量原始语料数据,沉淀了很多宝贵know-how(如专业知识),每月可产出2万亿token(数据处理量),高质量训练数据将应用到大模型上,复现相应改进效果。

此外是稳定的大规模集训,在大装置的支持下,商汤很早就具备千卡并行的系统能力,即使用上千张GPU卡进行单任务训练,以实现千亿参数量超大规模的训练,每个季度甚至能迭代1到2个版本的基模型,保持长期领先。

在如此强大的AI大装置支撑下,今年以来,商汤大模型成果叠出。4月商量SenseChat1.0发布,是国内最早推出的基于千亿参数大语言模型的聊天机器人产品之一;6月,商汤联合上海人工智能实验室等多家国内顶尖科研机构发布了首个综合能力超越GPT-3.5-turbo的大语言模型书生·浦语(InternLM)。

8月,新模型InternLM-123B完成训练,语言、知识、理解、推理和学科五大能力显著提高,在全球51个知名评测集的30万道问题集合上测试成绩整体排名全球第二,超过GPT-3.5-turbo、LLaMA2-70B等模型。

InternLM-123B还重点升级了代码解释器及插件调用能力,可使用python解释器、API调用和搜索等工具来解决复杂任务,灵活搭建智能应用。

商汤是国内最早引入“工具调用”的AI企业之一。工具的规模集成能提高大模型的适用性和解决问题的能力,能够准确使用工具的大模型也是解放行业生产力的关键。

值得一提的是,商汤大模型在开源上也走在了前列,系统开源能让更多的人接触并应用大模型,促进技术的共享和交流,推动大模型生态的建设,并加速AI的发展。

商汤已与多家科研机构合作推进AI开源平台建设。2018年至今,商汤开源的AI大工具涉及决策智能、大语言模型、数据平台、高性能训练、推理框架和AI智能体框架等。

其中,InternLM-7B(70亿参数)模型的部分训练数据、训练代码及基模型权重已向学术界和工业界开放、支持商用,并登顶多个模型测试榜单成为性能最好的轻量级基模型。能力更强的InternLM-20B模型(200亿参数)也将于近期开源。

商汤文生图模型的迭代也相当迅速。7月,商汤文生图大模型产品秒画升级3.0,与年初发布的秒画1.0相比,应用搭载的自研基模型参数量从8亿提升至70亿,其核心算法在COCO benchmark上超过了谷歌的Imagen与OpenAI的DALL·E 2,能够更智慧地理解用户需求,出图效果跻身全球前列,国内领先。

02 商业落地,重在「全面赋能」

从科学研究、科研成果到科技产品、商业应用,是每个新技术都要走的路,要保持AI的长期可持续发展,商业落地是重中之重。

现实因素来看,AI的商业化需要落地到具体的应用场景,赋能下游企业,实现降本增效,才会有人愿意“买单”,AI企业也才能获得相应的经济效益。

长远因素来看,长期的商业化探索能助推大模型技术迭代,反哺AI应用的落地和优化,持续提升AI的市场渗透率,形成行业发展的良性循环。

而2021年底登陆港交所之时,商汤的AI商业化模式已经“五脏俱全”,在当时的招股说明书中,将要打造的业务结构总结为“一个平台、四个支柱”。

其中,“一个平台”指商汤的AI大装置SenseCore,“四大支柱”分为智慧商业、智慧城市、智慧生活、智能汽车等板块,囊括了所有的落地场景。

今年上半年,基于AI大装置SenseCore和“日日新”大模型系列,商汤发布了一系列生成式AI产品,如,自然语言交互的“商量”、AI文生图的“秒画”、数字人视频生成的“如影”、3D大场景重建的“琼宇”、3D小物体生成的“格物”,并将之应用于各个业务板块,赋能行业创新。

商汤的“大模型力量”正驱动着集团全线业务升级。半年报显示,今年上半年,商汤集团的生成式AI相关收入同比增长670.4%,对集团业务的贡献迅速提升至20.3%。

例如智慧商业板块,大模型技术下诞生的企业级AI应用打开极为广阔的商业应用场景,成长为商汤第一大收入来源。商汤深入能源、金融、地产等十个行业的数百家客户深度定制行业大模型,如针对头部金融机构,以商量赋能关键业务,包括智能客服、营销培训等,并开展金融大模型合作研发;针对头部保险机构,提供基于AI遥感大模型的农作物承保数据交叉验证,效率提高60倍。上半年,智慧商业营收8.54亿元,同比增长50.2%。

在智慧生活板块,大模型产品提前抢占tob市场空间,“商量”和“秒画”深受移动互联网行业用户青睐,如影落地电商、直播、银行客服场景,格物与香港最大的珠宝集团之一实现商品3D数字化合作等。上半年,智慧生活营收3.12亿元;客户数达270个,同比增长47.5%。

趁着AI东风,智能汽车板块也成为商汤的重要发展引擎,并由研发转化为规模量产。上半年,绝影量产业务同比增长573%,量产交付数量39万台,规模量产带动单车毛利提高29%。基于大语言模型“商量”打造的车舱内智能助理备受关注,智能座舱前装产量同比增长3倍。

智慧城市板块,则是持续推进业务转型,聚焦头部城市,优化收入结构、改善现金流。上半年商汤在一二线城市的智慧城市收入占比由去年同期的34%上升至64%。

商汤的AI商业落地,也与整个行业的大规模产业化路径不谋而合,在经历长期的投入后,跨越工业红线,终于量变引发质变,大模型和生成式AI产品对各行各业的强大赋能,打开广阔的商业应用场景,助推企业在变现路上迈进一大步,有望进入高获利区间。

03 优胜劣汰,始终「向前迭代」

目前来看,商汤在AI新基建领域的提前布局和前瞻地位,让其在此次大模型的浪潮中构筑了强大的技术竞争壁垒,并加速商业化落地进程,但大模型的意义远不止于此。

与当年移动互联网之争一般无二,AI之争最终也会从单个应用的流量争夺走向整个生态系统的比拼。

而在AI生态中基础软硬件、基础模型和创新应用这三大层次中,基础模型可谓是AI生态的“支点”,大模型向下能带动AI基础软硬件发展,向上能支撑AI智能应用赋能社会各行各业。

业内普遍认为,大模型用一套算法、一套模型结构、一套训练思路,就能解决AI中的很多碎片化问题,标志着通用人工智能时代的到来。

“AGI催生了新的研究范式,即基于一个强大的多模态基模型,通过强化学习和人类反馈不断解锁基模型新的能力,从而更高效地解决海量的开放式任务。商汤科技联合创始人、首席科学家王晓刚指出,“AGI将实现从‘数据飞轮’到‘智慧飞轮’的演进,最终迈向人机共智。”

这种技术层面上的演进也将延伸至应用层面。与此前“空中楼阁”般的AI,存在研发成本高、规模生产难、落地场景模糊大等问题相比,大模型时期的AI重视泛化能力、产业结合和安全保障,有望成为拉动全球经济增长的新引擎。

据IDC预测,2026年中国AI大模型市场规模将达到211亿美元。而生成式AI更有可能是个万亿市场,麦肯锡的报告指出,在其研究的63种应用中使用生成式AI,将为全球经济带来每年2.6万亿-4.4万亿美元的增长。

嗅到机遇的不止有商汤,当年日新月异的互联网行业里,“一步慢步步慢”的竞争态势,被普遍认为在AI领域只会愈演愈烈,引得一众厂商纷纷下场。

赛迪数据显示,今年1-7月国内共发布了64个大模型。截至2023年7月,中国累计已经有130个大模型问世。

目前,热度较高的大模型中,除了像商汤这样的AI新贵所出之外,还有互联网大厂和学院派的力作。如阿里的通义大模型家族、腾讯的行业大模型解决方案、华为的盘古大模型系列,以及复旦的MOSS大模型、清华的ChatGLM、中科院自动化所的紫东·太初等。

正如手机系统一样,过多的大模型并不利于AI的标准化、统一化发展,持续的巨额投入也意味着这是个少数人的游戏,大模型,尤其是通用大模型的数量终将从上升转向下探。

生成式AI更是打响争夺用户“第一枪”。8月31日,首批国产AI大模型获批面向公众开放,包括百度“文心一言”、商汤“日日新大模型”、抖音“云雀大模型”、中科院“紫东太初大模型”、智谱AI“智谱清言”等。商汤“商量SenseChat”也在31日当天全面向用户开放服务。

AI企业该如何迎战?答案是始终向前迭代,以持续领先的技术优势,建立独特的市场定位,快速抢占市场份额,而商汤早已做好准备。

今年上半年,在“基建”成果的大力支持下,商汤全力投入在基模型研发,与顶尖科研机构联合发布的InternLM成为了中国首个全面超越GPT-3.5-turbo性能的大模型。下半年,商汤将借助丰厚的数据和算力资源,制作更强的基模型。2024年,通过开源和商业化的双重推动,商汤想要打造领先的生成式AI应用生态平台,类似当年的AI助手、操作系统等互联网应用生态平台,成为新的流量入口。

对于商汤来说,大模型的技术优势和平台的赋能服务,能够牢牢把握住生成式AI市场的刚性需求。对于其他企业来说,它们可以更快更好地利用AI解决生产经营痛点,或是构建AI商业生态,这也是商汤的初心与愿景。“商汤的长远目标仍然是向AGI持续迭代,用我们的创新力为AGI时代更快到来做出努力。”

近年来,AI在技术突破和应用方面,都取得了突破性的飞跃进展。但正如爱因斯坦所说,科学绝不是也永远不会是一本写完了的书,每一项重大成就都会带来新的问题,任何一个发展,随着时间的推移,都会出现新的严重的困难。

AI未来已来,却仍需要如商汤这类头部从业者,持续向新技术与新产品迭代,用自身的创新力为更多的行业与企业全面赋能,加速推动AGI时代到来,让AI真正成为解放人类双手、补足人类大脑的最强力量。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/992426.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

OpenCV项目实战(1)— 如何去截取视频中的帧

前言:Hello大家好,我是小哥谈。针对一段视频,如何去截取视频中的帧呢?本节课就给大家介绍两种方式,一种方式是按一定间隔来截取视频帧,另一种方式是截取视频的所有帧。希望大家学习之后能够有所收获&#x…

无涯教程-JavaScript - IMSIN函数

描述 IMSIN函数以x yi或x yj文本格式返回复数的正弦。复数的正弦为- $$\sin(x yi) \sin(x)\cosh(y) \cos(x)\sin(y)i $$ 语法 IMSIN (inumber)争论 Argument描述Required/OptionalInumberA Complex Number for which you want the sine.Required Notes Excel中的复数仅…

python-55-打包exe执行

目录 前言一、pyinstaller二、实践打包exe1、遇坑1:Plugin already registered2、遇坑2:OSError 句柄无效 三、总结 前言 你是否有这种烦恼? 别人在使用你的项目时可能还需要安装各种依赖包?别人在使用你的项目,可能…

Bean 的生命周期总结

目录 一、Bean生命周期的五个阶段 Bean的初始化 二、PostConstruct 和 PreDestroy 各自的效果 三、 实例化和初始化的区别 四、为什么要先设置属性在进⾏初始化呢? 一、Bean生命周期的五个阶段 Java 中的公共类称之为 Bean 或 Java Bean,而 Spring 中的…

深度学习的数值问题

文章目录 梯度下降临界点、驻点、拐点、鞍点、顶点(曲线)、曲率近似优化预测最佳步长 梯度下降 往斜率的反方向走。 临界点、驻点、拐点、鞍点、顶点(曲线)、曲率 临界点:在数学中,临界点是指函数的导数为…

【APISIX】W10安装APISIX

Apache APISIX 是一个动态、实时、高性能的云原生 API 网关,提供了负载均衡、动态上游、灰度发布、服务熔断、身份认证、可观测性等丰富的流量管理功能。以下简单介绍Windows下借助Docker Desktop来安装APISIX。 具体应用场景可参考官网(https://apisix.…

安科瑞铁塔基站能耗监控解决方案

安科瑞 华楠 1 背景概述 5G发展,基站先行。5G基站的选址建设,是保证5G信号覆盖的基础,因此5G基站建设是5G产业布局的一部分,也是5G成熟的基础。 2G、3G、4G均是低频段信号传输,宏基站几乎能应付所有的信号覆盖。但由…

Navicat Premium 16 安装及卸载

Navicat Premium 16 安装及卸载 文章目录 Navicat Premium 16 安装及卸载一 、简介二、下载三、安装四、使用五、卸载 一 、简介 Navicat Premium 是一套可创建多个连接的数据库开发工具,让你从单一应用程序中同时连接 MySQL、Redis、MariaDB、MongoDB、SQL Server、…

【HTML专栏4】常用标签(标题、段落、换行、文本格式化、注释及特殊字符)

本文属于HTML/CSS专栏文章,适合WEB前端开发入门学习,详细介绍HTML/CSS如果使用,如果对你有所帮助请一键三连支持,对博主系列文章感兴趣点击下方专栏了解详细。 博客主页:Duck Bro 博客主页系列专栏:HTML/CS…

线程的常用方法及六种状态

一、线程核心执行流程方法 -- run() run方法是Runnable接口中定义的。所有实现Runnable的接口的子类都需要覆写run方法。 run方法是线程的核心执行流程方法,也就是说,run方法决定了线程启动后要干什么,当run方法执行完…

2.11 PE结构:添加新的节区

在可执行PE文件中,节(section)是文件的组成部分之一,用于存储特定类型的数据。每个节都具有特定的作用和属性,通常来说一个正常的程序在被编译器创建后会生成一些固定的节,通过将数据组织在不同的节中&…

微信小程序接入隐私弹窗说明及详细过程

相信各位做小程序的小伙伴在微信小程序后台应该都接到了官方通知的小程序隐私新规,如果还未收到的小程序可以看一下: 为规范开发者的用户个人信息处理行为,保障用户合法权益,自2023年9月15日起,对于涉及处理用户个人信…

OpenCV 09(形态学)

一、形态学 形态学指一系列处理图像 形状特征 的图像处理技术. 形态学的基本思想是利用一种特殊的结构元(本质上就是卷积核)来测量或提取输入图像中相应的形状或特征,以便进一步进行图像分析和目标识别。这些处理方法基本是对二进制图像进行处理, 即黑白图像卷积核…

JUC编程中锁引发的“见解”

JUC编程中锁引发的“见解” 一大早就在想锁是干嘛的?什么情况下要用锁?想了很多,下面的所有表述都是就是我的思考流程,欢迎所有人一起讨论、更正。 文章目录 JUC编程中锁引发的“见解”1、什么是JUC编程?2、JUC编程中什么情况下需…

C/C++之链表的建立

个人主页:点我进入主页 专栏分类:C语言初阶 C语言程序设计————KTV C语言小游戏 C语言进阶 C语言刷题 欢迎大家点赞,评论,收藏。 一起努力,一起奔赴大厂。 目录 1.头插 1.1简介 1.2代码实现头插 …

二维数组前缀和(JAVA)

力扣(LeetCode)官网 - 全球极客挚爱的技术成长平台 暴力 双层for循环,遍历子矩阵。 前缀和算法: class NumMatrix {private int sum[][];private int matrix[][];public NumMatrix(int[][] matrix) {this.matrixmatrix;int row…

AI 帮我写代码——Amazon CodeWhisperer 初体验

文章作者:游凯超 人工智能的突破和变革正在深刻地改变我们的生活。从智能手机到自动驾驶汽车,AI 的应用已经深入到我们生活的方方面面。而在编程领域,AI 的崭新尝试正在开启一场革命。Amazon CodeWhisperer,作为亚马逊云科技的一款…

【高德地图】 覆盖物/画点/画折线/画多边形/画矩形/画圆

官方示例 https://lbs.amap.com/demo/javascript-api/example/mouse-operate-map/mouse-draw-overlayers <!doctype html> <html lang"en"><head><meta charset"utf-8"><meta http-equiv"X-UA-Compatible" content…

07_瑞萨GUI(LVGL)移植实战教程之LVGL对接EC11旋转编码器驱动

本系列教程配套出有视频教程&#xff0c;观看地址&#xff1a;https://www.bilibili.com/video/BV1gV4y1e7Sg 7. LVGL对接EC11旋转编码器驱动 本次实验我们向LVGL库中对接EC11旋转编码器驱动&#xff0c;让我们能通过EC11旋转编码器操作UI。 7.1 复制工程 上次实验得出的工…

一文读懂Swin-Transformer

系列文章目录 记录CV领域大模型的学习历程&#xff0c;欢迎大家一起讨论&#xff0c;互相学习。 ViT,DETR(一),DETR(二)DETR(三) 文章目录 系列文章目录前言一、整体框架1.Patch Embedding2.Patch Merging3.Swin Transformer Block3.1 Window Partition/Reverse3.2 Window-MSA…