“GPT全家桶”,喂不饱商汤科技

news2024/10/6 6:40:33

        加码追风大模型,终究没能让商汤科技找回投资者们的信心。

        4月10日,商汤发布了“日日新SenseNova”大模型体系,且一口气展示了多个产品,有类ChatGPT产品“商量”(SenseChat)、与Midjourney画风一致的秒画平台、AI数字人视频生成平台如影,以及琼宇、格物这两个3D内容生成平台。

        数量众多的产品矩阵,俨然有“AI全家桶”之势,但这并没有达到二级市场的预期。4月11日向上跳空开盘后,一路下探,连续多个交易日收阴,股价重新下杀到3港元以下。

        事实上,商汤科技作为最早把人工智能大模型技术写入招股书的公司,确实是有着足够的实力,也有独有的优势。但这并不意味着商汤能够趁着东风翻身把歌唱,能否抓住市场给到的机会,目前暂得不出一个利好定论。


逃不过的“套壳质疑”

        与其他借着GPT概念发布产品的国内公司一样,商汤大模型一经亮相,便遭到质疑。

        有网友发现商汤在演示秒画平台时,竟然出现了与AI模型站Civitai上一模一样的图片,甚至该模型底部还有显示Civitai的文字注释。因此,被质疑自研文生图是“直接从Civitai下的图”。

        而商汤方面回应到:“秒画SenseMirage包含商汤自研AIGC大模型,也提供第三方社区开源模型支持导入多个平台的开源模型或上传用户本地模型。用户可免除本地化部署流程,并基于开源模型自训练模型,高效地生成更多样的内容。”

        换成通俗易懂的话来讲,就是商汤虽然训练了自己的大模型,但秒画是一个平台,平台上提供第三方开源模型,其他第三方网站上的模型也可以正常导入进来。

        打个更好理解的比方是,自己虽然是超市老板,但超市里的货仅有少量自产,多数还是来自其他厂商的铺货。

        而对于商汤所谓的自研大模型,也被网友诟病为“云端stable diffusion”。这些猜测并非无据可依,从发布会上展示的一个例子可以看出,虽然是中文的prompt,但风格却是中译英的翻译腔调。譬如“惊人形象、颜色分级应该是专业的”等。

        值得称道的是,商汤发布的很多产品都是直接拿落地Demo进行演示,并非概念十足的PPT。

        在演示“商量”的医疗场景案例时,当用户提出症状后,“商量”并没有给出病情诊断,而是进行多次询问,根据用户的患病时长、其他症状等,才给出了可能的病症和求医科室建议,更加类似现实中的人工问诊。

        “秒画”为文生图创作平台,它的逻辑与Midjourney类似,用户除了自选风格外,还可以自添加批量图片,自训练图片风格。

        “如影”是商汤推出的AI数字人视频生成平台,用户仅需上传一段真人视频素材,就可以生成出来声音及动作自然、口型准确、多语种精通的数字人分身。

        虽然这些平台都还未对公众大范围开放,实际水平暂未可知,但从这些落地演示中不难发现,商汤的想法与其他厂商略有不同,布局大模型更像是为了卖算力、卖服务。商汤方面也直言,“日日新SenseNova”将为政企客户提供了多种灵活的API接口和服务,供合作伙伴在后续接入。

        当然这也是商汤的优势所在,只是能够领先多久,能够带来多少实质营收,并不明朗。


算力不等于实力

        短期来看,这一轮AI大模型的商业竞赛中,算力无疑是重中之重。

        AI大模型与传统“回复式”AI不同,它是由许多个简单的神经元组成。这些神经元之间相互连接,形成了一个庞大的神经网络。这些神经网络需要从大量的数据中学习,以便更好地完成任务,例如自然语言处理、图像识别等。

        而在训练时又涉及到大量的矩阵运算、梯度计算和参数更新等复杂的计算过程。这些计算需要在大规模的数据集上进行,以便模型可以学习到足够多的信息。庞大的计算量,自然需要使用高性能计算机、GPU集群等强大的计算资源来完成。

        这也是全球入局GPT的企业,疯狂抢购GPU硬件的原因。

        商汤恰恰拥有极为充足的GPU储备,“在去年停售之前就有1万张A100芯片了,完全可以覆盖训练一个千亿参数量的语言模型的消耗。”

        业内人士表示,“要训练像ChatGPT这样的生成式AI,所需的算力至少需要1万张英伟达A100芯片的支持。”据公开信息统计,国内目前仅有6家公司具备这样的硬件实力,分别为商汤、百度、腾讯、字节、阿里、幻方。

        只是商汤与几个互联网大厂的算力储备相比也有较大差距。相关消息显示,当前阿里云云上至少有上万张A100,整体能够达到10万张,阿里集团所拥有的量级为阿里云的5倍;百度则是有自研量产的GPU芯片,更无需担心算力问题。

        而除了英伟达专用显卡外,商汤也有采购国内的GPU。据悉,在其大装置里面已经适配了很多寒武纪和海光的GPU卡。

        不过,国产GPU适配也是个问题。一位业内专家表示,“当前的大模型训练,确实是只有A100与A800能够胜任,国内GPU卡的易用性与性价比都无法去比较”。即当前国产GPU不太能够支持超大模型的训练,还需要投入更多去进行优化。

        那么也就是说,未来一段时间内,高端GPU受综合因素影响短缺,还可以通过丰富的训练经验、更大的成本投入来进行掩盖;但从长期来看,如何能持续获得高端GPU,才是商汤需要考虑的问题。如果禁运依旧存在,并且国产GPU无法适配超大模型的训练,那么与国际尖端AI企业、最先进的大模型之间的距离,将会被持续拉开。

        一方面,不能否认商汤在算力储备上的硬实力,但另一方面,也不能忽视商汤在优质数据语料上的缺失。

        “在国内,大部分高质量中文语料都在行业内,而不在公域的互联网内,即便是大厂也很难拿到细分行业的关键数据。”一位AI公司联合创始人称。

        如果数据不足,模型就无法进行更多面的学习。这可能导致模型的准确性下降,使其无法很好地完成任务。缺失的数据可能使模型更加容易受到对抗性攻击和干扰,导致鲁棒性降低,使其更容易被攻击者攻击和欺骗。

        好在商汤的商业模式更偏向算力提供,客户可以自己上传数据进行训练。但这就会涉及到另一个问题,大厂有自己的大模型,没有理由与商汤合作,而一些中小厂因为比较垂直,数据量并不算多,在构建大模型并不困难的大背景下,结合算法效率的优化,完全可以自己组建大模型团队进行训练。这样还能保证自己的数据安全,毕竟谁也不会想将自己最核心的数据交于他人。

        此外,国内的AI大模型正在进入“百模大战”,除了百度、华为、阿里这些大厂外,昆仑、知乎这些腰部企业也都陆续“入局”。在「科技新知」看来,未来一个比较明显的趋势是,各行业、领域的头部企业几乎都会推出更为垂直的大模型产品,赛道内的小厂也更倾向选择站在自己行业巨人的肩膀上。届时商汤能够把自身摆在什么位置,尚值得思考。

        当然这只是依据预期推测得出的结论,大模型发展势必会给商汤带来新的增长点,只是这又能否改变其长期亏损的困境?


日日新解不了老问题

        虽然商汤布局AI多年,在计算机视觉等一些细分领域有着不错的积累,但此前受限于商业化落地、研发投入等因素,其盈利能力一直堪忧。

        2022年商汤科技实现营业收入38.09亿元,同比减少18.97%;实现归母净利润-60.45亿元,同比增长64.73%,经调整净亏损同比增长233.9%至47.36亿元。

        这表明其去年内的业绩遭遇了较大程度的下滑。一方面,两大主要业务智慧城市及智慧商业贡献的收入,出现下滑导致了净亏损额的扩大;另一方面,亏损加剧是受研发投入、金融资产及合约资产减值,及外汇亏损净额所致。

        整个2022年,商汤在研发支出上合计40亿元,同比增长11%;研发人效相比去年进一步提高90%,人均每年研发模型数9.35个;累计商用模型数提高了93%至6.7万个。

        纵然有AI企业特有的“烧钱”标签加持,但面对逐年升高的研发投入,以及持久无法兑现的业绩,商汤的投资者们并没有太多耐心。

        去年6月30日,商汤上市前投资者、基石投资者股权基本解禁,而也就是在解禁后短短一天之内,商汤科技的市值蒸发了915亿港元。随后半年,阿里、软银、环球资本等投资方已纷纷减持套现。

        如果与OpenAI的经历放在一起来看,从2019年微软向其注资10亿美元开始,已经“烧”了130亿美元也还未换来乐观收入。根据研究机构PitchBook的数据,OpenAI今年有望产生仅2亿美元的收入。

        在业绩不佳,资本市场不看好的前况下,商汤比起同期入局的互联网巨头而言,未来能否有持续资金投入,是个不小的疑问。

        乐观的是,商汤大模型可以很好地赋能当下四大主要业务,并且借助此前的客户渠道,将日日顺大模型体系推销出去,但最终能够带来多少的增值,也还有待市场检验。

        上市后的商汤不断向资本市场讲着故事,从智慧汽车到元宇宙,再到如今的大模型,几乎覆盖到了每一个大风口,但结果是概念越造越多,钱越赚越少。并且资本市场一旦流动性降低,对讲故事模式就越来越没兴趣,而在大模型时代具备先天优势的商汤,能否一改常态,倒也不妨多给一些耐心。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/424751.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

语句覆盖率\条件覆盖率\路径覆盖率\分支覆盖率的区别您知道吗

代码覆盖率 代码覆盖率是一种度量,它描述了程序源代码已经过测试的程度,它可以帮助我们评估测试执行的效率, 简单来理解代码覆盖率就是单元测试中代码执行量与代码总量之间的比率。代码覆盖率主要包括语句覆盖率、分支覆盖率、条件覆盖率和路…

【Linux】实现守护进程 | 以tcpServer为例

本文首发于 慕雪的寒舍 本文将以tcp服务器代码为基本,讲述如何将进程守护进程化,后台运行 1.守护进程 所谓守护进程,就是和其他进程没有关系的进程;其独立运行于系统后台,除非自己退出或收到信号终止,否则…

逆向-还原代码之(*point)[4]和char *point[4] (Arm 64)

// source code #include <stdio.h> #include <string.h> #include <stdlib.h> /* * char (*point)[4] // 数组指针。 a[3][4] // 先申明二维数组,用它来指向这个二维数组 * char *point[4] // 指针数组。 a[4][5] // 一连串的指针…

编程语言,TIOBE 4 月榜单:黑马出现了

TIOBE 4 月榜单已经发布了&#xff0c;一起来看看这个月编程语言排行榜有什么变化吧&#xff01; C 发展依旧迅猛 在本月榜单中&#xff0c;TOP 20 的变动不大&#xff0c;Python、C、Java 、 C 和C#依然占据前五。甚至排名顺序都和上个月一样没有变动。 同时&#xff0c;Rus…

【图形学】多边形裁剪算法综述

系列综述&#xff1a; &#x1f49e;目的&#xff1a;本文是个人学习多边形裁剪知识整理的&#xff0c;整理期间努力理解论文作者含义&#xff0c;并增加了自己的详述和注解。 &#x1f970;来源&#xff1a;材料主要源于多边形裁剪相关论文进行的&#xff0c;每个知识点的学习…

第三十一天 Linux介绍和基础命令

目录 1.前言 1.1 什么是Linux 1.2 为什么要学Linux 1.3 学完Linux能干什么 2.Linux简介 2.1 主流操作系统 2.2 Linux发展历史 3. Linux安装 3.1 安装方式介绍 3.2 安装VMware 3.3 安装Linux 3.4 网卡设置 3.5 安装SSH连接工具 3.6 Linux目录结构 4.Linux常用命令…

洛谷P8772 [蓝桥杯 2022 省 A] 求和 C语言/C++

[蓝桥杯 2022 省 A] 求和 题目描述 给定 nnn 个整数 a1,a2,⋯,ana_{1}, a_{2}, \cdots, a_{n}a1​,a2​,⋯,an​, 求它们两两相乘再相加的和&#xff0c;即 Sa1⋅a2a1⋅a3⋯a1⋅ana2⋅a3⋯an−2⋅an−1an−2⋅anan−1⋅anSa_{1} \cdot a_{2}a_{1} \cdot a_{3}\cdotsa_{1} \cd…

SpringCloud学习(五)——Nacos配置管理

文章目录1. Nacos实现配置管理2. 微服务拉取配置2.1 拉取优先级2.2 导入依赖2.3 添加注解2.4 配置热更新3. 使用 ConfigurationProperties3.1 使用注解3.2 测试4. 多环境共享配置4.1 添加依赖4.2 配置文件4.3 更改属性4.4 测试4.5 配置优先级1. Nacos实现配置管理 当微服务部署…

【测试面试】吐血整理,大厂测试开发岗面试题(1~4面),拿下年40w...

目录&#xff1a;导读前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结&#xff08;尾部小惊喜&#xff09;前言 自动化测试面试题&am…

scConverter 文档转换 DLL / SDK 2023.3.21 Crack

scConverter 转换 DLL / SDK scConverter 是一个DLL&#xff0c;可以将PDF、DWF、Gerber、CGM、TIFF、CALS、PLT、PNG和JPEG文件转换为大量输出格式。可用的输出格式列表包括Adob​​e PDF、PDF/A、DXF、DWF、CALS、TIFF、PLT和PNG。您将在下面找到所有可用输入和输出格式的完整…

计算机算法设计与分析(第5版)PDF

《计算机算法设计与分析&#xff08;第5版&#xff09;》是2018年电子工业出版社出版的图书&#xff0c;作者是王晓东。 整本书的结构是&#xff1a;先介绍算法设计策略思想&#xff0c;然后从解决经典算法问题来学习&#xff0c;通过实践的方式去学习算法。 网络上许多的算法…

天梯赛-模拟赛-4.16

L2-041 插松枝 人造松枝加工场的工人需要将各种尺寸的塑料松针插到松枝干上&#xff0c;做成大大小小的松枝。他们的工作流程&#xff08;并不&#xff09;是这样的&#xff1a; 每人手边有一只小盒子&#xff0c;初始状态为空。 每人面前有用不完的松枝干和一个推送器&#x…

【鸿蒙应用ArkTS开发系列】- Web组件使用讲解

目录 一、Web组件介绍 二、创建组件 权限列表 三、设置样式和属性 四、添加事件和方法 五、访问本地Html 1、本地html文件创建 2、本地html文件加载 2、JS对象注入&#xff0c;Html使用JS对象调用客户端方法 3、客户端调用本地Html网页中的JS方法 使用鸿蒙的ArkUI框架…

Lesson 10.1 超参数优化与枚举网格的理论极限和随机网格搜索 RandomSearchCV

文章目录一、超参数优化与枚举网格的理论极限1. 超参数优化 HPO&#xff08;HyperParameter Optimization&#xff09;2. 网格搜索的理论极限与缺点3. 建立 benchmark&#xff1a;随机森林中枚举网格搜索的结果二、随机网格搜索 RandomizedSearchCV1. 基本原理2. 随机网格搜索的…

使用chatgpt实现微信聊天小程序(秒回复),github开源(附带链接)

文章目录前言效果展示原理说明服务器端代码说明微信小程序代码说明代码链接总结前言 我在前一段时间突发奇想&#xff0c;就使用java来调用chatgpt的接口&#xff0c;然后写了一个简单小程序&#xff0c;也上了热榜第一&#xff0c;java调用chatgpt接口&#xff0c;实现专属于…

select 排序qsort排序

目录 1.希尔排序的时间复杂度 3.有技巧的选择排序&#xff1a;堆排序 4.排序的种类 5.直接插入排序和冒泡排序 6.快速排序 7.希尔排序 堆排序 和快排的区别 8.为什么相遇位置一定比key小 9.快排的优化 11.快排递归写法的不足 12.快排的非递归解法 1.希尔排序的时间复杂…

C++11新特性(上)

357089 文章目录1. 统一的列表初始化1.1 &#xff5b;&#xff5d;初始化1.2 std::initializer_list2. decltype3. 右值引用和移动语义3.1 左值引用和右值引用3.2 左值引用与右值引用比较3.3 右值引用使用场景和意义3.4 右值引用引用左值及更深入的使用场景3.5 完美转发4. 新的…

“编程式 WebSocket” 实现简易 online QQ在线聊天项目

目录 一、需求分析与演示 1.1、需求分析 1.2、效果演示 二、客户端、服务器开发 2.1、客户端开发 2.2、服务器开发 一、需求分析与演示 1.1、需求分析 需求&#xff1a;实现一个 online QQ在线聊天项目&#xff0c;当用户登录上自己的账号后&#xff0c;将会显示在线&…

我用nodejs和electron实现了一个简单的聊天软件-----chat 开源

翎&#x1f3a5;项目演示地址 &#x1f517;https://www.bilibili.com/video/BV1Fg4y1u76d/ 希望观众老爷给个免费的三连支持一下新人up主 ♻️项目基本介绍 翎是基于electron(vue2)和nodejs实现的简单聊天软件,其中用websocket和http进行通讯传递,数据库使用了mysql数据库,…

二进制插入与查找组成一个偶数最接近的两个素数

二进制插入 链接&#xff1a;二进制插入_牛客题霸_牛客网 (nowcoder.com) 描述&#xff1a;给定两个32位整数n和m&#xff0c;同时给定i和j&#xff0c;将m的二进制数位插入到n的二进制的第j到第i位,保证n的第j到第i位均为零&#xff0c;且m的二进制位数小于等于i-j1&#xff…