科技云报道:国内AI大模型鏖战,上演科技罗生门

news2024/11/28 22:46:11

科技云报道原创。

ChatGPT的狂热从年初持续至今,这份狂热不仅仅来源于用户层,从业者、投资人以及企业可以说有过之无不及。

于是,这些投资人、从业者以及企业将狂热转化,宣布入局大模型赛道并推出相关产品。一时间,大模型赛道好不热闹。

毫不夸张地说,从3月份至今,国内几乎每一周都有企业推出自己的大模型产品。上一周,科大讯飞公布了星火认知大模型后不久,云从科技就被爆出即将在5月18日发布大模型产品。

随着大模型产品的推出,其背后公司股价也是一路飘红。更为奇幻的一幕出现了,只要是沾上了大模型的边,公司股价就会蹭蹭上涨。

在这里插入图片描述

拿云从科技来说,尽管只是放出了产品发布的消息,云从科技近几天的股价也是一路向红。此前,在概念股疯长的阶段,得益于其AI相关业务属性,云从科技的股价早已经历经过一轮上涨,股价从26元每股涨至61.8元每股。

这又燃起了更多人对大模型的向往。周而复始间,国内大模型可以说是“百家争鸣”。但问题紧跟着出现,这些企业或者是人做入局大模型的原因何在?是与公司业务紧密相关,还是个人追求,又或是单纯的蹭热度?
另外,在大模型遍地开花的现在,又有哪些企业真正做到了场景落地,又有哪些是严重同质化,会被轻易取代?

国内大模型市场,俨然像是开启了一场科技盛宴,但其中鱼龙混杂的参会人员,让这场盛宴变得更为扑所迷离。

四大派系

三月份以来,两个时间节点可以说是让媒体人刻骨铭心。

一个是三月的第三周。那一周,周二深夜,ChatGPT4发布。周四下午,百度文心一言发布。紧接着凌晨时分,微软宣布将ChatGPT能力接入Office全家桶。

另外一个是4月18日,这一天,6个关于大模型的重要消息密集发布:钉钉宣布正式接入阿里“通义千问”大模型;字节跳动旗下火山引擎发布自研DPU(数据处理单元)芯片;斑马智行宣布接入“通义千问”大模型,智己汽车成为首个上车品牌…

“键盘敲到要冒烟”可以算是当时媒体人的真实写照。不过,尽管写稿写到绝望,依旧掩盖不住地兴奋之情。

可以说,媒体人的状态侧面显露了当时的盛况。

据不完全统计,截至目前,我国已有超过40家公司、机构发布了大模型产品或公布了大模型计划。当然,除了这超40家的企业、机构之外,还有不少企业和互联网大佬都透露出自己正在做大模型相关的产品的消息。

为了更好的分析企业的出发点、优劣势,我们从企业的性质出发,将这些已经或者入局在做大模型产品的企业和人分为这四大派系:互联网科技大厂以及科研机构、初创公司以及互联网大佬、AI企业(包括上市公司和创业独角兽)、跨界企业。

派系一:互联网科技大厂以及科研院所

互联网科技大厂和科研院所可以算是国内AI大模型领域的领头羊。这些大厂和机构拥有强大的技术实力和庞大的数据资源,同时互联网科技大厂还可以通过其它业务实现AI大模型的商业化应用。

比较典型的就是,百度有文心大模型以及文心一言;阿里有通义大模型和通义千问;腾讯有混元大模型和混元助手;华为有盘古大模型;字节跳动有飞书“My AI”;京东有ChatJD;360有360智脑;科大讯飞有讯飞星火等。

另外,科研院所的代表则是复旦大学邱锡鹏教授团队的对话式大语言模型MOSS、上海人工智能实验室的天气预报大模型“风乌”、清华大学的GLM-130B、北京智源人工智能研究院“悟道2.0”等等。

值得注意的是,这些互联网大厂的大部分模型已经开放了内测名额,普通受众也可以通过报名的方式体验大模型。

派系二:AI企业(上市公司和创业独角兽)

AI企业是中国AI大模型领域的另一个重要力量。这些企业在技术创新和商业模式上具有很强的专业性和深度,同时也可以通过资本市场的支持来加速其业务拓展。例如,旷视科技、商汤科技、云从科技等企业在图像识别、人脸识别等领域中均表现不俗。

具体来说,商汤科技发布了日日新SenseNova和商量、毫末智行发布了自动驾驶生成式大模型DriveGPT、竹简智能发布了魔力写作等等。

值得注意的是,目前AI企业推出的大模型更多是面向B端,因此大部分并未开放给普通用户测试。

派系三:初创公司以及互联网大佬

初创公司和互联网大佬是中国AI大模型领域的另一个重要力量。但目前,宣布入局大模型的互联网大佬还并未推出具体的产品。不过,凭借着其互联网老兵的身份以及技术实力等,他们依旧可以拿到天使轮融资,并且吸引很多人才。

王小川和王慧文即是如此。有意思的是,王小川为了宣布入局大模型一事,在搜狐大厦召开了媒体发布会,而楼上,就是王慧文做大模型的办公地点。

另外,有一个不得不说的前提,这些互联网老兵拿到的第一笔钱即5000万美金。此后,5000万美金也成了入局大模型的一道门槛。

派系四:跨界企业

从其他领域跨界的企业是中国AI大模型领域的一大特点。这些企业在自身领域内拥有丰富的数据资源和技术经验,通过AI大模型技术的运用,可以实现多个领域之间的交叉应用。例如,教育行业的学而思发布了MathGPT,专攻数学大模型,主要就是与其教学业务相结合。

为什么要做大模型?

梳理完企业后,不得不抛出一个问题,为什么要做大模型?

笼统来说,无外乎有下述几点原因:大模型可以为企业带来很多商业机会和收益,AI大模型是当前AI技术发展的重要方向之一,各个企业加入到竞争中也符合市场趋势和国家发展需求。

不过,具体来看,这四大派系的做大模型的原因、以及目的还是有所不同。

派系一:互联网科技大厂和科研院所

科研院所不必多说,学术研究使然,重点在于互联网科技大厂。

首先是,互联网科技大厂必须要做大模型。

就百度来说,从2017年李彦宏提出All in AI后,百度的业务巨轮从此前的搜索引擎和互联网业务转向了AI技术落地自动驾驶、智能云。尽管如此,在商业化落地上,AI目前仍未能取得突破性进展。从百度2022年年报来看,百度的收入基本盘依旧是以广告为主的互联网业务收入。

百度不得不去做大模型,争分夺秒去推文心一言。当然,百度也有能力去做文心一言。百度在AI领域的积累——海量数据、算力、算法以及预训练大模型,已经具备了生成类似项目的条件。

百度做的目的,已经逐渐显露出来——与自身业务结合,寻求技术落地,实现商业化。如与搜索引擎结合,或许会带来互联网广告收入形式的革新,以及出现新形式的增值服务,有不小的想象空间。

此外,百度还发公告称,小度将融合文心一言的全面能力,打造针对智能设备场景的人工智能模型「小度灵机」,应用到小度全系产品。更为重要的是,百度另一大业务,智能汽车中的车载场景同样如此。

阿里、腾讯、甚至京东等大厂都可以以此类推。

总结来说,互联网科技大厂拥有丰富的数据资源和高算力支持,这也为它们在AI大模型领域拥有独特的优势。在AI大模型的研发和应用中,大数据和算力是至关重要的,而互联网科技大厂在这方面已经具备了很高的技术实力和经验积累。同样,他们拥有广泛的业务场景,可以在技术支持下实现场景的落地。

派系二:AI企业(上市公司和创业独角兽)

AI技术的专业公司,这些企业在AI大模型领域拥有很强的技术实力和经验积累。

毫末智行官宣首个应用GPT模型和技术逻辑的自动驾驶算法模型,中文名“雪湖·海若”。这不得不引人发文,自动驾驶也需要GPT么?实际上,自动驾驶进入3.0时代后,不再是硬件或者软件驱动,不再是测试道路下的数据驱动,而是以真实道路行驶场景为核心的数据驱动。AI依然是核心技术,与1.0、2.0时代不同就在于AI对数据的要求发生了质变,“大模型”成为新的技术基石。

派系三:初创公司以及互联网大佬

初创公司通常具有较为灵活的运营模式和创新思维,更容易迅速适应市场需求并开展相应的业务。在AI大模型领域,初创公司可以通过创新的技术和业务模式来获取商业机会。

王小川在入局大模型赛道后,就一直强调未来发力的方向并不是像OpenAI一样去做AGI(通用人工智能),而是垂直在某些特定的领域去做大模型,并实现落地应用。

派系四:跨界企业

跨界企业不用多说的是,会与自身业务相结合,比如说垂直到教育、医疗、金融、房地产等领域。

不过,需要警惕的是,不少跨界的企业大有蹭热度,拉高股价的嫌疑。毕竟,能够做出真正实用的大模型离不开高额的投入、精进的算法、海量数据等。

泡沫横生,再现罗生门

大模型火热,正面展现了国内的科技热情,阴面却是泡沫横生。

在ChatGPT出现后,国内最开始传出入局大模型的企业,其实只有互联网科技大厂和AI企业。毕竟,这些企业有着AI背景,要么有数据、要么有算法、要么有资金投入或者是人才投入。

但是随着ChatGPT在聊天对话、创作剧本、撰写研报、应用编程等方面表现出的能力惊艳四座后,不少其他赛道的企业,或者是靠近AI边缘业务的企业也纷纷下场,去推出大模型产品或者是透露出做大模型的战略规划。

但这无疑主动放大了市场需求,打乱了市场发展节奏。最明显的表现,除了企业纷纷下场去做大模型外,还间接拉动了相关产业链的需求。

AI大模型作为一项前沿技术,其产业链包括了算力、数据、算法等多个环节。在这些环节中,算力和数据是AI大模型发展的关键。

当前,国内算力和数据产业的发展已经进入到一个快速发展的阶段。云计算、大数据、物联网等技术的发展为AI大模型的应用提供了足够的技术支持。同时,众多企业也纷纷加入到数据和算力产业的竞争中。

就拿“造芯”企业来说。据企查查数据显示,2020年新增芯片相关企业2.37万家,同比增长160.69%;2021年新增4.79万家,同比增长102.30%;而仅2022年上半年,新增芯片相关企业就高达3.08万家。

除了芯片企业疯狂冒出外,最具代表性的AI芯片企业寒武纪的股价也一改往日一蹶不振的颓势,逆势向上。3月,寒武纪的股价依旧处于低谷期,每股70元上下,到如今三个月不到的时间,涨到了逼近200元每股的价格,市值也直接涨到了825亿元。

另外,招银国际发表研报指出,因近3个月ChatGPT对相关概念股股价的拉动,芯片、光模块、PCB、服务器年初至今已各涨65%、146%、45%、62%。

但大模型的需求真就如此之大么?产业链的需求有没有虚火么?这个答案显而易见。虚火旺盛,泡沫横生,不少投机者也在其中浑水摸鱼,市场愈发混乱。

这一幕,似曾相识。当初AlphaGo出现后,AI相关企业也如雨后春笋般拔地而起。但一轮又一轮洗牌后,留下来的企业依旧陷入了低谷期,找不到落地场景,商业化受阻。直到2022年年底,这些依旧是剩下来的AI独角兽们一直存在的问题。

ChatGPT就像曾经的AlphaGo一样,一石激起千层浪。但即便是惊涛骇浪后,依旧归于平静。如今的大模型,是时候该反思了。

【关于科技云报道】

专注于原创的企业级内容行家——科技云报道。成立于2015年,是前沿企业级IT领域Top10媒体。获工信部权威认可,可信云、全球云计算大会官方指定传播媒体之一。深入原创报道云计算、大数据、人工智能、区块链等领域。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/528451.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

百万年薪架构师甩出的SpringBoot趣味实战手册,GitHub标星81.6K

前言 本书内容很全面,囊括了Spring生态的常用技术,如MVC、持久化、 Redis、定时任务、消息队列、搜索引擎。本书知识讲解由浅到深,循序渐进,从Hello World讲到Spring核心原理;技术讲解深入浅出,总能以“接…

无线传感网络的节点部署覆盖及能源消耗问题研究(Matlab代码实现)

目录 💥1 概述 📚2 运行结果 🎉3 参考文献 👨‍💻4 Matlab代码 💥1 概述 随着微电子技术的不断发展,被称作传感器节点的微小智能嵌入式设备不断的被开发出来,推动了无线传感器网络的发展。一个典型的无…

Matlab Python 如何在figure上画出表格【优化】

之前写过一次博客 Matlab&Python 如何在figure上画出表格 这次是对该博客的优化 图的结果见下相对之前有很大的进步: coding 在这里包含数据的绘制,表格的添加,设置表格的大小、位置等 clc clear close all; path(path,E:\new_matlab_Too…

如何获取不同分区模板的基因表达矩阵,abagen: Allen 大脑图谱遗传数据工具箱的使用笔记

abagen: Allen 大脑图谱遗传数据工具箱的使用笔记 介绍使用abagen工具箱进行标准化处理和报告代码实例——获取Schaefer2018_400Parcels_7Networks的基因表达数据基于surf空间的模板基于volume空间的模板参考文献介绍 基因表达从根本上塑造了人类大脑的结构和功能结构。像Allen…

【Linux】shell编程—数组

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 一、shell数组1,数组的概念2.数组的定义 二、Shell数组操作1. 获取数组的所有元素的列表2. 获取数组的所有元素下标3.取数组的元素个数4. 获取数组的某个元素的值5.…

Jmeter 压测 QPS

文章目录 1、准备工作1.1 Jmeter的基本概念1.2 Jmeter的作用1.3.Windows下Jmeter下载安装1.4 Jmeter的目录结构1.5 启动1.6 设置中文1.6.1 设置调整1.6.2 配置文件调整(一劳永逸) 2、Jmeter线程组基本操作2.1 线程组是什么2.2 线程组2.2.1 创建线程组2.2…

原型part学习NeurIPS2019

当我们面临具有挑战性的图像分类任务时,我们希望通过分解part来解释推理。每一类别的更多原型证据有助于做出最终分类决策。作者提出一种深度网络架构:Prototypical Part网络即ProtoPNet。网络通过寻找原型part来解释图像,并基于原型part进行…

同步 Swagger URL问题, 用这个插件就可解决

这个开源的 API 管理工具叫 Postcat, 支持从 Swagger URL 增量同步 API 数据到 Postcat。 使用 进入 API 模块,鼠标移动到主按钮加号,下拉看到从 Swagger 同步 URL 的选项。 填写完配置点击立即同步即可同步 API 数据。 同步规则 新的数据覆盖旧的数据…

PHP语言调用api接口,电商平台商品详情接口(封装可高并发)

PHP是为Web而生的语言,它提供了一些强大的内置函数来处理HTTP请求和响应。PHP为开发人员提供了一些Web开发工具,包括HTML、CSS、JavaScript以及各种数据库的连接和互动。与其他Web开发工具相比,PHP可以更加高效地运转与发挥作用。 PHP表现出…

Matlab 非线性迭代法(3)阻尼牛顿法 L-M

高斯牛顿法详解_我只是一只自动小青蛙的博客-CSDN博客 一、思想 先看一下牛顿高斯迭代法的缺点: 1、在计算的过程中可能会出现奇异矩阵(不满秩),比如:J(k)​)TJ(k) 为病态矩阵的时候就不能得到正确的解,或…

如何提升性能测试效能

上周六应邀在天津devops峰会的质量内建专场做了一次分享,主题是《稳定性保障利器:全链路压测》。 其中关于全链路压测对质量内建的意义,我做了一个总结,如下图所示。本文基于下图做了展开描述,仅供参考。 如何理解性能…

从零开始Vue3+Element Plus后台管理系统(八)——模仿禅道做一个Vue3版本的高级查询组件

暗黑模式 使用 Vue3element Plus 简单模仿了禅道系统的高级搜索组件,说简单也有点复杂,还没有完全开发完,但是大体架子有了,剩下一些功能点继续coding。边开发边记录吧,因为这个相比之前的内容确实复杂一些&#xff0c…

Java的基操,基操(一)

🔥二进制🔥二进制和十进制的转化🔥注释🔥标识符🔥关键字/保留字🔥变量(variable) 🔥二进制 二进制,是计算技术中广泛采用的一种数制,由德国数理哲学大师莱布尼茨于 1679 …

Helm chart 常用命令以及原理和生产实践

问: 到哪里去搜索helm package? 答: artifacthub.io Helm 的实质就是搞一些模版,最终依据这些模版生成k8s的系列yaml文件(deployemnt,service,secret,map等等),从而在k8s上能够简单部署出完整应用。可以用helm template查看最终生成的k8s部署文件。 helm version…

MQTT客户端应用编程及接口分析

MQTT客户端应用编程及接口分析 MQTT协议简介 MQTT是一个基于客户端-服务器的消息发布/订阅传输协议。MQTT协议是轻量、简单、开放和易于实现的,这些特点使它适用范围非常广泛。 客户端服务端安装 1.安装 sudo apt-add-repository ppa:mosquitto-dev/mosquitto-…

SpringCloud_服务注册中心_Consul(八)

SpringCloud_服务注册中心_Consul(八) 分为五部分 Consul简介 安装并运行Consul 服务提供者 服务消费者 三个注册中心异同点 Consul简介 官网:https://developer.hashicorp.com/consul/docs/intro 是Go语言写的 Consul是一套开源的分布式服务发现和配置管理系统&am…

GB50312-2016标准中需要检测的参数(AEMFLUKE)含双绞线和光

很多同学经常搞不清GB50312-2016标准的规定测试参数,或者说和测试设备对不上号。特意从标准中摘抄出来,供大家参考。 ACR-F(Attenuation to Crosstalk Ratio at the Far-end) 衰减远端串音比 ACR-N(Attenuation to Crosstalk Ratio at the Near-end)衰…

用于申威Alpha指令集处理器CModel裸机(不带操作系统)的CoreMark性能测试程序源码编译流程

CoreMark是一个综合基准,用于测量嵌入式系统中使用的中央处理器(CPU)的性能。它是在2009由eembc的shay gal-on开发的,并且试图将其发展成为工业标准,取代过时的dehrystone基准。代码用C编写,包含以下算法:列表处理(增删…

如何在Colab中使用gpu资源(附使用MMdet推理示例)

如何在Colab中“白嫖”gpu资源(附使用MMdet推理示例) Google Colab简介 当今,深度学习已经成为许多人感兴趣的话题,Google Colab(全称为Google Colaboratory)是Google推出的一个强大的云端 notebook&…

《微服务实战》 第七章 Spring Cloud 之 GateWay

前言 API 网关是一个搭建在客户端和微服务之间的服务,我们可以在 API 网关中处理一些非业务功能的逻辑,例如权限验证、监控、缓存、请求路由等。 1、通过API网关访问服务 客户端通过 API 网关与微服务交互时,客户端只需要知道 API 网关地…