科技云报道:卷完参数卷应用,大模型落地有眉目了?

news2025/1/27 12:36:55

科技云报道原创。

国内大模型战场的比拼正在进入新的阶段。
在这里插入图片描述
随着产业界对模型落地的态度逐渐回归理性,企业客户的认知从原来的“觉得大模型什么都能做”的阶段,已经收敛到“大模型能够给自身业务带来什么价值上了”。

2023 年下半年,不少企业将目光锁定在行业模型上。如何降低大模型使用门槛,让大模型真正在行业里用起来,是业内普遍关注的焦点。

由此,国内厂商在大模型上的认知也在逐步统一——百度创始人李彦宏认为“卷大模型没有意义,卷应用机会更大”;腾讯高管汤道生表示“大模型只是开端,行业应用才是未来”;华为云CEO张平安明确大模型“为行业而生,聚焦B端行业客户”,更直言盘古大模型“没时间作诗、没时间聊天”。

这也意味着,更多大模型厂商将开始卷应用,这会是今年竞争最为激烈的板块之一。

大模型行业落地渴望 “开箱即用”

过去半年,大模型To B的落地应用摸索已经度过尝鲜期。

对于企业而言,他们希望更快使用上大模型,在市场竞争中获得优势。但大模型的技术门槛很高,因此企业并不会从头开始训练自己的基础大模型,更多是基于某个成熟的大模型做二次开发。

然而,想借用好现有的通用大模型,企业仍面临着三大难题:

首先,各类企业的场景需求、复杂程度、智能化程度千差万别,大模型能力边界与企业的场景需求如何快速、准确匹配;

其次,从模型到应用中间还需要诸多技术桥梁,诸如SFT、RAG、LangChain、Agent等技术,如何与大模型有机组合达成最优解;

第三,企业过去积累了大量IT设施、软件、企业数据、业务流程,如何让大模型与现有设施结合的情况下,保障企业数据信息安全。

换句话说,企业无论是基于开源或闭源的通用大模型来做行业化落地,都远没有到达开箱即用的程度。

不过这也成为大模型厂商在竞争中突围的方向,除了要在底层技术上继续夯实外,补足行业Know-how和成功经验也是重中之重。

在百度和阿里的发展经验中,似乎可以给大模型行业一些启示。

其中,百度用搭建行业模型、垂直场景模型和应用的方式赋能具体行业。

2023年3月,百度智能云推出千帆大模型平台,从算力、模型、到应用层层结合,为企业提供一整套大模型开发工具。

一年后,基于一线经验积累和实战反馈,百度智能云抽取出“研、产、供、销、服”环节中的典型场景,于近日推出了5款全新模型和7款应用产品,来解决企业用好大模型的“三大难题”。

以此次发布的国内首款大模型全面重构的智能客服——百度智能云客悦为例,相比传统客服,客悦可结合大模型的理解、推理、记忆能力,实现更友好的对话、更高效的运营。
在这里插入图片描述
比如,当用户提问“我的车总有吱吱吱的声音”,传统客服无法理解“吱吱吱”这种口语化的表达。

而客悦在大模型的加持下,会继续追问用户该问题持续的时间和频次,并通过推理反馈用户,可能是皮带老化或者张紧轮松动导致,建议到店检查。

若用户反馈没时间检查,客悦还会基于自身知识库,提醒不检修可能导致车辆失去动力、长期会引起发动机故障等问题,引起用户重视,守护行车安全。目前,用户问题自助解决率已超过90%。

在运营效率方面,上一代的传统智能客服进行业务办理、知识咨询、闲聊等能力,需要花费的人效约100人/天,而客悦仅需约15.5人/天,大模型客服运营效率提升6倍。

目前为止,百度智能云已经布局了电力、汽车、金融、政务等十余个行业大模型,并取得了不错的效果,客户中也出现了国家电网、浦发银行、泰康、吉利等知名企业。

相比之下,阿里采用了另一套逻辑:赋能于内部已有应用和服务,再技术外溢至行业客户。

除已经发布“通义千问”大模型外,夸克也发布了自研大模型,应用于通用搜索、医疗健康等场景;后加之内部推行“云钉一体”,作为办公一体化平台,钉钉上线AI魔法棒,推出17项与AI相关服务,也为通义千问大模型助力颇多。

同时,阿里也提供了不少类似于Anyone fit类型的图像模型解决方案,其工具十分贴合电商需求场景。

因在电商、物流层面的深厚积累,让阿里拥有了对不同领域的行业特点、业务流程和客户需求有了充分的认识。

基于此,阿里的产品便可以在深度了解用户需求的基础上,为客户提供定制化的解决方案,满足其业务需求,提高其业务效率和竞争力。这让大模型有了其应有之意,不至于沦落为“无源之水”。

头部大厂领跑大模型行业落地

在大模型的 toB 竞争中,本质而言,是取决于客户企业对商业价值的认知。和其他行业一样,在大模型领域,“多快好省” 和 “物美价廉” 难以两全,匆忙上阵的结果可能是一地鸡毛。

因此,企业客户在大模型的选择上更为审慎。尽管大模型的应用还在初期,但企业在模型选择、模型可靠性、应用成本、使用门槛等层面,已有各种考量和顾虑。

百度集团副总裁侯震宇曾在采访中表示:“最终能够让大模型服务推广开的只有两个原因:第一个是模型效果,第二个是成本。”

以百度智能云为例,其大模型的调用和训练成本一直在下降。文心一言开启内测后,一个月就迭代了四次。

根据百度披露的数据,文心一言的推理成本如今只有发布之初的十分之一,在发布的3个月内推理效率提升10倍,模型推理性能提升50%,模型算力利用率提升1倍。

侯震宇透露,随着技术迭代带来的成本下降,不管是在模型使用,还是在模型微调甚至在模型再训练方面,“价格应该不会成为大家使用或者拥抱大模型的瓶颈”。

与此同时,在SuperCLUE中文大模型7月最新榜单中,百度的大语言模型产品文心一言以62分的总成绩一举超越越GPT-3.5-turbo(59.79)和ChatGLM-130B(59.35)等,稳居行业头部。

除了成本和效果,大模型从开发、应用到调优的每一个环节如何落地,如何基于数据安全合规进行私有化部署等,都是企业客户重点关注的问题。

例如,很多企业需要的聊天机器人,并不是选择具备强大通用能力的大模型就可以,还要求大模型厂商能够提供易用性、完备度、安全性、稳定性都有保证的工具链。

在关注大模型技术栈完备性的同时,企业还需要选择适合自身业务的大模型厂商——既有充分的产业应用经验积累,也能够将技术应用到实际业务场景中。

目前,百度智能云推出的千帆大模型平台就拥有较为全面的数据服务能力,从生成、标注、回流再到模型训练(Post-pretraining、Fine-tuning、Prompt-tuning)、模型评估(主观评估、客观评估)和压缩、自动化 Prompt 工程、到插件应用编排,客户都可以在千帆上一站式完成。

这意味着企业客户可以将基于千帆平台从0开始训练自己的专属模型,同时训练好的模型也可以部署和托管在千帆平台上,获得极致的性能、企业级的高可用性和安全环境。

由于千帆平台已经制备了开箱即用的使用流程,用可视化产品界面的方式引导用户使用,极大降低了使用门槛。对于企业级市场比较担心的安全可靠问题,也内置了安全机制,确保模型的输入和输出的安全。

不久前,IDC发布的《AI大模型技术能力评估报告,2023》对国内主流大模型,包括百度、阿里、腾讯、华为、科大讯飞、360、商汤等14家厂商参进行了评估。

IDC分别对大模型的平台、创新、通用、算法、服务、生态合作、行业覆盖和安全可解释性等诸多方面进行了评价,其中百度 7 个满分,阿里 6 个满分。百度在算法模型、行业覆盖领域拿下行业唯一满分。

可以看到,头部大厂的大模型产品已经有所成效。相较之下,部分初创和腰部公司开始呈现疲态。

从光年之外退出竞争、讯飞大幅亏损难以支撑大模型投入便可以得知,一些 “笨鸟先飞” 的企业已逐渐落后于发展大势。

对于企业业务而言,现阶段更加稳妥的方式还是在大厂之间做出抉择。大厂大模型更能保证服务交付、运维和维保,这也是企业对自身向智能化方向转型更加负责任地选择。

结语

随着企业研发、生产、销售、人力等各项业务场景数字化深入,如何借助大模型的力量,发挥出应用的最大价值,正成为企业商业制胜的关键所在。

接下来的竞争,对于企业而言,不再是局限于大模型的追逐,而是如何基于大模型对应用产品进行自我优化和革新。

对于大模型厂商而言,比拼的不仅是算力、算法和数据,未来长期的发展比的更是落地应用、生态渠道、客户服务、运维等系统性、全面性的支持。

这需要厂商具备强大的技术水平,以及不断迭代升级的能力。要满足可控和合规的要求,也需要厂商有较强的综合能力,能够长期稳定的投入人力物力。

【关于科技云报道】

专注于原创的企业级内容行家——科技云报道。成立于2015年,是前沿企业级IT领域Top10媒体。获工信部权威认可,可信云、全球云计算大会官方指定传播媒体之一。深入原创报道云计算、大数据、人工智能、区块链等领域。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1575774.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【C#】读取指定XML节点

&#x1f4f0;XML文件 <?xml version"1.0" encoding"utf-8"?> <configuration><userSettings><Internal.Settings type"Desktop"><setting name"StatsDisplayCount" serializeAs"String">…

算法设计与分析(实验5)-----图论—桥问题

一&#xff0e;实验目的 掌握图的连通性。掌握并查集的基本原理和应用。 二&#xff0e;实验步骤与结果 1.定义 &#xff08;1&#xff09;图的相关定义 图&#xff1a;由顶点的有穷非空集合和顶点之间的边的集合组成。 连通图&#xff1a;在无向图G中&#xff0c;若对于…

nestjs 全栈进阶--module

视频教程 10_模块Module1_哔哩哔哩_bilibili 1. 模块Module 在 Nest.js 中&#xff0c;Module 是框架的核心概念之一&#xff0c;用于组织和管理应用程序的不同部分&#xff0c;包括服务、控制器、中间件以及其他模块的导入。每个 Nest.js 应用程序至少有一个根模块&#xf…

log4j 集成 ELK环境搭建

一、前言 1.需要准备一台linux服务器&#xff08;最好是CentOS7&#xff09;,内存至少4g以上&#xff08;三个组件都比较占用内存&#xff09; 2.需要有docker使用经验 3. 三个软件的版本要一致 二、安装ElasticSearch 这里先创建一个网络&#xff1a;因为我们还需要部署k…

J基于微信小程序的电影订票、电影购票小程序

文章目录 1 **摘 要**2 技术简介**3 系统功能设计****第4章 系统设计****4.1系统结构设计** 第5章 系统实现**5.1管理员服务端功能模块**5.2用户客户端功能模块 结 论6 推荐阅读7 源码获取&#xff1a; 1 摘 要 本文从管理员、用户的功能要求出发&#xff0c;电影订票系统小程…

Python---Numpy线性代数

1.数组和矩阵操作&#xff1a; 创建数组和矩阵&#xff1a;np.array, np.matrix 基本的数组操作&#xff1a;形状修改、大小调整、转置等 import numpy as np# 创建一个 2x3 的数组 A np.array([[1, 2, 3], [4, 5, 6]]) print("数组 A:\n", A)# 将数组 A 转换为矩阵…

探究“大模型+机器人”的现状和未来

基础模型(Foundation Models)是近年来人工智能领域的重要突破&#xff0c;在自然语言处理和计算机视觉等领域取得了显著成果。将基础模型引入机器人学&#xff0c;有望从感知、决策和控制等方面提升机器人系统的性能&#xff0c;推动机器人学的发展。由斯坦福大学、普林斯顿大学…

javaer 为什么称redis、rabbitmq这些东西为中间件?

中间件&#xff08;Middleware&#xff09;是位于客户端和服务器端之间的软件服务层&#xff0c;它提供了一种通用服务的方式&#xff0c;帮助不同的应用程序、系统组件和服务之间进行交互和数据交换。中间件隐藏了底层的复杂性&#xff0c;使得开发者可以专注于业务逻辑的实现…

基于JSP SSM的社区生活超市管理系统

目录 背景 技术简介 系统简介 界面预览 背景 随着时代步伐的加速&#xff0c;计算机技术已广泛而深刻地渗透到社会的各个层面。随着居民生活水平的持续提升&#xff0c;人们对社区生活超市的期望和管理要求也越来越高。随着社区生活超市数量的稳步增长&#xff0c;开发一个…

Coding and Paper Letter(八十八)

系列重启之CPL。 1 Coding: 1.一个Python库用来分析城市路网的工具箱&#xff0c;城市形态分析工具。 Madina 2.SkyPilot&#xff1a;在任何云上运行 LLM、AI 和 Batch。 通过简单的界面即可实现最大程度的节省性能、最高的 GPU 可用性和托管执行。 skypilot 3.探索美国卫…

Apache-Pulsar安装操作说明

说明 Pulsar 是一种用于服务器到服务器消息传递的多租户高性能解决方案。 Pulsar 的主要特性如下&#xff1a; 对 Pulsar 实例中的多个集群的本机支持&#xff0c;并跨集群无缝地复制消息。 极低的发布和端到端延迟。 无缝可扩展至超过一百万个主题。 一个简单的客户端 API&…

arcgis10.5安装步骤

目录 一、安装License 二、安装ArcGIS_Desktop 三、安装汉化包&#xff0c;解压后&#xff0c;直接双击等待安装即可 一、安装License 双击ArcGIS_License_Manager_Windows_105_154033 选择【Next】 勾选I accept&#xff0c;然后选择【Next】 选择License的安装目录&#x…

实战webSocket压测(三)Jmeter真实接口联调

背景&#xff1a; 接口地址为&#xff1a;ws://sunlei.demo 接口说明&#xff1a;websocket接口&#xff0c;首次连接&#xff0c;通过Text请求设置开启标志&#xff0c;然后通过wav文件流传输&#xff0c;达到后端服务可以根据传输信息进行解析满足指定标准后&#xff0c;web…

SpringBoot响应式RedisClient配置

大多数场景&#xff0c;默认配置的Redis客户端不满足业务场景&#xff0c;根源在于Redis key、value 序列化反序列化问题。因此&#xff0c;有必要配置自定义的客户端来满足需求。 默认配置源码如下&#xff0c;采用jdk序列化/反序列化方式进行&#xff0c;我们只需要配置相同…

SpringMVC数据响应和请求

文章目录 1.SpringMVC简介2. SpringMVC快速入门3. SpringMVC执行的流程4.SpringMVC注解解释5. 视图解析器6.SpringMVC的数据响应6.1返回ModelView对象6.2直接返回字符串6.3返回json字符串 7.SpringMVC获得请求数据7.1 获得基本类型参数7.2获得POJO类型参数7.3获取数组类型参数7…

基于Swin Transformers的乳腺癌组织病理学图像多分类

乳腺癌的非侵入性诊断程序涉及体检和成像技术&#xff0c;如乳房X光检查、超声检查和磁共振成像。成像程序对于更全面地评估癌症区域和识别癌症亚型的敏感性较低。 CNN表现出固有的归纳偏差&#xff0c;并且对于图像中感兴趣对象的平移、旋转和位置有所不同。因此&#xff0c;…

WPS解决插入公式在正文带来行间距变大问题

问题描述 写论文解释公式时&#xff0c;插入对应的变量&#xff0c;导致行间距变大&#xff0c;如图 显然上文与下文行间距不等。但无法通过修改数值修改下文行间距。 解决办法

(已解决)引入本地bootstrap无效,bootstrap和jquery的引入

问题&#xff1a; 首先我是跟着张天宇老师下载的bootstrap文件&#xff0c;新建了一个css文件夹&#xff0c;但是这样子<link rel"stylesheet" type"text/css" src"./css/bootstrap.css">在index.html引入没有用。 解决办法: 1.把建立的…

贪心算法|1005.K次取反后最大化的数组和

力扣题目链接 class Solution { static bool cmp(int a, int b) {return abs(a) > abs(b); } public:int largestSumAfterKNegations(vector<int>& A, int K) {sort(A.begin(), A.end(), cmp); // 第一步for (int i 0; i < A.size(); i) { // 第二步if…

DSOX3034T是德科技DSOX3034T示波器

181/2461/8938产品概述&#xff1a; 特点: 带宽:350 MHz频道:4存储深度:4 Mpts采样速率:5 GSa/s更新速率:每秒1000000个波形波形数学和FFT自动探测接口用于连接、存储设备和打印的USB主机和设备端口 触摸: 8.5英寸电容式触摸屏专为触摸界面设计 发现: 业界最快的无损波形更…