重新理解百度智能云:写在大模型开放后的24小时

news2024/9/20 20:42:18

在这些回答背后共同折射出的一个现实是——大模型不再是一个单选题,而更是一个综合题。在这个新的时代帆船上,产品、服务、安全、开放等全部都需要成为必需品,甚至是从企业的落地层面来看,这些更是刚需品。 

作者| 皮爷 

出品|产业家 

过去的5个月,李亮很忙。

“从今年3月份文心一言发布之后,很多工业侧的企业,甚至是国央企,都主动来和我们探讨大模型的落地。”他表示,“也包括很多行业伙伴都找过来,说看如何一起打造具备服务共性的平台。”

作为百度智能云的一位工程师,过去的近半年时间里,他真切感受到了企业对AI大模型的热切程度。这种热切是企业对具备落地能力的新技术的期待,也更是担心落后的焦虑。

这不是个例。

伴随着OpenAI和国内一众大模型企业的频频发声,越来越多的“产业+AI大模型”框架正在清晰地呈现在企业面前,相较于之前的元宇宙、区块链等技术,AI大模型应用距离企业的真实场景更近,应用路径也更短,效果更“立竿见影”。

但在热火朝天的AI实践里,越来越多企业开始逐渐发现一个更为现实的问题:最佳的大模型切入点在哪?或者说,企业应该如何高效地构建适配自身的大模型?

问题背后,对应着一众企业在大模型转型路上的“挫折”。“现在很多企业的问题是有意愿,但没渠道;或者是尝试后,整体进度很慢。”一位投资人告诉我们,“中间包括数据清洗、标注,以及prompt的生成、模型微调、训练这些,市面上都没有特别易用的方式。”

实际上,这些现象也构成了尽管企业对大模型热情依旧高涨,但越来越多开始在迈出第一步同时保持“谨慎”态度,这种观望在清晰与否的转型路径,也更在参与其中的成本性价比。

不过,AI加速的好消息依旧在传来。在刚刚过去的8月31日,百度文心一言、商汤商量SenseChat等大模型首批通过了《生成式人工智能服务管理暂行办法》备案,正式面向全社会开放服务。此外,据悉,针对企业用户,百度智能云还将在9月5日举行的2023百度云智大会上宣布四大配套举措,旨在助力企业以更低成本更快捷方式使用上大模型。

在滚滚而来的AI洪流中,企业应该如何选择适合自己的大模型?或者说,在如今大模型开放的AI时代,怎样的AI大模型才能成为企业在AI数智化时代的最佳航船?

在8家大模型获批上线的当下,这个问题正在被加速推到台前。

一、AI需求,和背后的新产业命题

在得出答案之前,不妨先来看天平的另一侧:即客户AI落地的难点到底在哪?

“现在大家对于大模型在行业会怎么落地,有哪些完全颠覆性的应用,或者说这种能带来很大风潮的应用,会出现在哪儿,也都不是很确定。其实我们客户也很清楚的认识到这一点。”百度智能云一位解决方案工程师表示。

这是如今国内很多企业面临AI大模型的共性。即尽管企业对自身的业务场景有充分的认知,但大模型能做到哪一步,以及如何使用大模型进行原有业务的降本增效,这都是未知命题。

而对部分已经尝试的企业,问题则是更为尖锐。

“我们最开始使用的是国外开源模型,但最近也在考虑尝试重新接入国内的大模型,因为国外开源的中文语义理解太差了,基本的交互都出现问题。”一位低代码企业创始人这样告诉我们。

有同样感受的是另外一家农业方向的企业,在和其创始人的交流过程中,他直言,“从最开始做prompt,到后面一轮一轮的训练,包括数据清洗、高质量标注等等,整个过程的开销非常大的,训练效果还不是特别好,甚至不如原有界面。”截止到目前,这家企业的大模型产品仍然处在内测阶段,尚未对外使用。

在这些之外,更多的企业则是停滞在大模型的“第一步”——选型。

不过,在选型阶段,企业的顾虑有所不同。对目前大部分中小企业而言,其选型难的原因在于不清楚哪家底层大模型企业的产业能力强,这些能力包括产品能力,也更有对模型微调、知识增强等服务落地的要求。

而对大型企业而言,除了数据安全之外,产业理解和复用性是企业的最核心考量。“大企业更看重的是,你不仅要在我看重的这一点的业务上能做出效果,还有就是要在整个集团的复用性上,能和既有业务结合的效率要更高。”上述工程师表示。

在他的感知里,以央国企为代表的大型企业更多地希望大模型服务商是一个教练的角色,不仅要给到好的工具,还要教会企业怎么用,从长期提升价值。

从更大的视角来看,当下大模型落地的难点大概分为三个层面,一是企业不知道选择怎样的大模型,或者说企业不知道自身的需求怎样的大模型可以满足,视野范围内的大模型选项太少;二是对部分选择自建大模型的企业而言,其在prompt提示词和数据清洗、标注以及中文增强等工具链层面屡屡碰壁,投入太大或者经验不足;三是企业自身的数据安全和合规性较高,同时需要较深的产业know-how,对大模型服务商的功能能力要求较高。

不难感知到的是,如果从原子化服务的角度拆解来看,当下国内企业对大模型的需求已然不仅在产品层面,如参数、逻辑推理等硬核指标,更大的需求点涌现在服务侧,即对不同企业需求的一站式满足,这些满足或是在prompt层面、或在中文增强、数据标注、训练层面,再或是在产业场景适配乃至数据安全,以及最核心的成本层面。

大模型,已然从一道单纯的技术命题,悄然进化为一道糅合技术、产品、服务等全部环节的产业综合命题。

二、千帆背后,看见大模型的“真实表达”

在忙碌的几个月里,李亮对一家企业印象很深刻。

“有一个矿山行业的合作伙伴,在大模型的领域非常期望跟我们合作,想要通过大模型去进行整个的矿山的智慧化服务,包括安全生产的管理,安全生产的预警等等。”他说道,“我们现在在跟他进行多轮测试,有很多也有非常不错的测试效果。”

他的意外之处在于,像矿山这样的偏传统的企业,也开始主动找到百度寻求大模型方面的进展和落地。据了解,如今双方经过多轮共创,一个基于矿山场景的大模型已经接近成型。

实际上,这不是第一个主动找到百度智能云的企业。而百度智能云对这些产业伙伴的一个统一服务界面,正是在今年3月份正式推出的一站式企业级大模型平台“百度智能云千帆”。

作为唯一TO B大模型界面,百度智能云千帆也恰构成着百度大模型在如能源、金融、政务、交通等不同产业场景的真实表达,以及包括数据管理、模型训练、评估&优化、预测服务和Prompt工程和插件服务等全部大模型开发周期的能力展示。

而在刚刚过去的8月,它更是交出了一张亮眼的成绩单。

一个亮眼之处是,在本次对外公布的模型种类中,百度智能云千帆除了文心大模型的核心外,其也更全面接入Llama 2全系列、ChatGLM2-6B、RWKV-4-World、MPT-7B-Instruct、Falcon-7B等33个开源大模型,成为国内拥有大模型最多的平台。

换言之,基于百度智能云千帆的“模型仓库”,除了文心大模型之外,企业可以自行适合自身的其它基础大模型产品。

此外,和其它模型仓库不同的是,百度智能云千帆对“模型仓库”内的模型进行了“二次加工”。

比如,在安全性层面,千帆对所有接入的第三方模型均做了模型安全增强,不仅保障文心大模型的内容安全,还保障了第三方大模型的安全输出;再比如在成本层面,对每一个接入的大模型,千帆都做了二次性能增强。

根据测算,在性能调优后,第三方模型体积可压缩至25%-50%,推理成本可降低50%。这意味着,相较于直接调用,企业在千帆平台上使用这些模型可极大地节约成本,提升效果。

与此同时,千帆对接入的大模型做了深度适配,其为企业提供模型再训练的全套工具链以及多种形式模型调优,其中包括SFT(全量参数微调、Prompt Tuning、Lora)及强化学习(奖励模型学习、强化学习训练)等等。

换言之,基于百度智能云千帆,不论是选择文心大模型,还是平台上的第三方开源大模型,企业都可以端到端地搭建自身的专属模型

不仅于此,在对外的服务能力上,百度智能云千帆可以为企业提供公有云和私有部署两种方式,包括上文所说的大模型落地难的推理、微调、托管,企业都可以基于公有云模式接入使用。而在本地部署方面,百度智能云千帆也更是可以纯软件和软硬一体的交付方式,充分满足企业本地部署的要求。

实际上,这些能力在也构成了百度智能云千帆在一众产业侧的真实落地。根据不完全统计,在过去的5个月时间里,千帆大模型平台在超过400个真实产业场景中实现了落地。截止目前,百度文心大模型已拥有中国最大的产业落地规模。

这些落地构成了中国大模型赛道的一个个特殊节点。比如在能源层面,百度智能云和国家电网联合打造的“设备运检知识助手”入选北京市首批十大行业大模型应用案例。与深圳燃气联合发布的“深燃-百度·文心大模型”,基于大模型能力,只需要进行微调,就可以形成针对性的行业模型能力,完成多个应用场景的任务。

再比如在金融层面,百度智能云与中信金控联合打造了基于大模型的数字人,让每一位银行客户都有自己专属的理财顾问,可以承担包括投研助手、投顾助手、营销助手、合规助手等在内的多个角色。

这些真实的产业落地侧写也更在一众中小企业侧。根据不完全统计,已经有超过10万家企业申请测试,这个数目伴随着如今面向全社会层面的开放动作,也更在加速倍增。据了解,在在开放的24小时内,文心一言共计回复网友问题数超过3342万个。

可以说,不论是在产品层面,还是服务层面,千帆大模型为企业提供的是一个开放兼容的大模型选择界面,在这里,企业既可以实现从0到1的端到端大模型搭建,也更可以寻求到包括数据标注、prompt在内的一众工具链能力,以最低的成本和门槛,构建出自身的专属大模型。

三、AI时代,我们需要怎样的大模型?

如今,越来越多人开始讨论的一个命题是:在如今的产业数字化时代,我们需要怎样的大模型?有的人的回答是产品,有的人的回答是服务,也更有人的回答是数据安全。

在这些回答背后共同折射出的一个现实是——大模型不再是一个单选题,而更是一个综合题。在这个新的时代帆船上,产品、服务、安全、开放等全部都需要成为必需品,甚至是从企业的落地层面来看,这些更是刚需品。

不过,这些问题也正在被作答。

以百度智能云为例,除了在产业领域侧联合企业进行落地之外,其也更是和生态伙伴联合打造了更多基于特定场景的产品。比如和软通动力打造的大模型基础设施软通天璇2.0,与微盟联合构建的AI应用型产品WAI,以及和金蝶、金山办公一起研发的专属领域大模型产品。

在这个新的团战背后,大模型正在以更加真实的姿态出现在各个产业场景和各个企业应用中,不仅是金融、能源,也不仅是大型的央国企,在如今百度智能云千帆的底座之上,越来越多的产业场景和越来越多体量的企业都正在齐力迈出AI大模型时代的第一步。

此外,从更大的视角也同样能清晰看到的是,这些产业的真实表达也恰在构成着大模型企业的产品和营收新增长飞轮。

根据不完全统计,截至目前,百度智能云千帆平台上有103款Prompt模板,包含对话、编程、电商、医疗、游戏、翻译、演讲等十余个场景。其中既有基于百度智能云在产业实践中积累的Prompt模板,也有来源于文心一言高频用户的Prompt模板。可以预见的是,作为大模型训练中最核心的环节之一,这些Prompt模板将使得千帆更容易被企业和市场欢迎。

而在财报层面,根据百度发布的2023年Q2财报显示,第二季度百度营收341亿元实现加速增长,净利润高速增长44%。此外,由《IDC中国AI公有云服务市场份额,2022》报告数据显示,2022年中国AI公有云服务总体市场79.7亿元,其中百度智能云占28.9%排名第一。

或者可以说,在AI大模型在成为各个产业基建企业验金石的同时,它也更在成为一个新的发动机。

进度仍在持续推进。在接下来的9月5日,百度智能云还将在2023百度云智大会上宣布四大配套举措。

据内部人士透露,在此次大会上,百度智能云将全面升级“千帆大模型平台”,升级将覆盖算力基础设施、大模型工具链、高质量数据集等等。此外,其将推出基于文心大模型重构的行业解决方案,同时还将发布覆盖服务营销、办公提效、生产优化三大领域的10款企业级的AI原生应用产品。大模型相关的生态政策也将在大会上同步披露。

或许再来回答前面那个问题,即“我们需要怎样的一个大模型?”——这不仅是一个对企业而言,寻找最佳选项的命题,也更是对大模型企业而言,锚定未来和自证的长期思考。

恰如百度相关负责人在采访中所说,“未来肯定还会有更多AI产品,或许这些产品不是百度开发出来,但企业都可以基于百度智能云千帆开发出来,这是我们想要的,也是会一直持续去做的。”

答案,已经在成形的路上。

*文中李亮为化名

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/959961.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

大数据课程K12——Spark的MLlib概述

文章作者邮箱:yugongshiye@sina.cn 地址:广东惠州 ▲ 本章节目的 ⚪ 了解Spark的MLlib概念; ⚪ 掌握Spark的MLlib基本数据模型; ⚪ 掌握Spark的MLlib统计量基础; 一、Spark MLlib介绍 1. 概述 MLlib是Apache Spark的可迭代机器学习库。 2. 易于使用 …

改革企业治理结构,建立国有企业全面预算管理制度

随着我国市场经济的推广,国有企业进入到改革发展的必经之路上,企业应当结合自身实际情况加强成本管控,提高管理效率,为企业的发展提供有力保障。近年来,全面预算管理的理念在国有企业实施范围内不断扩大,加…

联发科MTK6762/MT6762核心板_安卓主板小尺寸低功耗4G智能模块

MT6762安卓核心板是一款基于MTK平台的高性能智能模块,是一款工业级的产品。该芯片也被称为Helio P22。这款芯片内置了Arm Cortex-A53 CPU,最高可运行于2.0GHz。同时,它还提供灵活的LPDDR3/LPDDR4x内存控制器,此外,Medi…

5年前我们摸爬滚打进入测试行业,如今的你后悔吗?

记得在求职的时候,面试官经常问我:“为什么要选择软件测试工作?”而我也会经常说一堆自己有的没的优势去应付。 工作这么久了,也不再浮躁,静下心来回忆当初选择软件测试工作的历程,也是对自己职业生涯的一次回顾。 一…

GreenPlum的gpfdist使用与原理流程分析

一、简介 GreenPlum 的数据导入功能作为对数据源的一种扩充,数据导入的方式有: 1、insert 该方式通过 sql 语句,把数据一条一条插入至表中。这种方式,不仅读取数据慢(一条一条读取),且数据需要…

我们学到的关于减少客户流失的 4 个经验教训

客户流失 – 这两个词会让任何企业主的脊背不寒而栗。用最简单的术语来说,它是在特定时间内停止使用您的服务的客户百分比。这很糟糕,但这并不全是厄运和阴霾。我们已经通过四个简单的步骤研究了如何减少客户流失,并与您分享这些秘密。请继续…

SP1545L肖特基二极管厂家

目前,市面上供应肖特基二极管的厂家、供应商特别地多,更多选择的背后,带来的却是更多的迷茫和不知所措。采购肖特基二极管,哪家好呢?提及“东沃电子DOWOSEMI”这个国产二极管品牌,很多客户可能第一想到他家…

部署Django报错-requires SQLite 3.8.3 or higher

记一次CentOS7部署Django项目时的报错 问题出现 在部署测试环境时,有需要用到一个python的后端服务,要部署到测试环境中去 心想这不是so easy吗,把本地调试时使用的python版本及Django版本在服务器上对应下载好,然后直接执行命…

AWS-数据库迁移工具DMS-场景:单账号跨区域迁移RDS for Mysql

参考文档: 分为几个环节: 要使用 AWS DMS 迁移至 Amazon RDS 数据库实例: 1.创建复制实例 有坑内存必须8g或者以上,我测试空库 都提示内存不足 2.创建目标和源终端节点 目标空库也得自己创建哈 3.刷新源终端节点架构 4.创建迁…

FrameWork的概述与启动过程

FrameWork框架 Framework定义了客户端组件和服务端组件功能及接口。以下阐述中,“应用程序”一般是指“.apk”程序。 框架中包含三个主要部分,分别为服务端、客户端和Linux驱动。 服务端 服务端主要包含两个重要类,分别是WindowManagerSe…

jsch网页版ssh

使用依赖 implementation com.jcraft:jsch:0.1.55Server端代码 import com.jcraft.jsch.Channel; import com.jcraft.jsch.JSch; import com.jcraft.jsch.Session; import java.io.InputStream; import java.io.OutputStream; import java.util.concurrent.TimeUnit; import o…

django项目改名字后顺利运行、ModelSerializer使用、模块与包的使用、反序列化校验源码分析、断言、drf之请求、魔法方法之点(.)拦截

一 django项目改名字后顺利运行 1 先改文件夹名 2 改项目名 3 改 项目内的文件夹名 4 替换掉所有文件中的 drf_day04_02 ---》drf_day05 5 命令行中启动:python manage.py runserver 6 setting--->django--->指定项目根路径二 同时创建作者和作者详情表(一对…

Ros noetic 机器人坐标记录运动路径和发布 实战教程(A)

前言: 网上记录Path的写入文件看了一下还挺多的,有用yaml作为载体文件,也有用csv文件的路径信息,也有用txt来记录当前生成的路径信息,载体不重要,反正都是记录的方式,本文主要按yaml的方式写入,后文中将补全其余两种方式。 其中两种方式的主要区别在于,加载yaml所需要…

ASUS华硕VivoBook15笔记本V5200EA_X515EA原装出厂Win11预装OEM系统

华硕11代酷睿笔记本电脑VivoBook_ASUSLaptop X515EA_V5200EA原厂Windows11系统 自带显卡、声卡、网卡、蓝牙等所有驱动、出厂主题壁纸、Office办公软件、华硕电脑管家MyASUS、迈克菲等预装程序 链接:https://pan.baidu.com/s/1yAEdA7aiuHK4CTdGLlSOKw?pwdo45a …

【MySQL】一文带你搞懂MySQL中的各种锁

1.概述 锁是计算机协调多个进程或线程并发访问某一资源的机制。在数据库中,除传统的计算资( CPU 、 RAM、 I/O )的争用以外,数据也是一种供许多用户共享的资源。如何保证数据并发访问的一致 性、有 效性是所有数据库必须解决的一个…

posexplode函数实战总结

目录 1、建表和准备数据 2、炸裂实践 3、错误炸裂方式 4、当字段类型为string,需要split一下 对单列array类型的字段进行炸裂时,可以使用lateral view explode。 对多列array类型的字段进行炸裂时,可以使用lateral view posexplode。 1…

命令行编译VS工程

先输入以下命令,因为命令出错了,就会弹出帮助,如下: "C:\Program Files (x86)\Microsoft Visual Studio 11.0\Common7\IDE\devenv.exe" /help 反正就是Microsoft Visual Studio 的安装路径。 帮助界面如下&#xff1a…

新风机为什么会出现?

新风机之所以会出现,是因为人们对于室内空气质量的重视与需求。随着社会的进步和人们生活水平的提高,人们更加注重健康和舒适的居住环境,而室内空气质量是其中一个重要的方面。 空气污染问题:城市化进程加速,工业排放、…

vue3+ts+uniapp小程序端自定义日期选择器基于内置组件picker-view + 扩展组件 Popup 实现自定义日期选择及其他单列选择

vue3ts 基于内置组件picker-view 扩展组件 Popup 实现自定义日期选择及单列选择 vue3tsuniapp小程序端自定义日期选择器 1.先上效果图2.代码展示2.1 组件2.2 公共方法处理日期2.3 使用组件(全局自动导入的情况) 3.注意事项3.1refSelectDialog3.1 backgroundColor"#fff&q…

Python做数据分析更快,为什么很多人只学Excel,不学Python?

在当今信息时代,数据分析已经成为了各个行业不可或缺的工作内容。而在数据分析中,Excel一直是最常被使用的工具之一。然而,随着Python编程的兴起,越来越多的数据分析师开始转向Python进行数据分析。本文将从速度、灵活性、可视化和…