从技术出发or从场景出发:大模型开始“路线分化”?

news2024/11/23 15:51:53

文 | 智能相对论

作者 | 叶远风

大模型时代,厂商们狂奔突袭,技术创新一浪高过一浪。

在这个过程中,先赶上风口做出一个大模型产品,宣传一波、站稳脚跟,再慢慢谈场景应用、价值落地,是很多厂商的做法——从技术出发再往场景切入,成为业界普遍的“路线图”。

但是,随着场景落地变得越来越重要,越来越成为业界尤其是政企客户的普遍关切,一种新的路线正在出现。

2023世界人工智能大会期间,大数据基础设施提供商爱数在“大模型时代的领域认知智能”分论坛上宣布全面升级AnyShare智能内容管理平台,推出AnyShare认知助手和AnyShare大模型一体机,并发布领域认知中台方案,正式布局大模型。

在直观上,爱数的这次发布,并没有像很多大厂那样推出一个有名字的大模型产品,而是强调“助力行业客户解决数据治理、数据运营、内容管理难题,加速业务智能化”。

换言之,大模型“产品”不是爱数的布局重点,把大模型“能力”嵌入已有的数据服务业务才是关键。

在这里,从场景需求出发再思考技术的融合,成为大模型一种新的发展路线。

聚焦落地后,大模型的路线分化是必然结果

每个明星大模型产品的发布,往往都是先展示一套面向C端的“聊天能力”,然后再公布其发展的“宏伟蓝图”——拉拢合作伙伴往各大场景布局落地。

数字化、智能化过去已经玩过的全场景构想,在大模型这里又来了一遍。

在千行百业都将被大模型占领的预期下,创造一个能够实现这样的市场机会的大模型,就成为从大厂到中小创业者的普遍理想。

而这,就是一种典型的“跟风”,先做出来画个大饼再说,管它后边如何。

实际上,既然大模型是注定要走向千行百业的,那么从千行百业原生出契合各自场景需求的大模型,某种程度上才应该是最恰当的方式之一。

这正是爱数在做的。

从2021年起,爱数就在推出数据智能产品,并与德国汉堡大学、复旦大学、天津大学等建立联合实验室。领域认知智能是爱数帮助客户实现数智化转型的重要着力方向,已经持续耕耘多时。

现在,当大模型东风吹起来,除了火热的、更容易被大众直接感知的AIGC,实际上最根本带动的是AGI(通用人工智能)的发展,而这与爱数实现领域认知智能的方向是一致的。

对爱数这样已经从事数据服务、认知智能的厂商来说,积极拥抱大模型,将全域数据能力及领域认知智能积累的优势与大模型技术深度结合,就成为一种自然而然的选择。

不需要跟风,不需要刻意,场景的价值基础一开始就具备,大模型带来的是直接落地的强化能力。

过去,爱数虽然着力推动客户实现业务智能化,但仍然面临一些挑战,例如在业务运营、决策方面缺乏高质量数据;由于业务不标准、执行不规范导致数据难治理;以及信息、知识的共享还需要人力繁琐的操作积累原始的数据,等等。

在业界,这种先需要大量的人力投入然后再创造智能化价值的过程,被称为“有多少人工就有多少智能”。大模型的介入,让爱数得以解决过去企业智能化转型在业务、知识、数据等层面大量需要人力工作的问题,全过程都不再需要太多人力的介入,而实现“有多少数据就有多少智能”。

如此,爱数的数据资产化、数据知识化、数据服务化和数据要素化努力就将事半功倍,帮助客户更好地实现业务智能化。

例如,在城市招商的过程中,爱数原本就能帮助政务客户实现领域认知智能,自动化整理各种产业链对象的知识,根据城市园区建设需求匹配对应的潜在合作对象。

大模型的加入,让这些知识的获取也不再需要繁琐的、长周期的大量人力投入,而是可以通过AGI能力大大加速,并在资源匹配上变得更加精准。

可以看到,爱数的大模型完全起源于场景业务的需求,是对创新技术的充分利用,推动原有数字化、智能化服务的效率和质量提升,而这,正好也符合广大政企客户对大模型的价值期待。

一窝蜂式的搞概念,带来的只有看客,而不是真正的接纳。

新的路线选择,“附带”解决了大模型落地三大场景痛点

当大模型开始从场景出发而不是从技术出发,大模型过去在落地层面所面临的三大痛点问题也在得到解决。

1、解决数据安全的核心关切

任何的大模型要走向应用,在庞大的公域数据预训练后,都必须要有一个根据政企业务需求进行再训练的过程。这其中就存在数据泄露等安全隐患,成为很多政企客户在选择大模型时的首要关注因素。

而如果长期耕耘场景,知道政企客户的痛点所在,大模型能力就能以恰当的方式“植入”。

爱数联合行业生态伙伴共创的大模型一体就是如此。

此次大会上,爱数推出了AnyShare领域大模型一体机AS19000,该设备独立部署于政企客户的私有云环境下,领域大模型训练和推理实现了分离(即一体机本身自带有已经训练好的大模型,接入即可投入使用)。

这种物理上的隔离,一方面解决了数据安全的问题,另一方面,基于强大的预训练过程+硬件高配置又具备强大的大模型能力,能为政企客户带来一体化的智能内容管理体验。

此外,一体机模式还解决了大模型推理所耗费算力成本高昂的问题,实现更经济性的部署。

2、解决大模型与业务割裂问题

几乎所有数字化、智能化转型,都会面临外部服务商不了解内部业务实际、技术与场景割裂的痛点问题。

大模型进入行业和场景,在根本上也是一种转型升级,也在面临相同的问题,那些手举所谓优质大模型的厂商虽然确实在技术创新上有所建树,但真正要深入场景却未必懂企业具体的业务和需求。

这时候,原本就深耕场景的厂商其优势就凸显出来。

前文提到爱数通过大模型解决业务、数据治理、知识运营过程中耗费人工的问题,其主要方式,就是推出一套数据驱动业务的领域认知中台,以领域认知智能赋能数据资产化,实现业务智能化。

领域认知中台的核心逻辑在于理解业务目标、流程、标准、规则和指标,建立一套统一的业务模型。具体而言,即在数据资源化的基础上,基于领域知识网络和领域大模型实现数据知识化,通过爱数领域认知助手落地具体应用场景,以AnyFabric智能运营中心和AnyShare知识中心为载体,实现业务智能化。

这个中台不仅仅能够覆盖所有的业务,还能够确保数据安全、访问控制安全、安全运维及安全灾备,进一步回应政企客户的安全关切。

如此,大模型能力、爱数的数据服务、政企业务场景实际实现了三位一体的融合。

典型如,爱数发布的“领域认知助手”,提供创新的智能搜索、智能问答、辅助创作、辅助阅读等认知能力,将大模型能力具象化,直接贴合员工的日常工作,让内容生产实现真正的“智能化”。

3、解决大模型“黑箱”难题

在内容输出上瞎编乱凑已经成为全球大模型的技术顽疾,无论GPT-4还是国内一众大模型产品,把信息张冠李戴的现象都十分严重,例如李白的诗句被说成是杜甫作的。

目前为止,包括OpenAI在内的厂商都在“寻找最合适的解决办法”,但在一些测试中,这种现象也只是得到部分缓解。

在根本上,这是因为通用大模型无法针对性识别某个具体领域的信息之间的逻辑联系进行针对性处理,要解决这个问题,可能需要很多针对性的知识进行“校正”,其技术实现难度较大,或者说训练参数量需要更加庞大。

现在,当场景业务经验积累在前,大模型的“黑箱”造成信息输出偏差的问题得到了自然而然的解决。

爱数在过去就为不同行业、场景建立了一套系统的领域知识网络,作为其领域认知智能的重要智力来源。现在,这套领域知识网络与大模型结合,用正确的场景知识逻辑作为“同步评审”,让大模型可实现可控可干预可解释,直接推动大模型输出结果的精确化。

实际上,爱数领域知识网络与大模型的结合,也是大模型深入场景的一种必要。

例如,在化工等“容错率”极低的行业,大模型的结果输出必须做到精准无误,无法容忍重要的信息张冠李戴。而爱数的领域知识网络中,任何一个材料的工艺都来自于大量实践,属于最省成本、最安全可控的流程方法,精确到了数量、比例、时间等每一个可度量的单位条件,形成了结构化、规范化的数据,最终通过大模型实现用户查询、引用,指导技术人员操作,降低成本、防范风险。

明星产品风光过后,大模型落地呼唤产业生态

除了爱数,最近很多有关大模型的行业动作,都逐步脱离“快速打出明星产品”的做法。

例如,AI计算领域的昇腾全栈体系中,开源的昇思AI开发框架推出专门推动大模型开发的新版本,并邀请来自客户企业、伙伴、高校的开发者一起做大模型,推动大模型生态的繁荣。

也即,昇思不再寻求自己做一个大模型产品,而是让那些更接近场景的主体去做大模型——不只有爱数,整个行业都开始通过融合场景的方式推动大模型产业落地。

在这个过程中,大厂、创业者、数字化服务商、高校、科研院所、基础软件、基础硬件、整机厂甚至政企客户本身……大模型的生态会在场景需求导向下,变得越来越丰富,生态主体之间也在不断相互协同。

例如,爱数就宣布要开放合作通用大模型,以及与客户共创垂直领域的大模型,以合作姿态推动大模型能力进化。

当这种普遍的氛围形成,大模型风口下“赢家通吃”的野心将消散。

以场景落地为目标,将有不同的大模型在各自领域创造属于自己的价值,除了爱数这样的已经有深厚场景业务积累的玩家,那些新晋创业者的大模型可以只服务一家公司,例如美团收购光年之外,后者的产品将直接面向美团,获得“最好的归宿”;大厂的大模型也可以只作为业务的强化,例如字节的大模型专注于服务好自身的内容、电商业务,等等。

只有从场景出发的百花齐放,才有大模型繁荣的未来,一个深刻改变世界的未来。

*本文图片均来源于网络 

#智能相对论  Focusing on智能新产业新服务,这是智能的服务NO.232深度解读

此内容为【智能相对论】原创,

仅代表个人观点,未经授权,任何人不得以任何方式使用,包括转载、摘编、复制或建立镜像。

部分图片来自网络,且未核实版权归属,不作为商业用途,如有侵犯,请作者与我们联系。

•AI产业新媒体;

•澎湃新闻科技榜单月度top5;

•文章长期“霸占”钛媒体热门文章排行榜TOP10;

•著有《人工智能 十万个为什么》

•【重点关注领域】智能家电(含白电、黑电、智能手机、无人机等AIoT设备)、智能驾驶、AI+医疗、机器人、物联网、AI+金融、AI+教育、AR/VR、云计算、开发者以及背后的芯片、算法等。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/752819.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

第二届计算与人工智能国际会议 | ACM-ICPS独立出版 | 快速检索

会议简介 Brief Introduction 第二届计算与人工智能国际会议(ISCAI 2023) 会议时间:2023年10月13 -15日 召开地点:中国上海 大会官网:www.iscai.org 2023年第二届计算与人工智能国际会议(ISCAI 2023)将围绕“计算与人工智能”的最新研究领域而…

【学会动态规划】使用最小花费爬楼梯(3)

目录 动态规划怎么学? 1. 题目解析 2. 算法原理 1. 状态表示 2. 状态转移方程 3. 初始化 4. 填表顺序 5. 返回值 3. 代码编写 写在最后: 动态规划怎么学? 学习一个算法没有捷径,更何况是学习动态规划, 跟我…

webpack项目和vue项目发布,浏览器存在缓存

项目是webpack搭建的每次发步到线上,经常需要手动清楚浏览器缓存才能有效果。vue项目设置在最下面 项目打包的js(css也是一致)名称都采用哈希值 问题:哈希值在有些情况下打包会不变,导致浏览器使用自己缓存的资源 解…

洗地机选哪个牌子好、洗地机排名

洗地机可以说是现代家居清洁首选设备。因为它比拖把拖地更加高效率,同时对比扫地机和吸尘器拥有更多的清洁功能,干湿垃圾一起拖少。并且自清洁功能能够帮助它更好的清理干净滚刷和管道,清洁使用非常省心省力。下面小编就给大家分享几款家庭清…

红队打靶:Brainpan打靶思路详解(vulnhub)

目录 写在开头 第一步:主机发现和端口扫描 第二步:web渗透 第三步:缓冲区溢出漏洞识别 第四步:定位eip寄存器(确定溢出字符串的长度) 第五步:ESP扩容(判断ESP寄存器的大小是否…

如何在 3ds Max 中使用 Mental Ray 制作逼真的草地和带有光晕的天空

推荐: NSDT场景编辑器助你快速搭建可二次开发的3D应用场景 首先,您将创建一个平面对象,然后添加一个噪点修改器。在此之上应用毛发和毛皮修饰符。 这将用于模拟逼真的草地。 我们用日光系统创造太阳和天空。为太阳添加镜头和戒指效果以及酷炫…

防火墙规则过期通知

作为规则管理最佳实践,大多数安全管理员为其防火墙规则设置到期日期。过期后,需要更正防火墙规则才能再次激活。但是,由于大多数组织都有数百个规则和多个安全管理员处理这些规则,因此几乎不可能查看过期的规则并手动纠正它们。这…

GPT的体验与思考

文章目录 一、GPT使用过程之对话二、AI大模型训练之文生图三、总结与思考 本文用到的词汇偏口语,甚至是小编自己创造;本文主要关注点在于使用和使用后的思考。 一、GPT使用过程之对话 在chart-gpt刚刚爆火出圈的时候,我并没有选择立马使用、…

力扣 309. 最佳买卖股票时机含冷冻期

一、题目描述 给定一个整数数组 prices,其中第 prices[i] 表示第 i 天的股票价格。​ 设计一个算法计算出最大利润。在满足以下约束条件下,你可以尽可能地完成更多的交易(多次买卖一支股票): 卖出股票后&#xff0c…

Star History 月度开源精选|2023 年 6 月

上一期 Star History 月度精选是写给市场、运营人员的,而这一期回归到 DevTools 类别,我们六月发现了好一些开发者可以用的不错工具! AI Getting Started 还记得 Supabase “Build in a weekend” 的广告词吗!AI Getting Started…

10个项目瓜分5万美元,邀您参与Sui夏季黑客松最喜爱奖项投票

已经顺利完成第二阶段的项目选拔,40个项目成功入围最终的Demo Day。随着Sui Builder House巴黎站活动的临近,黑客松第三阶段Demo Day的气氛也逐渐热烈。 此次Demo Day将采用线上线下的形式为大家呈现精彩的项目路演,无法到达现场参与活动的朋…

vite + vue 白屏 Uncaught Syntaxerror: Unexpected token ‘?‘

如果可以实现记得点赞分享,谢谢老铁~ 一、问题的描述 突然收到业务方发来的反馈: 浏览器一片空白,开控制台输出:Uncaught Syntaxerror: Unexpected token ? 这个是语法错误。 二、 问题分析: 根据vit…

【数据分享】1929-2022年全球站点的逐年最大持续风速数据(Shp\Excel\12000个站点)

气象数据是在各项研究中都经常使用的数据,气象指标包括气温、风速、降水、能见度等指标,说到气象数据,最详细的气象数据是具体到气象监测站点的数据! 对于具体到监测站点的气象数据,之前我们分享过1929-2022年全球气象…

母婴市场进入增长寒冬,AIGC能否为孩子王“供暖”?

文|螳螂观察 作者| 青月 人口负增长这件事,已经使母婴行业成了首批受到冲击的板块之一。用「母婴行业观察」的话来概括,就是“母婴行业正在进入销量低增长甚至零增长、营收利润低增长的挤压式竞争新阶段,并且已经开始了”。 行业内的玩家&…

BI分析中,经营和管理的关系到底是怎样的?

一家企业的CEO在聊BI的时候聊到的一个话题,这个级别的对话就不会聊具体的技术实现了,就会稍微务虚一些。但有时看似务虚的东西,深入去思考一下,其实也并不务虚,考虑的都是抽丝剥茧之后根源性的问题,把一些问…

接口测试原理及Postman详解

接口测试定义 接口是前后端沟通的桥梁,是数据传输的通道,包括外部接口、内部接口。内部接口又包括:上层服 务与下层服务接口,同级接口 生活中常见接口:电脑上的键盘、USB接口,电梯按钮,KFC下单 接口测试…

WebUI自动化必备技能-HTML和css知识详解

学习web自动化的前提条件:手工测试(了解各种测试的知识)、学习编程语言、学习Web基础、学习自动化测试工具 、学习自动化测试框架 、需要掌握前端的一些知识,无论学习语言还是前端知识,都是为了接下来的脚本和框架做铺…

【C语言】回调函数(qsort)与模拟实现

何思何虑,居心当如止水;勿取勿忘,为学当如流水。— 出自《格言联璧学问类》 解释:无思无虑,心境应当平静如水;不求冒进也不忘记,学业当如流水一般永无止境。 这篇博客我们将会理解回调函数这个概…

长达 1.7 万字的 explain 关键字指南!

当你的数据里只有几千几万,那么 SQL 优化并不会发挥太大价值,但当你的数据里去到了几百上千万,SQL 优化的价值就体现出来了!因此稍微有些经验的同学都知道,怎么让 MySQL 查询语句又快又好是一件很重要的事情。要让 SQL…

桥梁监测是做什么的?桥梁结构监测方案

现代化大型桥梁是交通主干道的重要节点,对交通运输发展具有重大影响。然而,桥梁在长期使用过程中容易受到各种因素的影响,如自然灾害、车辆载荷、材料老化等,从而导致结构损伤和安全隐患。因此,对桥梁结构性能进行自动…