产业大模型刚开卷,京东跑进“最后半公里”

news2025/2/24 9:16:16

点击关注

 

姚    悦

王一粟

“京东一直在探索哪些产品、技术、场景可以真正把大模型用起来,在我们内部的场景中反复验证后,才决定在7月份对外发布,现在我们在零售、健康、物流、金融等业务场景里已经积累了一些经验。”京东集团技术委员会主席、京东云事业部总裁曹鹏在群访中,对光锥智能表示。

大模型火热半年,自2月官宣聚焦“产业大模型”后,一直相对低调的京东,也终于展示了自己的言犀大模型。但与此同时,大模型的竞争已经趋于白热化。据不完全统计,当前国内已发布超过80个大模型产品,并已经开始对应不同行业、不同应用场景频繁发力。

究竟什么样的大模型,才能在这番激烈的竞争中突出重围?

一方面,大模型亟需寻找到场景快速落地,另一方面,中国实体产业需要技术驱动来降本增效。

于是,从产业中来,到产业中去,就成了京东大模型自然的选择。

“大模型,让技术帮助产业降本增效的可能性成倍递增。”京东集团CEO许冉认为,从产业段切入大模型,如同从北坡攀爬技术珠峰。道路虽然更加艰难,却有更波澜壮阔的风景。

图片

长于产业的大模型

“言犀大模型训练时,融合70%的通用数据与30%数智供应链原生数据”,IEEE Fellow、京东探索研究院院长、京东科技智能服务与产品部总裁何晓冬告诉光锥智能。

这种大模型训练方式,与此前业界早期普遍认为的并不相同。

“目前,基础模型有三种不同的应用模式:第一种是通用基础模型训练好后,迁移至行业基础模型中,进而做产业(垂直)应用;第二种是通用基础模型进行微调;第三种,则是利用通用大模型+‘知识库和搜索引擎’。”业内人士分享道。

图片

2023京东科技峰会现场

由于前两种的训练成本偏高,且用于通用大模型训练的公开数据“噪声”过大,容易出现错误、谣言、偏见等问题,以至于让AI 存在“幻觉”“一本正经的胡说八道”,无法保障内容真实可信,进而阻碍大模型落地行业。

近期,从OpenAI到国内部分公司,都开始偏向第三种应用路径,而京东也正是走的这条路。“知识库+搜索引擎”,大致可以理解为是产业(垂类)领域的向量数据库,这样的向量数据库与通用大模型结合,被业界称之为“黄金搭档”。

通过这样的路径,“言犀大模型一开始就既具备常识,又具备专业性。相当于是既做了通识教育,又做了四年本科教育”,何晓冬形象地描述言犀大模型的差异性。

京东找到这样的路径,并不是偶然。

从事AIGC领域研究20余年的何晓冬,在2020年开始通过注意力机制、深度学习、Transformer 生成文档、文案,他注意到,用大语言模型直接生成的文案、文字和报告总会出现一些“胡说八道”“玄幻”的现象。

于是,何晓冬和团队提出了知识注入的预训练语言模型(K-Plug),并于2021年发布了相关论文。“京东内部用上更早一点”,何晓冬说,通过K-Plug,让Transformer和行业知识结合,让生成式语言模型的内容生成正确率从83%、85%左右,直接提升到95%以上,才能达到商用程度。

“83%的正确率在to C 用户的聊天中,也可以接受。但是,商用是不可接受的。”何晓冬提到。

GPT能出现智能涌现,依靠的不是数据,而是文本数据中的知识。所以,相比一味的追求超大参数量,数据中的“知识”含量更为重要。

基于20年的行业“知识”积累,京东言犀可以说是“长”在了数智供应链上。

图片

供应链是产业中数据最集中、结构最复杂、相关度最密切的环节。在零售、物流,到健康、保险、工业等场景中,京东沉淀了从采购、分销、交易、物流等产业链条中的巨量数据,并且每天还会源源不断产生大量“活”的交互数据。

在行业中长期积累的“知识”,保障了大模型的可信,极大的帮助大模型落地。

“只有自己的场景才能培养适合自己的大模型应用”,京东集团副总裁、京东科技产品与解决方案总裁高礼强如此说道。

30%的京东数智供应链数据,训练出了产业可用的大模型,而大模型在应用过程中要落地,还需要在具体场景中继续打磨。

在场景中历练,算法与数据的飞轮

“大模型不是我们的目标,而是(产业服务的)工具。”曹鹏表示,大模型不能只用来聊天、画画、吟诗作赋,最终还是要在产业中创造价值。

所以,在语言大模型火热的半年里,京东选择了埋头摸索和尝试,让大模型先在京东的多项业务中历练。

由于AIGC在生成和交互中表现优异,所以在京东健康中落地较快。

图片

AI问诊流程

在京东健康的诸多业务流程中,大模型首先在AI问诊中落地。用户输入“我可以吃阿司匹林吗?”的诉求后,接下来在AI的引导下,通过多轮对话逐步判断病因,给出诊断、用药参考,并进行生活建议,医疗风险提示。

这就是在言犀大模型3.0的基础上,通过医疗知识和经验训练的“慧医千询”大模型,在现场辅助诊疗场景下的具体表现。这背后,是京东健康累计线上问诊数据2.8亿,超3千万高质量临患对话,140余科室医疗专家等数据积累。

如果是一般通用大模型,在遇到患者问题时,更倾向于直接把答案给出。“但是在实际的医疗场景下,是需要多轮对话,才能更深入了解用户病史信息,这样才能给出更适合用户自身特点的方案。”京东集团副总裁、京东健康技术产品部负责人李欣表示。

医疗是和百姓生活息息相关一个行业,其中存在一个著名的“不可能三角”,即医疗服务不可能同时实现高质量、高覆盖、低成本,这本质上是由于优质医疗资源的供给不足造成。

“慧医千询”的出现,目标就是通过远程医疗全流程方案,解决这个“不可能三角”。

李欣透露,“慧医千询”重点会做两个核心场景,“首先是药师的问答,这个非常专业化、具体,是医疗大模型最容易发挥作用的地方,AI自动化可以省去90%的人工工作量。再在这个基础上,推全场景医患问答。”

除了京东健康,大模型在京东物流、零售等方面也大展拳脚。

“电商的产品视频、照片直接由人去拍摄非常贵,少则几百块,多则几千块。”京东集团副总裁、京东科技产品与解决方案总裁高礼强表示,AIGC可以极大的降低商品营销的成本。

图片

目前,基于言犀的AIGC内容营销平台,已经能很好地理解商品特征,自动帮助商家生成商品图片、卖点等营销素材。以每套图为例,成本降低90%,周期从7天缩短到半天。

通过对营销的理解,以及用户运营经验的持续积累,大模型解决了诸如关键性任务,动态适应性、用户体验等问题。本次发布的AI增长营销平台是京东科技市场和平台运营团队依托日常的金融营销工作结合大模型应用的探索,能大幅优化了营销运营流程,降低运营人员的学习成本与操作成本,实现方案生产效率上百倍提高。将过去涉及产品/研发/算法/设计/分析师等5类以上职能才能完成的流程,压缩至1人。同时,一个入口的全新交互模式,让人机交互次数从2000次降低至少于50次,将操作效率提升了超过40倍。

另外,数字人在主播方面的落地也是行业热点,基于京东在电商领域知识增强模型K-PLUG,仅需在直播后台上传商品链接,数字人就能“阅读”商品详情,找到关键的规格、卖点等信息,并自动生成真实、生动、可阅读性强的直播文案。

图片

例如,商家原先写出50个SKU的直播脚本需要至少五小时,使用K-PLUG模型只需要“一键生成”。目前K-PLUG商品文案写作能力已经覆盖3000多个京东的品类,累计生成文案30多亿字。

通过上面场景就可以看到,大模型在产业(垂类)场景中的降本增效非常明显。

当大模型在海量具体场景中使用时,人类真实反馈就会让数据和算法的形成飞轮效应。这期间,高质量数据不断生成,垂直行业的智能涌现才有可能出现。

为了支撑大模型在场景中的历练,京东需要不断在产品和算力方面提升能力。产品方面,日前,京东将积累高质量行业数据的两个平台——数智平台优加DaaS和言犀智能服务都已升级到了3.0版本,进一步提升了交互能力,以及更好地将数据用起来;算力方面,已经布局了全国首个基于SuperPOD架构的超大规模计算集群——天琴α,算力总规模达到135TFLOPS(每秒浮点运算次数)。

六年AI路,三年大模型

种树最好的时间是在十年前。

在大模型突然爆火之前,京东很早已经开始“栽树”。

“技术、技术、技术”,2017年初,京东开始全面向 AI 技术转型。

第一个技术,主要用于解决内部大规模人力带来的效率问题;第二个技术,是组件化、模块化的技术服务对外输出;第三个技术,则是对前沿技术进行探索和有秩序地创新。

2017年底,京东在人工智能的布局就开始落地,一方面聚集团队,通过人才、研究、专利等打造技术护城河;但与此同时,京东也一直在思考一个问题——怎样将这些技术落地产生闭环的商业价值和产品价值?

2018年,人工智能领域科学家何晓冬正式加入京东。2020年,何晓冬团队就开始关注如何利用深度学习的模型。2021年京东开始组建大模型团队,探索深度学习及语音和语言技术在新兴领域等应用场景的落地。

早在2022年,京东就推出了百亿参数的大模型Vega。但直到今年上半年ChatGPT大火,京东虽然在2月份宣布要做服务产业的大模型,但迟迟没有对外公布。

“百模大战”白热化升级,外界都替京东着急了。“有无数的朋友,最近都会跑过来问我,你们京东有没有大模型?什么时候发大模型?”曹鹏在2023京东全球科技探索者大会暨京东云峰会上打趣道。

但这背后,其实回到一个很严肃的问题上,就是京东最初就思考的那个问题——技术的价值,也可以说成是大模型的价值。

“大模型本身是没有办法直接产生价值的,只有放到场景里才能够产生实际的价值。”曹鹏说,“在京东我们真正讲大模型本身会比较少,更多会讲在产业里面、场景里面,怎么能够利用新的技术带来产业变化,真的给产业不断提升效率、改善体验、降低成本,这才是一个技术真正核心的价值所在。”

关于大模型,京东制定了“三步走”战略。第一步,基于内部实践构建言犀大模型和言犀AI开发计算平台;第二步,在零售、金融、健康、物流等京东内部高复杂场景大规模锤炼,并针对重点场景的标杆客户进行对外服务,主要目的是发现那些看起来“不起眼”,但产业应用中又非常关键的问题;第三步,针对严肃商业场景将大模型能力对外开放。

图片

今年上半年,京东大模型走过了第一步,并在第二个阶段有了初步尝试,处于在第二个阶段的深化和逐步向第三步迈进的状态。

大模型不是一天能炼成的。

在 ChatGPT 证明 AGI(通用人工智能)的可能性之前,AI技术长期面临着技术突破遥遥无期、商业落地困难等问题,甚至AI行业自己也一度质疑过人工智能的价值。

但在今年光锥智能观察到一个现象,就是:

人工智能,已经不再是独立的人工智能实验室,而是泛化到所有业务当中。

当 AI 离开实验室,才是价值绽放的开始。

图片

京东对大模型的价值,有自己的理解。许冉在峰会上提出,“大模型的价值=算法×算力×数据×产业厚度的平方”的公式,她强调,当产业效率和产业的边界得到质的提升后,大模型才有了更重要的实际价值和意义,将不亚于又一次工业革命。

欢迎关注“光锥智能”CSDN号,关注前沿科技!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/755148.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

架构训练营:3-3设计备选方案与架构细化

3架构中期 什么是备选架构? 备选架构定义了系统可行的架构模式和技术选型 备选方案筛选过程 头脑风暴 :对可选技术进行排列组合,得到可能的方案 红线筛选:根据系统明确的约束和限定,一票否决某些方案(主要…

Java分布式项目常用技术栈简介

Spring-Cloud-Gateway : 微服务之前架设的网关服务,实现服务注册中的API请求路由,以及控制流速控制和熔断处理都是常用的架构手段,而这些功能Gateway天然支持 运用Spring Boot快速开发框架,构建项目工程;并结合Spring…

java错误:不支持发行版本5或java: 不再支持源选项 5。请使用 6 或更高版本的解决方案

大家好,我是爱编程的喵喵。双985硕士毕业,现担任全栈工程师一职,热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的…

Docker本地镜像发布到私有库

Docker Registry(Docker镜像仓库) 使用Docker Registry,可以创建私有或公共的镜像仓库,以存储Docker镜像。私有仓库可以用于存储公司内部的镜像,或者用于个人项目的镜像。公共仓库则会将发布的镜像分享到全世界。 1 …

【C++】string模拟实现

个人主页🍖:在肯德基吃麻辣烫 文章目录 前言一、string的成员变量二、string默认成员函数1.构造函数1.1 无参构造(默认构造)1.2 普通构造1.3无参构造和全缺省构造可以合并 浅拷贝和深拷贝2.拷贝构造3.赋值运算符重载4.析构函数 三、[]的下标访问和iterat…

P5 第二章 电阻电路的等效变换

1、电阻的Y形联结和△形联结的等效变换 可以发现电阻的Y形联结和△形联结可以刻画成下图模型: 如果Y形联结和△形联结i1,i2,i3都相等,则可以列公式解出R1,R2,R3之间的大小关系。 电路普遍存在对偶关系,可以将上图的电阻换成电导&#xff0c…

干货 | 一个漏洞利用工具仓库

0x00 Awesome-Exploit 一个漏洞证明/漏洞利用工具仓库 不定期更新 部分漏洞对应POC/EXP详情可参见以下仓库: https://github.com/Threekiii/Awesome-POC https://github.com/Threekiii/Vulhub-Reproduce 0x01 项目导航 ActiveMQ CVE-2015-5254 Apisix CVE-2…

el-upload实现上传文件夹(批量上传文件)

el-upload实现上传文件夹(批量上传文件)&#xff1a;关键代码在于 this.$refs.uploadFolder.$children[0].$refs.input.webkitdirectory true;//让el-upload支持上传文件夹 <template><div class"sg-body"><el-upload ref"uploadFolder" :…

【智能时代的颠覆】AI让物联网不再是物联网

自我介绍⛵ &#x1f4e3;我是秋说&#xff0c;研究人工智能、大数据等前沿技术&#xff0c;传递Java、Python等语言知识。 &#x1f649;主页链接&#xff1a;秋说的博客 &#x1f4c6; 学习专栏推荐&#xff1a;MySQL进阶之路、C刷题集、网络安全攻防姿势总结 欢迎点赞 &…

HTML5 WebSocket介绍与基本使用(解析服务端返回的二进制数据)

WebSocket基本介绍 WebSocket 是 HTML5 开始提供的一种在单个 TCP 连接上进行全双工通讯的协议。 WebSocket 使得客户端和服务器之间的数据交换变得更加简单&#xff0c;允许服务端主动向客户端推送数据。在 WebSocket API 中&#xff0c;浏览器和服务器只需要完成一次握手&a…

数据库系统 - 家庭教育平台设计开发

目录 1.绪论 1.1项目背景 1.2家庭教育平台的发展现状与优势 1.2.1国内外发展现状 1.2.2家庭教育平台的优势 2.需求分析 2.1可行性分析 2.1.1经济可行性 2.1.2 技术可行性 2.1.3操作可行性 2.2系统功能 2.2.1 家庭教育资源 2.2.2 家庭教育指导师 2.2.3家庭教育咨询…

H3C-Cloud Lab实验-静态路由配置实验

实验拓扑图&#xff1a; 接口IP地址规划&#xff1a; 实验需求&#xff1a; 1、理解静态路由的运行原理 2、掌握静态路由的配置 实验步骤&#xff1a; PC1和PC2的IP地址、子网掩码、网关 1、连接所有设备并重命名 2、R1&#xff0c;配置R1的接口IP地址&#xff0c;配置3.0、…

042、TiDB特性_系统表的使用

系统表存储位置 MySQL 存储TiDB 系统表 mysql.user 等 information_schmea提供了一种查看系统元数据的方法 与mysql兼容的表&#xff1a;tables、processlist、columns等自定义的表&#xff1a; cluster_config、cluster_hardware、tiflash_replica等等 metrics_schema: 基于P…

Java的数据结构-Map集合

文章目录 Map概述Map常用方法Map遍历元素的方法1.方法一&#xff1a;keySet()2.方法二&#xff1a;entrySet() Map概述 1、Map和collection没有继承关系2、Map集合以key和value的方式存储数据&#xff1a;键值对key和value都是引用数据类型。key和value都是存储对象的内存地址…

ChatGPT:利用人工智能助推教育创新

当前&#xff0c;世界正需要一个更加开放的、更加个性化的学习空间&#xff0c;学生的个性发展和生存发展应该被关注和尊重&#xff0c;课程应该引导学生掌握有用的东西&#xff0c;学生之间的差距应该被正视&#xff0c;教育成功的标准也要被重新定义。过去&#xff0c;我们总…

如何有效利用chatgpt?

如何有效地使用ChatGPT&#xff1f; 代码、诗歌、歌曲和短篇小说都可以由 ChatGPT 以特定的风格编写。您所需要的只是正确的问题和适当的提示。以下是有关如何有效使用ChatGPT的一些提示和想法&#xff1a; 头脑 风暴获取初稿解决编码问题尝试不同的提示格式查找标题寻求帮助…

Docker安装ElasticSearch/ES

目录 前言准备拉取ElasticSearch镜像安装ElasticSearch拉取elasticsearch-head镜像安装elasticsearch-head参考 前言 TencentOS Server 3.1Docker version 19.03.14, build 5eb3275d40 准备 docker 已安装。 安装 docker 参考&#xff1a;【Centos 8】【Centos 7】安装 docke…

XSS简介

OWASP TOP 10 OWASP(开放式Web应用程序安全项目)的工具&#xff0c;文档&#xff0c;论坛额全球各地分会都是开放的&#xff0c;对所有致力于改进应用程序安全的人士开放&#xff0c;最具权威的就是10项目最严重的Web应用程序安全风险列表 Cross Site Scripting&#xff08;X…

基于mediapipe的人脸关键点检测及嘴唇换色demo

Face-mesh(人脸关键点检测及网格绘制) import mediapipe as mp import numpy as np import cv2mp_face_mesh = mp.solutions.face_mesh face_mesh = mp_face_mesh.FaceMesh(static_image_mode=False, # False处理视频,True处理单张图片max_num_faces=1,refine_landmarks=True,…

LayUI之CRUD(增删改查)

目录 一、前期准备 1.数据表格 2.弹出层 3.用户表数据查询 二、用户管理后台编写 三、前端JS编写 四、效果展示 一、前期准备 1.数据表格 在layui官网找到我们需要的数据表格 根据需求复制修改代码&#xff0c;再找到表单复制一个输入框和按钮&#xff0c;做一个搜索功能…