电商搜索新纪元:大模型引领购物体验革新

news2024/11/27 6:21:08

随着电商行业的蓬勃发展,搜索技术作为连接用户与商品的桥梁,其重要性日益凸显。在技术不断革新的今天,电商搜索技术经历了哪些阶段?面对大模型的飞速发展,企业又将如何把握趋势,应对挑战?为了深入探讨这些问题,京东技术总监翟周伟与InfoQ栏目探讨了电商搜索技术的发展历程、当前的应用状况以及面临的挑战和未来的发展方向。以下是采访的详细内容。

InfoQ:在您看来电商搜索经历了哪些阶段?

翟周伟:我从技术发展的角度讲下,本质上电商搜索技术演进的驱动力是通过不断的技术创新去实现更低的成本,更高的效率,以及更好的用户体验,可以划分为 4 个阶段:
第一是文本检索阶段,主要基于基础文本检索技术和以规则统计为主的人货匹配;第二是机器学习阶段,以统计 NLP 技术为核心的用户意图理解和商品理解,利用机器学习模型对 UCTR 和 UCVR 进行建模提升转化,并在人货匹配上引入 LTR 等排序模型提升相关性,同时利用用户搜索行为反馈数据来优化效果;第三是深度学习阶段,核心是 DNN 技术驱动,包括基于深度模型的意图理解和商品理解显著提升了需求分发的准确性,在商品搜索上引入了 ANN 语义向量召回,多模态召回,DNN 匹配技术,交互上除了文本交互还支持以 DNN 技术为核心的语音和图像商品搜索交互,排序上支持个性化搜索可以千人千面的商品展示;第四是大模型阶段,正是当下正在经历的阶段,首先是交互的改变,从单向的需求引导到双向的对话式自然语言交互,基于大模型的用户理解和商品理解有效解决了长尾泛化问题,在召回和相关性上大模型也正在重构整个技术架构,包括极具有颠覆潜力的大模型生成式检索技术的探索和应用。

InfoQ:在京东或者在电商平台,大模型主要应用于什么方向?可否举几个例子?

翟周伟:在电商领域主要在用户交互,意图理解和商品理解,商品召回和相关性,以及文案创意生成等方向。在用户交互上重点利用大模型的对话能力进行对话式交互导购,例如我们的京言 AI 助手,意图理解和商品理解上核心是利用大模型的超强理解能力进一步提升用户需求识别的准确性以及商品信息的精准建模,商品召回和相关性上的一个典型例子就是用大模型做商品的增强召回,用大模型对用户需求和商品 SKU 做相关性,文案生成应用上利用大模型来生成图文并茂的营销文案,大模型评论总结等。

InfoQ:这些应用有哪些实际落地的困难?

翟周伟:第一个首要问题就是通用大模型对商品知识的理解能力比较弱,直接应用没有明显效果优势;第二个问题就是个性化 Context 理解问题,大模型在理解用户购物偏好,用户评论,商品细节上存在个性化效果挑战;第三个就是时效性问题,大模型本身数据更新很慢,知识陈旧,而新商品,促销,价格等时效性更新超高频;第四个就是成本和速度问题,大模型训练和推理成本很大,大规模使用会面临 ROI 低的问题,在线推理速度也很难满足系统实时性要求;最后就是安全问题,大模型存在敏感数据泄露风险,以及生成内容的安全合规等问题。

InfoQ:大模型实时信息获取和专业信息处理能力的能力应该是非常重要的一环,京东的解决思路是什么?目前可以做到什么程度或者说效果?

翟周伟:我们的解决思路主要通过两种方法,第一是新数据和新知识的增强持续预训练,第二就是 RAG,包括电商知识图谱 KG-RAG,商品搜索 RAG,Web 搜索 RAG。通过这些技术手段我们的大模型在电商领域任务上显著高于通用大模型,并且通过 RAG 可以做到实时性信息更新。

InfoQ:如何构建一个好的大模型电商搜索引擎?在您看来需要哪些原则或者考虑?

翟周伟:大模型电商搜索引擎的核心是所使用大模型的能力决定的,这个能力不仅仅是在通用领域的性能,关键在于大模型对于电商用户的理解,对商品的深刻理解,对电商场景的理解,以及在整个电商应用任务上的性能表现,因此核心考虑是如何构建一个高性能的电商大模型能力底座,以及性能评估体系。这个也是当前我们的工作重点,启发于人类学习总是在前人积累的知识和经验上进一步学习,我们提出了一种继承学习方法来持续学习,在数据上通过提升知识密度和配比调整,通过模型结构优化,退火学习,多阶段指令对齐优化,增强安全治理对齐等方法提升我们电商大模型的性能表现。

InfoQ:大家都说大模型好,但是目前行得通的商业模式目前还不多,您认为企业,大家对于大模型的投入产出比如何?

翟周伟:大模型表现的涌现能力让人震惊,基于大模型的各种应用层出不穷,但到目前为止还没有出现所谓的大模型超级应用,也没有出现颠覆性的商业模式,由于大模型研发成本非常大,各种基于大模型的原生应用,包括一线大厂和创业公司的各种 AI 助手类应用还都处于亏损阶段,因此 ROI 是很低的,但大模型应用的商业潜力巨大,这种商业探索非常值得。同时另一个方面是利用大模型去优化成熟商业模式业务中的效果,重点在于解决中长尾问题,在这个方向上 ROI 还是可以的,已经产生了商业价值。

InfoQ:理想中的下一代 AI 电商搜索是什么样的?

翟周伟:理想的下一代 AI 电商搜索在技术上应该是完全大模型驱动或 AGI 技术驱动,产品形态上应该是一个数字虚拟助理,类似电影《Her》中出现的超级 AI 助手,在交互上可以和人类进行全模态的自然语言交互,可以直接进行无障碍的流畅语音交互,同时具有听觉,视觉,以及空间感知等能力,可以精准基于用户需求直接推荐最匹配的商品,并给出精准的商品总结,以及为什么满足需求,性价比等,在需求不明的时候可以进行拟人的交互式导购,并可以智能的通过 AI Agent 技术在用户授权下自动下单,包括后续的物流,售后服务都可以由 Agent 来完成,用户只需要下达命令即可。

InfoQ:可以看的出京东也是比较重视大模型的投入的,在您看来一般企业开发或应用大模型的门槛是不是比较高?对于企业开发和应用大模型有哪些建议?

翟周伟:在我看来,对于一般企业做大模型应用的门槛其实是相对比较低,至少是比传统的 AI 应用门槛低,是因为大模型改变了 AI 应用的研发范式,只需要会写 prompt 就可以使用大模型,而且效果不错,虽然应用门槛变低了,但要做好大模型应用的门槛是变高了,是因为一旦涉及到具体的业务场景深度效果优化就需要优化大模型本身,而大模型研发成本和技术门槛还是比较高,首先训练和推理资源投入就很大,数据也需要很大成本,技术上涉及到预训练,SFT,DPO,PPO,MOE 等技术,要做好还是有门槛的。在应用上我有两点建议:第一:如果偏向创新产品,建议初期直接调用大模型云服务 API,以 prompt 方式先把产品做出来,先跑通商业模式,尽快建立用户反馈,有一定用户规模后再考虑是否研发自己的大模型。第二:如果需要优化大模型,建议以性能和商用友好的开源大模型作为底座从而降低训练成本,可结合应用在预训练增强,指令对齐上进行优化,也可以开源模型做初始化进行模型扩展或压缩以适应业务需求。

在这里插入图片描述

大模型&AI产品经理如何学习

求大家的点赞和收藏,我花2万买的大模型学习资料免费共享给你们,来看看有哪些东西。

1.学习路线图

在这里插入图片描述

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

2.视频教程

网上虽然也有很多的学习资源,但基本上都残缺不全的,这是我自己整理的大模型视频教程,上面路线图的每一个知识点,我都有配套的视频讲解。

在这里插入图片描述

在这里插入图片描述

(都打包成一块的了,不能一一展开,总共300多集)

因篇幅有限,仅展示部分资料,需要点击下方图片前往获取

3.技术文档和电子书

这里主要整理了大模型相关PDF书籍、行业报告、文档,有几百本,都是目前行业最新的。
在这里插入图片描述

4.LLM面试题和面经合集

这里主要整理了行业目前最新的大模型面试题和各种大厂offer面经合集。
在这里插入图片描述

👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。
在这里插入图片描述

1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集

👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2044987.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

openinstall支持抖音游戏小手柄监测,助力游戏联运生态高效增长

近来,抖音“小手柄”功能风靡游戏广告生态,通过新颖的联运形式成功将游戏广告触达到抖音整个流量池,由于受众较广,小手柄也是目前直播场数、点赞数最高的形式。 为了帮助广告主快速捕捉流量红利,打通抖音小手柄的数据…

【选型指南】大流量停车场和高端停车场如何选择停车场管理系统?

在当今快节奏的城市生活中,大型停车场和高端车场的运营者面临着一系列挑战,尤其是在车辆流量大和客户期望高的情况下。选择一个合适的停车场管理系统,不仅关系到日常运营的效率,更关系到客户的满意度和车场的整体形象。 捷顺科技认…

螺纹钢生产线中测径仪对基圆和负公差的测量和影响

螺纹钢生产线中测径仪的作用 在螺纹钢生产线中,测径仪是一种关键的检测设备,它负责对螺纹钢的基圆直径、横肋和纵肋等尺寸进行实时测量。测径仪的数据对于监控和控制螺纹钢的生产质量至关重要,尤其是在进行负公差轧制时,它能够提供…

K8S中使用英伟达GPU —— 筑梦之路

前提条件 根据不同的操作系统,安装好显卡驱动,并能正常识别出来显卡,比如如下截图: GPU容器创建流程 containerd --> containerd-shim--> nvidia-container-runtime --> nvidia-container-runtime-hook --> libnvid…

【Spring Boot - 注解】@ResponseBody 注解:处理 JSON 响应

文章目录 一、ResponseBody 注解概述1. 注解的功能2. 主要功能 二、ResponseBody 的工作原理1. 接口定义2. 消息转换器3. 自动配置与默认行为 三、ResponseBody 的应用场景1. RESTful API 的实现2. 返回复杂数据结构3. 错误处理和异常处理 四、ResponseBody 的配置和自定义1. 自…

Rabbit的学习——从安装到集群

一、MQ概念 1.1、异步通讯和同步通讯 1.2、同步调用和异步调用 1.2.1、同步调用 1.2.2、异步调用 1.3、消息队列的作用 1.3.1、流量削峰/限流 1.3.2、 应用解耦 1.3.3、异步处理 1.4、消息队列的两种模式 1.4.1、点对点模式 1.4.2、发布/订阅模式 二、RabbitMQ 2.1…

MyBatis Plus批量写入慢?

1. 数据库连接配置 在使用 MyBatis Plus 进行批量插入之前,首先需要配置数据库连接。在连接 URL 中添加 &rewriteBatchedStatementstrue,以提高批量插入的性能。以下是一个示例: spring.datasource.urljdbc:mysql://localhost:3306/your…

路径规划 | 基于改进蝙蝠算法的多无人机路径规划(Matlab)

目录 效果一览基本介绍程序设计参考文献 效果一览 基本介绍 路径规划 | 基于改进蝙蝠算法的多无人机路径规划(Matlab) 蝙蝠算法(Bat Algorithm)是一种基于自然界蝙蝠群体行为的启发式优化算法。该算法模拟了蝙蝠在寻找食物时的行为…

Linux 内核源码分析---内核ICMP协议分析

因特网控制报文协议ICMP(Internet Control Message Protocol) 是一个差错报告机制,是TCP/IP协议簇中的一个重要子协议,通常被IP层或更高层协议(TCP或UDP)使用,属于网络层协议,主要用…

论文阅读-Transformer Layers as Painters

1. 摘要 尽管大语言模型现在已经被广泛的应用于各种任务,但是目前对其并没有一个很好的认知。为了弄清楚删除和重组预训练模型不同层的影响,本文设计了一系列的实验。通过实验表明,预训练语言模型中的lower和final layers与中间层分布不一致…

四路一体行车记录仪,语音提示注意行人,保障车辆行驶安全

在叉车、货车、客车等行业中,随着运输业务量的不断增加,行车安全问题已经成为了一大难题。经常会发生车祸、司乘人身安全无保障、货物损失等意外情况,这些事件不仅会给企业带来经济损失,也会影响对应行业的整体形象。 如何提高运…

服装行业的利器:RFID智能吊挂分拣系统

服装行业的利器:RFID智能吊挂分拣系统 服装业继续走粗放型老路的利润空间越来越小,行业内过度竞争利润降低,原料价格上涨导致成本上升。企业内部生产技术创新不足、工厂生产效率低,导致产出不够、货期竞争乏力。企业为了盈利生存…

C++中STL的sring类常用接口及其源码解析

1. 为什么会有string类? C语言中的字符串 C语言中,字符串是以\0结尾的一些字符的集合,为了操作方便,C标准库中提供了一些str系列的库函数, 但是这些库函数与字符串是分离开的,不太符合OOP的思想&#xff0…

VS2022快速搭建OLLVM

基本参考这篇文章: 构建含有ollvm功能的LLVM(clang-cl)供Microsoft Visual Studio 2022使用 - 哔哩哔哩 前提 已安装VS2022 1.VS开启Clang支持 我们要用自己的Clang,所以无需安装VS提供的clang编译器,而且体积太大了,10多个G&…

Jmeter基础与概念详解

🍅 点击文末小卡片,免费获取软件测试全套资料,资料在手,涨薪更快 JMeter 介绍: 一个非常优秀的开源的性能测试工具。 优点:你用着用着就会发现它的重多优点,当然不足点也会呈现出来。 从性能…

c++模板进阶——模板特化和模板分离编译

目录 前言: 1. 非类型模板参数 2. 模板的特化 2.1 概念 2.2 函数模板特化 2.3 类模板特化 2.3.1 全特化 2.3.2 偏特化 2.3.3 类模板特化应用示例 3 模板分离编译 3.1 什么是分离编译 3.2 模板的分离编译 3.3 解决方法 4. 模板的优缺点 前言&#xf…

Zotero 常用插件介绍

1. Zotero 插件安装方法 下载以 .xpi 结尾的插件;打开 Zotero → 工具 → 插件 → 右上小齿轮图标 → Install Add-on From File ... → 选择下载好的 .xpi 插件安装 → 重启 Zotero 2. 常用插件介绍 2.1. Scholaread - 靠岸学术 Zotero 英文文献相关插件&#xf…

Spring中使用JdbcTemplate访问数据库

首先在原来的基础上添加jar包&#xff0c;建一个测试数据库pring5&#xff0c;里边新建两个表users&#xff0c;authorities&#xff0c;user_authority&#xff1a; <dependency><groupId>org.springframework</groupId><artifactId>spring-jdbc<…

目标检测之数据增强

一、概述 数据增强是一种通过人工或自动方式对数据进行修改或变换&#xff0c;以增加数据集规模和多样性的技术。在机器学习中&#xff0c;数据增强被广泛应用于解决数据稀缺、数据不平衡、数据噪声等问题&#xff0c;提高模型的泛化能力和鲁棒性。 二、为什么需要数据增强 …

JAVA智慧养老护理帮忙代办陪诊陪护系统小程序源码

&#x1f475;&#x1f3fc;&#x1f496;科技温暖夕阳红 —— 探索“智慧养老护理帮忙代办陪诊陪护系统” 一、引言&#xff1a;科技如何温柔拥抱银发族&#xff1f; 在快节奏的现代生活中&#xff0c;如何给予家中长辈更周全的关怀与照顾&#xff0c;成为了许多家庭面临的难…