480万商品,如何架构商品治理平台?

news2025/1/23 10:35:11

说在前面

在40岁老架构师 尼恩的读者交流群(50+)中,很多小伙伴拿高薪,完成架构的升级,进入架构师赛道,打开薪酬天花板

最近有小伙伴拿到了一线互联网企业如京东、网易、微博、阿里、汽车之家、极兔、有赞、希音、百度、滴滴的架构师,遇到一些很重要的面试题:

  • 一个系统,如何进行 技术架构演进,你的方法论是什么?
  • 一个系统,如何进行 服务边界划分,你的方法论是什么?

现在,40岁老架构师尼恩,站在京东如何架构商品治理平台的巨人肩膀,给大家提供一份比较全面的参考答案。使得大家可以充分展示一下大家雄厚的 “技术肌肉”,让你的面试官爱到 “不能自已、口水直流”

也一并把这个题目以及参考答案,收入咱们的 《尼恩Java面试宝典PDF》V113版本,供后面的小伙伴参考,提升大家的 3高 架构、设计、开发水平。

《尼恩 架构笔记》《尼恩高并发三部曲》《尼恩Java面试宝典》的PDF,请关注本公众号【技术自由圈】获取

文章目录

    • 说在前面
    • 480 万商品,京东如何架构商品治理平台?
    • 背景
    • 系统架构介绍
    • 早期的治理系统
    • 治理系统架构升级
      • 抽象思维显神威
    • 难点问题巧手破
      • 业务难点问题
      • 技术难点问题
      • 治理触达终落地
    • 治理业务全景图
    • 未来规划
    • 总结
    • 说在最后:有问题可以找老架构取经
    • 推荐阅读

480 万商品,京东如何架构商品治理平台?

注意,此文作者不是尼恩, 作者:京东到家技术团队/达达集团技术柯贤铭

此文,仅仅是作为架构师的重要学习材料,供大家参考。

同时,希望此文也能给京东到家的产品多做点宣传, 建议大家多用用京东到家的 服务和商品。

背景

作为一家即时零售电商平台,京东到家致力于在一小时内将各类优质商品送达消费者手中,同时也在努力提升商品的价值和平台的满意度。

京东到家商品管理系统,其主要职责:

对商品的创建、修改和展示的全流程进行干预和审核,旨在发现并解决商品信息中如:敏感词、虚假宣传、错误信息等不符合平台规范和质量要求的问题,确保商品与实物的一致性,以及信息的准确性。

系统架构介绍

京东到家的各个业务线都采用了标准化的微服务架构设计,各个系统在迭代过程中只需按需申请对应的组件。

以下是治理系统所使用的技术组件:

  • 日志服务:提供日志采集和查询服务。
  • RPC调用:利用京东的 JSF 平台,实现服务间注册、服务间调用和服务治理等功能,支持请求超时自动阻断。
  • 服务监控:使用统一监控与告警服务平台,实现秒级监控、多方位监控、服务告警、全链路追踪等功能。
  • 分布式调度引擎:基于 TBSchedule 分布式调度引擎框架构建的服务,负责定时任务的执行和分发。
  • 高性能存储:使用 Redis 集群、MySQL 集群等。
  • 消息中间件:采用京东的 MQ 中间件,实现业务解耦。

系统架构如下

系统架构

注意:请点击图像以查看清晰的视图!

早期的治理系统

第一个需求与大多数业务系统相似,即基于数据的增删改查,构建一套敏感词管理模块,同时为商品主系统提供敏感词的校验能力。

第二个需求是为运营团队提供一个核验结果的报表,主要逻辑是通过上传 Excel,内部解析后调用接口获取相应的数据结果,基于 MySQL 进行存储,然后提供查询和展示功能,方便运营人员使用。

然而,由于缺乏设计和长远的考虑,因此当时的治理系统与商品主系统耦合严重,早期治理系统业务架构图示如下:

早期治理系统业务架构

注意:请点击图像以查看清晰的视图!

随着平台对商品信息合规性的规定日益严谨,针对商品分类、净重、图片等各项治理需求也相继出现。

然而,在上图的设计之中,我们可以明显看出,治理系统是基于具体业务来构建对外接口的。

因此,随着业务需求的持续扩大,两个系统之间交互的接口数量也会急剧增长,这是我们不愿意看到的。

另外,治理的最终目标是期望商品问题能够得到解决,而不仅仅是发现,因此,将问题暴露给运营或商家是必要的。然而,目前存在两个问题:

  1. 商品系统在其主要流程中过度依赖治理的核验功能,且随着业务的扩展,依赖程度会逐步增加。
  2. 商品系统只能将前置拦截的核验结果告知商家,业务覆盖面不足。

再加上许多问题属于弱合规性(不需要强制拦截但仍需要解决),因此,需要将商品治理业务的核心从商品系统转向治理系统

为了实现商品治理的高效率,对治理系统的设计和定位进行了调整,提出了两个基本原则:

  • 治理系统需要完成整个治理业务的闭环,作为商品问题发现和解决的总入口和总出口。
  • 治理系统需要具备高扩展性,当增加特定化治理需求时能够迅速响应。

治理系统架构升级

抽象思维显神威

在理清治理系统的业务架构升级思路之后,我们首先需要确定的一个问题就是:治理系统最基础的原子能力是什么?

以各个主系统为例,‘

商品系统最基础的原子能力即:商品的创建、修改和提供查询能力、

库存系统最基础的原子能力即:商品库存信息的维护及查询能力。

根据治理业务的发展规划,我们也基本确定出治理系统的原子能力,即:发现商品存在的合规问题,并向外提供查询和辅助解决的能力

对于合规问题的定义,我们做出了如下解释,即:不符合电商平台商品展示规范的如敏感词、虚假渲传等问题。

例如商品名称中包含敏感词,会被视为敏感词问题,需要说明的是:在编码阶段,一种可量化的具体规则可以对应一种合规问题,且同一商品可能同时存在多个不同的合规问题。

目前到家治理系统所涉猎的合规问题主要有:

合规问题大类对外描述问题细节
商品毛重问题商品毛重不准确商品毛重与实际商品不符、商品毛重超过最大运力限制等
商品信息不正确商品信息不正确,请检查具体内容商品名称包含敏感词、商品分类与实际商品不符、虚假宣传等
商家商品经营范围问题当前售卖商品超出商家经营范围当前售卖商品超出商家经营范围等
图片信息问题商品图片信息存在问题商品无主图、商品主图为默认图、商品主图为黑底图等
未来计划
商品价格问题
商品画像问题
...

为了方便理解,我们可以将每一种合规问题看作是一种策略,而针对策略的顶层接口又定义了四个核心方法:

  • 核验方法:根据业务规则实现的具体核验逻辑
  • 自定义过滤能力:根据业务特点,减少无用处理
  • 问题关联的字段:每一个问题都需要关联具体的影响字段或被影响字段
  • 映射关联的枚举:每一个问题都需要关联具体的问题原因

具体的实现逻辑如下图所示:

注意:请点击图像以查看清晰的视图!

商品毛重信息填写错误为例,下图为处理前后的展示结果:

关于毛重的问题,我们可以将其与相关的枚举和文案映射联系起来,即:当商品毛重出现偏差(问题类型)时,建议的毛重为 XXX(文案映射)。其关联的字段包括商品的重量和名称。通过结合一定的过滤逻辑和验证算法,我们可以完成对毛重问题的抽象处理。以此方式,我们在处理新的治理问题时,可以借鉴这种做法。

熟悉设计模式的读者可能已经发现,这个设计方案实际上是策略模式和模板方法模式的混合体。在编码阶段,我们也会用到工厂模式,在编码层面整体的变化如下图所示:

注意:请点击图像以查看清晰的视图!

上述方案落地之后,产研团队对治理业务的未来发展有了基本的共识,同时,需求的实现也变得更加简单。我们不再需要关注其他系统的逻辑,而是专注于合规问题的业务规则实现。

业务部门和产品团队能够通过数据分析来确定未来的治理重点和需求规划,研发人员也通过优雅的方式解决了系统间耦合和业务代码重复的问题。

难点问题巧手破

在我们初步设定治理系统的业务架构设计后,后续迭代过程中,我们遇到了两个比较棘手的问题,一个是业务问题,一个是技术问题。

业务难点问题

业务部门要求 APP 展示的商品主图不能与默认图(如空白图、品牌商标图等不能体现商品信息的图片)相同,然而商品图片的校验逻辑一直由图片核验系统承接。

这就引起了一个问题:治理系统是否需要集成图片核验逻辑,如果不集成,那又该如何将其图片违规问题纳入至治理体系中?

有经验的开发者可能会建议使用消息队列(MQ)的方式,由图片核验系统将校验结果发送至治理系统,以解决此问题。

实际上,我们也是这么做的,只是做得更加彻底。

在设计模式中,我们通常会将一系列类似业务整合成一个公共接口向外提供能力,我们将其称为:门面模式或外观模式。

针对上述类似问题,我们找到了一个通用的处理方法,即:将治理系统作为门面,其他系统作为组件,各系统都可以主动的向治理系统提供需要治理的内容。

该方案确定后,各种棘手的业务场景也变得简单起来,同时,此举还扩大了治理系统的边界,例如商品无图合规问题,商品差评率高的问题,只需要对应系统将相关数据/结果以消息队列(MQ)的形式发送至治理系统,然后由治理系统为其绑定具体的合规问题即可。

在编码层面,我们采用最简单的消息队列(MQ)解耦方式实现,示意图如下:

注意:请点击图像以查看清晰的视图!

在进行治理迭代的过程中,有一系列的需求是针对平台商品的图片进行治理,以破损图逻辑为例。

在最开始的处理逻辑中,大家查询资料整合信息,发现平台偶尔出现的破损图是由于图片在下载过程中未下载完整后流中断,触发上传引起的。

因此在第一版的逻辑中,我们查阅资料作出了如下逻辑判断:当图片下载完成触发上传前,对比请求体中的ContentLength与实际图片字节大小,问题初步解决。

技术难点问题

然而,不久之后,问题再次爆发,我们发现事情并非想象中那么简单。

由于我们的平台对接了众多的商家系统,各个系统的图片服务器和后台逻辑都不尽相同,因此我们无法对所有图片都采用文件大小比对的方式进行处理。’

因此,我们重新进行了调研,并实现了针对破损图的核验能力。

注意:请点击图像以查看清晰的视图!

即通过下载后的图片内容进行处理和分析,利用算法与目标问题的业务特征进行识别,从而基本解决了这个问题。

同时,基于该思路我们也衍生出针对黑底图默认图的处理方式,在图片问题的治理上更进一步。

治理触达终落地

基于上述的方案和设计,治理系统在问题发现的流程上已经趋于完善,

接下来,产品提出了新的要求,即:部分问题实现自动治理及问题触达商家。

机器学习的模型,大致可分为两种:分类模型和生成模型。

抛开它们的具体含义,我们可以借鉴这种设计理念,将治理系统划分为两个部分,即:发现解决

上述的业务提取和技术问题、业务问题都是用于侦测问题的,当我们将解决问题的目标纳入治理体系,只需要对现有架构进行适度的扩展就能满足需求。

以商品毛重信息填写错误为例,我们只需要在上述的提取中添加两个待实现方法:

  • 是否需要自动处理:毛重问题需要自动处理
  • 自动处理的具体实现规则:当实际毛重大于某一阈值时,将商品系统下架处理(依托于商品对外接口能力)

在核验结果存储前,依据具体的执行逻辑以及数据反馈结果来判断是人工处理还是系统处理即可。

对于触达需求,其实现更加简单,因为在初始阶段我们就定义了治理业务交流的基本元素是具体的治理问题,我们只需要将已存储的数据通过接口或消息队列的形式展示即可。

至此,整个治理体系从编码层面也就建设完成,其核心逻辑在三个环节:

  1. 商品变动MQ/其他系统治理内容通知触发具体合规问题核验。
  2. 针对核验结果进行判断:人工处理或系统自动处理(处理的能力需借助于商品对外接口)。
  3. 核验结果对外露出。

下图为治理系统当前整体业务结构图:

治理系统整体架构图

注意:请点击图像以查看清晰的视图!

治理业务全景图

自从治理平台业务框架升级以来,已经连续稳定运行了九个多月。

在此期间,我们已成功治理了 480 万以上的平台商品,构建了 8 种识别能力、3 种处理方式和 2 种触达方式。

同时,我们依托商品和标品系统,为商品快速建品、基础信息建设和治理审核等方面提供了有力保障。

以下是到家治理的全景图:

治理业务全景图

治理业务全景图

注意:请点击图像以查看清晰的视图!

未来规划

现行的治理体系主要围绕商品系统的核心环节进行设计和构建,其影响范围相对较小。

实际上,我们可以将商品治理的成果扩展应用到商品体系之外的其他系统。

例如下图中的各个业务场景:

注意:请点击图像以查看清晰的视图!

以搜索推荐为例,我们可以针对各种合规问题制定相应的扣分规则,在搜索侧构建数据时,将商品的合规分数纳入其中,并根据分数大小进行排序,以满足搜索条件。

同时,我们也需要将一些算法无法识别的问题纳入治理体系,例如:商品差评率高、退货率高等。

总结

随着业务的不断发展,对商品信息质量的要求将越来越高。到家治理系统需要与各上下游系统紧密联动,提供更加精细化的商品管控能力。

我们期待在未来,我们的治理能力能够更加优秀,为用户提供更真实、贴近实际的商品数据和更优质的服务。

说在最后:有问题可以找老架构取经

架构之路,充满了坎坷

架构和高级开发不一样 , 架构问题是open/开发式的,架构问题是没有标准答案的

正由于这样,很多小伙伴,尽管耗费很多精力,耗费很多金钱,但是,遗憾的是,一生都没有完成架构升级

所以,在架构升级/转型过程中,确实找不到有效的方案,可以来找40岁老架构尼恩求助.

前几天一个小伙伴,他们要进行 电商网站的黄金链路架构, 开始找不到思路,但是经过尼恩 10分钟语音指导,一下就豁然开朗。

推荐阅读

《百亿级访问量,如何做缓存架构设计》

《多级缓存 架构设计》

《消息推送 架构设计》

《阿里2面:你们部署多少节点?1000W并发,当如何部署?》

《美团2面:5个9高可用99.999%,如何实现?》

《网易一面:单节点2000Wtps,Kafka怎么做的?》

《字节一面:事务补偿和事务重试,关系是什么?》

《网易一面:25Wqps高吞吐写Mysql,100W数据4秒写完,如何实现?》

《亿级短视频,如何架构?》

《炸裂,靠“吹牛”过京东一面,月薪40K》

《太猛了,靠“吹牛”过顺丰一面,月薪30K》

《炸裂了…京东一面索命40问,过了就50W+》

《问麻了…阿里一面索命27问,过了就60W+》

《百度狂问3小时,大厂offer到手,小伙真狠!》

《饿了么太狠:面个高级Java,抖这多硬活、狠活》

《字节狂问一小时,小伙offer到手,太狠了!》

《收个滴滴Offer:从小伙三面经历,看看需要学点啥?》

《尼恩 架构笔记》《尼恩高并发三部曲》《尼恩Java面试宝典》PDF,请到下面公号【技术自由圈】取↓↓↓

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1045993.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Fortinet 2023上半年全球威胁态势研究报告:勒索软件检测成下降趋势,针对性攻击持续升温

近日,专注于推动网络与安全融合的全球网络安全领导者Fortinet(NASDAQ:FTNT),发布《2023上半年全球威胁态势研究报告》。报告显示,2023 年上半年勒索软件检出数量继续下降、高级持续性威胁(APT&a…

机器人中的数值优化|【六】线性共轭梯度法,牛顿共轭梯度法

机器人中的数值优化|【六】线性共轭梯度法,牛顿共轭梯度法 往期回顾 机器人中的数值优化|【一】数值优化基础 机器人中的数值优化|【二】最速下降法,可行牛顿法的python实现,以Rosenbrock function为例 机器人中的数值优化|【三】无约束优化…

Spring Boot 3.0:构建下一代Java应用的新方法

文章目录 Spring Boot 3.0:一览1. **模块化应用程序**2. **更强大的自动化工具**3. **更强大的安全性**4. **更好的性能和扩展性** 如何开始使用Spring Boot 3.01. 安装Spring Boot CLI2. 创建新项目3. 配置应用程序4. 编写业务逻辑5. 测试应用程序6. 构建和部署 结…

DataGrip 恢复数据

DataGrip 恢复数据 准备数据库 create database chap02; use chap02;恢复数据 运行sql脚本方式恢复数据到刚刚创建的数据库 数据右键—> SQL Scripts —> Run SQL Script… 选择sql脚本

基本网络协议

TCP 协议 TCP 协议是一种传输控制协议,是一种面向连接的传输层协议,它提供高可靠性的通信高可靠性:数据无错误,数据无丢失,数据无失序,数据无重复到达。 TCP 协议头部结构 下图是 TCP 协议的头部结构,如图: 16 位端口号: 告知主机…

超声波乳化具有什么特点(优点)?

梵英超声(fanyingsonic)探针式超声波乳化棒 超声波乳化是通过探针式超声波探头,高强度超声波耦合到液体中并产生声空化。超声波或声空化产生高剪切力,提供将大液滴破碎成纳米尺寸液滴所需的能量。梵英超声(fanyingsonic)提供各种探头式超声波乳化棒和配件…

QT的安装和注册

浏览器搜索qt官网或者点链接直接跳转 Index of /new_archive/qthttps://download.qt.io/new_archive/qt/尽量下载5.6版本以上的 根据系统选择下载 进入qt官网 点击注册 在安装界面输入注册的账号 然后一直点击下一步 选择需要的组件 完成安装

基于springboot+vue的新闻推荐系统

目录 前言 一、技术栈 二、系统功能介绍 管理员模块的实现 用户信息管理 排行榜管理 新闻信息管理 用户模块的实现 首页信息 新闻信息 我的收藏 三、核心代码 1、登录模块 2、文件上传模块 3、代码封装 前言 随着信息互联网购物的飞速发展,国内放开了自…

MeterSphere 监控方案

前言:在部署MeterSphere之后,很多时候需要看下MeterSphere服务的监控信息,虽然有监控告警脚本,但还不是太直观,所以就结合 PrometheusExporterGrafana 部署一套完整的MeterSphere监控方案。 首先我们先罗列一下需要监控…

【工具使用】如何使用Audition创建多音轨项目并验证

一,简介 本文主要介绍如何使用Audition 2020创建多音轨工程,并新增轨道,供参考。 二,操作步骤 2.1 新建多轨工程 打开Audition,新建多轨会话: 设置参数,点击确定: 工程默认有6个…

MataDoor 模块化后门:先发现后解除

👁 PT 专家安全中心的专家发现了一个新的 Dark River 组织,该组织利用名为 MataDoor 的高科技模块化后门攻击国防工业公司。请阅读我们的最新研究。 我们的专家于 2022 年 10 月在调查一家俄罗斯工业企业的事件时首次遇到这种恶意软件。 🥷…

Javascript中生成器函数和Generator对象的介绍与使用

✨Generator 🎶Generator的描述 Generator 函数是ES6提供的一种异步编程解决方案 🎉三种异步方法出现的顺序 🍧Generator的 核心语法 // 像下面这样 func 这样的函数称之为生成器函数 // 通过 * 进行声明 通过yield进行等待 function* fu…

十六,镜面IBL--预滤波环境贴图

又到了开心的公式时刻了。 先看看渲染方程 现在关注第二部分,镜面反射。 其中 这里很棘手,与输入wi和输出w0都有关系,所以,再近似 其中第一部分,就是预滤波环境贴图,形式上与前面的辐照度图很相似&#…

TensorFlow入门(五、指定GPU运算)

一般情况下,下载的TensorFlow版本如果是GPU版本,在运行过程中TensorFlow能自动检测。如果检测到GPU,TensorFlow会默认利用找到的第一个GPU来执行操作。如果机器上有超过一个可用的GPU,除第一个之外的其他GPU默认是不参与计算的。如果想让TensorFlow使用这些GPU执行操作,需要将运…

Java多线程编程-栅栏CyclicBarrier实例

前言 本文是基于《Java多线程编程实战指南-核心篇》第五章个人理解,源码是摘抄作者的源码,源码会加上自己的理解。读书笔记目前笔者正在更新如下, 《Java多线程编程实战指南-核心篇》,《How Tomcat Works》,再到《spr…

QT中计算日期差,并进行加减

1、界面上拖动两个QDateTimeEdit控件,同时设置为开始时间与结束时间,然后再来拖动个pushButton,命名为查询功能,然后槽函数中,实现如下: void Database::on_pushButton_4_clicked() {QDateTime time1 u…

ARM/X86工控机在轨道交通车站管理系统的应用(1)

车站管理系统 车站管理系统是一种集成平台,包括综合监控系统(ISCS)、火灾报警系统(FAS)、以及楼宇自动化系统(BAS)等。由于其复杂性,车站管理系统要求硬件必须稳定且可扩展,以确保24/7全天侯正常运作。信迈工业服务器级系统素以坚固耐用和广…

x86汇编基础

目录 CPU架构与指令集 x86 / x64 CPU操作模式 寄存器 数据类型 数据传送与访问 算数逻辑与运算逻辑 跳转指令和循环指令 栈与函数调用 这一部分更详细的内容可以参考我的专栏:C与汇编 CPU架构与指令集 CPU即中央处理单元(Central Processing Unit )&#…

虚拟机联网

桥接 桥接模式就是虚拟机与你的电脑平起平做,都有同样的IP,且与你的电脑在同一网段下,就能够上网。 电脑的IP的地址 虚拟机的ip地址 设置vm1的ip地址与网关与电脑相同 如果出现ssh连接虚拟机不成功的问题,无其他问题时&#xff0…

2023-09-27 LeetCode每日一题(餐厅过滤器)

2023-09-27每日一题 一、题目编号 1333. 餐厅过滤器二、题目链接 点击跳转到题目位置 三、题目描述 给你一个餐馆信息数组 restaurants,其中 restaurants[i] [idi, ratingi, veganFriendlyi, pricei, distancei]。你必须使用以下三个过滤器来过滤这些餐馆信息…