数云融合丨知识图谱在烟草零售数字化转型中的应用

news2024/9/28 23:38:43

一、知识图谱的趋势      

随着互联网、云计算、大数据、人工智能等信息数据技术的快速发展,计算机的智能化程度也越来越高,知识图谱作为人工智能的核心技术,其在数据集成、语义表示和逻辑推理等方面存在着得天独厚的优势。

2021年,知识图谱核心市场规模预计达到107亿元,而到2026年,相应规模将超过296亿元(《2022年中国知识图谱行业研究报告》。感知到认知的跨越式发展,须引入发展认知技术,知识图谱在此形势下成为了破局的关键技术。

经过多年的发展,知识图谱的技术已经深入到互联网、医疗、金融等多个行业,其应用场景也包含了智能推荐、业务推理、运营分析、服务测评、决策支持、RPA机器人与大数据挖掘。

二、什么是知识图谱    

知识图谱是人工智能的一大底层技术,是描绘实体之间关系的语义网络,自带语义、逻辑含义和规则,通过三元组即“实体×关系×属性”集合的形式来描述事物之间的关系。

知识图谱将非线性世界中的知识信息结构化、可视化,辅助人类进行推理、预判、归类。

知识图谱中的图并非图像概念,而是类似化学分子式的结构,一个知识图谱往往存在多种类型的实体与关系。

知识结构网络化、网络结构复杂、网络由三元组构成、数据主要由知识库承载是知识图谱的四大基本特征。一般而言,知识图谱的数据以文本化数据为主,数据化数据为辅。

三、烟草零售行业的痛点     

烟草商业企业作为烟草产业链上重要一环,外部连接烟草工业企业、零售客户、消费者,内部包含营销、专卖、烟叶、物流等诸多业务,信息系统众多,企业数据量庞大。

特别是当前卷烟营销工作出现了新的特点,卷烟营销模式、方法和手段也在不断发生变化,面对“客户需求多元化、客户体验个性化、行业特征高度适配化”的数字化运营阶段,如何借助知识图谱技术,整合烟草商业企业诸多业务系统数据资源,探索建立一个适用于卷烟零售户的服务策略体系。

为零售户提供全面高效的服务,能真正解决零售户的实际问题,同步提升烟草公司服务能力、密切客我关系、强化品牌培育、拉升卷烟结构、强化终端软实力,提高客户满意度和忠诚度,是实现卷烟营销以及整个行业高质量发展的重要环节。

四、知识图谱  在烟草零售行业的具体应用   

# 1   烟草零售行业知识图谱构建设计

  • 设计思路 

在烟草零售行业,主要解决如何基于知识图谱技术,利用烟草商业企业营销、物流、专卖、内管、市管等内部业务系统以及零售终端等外部系统数据,在此基础上建立零售客户标签体系,能全范围,多视角的描述零售客户。

利用大数据与数据可视化等相关技术,实现标签计算、展示等全生命周期管理。在零售户标签体系之上,建立零售客户的知识图谱模型。

围绕零售客户终端属性、规范经营、以及不同类型计算标签(预警度、诚信度、配合度、成长度、规范度等)数据模型的生成。

实现基于以零售户和卷烟为中心实体的信息检索与推荐系统,最终形成烟草零售户客户服务策略的知识图谱,充分展示零售客户在基本属性、业务关联关系、用户需求、自身价值、用户营销、用户行为等各个业务层面的信息,支持精准营销、客户洞察、渠道优化、品牌提升、运营内控、监督管理等卷烟零售客户服务的应用场景。

  • 图谱构建方式 

烟草零售行业图谱的构建方式主要是选用自上而下的模式来建设零售客户服务策略知识图谱的方式。

通过将数据粒度从文档级别降到数据级别,聚合大量知识,实现知识的快速响应和推理。

其基本组成单位是“实体-关系-实体”三元组,以及实体及其相关属性的键值对,实体通过之间的关系相互联结。

从原始数据到知识图谱的生成,大致要经历知识抽取、知识融合、数据模型构建等过程。具体包括四个步骤:知识抽取、知识融合、知识加工、图谱应用,如下图所示:

/   图:应用数据架构知识图谱模型

知识图谱的构建与计算,需要考虑以下内容:

1)  不仅需要考虑如何结合文本、多媒体、半结构化、结构化知识、服务或API,以及时态知识等的统一知识表示,还需要进一步考虑如何结合结构化(如关系型数据库)、半结构化(HTML 或 XML)和非结构化(文本、图像等)多源异质数据源来分别构建通用事实类(各种领域相关实体知识)、常识类、零售客户记忆类和服务任务类知识库等;

2) 针对不同类型的数据和知识,有不同的构建技术,如针对结构化数据的知识映射、针对半结构化知识的包装器(Wrapper),以及针对非结构化知识的文本挖掘和自然语言处理。

3) 为了得到融合的图谱,除了需要考虑离线的多源异构的知识融合,还需要额外考虑服务任务类动态知识的对象绑定。这项工作往往是在线完成的,相当于根据不同的交互,在线动态扩充知识图谱并实例化的过程。

4) 最后还需要考虑知识图谱的存储。既然有了知识,就必须用一定的手段去存储。但这里谈到的存储,不仅仅是建立一个知识库,还包括存储之后的应用效率等。

  • 标签体系建立 

标签体系内容可以从零售户基础信息、营销、专卖、物流、规范经营、内管等多个领域中定义。

零售客户标签体系建立模式主要包括标签定义、标签规则、标签计算和标签查询这4步。

标签定义包括确认标签在标签管理体系中的分类、标签名称、标签代号、标签在同规则下的对应值、标签状态等。

标签定义之后,需进一步明确标签所对应的业务逻辑,标签规则的设定即为标签的业务逻辑配置过程。

标签计算包含标签计算任务的建立,以及标签计算调度接口的实现。主要是对配置好的标签规则按指定循环周期进行自动的程序调度管理,以确保标签数据的正常使用。

标签查询是广义的查询,即只要通过技术手段获悉了标签的直接或间接分析结果,均为标签查询。

  • 知识图谱模型

利用自动化相关技术,将已有的业务系统数据(结构化)、离线文本、图片等(非结构化)、以及运行日志等(半结构化)自动整合成对应的结构化数据,以便于后续的实体、关系、属性的建模与维护。

譬如,以业务系统结构化数据为例,结合业务数据的关联关系,将概念类类比成模式层,将数据之间的关联关系映射到知识的关系。

·模型定义。模型定义包括模型的名称,所属类别等 信息。模型定义功能包含模型的在线维护,具体包含模型的增删改查等。

·模型规则。模型定义之后,需进一步明确模型所对应的业务逻辑,即为模型的业务逻辑配置过程,确定标签具体筛选出客户的组合方式。

·模型规则主要支持以下几种运算逻辑:四则运算、比较运算、逻辑运算、聚合运算、函数运算以及常量的引用。并支持在线配置模型规则,以应对不同模型计算场景。

·模型计算。模型计算主要是对配置好的模型规则按指定循环周期进行自动的程序调度管理,以确保模型数据的正常使用。包含模型计算任务的建立,以及模型计算调度接口的实现。

·模型查询。模型数据的查询主要是按照业务需求将零售客户的模型输出,提供实时接口查询和批量卸载两种方式。

# 2   知识图谱系统架构 

综上所述面向烟草零售户客户服务策略的知识图谱建设的理论基础,在系统架构设计上,可分为6个部分,数据获取层、数据存储层、数据组织层、数据计算层、数据管理层以及数据应用层。其设计如下图所示:

/ 图:知识图谱系统架构示意图

  • 数据接入层

数据接入层,其主要目的是对接当前烟草商业系统中已有的业务数据,主要包含营销、物流、专卖和内管数据。本部分数据以结构化数据为主,并且围绕零售户、卷烟两大实体类型进行展开。

  • 数据存储层

数据存储层,其主要功能是实现各业务系统原始数据的汇总存储、加工后结果数据的存储,包含知识图谱数据的存储。

其中基础源数据直接以文件方式存储到HDFS中,并结合 Hive 实现传统数据仓库的功能;而对于图数据,则结合图数据库 Graph 与列数据库 Hbase 实现数据存储。

对于图数据的索引,则使用基于 Lucene 的搜素引擎 Elasticsearch。该搜索引擎是一种基于全文搜索的分布式搜索引擎,从而保证数据的高效检索。

  • 数据组织层

数据组织层,其主要功能是实现数据的预处理、装载与实体对齐等操作。数据预处理主要包含命名实体识别、实体特征向量的提取以及实体向量化表示等操作。

当然针对烟草知识图谱中节点相似度的计算,亦属于数据预处理的范畴。

  • 数据计算层

数据计算层是数据组织层的扩展与延续。其主要目的是实现数据的深度分析与计算。

包含批量离线数据的计算以及即时数据的计算,而计算的工具,则使用基于内存的分布式计算引擎——Spark。 

  • 数据管理层

数据管理层则侧重数据的权限管理与调度管理等。重点权限的设置与数据API 的管理等。

通过数据权限配置,可规范数据输出的内容。

通过调度配置可配置自动生成数据、处理数据的调度任务,从而实现程序的自动化运行。 

  • 数据管应用层

数据应用层主要用于零售户与卷烟信息的检索,实体关系展示,图谱展示等功能,是本系统中人机交互的重要部分。而对于专业人士来说,本部分可提供本体管理、知识维护等模块。

# 3   知识图谱应用 

面向烟草零售客户服务策略的知识图谱建立之后,可以广泛的应用于烟草商业企业中,为零售户提供全面高效的服务,能真正解决零售户的实际问题,同步提升烟草公司服务能力、密切客我关系、强化品牌培育、拉升卷烟结构、强化终端软实力,配套终端硬件建设,助力卷烟市场大户管理、货源精准投放等工作。

/ 图:零售客户与卷烟知识图谱示意图

  • 卷烟商品推荐

基于零售客户服务策略知识图谱的建立,构建基于零售户和卷烟的检索与推荐系统,可以获取3类卷烟商品数据与零售客户的关系。

·强关联卷烟商品:按照零售客户和卷烟品牌知识图谱的相似度关系,相似度值最高的卷烟商品定义为强关联卷烟商品。

·弱关联卷烟商品:按照零售客户和卷烟品牌知识图谱的聚类结果,与推荐目标用户相似度较高用户聚类的卷烟商品,且这些卷烟商品与目标用户关联度较低的商品定义为弱关联卷烟商品。

·无关联卷烟商品:按照零售客户和卷烟品牌知识图谱的聚类结果,被聚类次数较高的卷烟商品但与目标用户没有关联关系的商品为无关联卷烟商品。

  • 零售客户经营指导

通过对知识图谱技术的应用,以实现“简化、协调、高效”为指导原则,通过梳理一线营销人员日常工作,减少重复、非必要工作内容及流程,从工作协同、效率提升、价值增值等方面创新客服经理工作方法,改善客户经理工作服务流程,线上服务和线下服务相结合,依托面向烟草零售客户服务策略的知识图谱,提升客户服务的满意度,做好现代终端建设的服务和保障工作。

五、结束语  

本文探讨了基于知识图谱技术,利用烟草商业企业营销、物流、专卖、内管、市管等内部业务系统以及零售终端等外部系统数据,建立零售客户与卷烟的数据标签体系,设计了面向烟草零售客户服务策略的知识图谱系统。

通过机器学习算法进行回归、分类、聚类,再结合卷烟营销工作中客户服务的真实场景以及实际需求,为后续的智能化应用,如智能搜索、自动问答、推荐和决策支持等奠定基础。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/55659.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Java并发-交替打印的四种方法。

1 前言 如下图所示,现在有两个线程A,B;A打印12345,B打印abcde,结果为1a2b3c4d5e交替输出。 1.1 采用wait和notify 【分析】我们要求线程A始终先打印,因此在线程B先获得CPU使用时间时也应该阻塞。 细节 线程A应该打印…

【人工智能/算法】搜索求解(Solving Problemsby Searching)

文章目录一、求解与搜索二、盲目式搜索1. 深度优先搜索(Depth First Search, DFS)回溯搜索(Backtracking Search)2. 广度优先搜索(Breadth First Search, BFS)一致代价搜索(Uniform-cost Search…

TLog轻量级分布式日志标记追踪神器

文章目录TLog简介项目特性安装TLogspringboot依赖spring native依赖日志框架适配方式(举例Log4j框架适配器)任务框架支持(举例XXL-JOB框架)TLog架构图TLog简介 TLog通过对日志打标签完成企业级微服务的日志追踪。它不收集日志,使用简单, 产生全局唯一的…

Actor 生命周期

一,一览图 二, 大致流程 三,细节 从磁盘加载 已位于关卡中的 Actor 使用此路径,如 LoadMap 发生时、或 AddToWorld(从流关卡或子关卡)被调用时。 包/关卡中的 Actor 从磁盘中进行加载。 PostLoad - 在序…

支持向量机(SVM)—— 详细推导及案例应用可视化

支持向量机(SVM) 1. 什么是支持向量机? 在上图中,我们想在二维平面中通过画出一条分界线将黑点与白点分开,很明显,我们认为在上面所画的三条分界线中H3H_3H3​是最好的,因为H1H_1H1​压根就没有…

【行为识别】差影法三维人体姿态行为识别【含Matlab源码 277期】

⛄一、简介 该课题为基于MATLAB差影法的人体姿态识别。需要准备对应的模板图片作为背景图,然后测试图和背景图进行作差,结合形态学知识,提取出人体轮廓,接上最外接矩形,得出矩形长宽,计算长宽比例&#xf…

江江文具店铺运营方案设计

目 录 摘 要 I ABSTRACT II 第一章 项目背景 1 1.1电子商务基本概念 1 1.2电子商务现状及发展趋势 1 1.3文具行业的发展现状 2 第二章 文具行业介绍 4 2.1文具行业的调查与分析 4 2.1.1文具行业电子商务渗透率 4 2.1.2文具行业内企业电子商务销售平台使用状况调查统计 5 2.1.3文…

自研芯片重构云上算力革新,满足用户所有负载的需求!

目前,云计算已深入到整个云基础设施,进入硬件协同创新的“深水区”,芯片创新之路是最底层的创新,是最具颠覆性的,也是改变云计算游戏规则的能力。 而亚马逊云科技硬件创新背后的初衷:为云而生的硬件设计&am…

【计算机毕业设计】71.大学生兼职信息系统源码

一、系统截图(需要演示视频可以私聊) 摘 要 21世纪的今天,随着社会的不断发展与进步,人们对于信息科学化的认识,已由低层次向高层次发展,由原来的感性认识向理性认识提高,管理工作的重要性已逐…

react源码中的协调与调度

requestEventTime 其实在React执行过程中,会有数不清的任务要去执行,但是他们会有一个优先级的判定,假如两个事件的优先级一样,那么React是怎么去判定他们两谁先执行呢? // packages/react-reconciler/src/ReactFibe…

数字化门店| 运动场馆管理系统| 智慧门店小程序

忙碌了一天或闲暇之余想要放松,不少年轻人都会选择前往运动场馆进行各种运动,如打篮球、踢足球、打羽毛球等,一些城市的某个特定区域内聚集着不同品牌的运动场馆,相互之间竞争激烈。 如今,消费升级下,消费者…

Win10系统修改用户名以及C盘下Users用户名实操手册(实测有效)

当然,前提先说下如无必要,不建议修改C盘user下用户名,毕竟重装系统可能就在那一瞬间。我们要理解里面的原理,逻辑关系就会好操作很多了。再次申明,目前这只是针对Win10的实操,Win11的操作会有一些不同&…

铁矿行业商业智能BI经营分析框架(三)财务能力分析

铁矿行业属于黑色金属矿采选业,商业智能BI对于这个行业的财务能力指标分析框架跟其它行业大体上是一样的。比如从盈利能力、债务风险、营运能力、发展能力、现金流这几个角度去看。 财务分析 - 派可数据商业智能BI可视化分析平台 一、盈利能力 商业智能BI从资产、…

天黑了、让我为你关窗帘吧

今天遇到朋友发来的一个需求,需要做一个窗户上下拉窗帘的小小的交互,于是就有了今天的小DEMO,要实现下图一个效果,需要开窗帘,关窗帘,中途还可以暂停,就这样一个小小的效果,我们来分…

阿里18年架构师,带你分析经典算法应用思路,探究分布式背后原理

你要知道 长期以来,在996的工作压力下,工程师们更重视实践中的技巧,力求快速解决眼前的问题,而鲜有时间关注问题背后的底层原理。 表面看来,这种做法提高了工作效率,但实际上,这样容易形成“头疼医头,脚疼…

【Python】解决CNN中训练权重参数不匹配size mismatch for fc.weight,size mismatch for fc.bias

目录 1.问题描述 2.问题原因 3.问题解决 3.1思路1——忽视最后一层权重 额外说明:假如载入权重不写strictFalse, 直接是model.load_state_dict(pre_weights, strictFalse),会报错找不到key? 解决办法是:加上strictFalse&…

Ajax学习:解决跨域_JSONP

JSONP:非官方的跨域解决方案,纯粹依靠程序员的聪明才智,只支持get请求 JSONP是怎么工作的:再页面中有一些标签天生具有跨域能力,就像是link,img,iframe,script JSONP就是利用script标签的跨域能力来发送请求 如下所示&#xff1a…

[附源码]计算机毕业设计毕业生就业管理系统Springboot程序

项目运行 环境配置: Jdk1.8 Tomcat7.0 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: SSM mybatis Maven Vue 等等组成,B/S模式 M…

【Docker】Docker常用命令(包含Dockerfile指令)

目录一.Docker常用命令1.帮助命令2.镜像命令3.容器命令4.其他常用命令5.更多更详细命令二.Dockerfile常用指令1.常用指令2.CMD 和 ENTRYPOINT 的区别一.Docker常用命令 1.帮助命令 # docker version //查看docker版本号 # docker info //查看docker的系统信息…

外贸员的日常工作分享

外贸人米贸搜的日常工作流程为你整理如下。希望能帮到你: 外贸业务员的职责 一、业务人员在向国外买家询价前,要了解客户的基本信息,包括是否是终端客户,年采购量,消费区域,产品的用途,规格,质…