Portal数据清理过程说明

news2025/1/22 20:59:15

Portal门户集成平台作为统一的门户搭建和展现平台,提供综合门户、信息门户、应用门户、数据门户等不同类型门户的建设能力,可以为企业构建门户网站、内部业务中心,同时对企业文档资料进行整合、统一归档,对内部、外部提供资料。通过门户平台的搭建,为企业内部管理提供统一入口,并对外部宣传、客户服务等提供便捷的通道。

Portal门户集成平台提供多种门户的建设方案,在配置和功能完善的过程中,对Portal的相关功能进行升级,使其更好地支撑门户建设,同时对Portal中的历史数据进行清理,保证数据更加准确。

1总体说明 

为了满足Portal功能调整以及网站配置的需要,同时也为了保证后续Portal产品数据的准确全面,对Portal中预置的门户数据进行整合清理,主要针对信息门户的相关文档和图片资源等进行清理。

1.1业务需求

1.对标准产品中信息门户相关的资源进行整合清理,主要是预置门户网站、知识中心、技术博客等相关的文档

2.在清理过程中对文档涉及的相关图片进行清理,包括平台显示的相关图片记录信息,以及在Portal产品中存储的图片资源等需要一并清理;

3.在清理时需要保证文档、平台的图片数据以及产品中的图片资源保持一致,避免垃圾数据的产生;

4.后续Portal上线,需要在Portal标准产品数据的基础上,将现有的网站中的信息门户数据统一迁移合并,重新构建信息门户。

1.2需求说明

1.明确文档、图片数据、图片资源的清理方式,三者统一,避免垃圾数据;

2.对标准产品的数据进行清理,包括不再使用的文档、图片等;

3.数据库图片记录与产品中的图片资源一一对应,数据、名称、路径保持一致,不能出现无法对应的数据;

4.文档中使用的图片都能找到对应的记录,同时有对应的图片资源保证文档正常显示;

5.平台所有的图片都有在文档或其他功能中使用,没有使用的图片作为垃圾数据删除;

1.3清理思路

1.首先对数据库中的图片记录进行清理,删除重复数据; 

2.建立文档和图片的关联表,并初始化关联数据,为每一个图片找到对应的应用场景;

3.对于无法关联,没有应用场景的图片作为垃圾数据删除;

4.对server中的图片资源进行梳理,并根据图片名称、路径等和数据库记录建立一对一关联;

5.对于无法和数据库记录建立关联的图片资源,作为垃圾数据删除,同时对server图片资源的目录进行清理,删除空目录;

6.将图片资源数据整理成数据,导入数据库的临时表中;

7.通过数据库图片记录和临时表进行比对,对于图片记录中多出来的数据作为垃圾数据删除;

8.根据删除的图片记录,对图片关联的文档作为垃圾数据进行删除;

9.根据图片的使用场景(导航、组件、文档)的不同,对图片进行重命名处理,网站图片:web-文档短标题 + 序号,文档图片:art-文档短标题 + 序号

2数据记录

数据记录主要是对Portal数据库中的记录进行删除,主要是针对图片信息表中重复记录进行删除,同时建立图片和文档的关联信息。

2.1重复数据

1.数据库图片信息重复数据的判断主要依赖于图片名称和图片路径,名称和路径相同即为重复数据

2.通过ESB创建一个Http流程用于图片重复数据清理;

3.查询wcm_picture_resource获取全部图片记录; 

4.循环图片记录,将图片名称和路径拼接存储到集合中,并判断如果集合中存在相同记录,说明图片重复,进行删除处理;

5.ESB流程如下:

6.关键判断代码:

2.2建立关联

1.主要建立图片资源与文档的关联,通过关联表存储关联信息;

2.通过ESB创建一个Http流程用于更新图片和文档关联信息;

3.分别查询图片wcm_picture_resource和文档wcm_information数据;

4.先循环图片,再循环文档,通过文档的内容以及文档封面匹配图片的路径,建立图片和文档关联;

5.将关联后的数据写入关联表wcm_info_pic_rel;

6.ESB流程如下:

7.关键处理代码:

2.3数据清理

1.主要用于清理数据库中无法建立关联或没有使用场景的数据

2.查询图片数据wcm_picture_resource;

3.由于图片除文档正文外,还在组件模板、静态数据中有使用,所以需要查询文档、组件模板、静态数据三个场景应用的图片;

4.比对查询结果,如果图片在三个场景中都没有关联,直接进行删除;

5.ESB流程如下:

6.关键处理代码:

    

3资源文件

文件清理主要是对server中存储的图片资源进行清理,主要是无法和数据库中的图片信息表无法关联的数据,对于这些数据要进行统一清理。如果是在产品中使用(页面、文档)但是在数据库中没有图片记录的,也作为垃圾数据删除,后续手动进行维护补充。

3.1文件查询

1.创建一个图片文件服务,主要用于对server中的文件资源进行操作,包括查询、删除、修改等;

2.通过ESB创建Rest服务ImageFilesService,并手动扩展query方法,用于对server中的图片资源进行查询,入参为portal_server的主目录;

3.通过server路径读取uploads文件夹中的图片数据;

4.构建图片名称、相对路径、绝对路径、略缩图路径、后缀等信息,并通过json数组存储,再将数组存储到一个json对象中,并指定key;

5.查询数据库的图片记录wcm_picture_resource,通过比对图片相对路径(包括图片名)进行图片资源和记录的关联,并更新关联标识;

6.不能进行关联的单独作为一个json数组存储到json对象中;

7.将json对象以字符串方法作为返回值输出

8.ESB流程如下:

9.文件读取代码:

10.资源关联代码:

3.2文件删除

1.在ImageFilesService服务中扩展一个删除方法,用于删除无法和数据库记录建立管理的图片资源;

2.先调用ImageFilesService服务中的query查询接口获取图片数据;

3.解析数据获取需要删除的图片信息,根据路径进行图片删除,删除时同步删除略缩图;

4.ESB流程如下:

5.文件删除处理代码:

3.3目录清理

1.在ImageFilesService服务中扩展一个删除目录方法,用于删除server中uploads下的空目录;

2.由于目录是多级,所以需要通过递归的方式进行删除

3.ESB流程如下:

4.删除处理代码:

4数据比对

数据对比主要是图片清理后的数据库数据处理,因为存在部分数据是数据库有记录,但是图片资源已经被删除了,所以需要回查数据库,将数据库中多余的记录删除,同时也要对应用的功能进行处理。

4.1数据导入

1.数据对比主要是通过查询接口查出server中的图片资源,并导出到数据库的临时表中;

2.先调用查询接口获取图片数据(json对象):

3.手动处理结果,提取json对象中存储全部图片信息的json数组,并保存成.json格式文件:

4.将json数据导入数据库临时表中:

4.2图片删除 

1.通过数据库关联查询,对比图片资源表wcm_picture_resource多出来的图片记录;

2.将多出来的图片记录在数据库中进行删除,同时将图片文档关联表wcm_info_col_rel中的关联删除;

3.图片表关联查询:

4.关联表查询:

4.3文档处理

1.基于处理后的图片对文档进行处理;

2.通过数据库关联查询确定无法关联图片的文档:

3.对查询到的结果进行手动处理:

(1)历史文档不在应用:直接删除;

(2)在使用文档但图片已缺失:找到对应图片重新上传,并调整文档配置;

(3)文档中图片目录存在问题导致无法关联的:重新配置文档,缺少图片就重新上传。

5总结分析

本次数据清理是基于Portal门户集成功能完善的需要进行的一次整体梳理,在这过程中对标准产品中的内容进行了整体检查,结合ESB对历史数据进行清理,保障了后续产品数据的准确性。

5.1功能优化

针对Portal中图片以及使用图片的相关功能进行了整体优化,加强的了文档和图片的强关联,保证图片和文档对应的有效性,图片随文档进行管理维护,与文档的生命周期保持同频,杜绝了后续图片、文档无法有效对应的问题。统一了图片的维护入口,使后续文档和图片的维护更加便捷,在使用性能上有了全面的提升。

5.2应用模式

Portal门户集成平台作为门户的统一配置和展现平台,通过构建应用门户,为企业提供了统一的应用入口,并通过集成各个系统的核心业务数据,使企业员工可以在应用中心中完成大部分业务操作,提高了工作效率;同时Portal还具备门户网站、信息门户、外部门户等多种门户构建能力,能为企业内外部的宣传和业务往来提供全面支撑。

5.3集成场景

Portal门户集成平台作为企业统一的门户和应用入口,虽然具备独立的应用能力,但是对于应用门户、数据门户等集成性门户需要和各个业务系统进行集成对接,将业务系统的入口、应用、数据等集成到门户中进行统一管理,如消息、待办、日程、人事、运营、财务等数据集成到门户展现,但一般Portal采用接口集成,不做数据落地。

在目前主推的技术解决方案,如集成底座、数据中台等,都结合Portal产品作为统一入口,通过菜单、应用、数据集成的方式将产品功能统一到门户中,一般的业务类操作直接在Portal上完成。对企业而言,在进行信息化建设的过程中,打通系统壁垒、实现数据互通、统一监管、统一维护是提升信息化价值的重要方式,而通过应用系统的整合、管理入口的统一能大大提升管理的效率。 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/89885.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

基于微信小程序的劳务咨询系统设计与实现-计算机毕业设计

项目介绍 随着科学技术的飞速发展,各行各业都在努力与现代先进技术接轨,通过科技手段提高自身的优势;对于劳务咨询服务平台小程序当然也不能排除在外,随着网络技术的不断成熟,带动了劳务咨询服务平台小程序&#xff0…

[附源码]计算机毕业设计第三方游戏零售平台Springboot程序

项目运行 环境配置: Jdk1.8 Tomcat7.0 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: Springboot mybatis MavenVue等等组成,B/S模式…

互联网电商大厂的分布式事务使用案例

事务的原子性、持久性可确保在一个事务内,更新多条数据都成功/失败。在一个系统内部,我们可以使用数据库事务来保证数据一致性。那如果一笔交易,涉及到跨多个系统、多个数据库的时候,用单一的数据库事务就没办法解决了。 在之前大…

Altova MissionKit Enterprise 2023 SP1 Crack

屡获殊荣的 XML、JSON、SQL 和 UML 工具套件 以低于 2 个的价格获得 7 个 XML、JSON SQL 和 UML 工具! Altova MissionKit 是面向信息架构师和应用程序开发人员的企业级 XML、JSON、SQL 和 UML 工具的软件开发套件。MissionKit 包括 Altova XMLSpy、MapForce、Styl…

Python 中的垃圾回收机制总结(1)

1.背景 对于Python来说,一切皆为对象,所有的变量赋值都遵循着对象引用机制。 程序在电脑上运行的时候,需要在内存中开辟出一块空间,用于存放运行时产生的临时变量,一方面,内存的容量是有限的;…

JNPF3.4.5消息模块:多渠道应用,配置灵活多样,满足更多使用场景

自11月15日,JNPF 3.4.5 JAVA版本上线,就受到了众多用户的广泛好评,此次更新为用户带来了不同以往的使用体验。 在本次更新中,所有工作流都可以实现自主配置消息模板的操作,同时包括站内信,也可以实现自主配…

sublime json美化

sublime 的插件 json美化感觉很难用,好多正常的json串都 不能正常解析 ,自己写了一个json解析插件,此插件跟网上教程的json美化插件 不同的是: 只对json的特殊字符进行格式化 { [ ] } : , 这种不是很严格但是正好解决了我的问…

【Redis】Redis 持久化

文章目录概述RDB触发机制如何恢复 rdb 文件?RDB 优点:RDB 缺点:AOFAOF 优点AOF 缺点概述 Redis 是内存数据库,如果不将内存中的数据库状态保存到磁盘,那么服务器一旦进程退出,服务器中的数据库状态也会消失…

【C语言进阶】一文速通面试中的指针相关疑难杂症(内含模拟库函数 qsort 的实现)

目录 🥇前言🥇: 一、指向函数指针数组的指针🤯: 1.书写格式🦚: 2.指向函数指针数组指针示例🦩: 二、回调函数🧐: 1.回调函数的定义&#x1f99…

嵌入式软件工程师技能树——应用编程/网络编程/驱动开发/操作系统/计算机网络

文章目录Linux驱动开发1、Linux内核组成2、用户空间与内核的通讯方式有哪些?3、系统调用read/write流程4、内核态用户态的区别5、bootloader内核 根文件的关系6、BootLoader的作用7、BootLoader两个启动阶段1、汇编实现,完成依赖于CPU体系架构的设置&…

Win10安装Linux虚拟机-安装与使用

Win10安装Linux虚拟机-安装与使用 1、VMware 的下载 VMWare虚拟机软件是一个“虚拟PC”软件,它使你可以在一台机器上同时运行二个或更多Windows、DOS、LINUX系统。 下载地址:https://customerconnect.vmware.com/en/downloads/#all_products 在搜索中…

用 Charles 断点调试 HTTPS 请求,原理解析

现在的网站基本都是 https 的,而 charles 是常用的 http 抓包工具,所以用 charles 调试 https 请求是常见的需求。 今天就分享下如何用 charles 调试 https 请求,如何打断点。 首先安装 charles,点击 start recording&#xff1…

FineReport平台数据分析-图表显示部分系列接口

1. 概述 1.1 应用场景 当图表系列较多时,用户希望可以自己设置哪些系列显示,哪些系列不显示。以决策报表为例,实现效果如下图: 1.2 实现思路 通过FR.Chart.WebUtils.getChart("chartID").getChartWithIndex(chartInde…

静态HTML旅行主题网页作业——青岛民俗7页html+css+javascript+jquery 地方民俗网页设计与实现

👨‍🎓静态网站的编写主要是用 HTML DⅣV CSSJS等来完成页面的排版设计👩‍🎓,一般的网页作业需要融入以下知识点:div布局、浮动定位、高级css、表格、表单及验证、js轮播图、音频视频Fash的应用、uli、下拉…

web开发:linux常用命令总结

1.关于目录操作: (1)ls 列出当前目录下都有哪些文件/目录 也可以写成: ls 指定目录 列出指定目录下的文件/目录 还可以写成 ls -l 指定目录 以列表的形式列出 或缩写成 ll 指定目录 (2)pwd 查看当前…

shared_ptr

先看源码 template<typename _Tp> class shared_ptr : public __shared_ptr<_Tp> {template<typename... _Args>using _Constructible typename enable_if<is_constructible<__shared_ptr<_Tp>, _Args...>::value>::type;template<ty…

【TuyaOS开发之旅】环境搭建

前言 涂鸦最近更新了打磨良久的TuyaOS&#xff0c;整体使用感受非常的nice。所以决定写一个专栏讲解一下TuyaOS的入门使用&#xff0c;来方便小白快速的入门和熟悉TuyaOS的开发。 官方环境搭建教程 Tuya Wind IDE-TuyaOS-涂鸦开发者 报错和解决 暂无 补充 程序下载方法 …

MetaFormer实际上是你所需要的视觉

transformer在计算机视觉任务中显示出了巨大的潜力。人们普遍认为&#xff0c;他们基于注意力的token混合器模块对他们的能力贡献最大。然而&#xff0c;最近的工作表明&#xff0c;transformer中基于注意力的模块可以被空间mlp取代&#xff0c;得到的模型仍然表现相当好。基于…

11.关联容器

文章目录关联容器11.1使用关联容器使用map使用set11.2关联容器概述11.2.1定义关联容器初始化multimap或multiset11.2.2关键字类型的要求有序容器的关键字类型使用关键字类型的比较函数11.2.3pair类型创建pair对象的函数11.3关联容器操作11.3.1关联容器迭代器set的迭代器是const…

为什么Docker比VM虚拟机快?

(1)docker有着比虚拟机更少的抽象层 由于docker不需要Hypervisor(虚拟机)实现硬件资源虚拟化&#xff0c;运行在docker容器上的程序直接使用的都是实际物理机的硬件资源。因此在CPU、内存利用率上docker将会在效率上有明显优势。 (2)docker利用的是宿主机的内核,而不需要加载操…