海睿思分享 | 浅谈企业数据质量问题

news2024/12/23 5:24:47

一、数据质量问题场景

在日常工作中,业务领导经常通过BI系统来了解各项业务的业绩情况。倘若某天,他打开某张核心报表,发现当日某个区域的数据一直是空白的。BI开发人员经过几个小时的排查分析,发现是当日该区域的销售数据存在产品类型属性值缺失情况。

以上就是典型的数据完整性问题造成的问题。

随着数字化时代的到来,数据质量逐渐成为企业发展的关键因素之一。数据质量管理应秉持预防为主的理念,坚持将“以预控为核心,以满足业务需求为目标”作为工作的根本出发点和落脚点,帮助企业全面提高数据质量。只有通过这种方法,企业才能充分利用数据驱动业务发展,实现长期的竞争优势。

二、数据质量—质量规则

按照DAMA对数据质量的衡量标准,数据质量的六大核心要素:完整性、唯一性、一致性、准确性、有效性、及时性。系统提供丰富的质量规则模板,同时支持用户自定义创建。

三、数据质量—质量检查

通过预设的数据质量规则在数据集成、数据处理、数据分析等各个环节中,对数据质量进行控制。对于不符合质量规则的数据进行特殊处理,可根据质量阀值选择中断流程,以避免影响后续业务。

说明:

得分低于阈值时中断流程:若打开该按钮,当数据质量的得分比设置的阈值低时,则任务会被中断执行。

异常数据处理策略:对于不符合质量规则的数据,处理策略有三种:丢弃、保存和正常标准化。

丢弃:不符合规则的数据不会落库,也不会保存。

保存:不符合规则的数据不会落库,但是会保存,用于后续的补录。

正常标准化:不符合规则的数据也会正常落库。

四、数据质量—质量闭环

质量检查发现问题—》生成问题单—》问题单指派给质量负责人处理—》质量负责人解决问题单—》审核问题单处理完成情况—》问题单关闭

1、生成问题单

在质量任务结果监控页面中,得分不满足100分的结果,可以生成问题单进行指定任务进行异常数据处理和跟踪;此外,还可以设置该任务检测出的异常数据无需处理。

生成问题单页面,可以设置质量问题的严重程度以及指定解决该质量问题的责任人。

问题单创建完成,会通过站内信、邮箱、钉钉、飞书等方式通知到对应责任人。

2、问题单解决

在质量问题处理页面查看待处理问题单。

在问题单处理页面,可以查看问题单基本信息,包括关联的检测任务、得分、关联的数据资源、问题单状态和描述;此外可以查看问题单关联的异常数据,并且支持导出异常数据进行修改。

在对异常数据处理完成后,提交质量异常数据处理意见。问题单会自动流转到问题单发起人处,由发起人员确认。问题单流转会通过站内信、邮箱、钉钉、飞书等方式通知相关人员。

3、问题单审核

可以在问题单发起记录页面,查看我发起的问题单处理结果。对于已处理问题单进行审核。

发起人可以通过重新运行质量检查任务来校验问题单异常数据解决情况,支持对问题单退回和关闭操作。

五、数据质量-事后审计

提供可视化开发功能,支持用户构建审计模型,对复杂场景下的数据质量进行发现和分析。

六、总结

OceanMind海睿思数据中台,依据DCMM数据质量能力域,以”事前预防、事中控制、事后审计“为核心,在数据质量需求、数据质量检查、数据质量分析和数据质量提升等方面具备成熟的方法论和丰富的实施经验。

事前预防:通过优化流程制度,培训提升质量意识,提高企业业务系统的数据质量。

事中控制:在调研阶段,输出的业务蓝图中包括业务流程、数据质量要求和数据责任部门;在实施阶段,数据质量要求落地为数据质量规则和质量检查任务,并且通过质量问题单由数据责任部门进行整改,解决数据质量问题。

事后审计:定期对企业数据质量进行全面“体检”,找到问题的“病因”,以实现数据质量的持续提升。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/687098.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

VsCode 安装Copilot

1,插件安装 (1)首先我们在 VSCode 里面搜索并安装 Copilot 插件: (2)安装后编辑器右下角会出现一个小机器人图标,并且提示我们需要登录 GitHub 账号: 此时需要科学 目前要收费劝退…

增值税高如何解决?有哪些注意事项?

增值税高如何解决?有哪些注意事项? 《税筹顾问》专注于园区招商、企业税务筹划,合理合规助力企业节税! 咦,增值税高了怎么办?这可是个大问题啊!特别是对于那些经济效益还不错的企业来说&#x…

【Leetcode60天带刷】day37——968. 监控二叉树

​ 题目: 968. 监控二叉树 给定一个二叉树,我们在树的节点上安装摄像头。 节点上的每个摄影头都可以监视其父对象、自身及其直接子对象。 计算监控树的所有节点所需的最小摄像头数量。 示例 1: 输入:[0,0,null,0,0] 输出&#…

校园外卖行业内卷之下,高校外卖创业者如何成为卷王?

伴随着外卖行业的不断发展,校园市场前景广阔。校园外卖市场因各大平台的竞争而变得越来越复杂。各种技术支持和经验参考让大学生创业校园外卖越来越困难,市场竞争也越来越激烈。 校园外卖市场究竟有多内卷? 外卖龙头企业。 校园市场广阔的发…

抖音seo矩阵系统:源码编写及优化策略

开发概述 抖音作为一款流行的短视频分享平台,其搜索引擎优化(SEO)的重要性日益凸显。为了提升抖音账号的曝光率和用户粘性,开发一套抖音SEO矩阵系统源码成为了必不可少的一步。 在编写抖音SEO矩阵系统源码时,需要首先…

企业缺成本票怎么办?

企业缺成本票怎么办? 《税筹顾问》专注于园区招商、企业税务筹划,合理合规助力企业节税! 企业缺成本发票的原因基本都是一样的,不外乎以下这几种: 1.企业类型自身缺陷:成本费用以人员工资、提…

父元素设置max-height,子元素高度设置百分比,子元素继承父元素高度失败

需求描述: 小程序里碰到的,最外层page高度 100%,里边第一层盒子高度为 max-height: 60%; 第一层盒子里有 title,content,这个 content 高度要随着第一层盒子高度走,最高为第一层盒子的高度减去 title 的高…

金属元素螯合剂:1023889-20-4,(S)-DOTAGA-(COOt-Bu)4,水溶性好、稳定性好

●中文名:(S)-DOTAGA-四叔丁酯 ●英文名:(S)-DOTAGA-(COOt-Bu)4 ●外观以及性质: (S)-DOTAGA-(COOt-Bu)4中DOTA是一种十二元四氮杂大环配体的金属元素螯合剂,该化合物还可作为一种水溶性好、稳定性好的离子液体的配体。此外&…

it个人工作总结范文10篇

it个人工作总结1 20-年这一年中,在公司领导的正确领导及对公司信息化建设高度重视下,经过IT部门全员长期努力,公司信息化工作取得了明显的成效。现将20-年IT部工作总结如下: 第一部分:取得的成绩 (一)建立华凯尔协同工…

光伏行业快速发展与分布式光伏云平台的设计

安科瑞虞佳豪 ​近年来,我国光伏产业实现快速发展,成为我国取得全球竞争优势、实现端到端安全可控、有望率先成为高质量发展典范的新兴产业之一。阳光电源股份有限公司董事长曹仁贤表示,目前我国光伏产业已形成全球最完整的产业链&#xff0c…

民用飞机飞控系统传感器故障诊断研究综述

导语 飞控系统中的各类传感器对飞机稳定与操纵起着至关重要的影响,是飞机的重要安全机载设备之一。传统冗余方法具有“安全性高,经济性低”的特点,通过多余度设计来提升系统的安全性给飞机的重量与结构设计、系统综合集成、维修与检测成本都…

Axure教程—中继器分页

本文是关于Axure中继器的运用操作,详细讲解利用Axure中继器实分页的操作流程,比较基础,供初学者参考学习。 效果 预览地址:https://hd42dm.axshare.com 功能 1、点击“数字”显示相应页面的内容 2、点击“首页”显示第一页内容 …

测试找工作,如今真的一年比一年难,怎样才能打破困境?

坐标深圳,2020年6月毕业开启了社畜的模式,深圳某大型互联网码农集散基地(非大厂)学历背景:二本。 第一份工作在深圳的一个60人左右规模的小公司做软件测试。年初离职后,最近刚刚跳槽成功。 做测试是从20年…

nginx页面优化与防盗链

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 一、nginx页面优化1.版本号1.1 查看版本号1.2 修改版本号1.2.1 修改配置文件1.2.2 修改源码文件,重新编译安装 2.nginx的日志分割3.nginx的页面压缩3.1 …

宝塔面板SSL证书配置方法(Nginx及Apache环境)

宝塔面板是一款服务器管理软件,可以通过网络轻松管理服务器,提高运维效率,让用户更容易使用服务器,它可以支持Linux操作系统、Windows操作系统,是国内非常受欢迎的主机控制面板,可以通过交互界面完成服务器…

《深度学习入门:基于python的理论与实现》chap2感知机

文章目录 2.1 什么是感知机2.2 简单逻辑电路 &2.3 感知机的实现引入偏置与门 And gate与非门(NAND gate)或门 OR gate 2.4 感知机的局限性(单层感知机无法分离非线性空间)2.4.1 异或门2.4.2 线性和非线性 2.5 多层感知机(multi-layered perception)2.5.1 已有门电路的组合2…

Git 工具原理及使用 -- 基本使用

Git 工具原理及使用 – 基本使用 文章目录 Git 工具原理及使用 -- 基本使用1.创建本地仓库2.配置本地仓库3.认识工作区、暂存区、版本库4.添加文件 -- 场景一5.查看.git文件6.添加文件 -- 场景二7.修改文件8.版本回退9.撤销修改**情况一:对于工作区的代码&#xff0…

【哈士奇赠书活动 - 28期】- 〖产品经理就业实战〗

文章目录 ⭐️ 赠书 - 《产品经理就业实战》⭐️ 内容简介⭐️ 作者简介⭐️ 编辑推荐⭐️ 赠书活动 → 获奖名单 ⭐️ 赠书 - 《产品经理就业实战》 ⭐️ 内容简介 本书专门为想要入行从事产品经理相关工作的零基础就业人员而编写,涵盖了在产品准备阶段、产品开发阶…

TipDM数据挖掘建模平台产品功能特点

TipDM数据挖掘建模平台是可视化、一站式、高性能的数据挖掘与人工智能建模服务平台,致力于为使用者打通从数据接入、数据预处理、模型开发训练、模型评估比较、模型应用部署到模型任务调度的全链路。平台内置丰富的机器学习、深度学习、人工智能算法,可覆…

桥接模式(Bridge)

定义 桥接是一种结构型设计模式,可将一个大类或一系列紧密相关的类拆分为抽象和实现两个独立的层次结构,从而能在开发时分别使用。 前言 1. 问题 假如你有一个几何形状(Shape)类, 从它能扩展出两个子类&#xff1a…