分析的四个维度

news2024/9/28 5:23:56

我们都听过这句格言“数据是新石油”——一种宝贵、丰富的资源,只有提炼后才有用。然而,最引人注目但又令人望而生畏的比较之一是将船只送入海洋进行石油勘探。有些会失败,有些会有重大发现。

深海勘探和钻探取决于精确测绘和对海底的清晰认识。分析也是如此。最成功的人将能够获得企业数据资产的可靠知识。这意味着拥有强大的数据编目和治理流程,可提供有关资产的上下文、利用他人的经验、围绕数据建立信任并帮助理解数据流经各种系统时的沿袭。

业务用户希望了解他们在 BI 报告中看到的指标并将其跟踪到云数据仓库,最后跟踪到数据最初来自的源系统。更重要的是,这意味着拥有能够将批判性思维应用于分析的具有数据素养的员工。

大多数公司都对其员工的分析素养存在过度自信的偏见,这实际上抵消了对旨在帮助他们的计划和平台的任何投资。

要解决这个问题,首先要制定成为数据驱动型公司的战略计划,然后制定数据素养计划。

阐明问题

根据《成为数据素养》一书的作者所说,数据分析有四个主要阶段:描述性、诊断性、预测性和规范性。

描述阶段正如它听起来的那样:公司以向后看的方式用他们的数据描述情况。它告诉我们发生了什么,以及我们在世界上 99% 的仪表板、列表报告和商业智能报告中看到的情况。他们比较部门、地理位置、商店、产品细分和客户细分等维度随时间变化的指标。

描述性分析导致诊断分析,回答“为什么?” 描述性分析结果的背后。虽然本质上是回顾性的,但描述性分析提供了更详细的根本原因分析,需要主题和分析领域的专业知识。这通常是标记为自助服务的程序和工具的目的。

一旦你深刻理解了“为什么”的因果关系,你就可以开始预测会发生什么。预测分析首先提供了向前看的能力,因此我们可以影响未来。在零售方面,亚马逊推荐相关产品。在商业世界中,供应基于耗尽率的回购通知或基于区域天气的零件转移到仓库。

最后,我们可以而且应该利用收集到的所有分析知识来做更多的事情,而不仅仅是简单地“了解未来”。我们应该通过提供行动/活动来改变未来,这是规范性分析。

如果我们知道某事发生的可能性很高(预测),我们就会采取措施避免或确保它发生。例如,如果我们根据特定事件和季节性时间预测供应补货的需求,我们可以在淡季和前期进行预采购,以降低供应成本并平稳供应。

有一个与数据素养相关的三个方面的问题:

  1. 访问可信数据。大多数公司不提供对可靠数据的透明访问,并继续以最少的跨职能资产共享进行运营。结果是一个非常缓慢的手动过程,用于查找符合目的的数据,浪费时间和金钱重新创建相同的分析,并在分析结果中导航不一致。

  2. 缺乏数据素养培训。只有少数人具备足够的数据素养,可以超越对描述性分析的简单接受。许多人需要更多培训或需要积极鼓励将批判性思维应用于描述性结果。要做到这一点,需要与比例的使用、比较、基本计算、度量单位和时间框架相关的基本知识。想一想一个在没有任何相应的数据素养培训课程的情况下反复推出更好的自助服务工具(鼠标陷阱)的组织。

  3. 依靠直觉与证据。领导者继续依赖经验和“直觉”,而不是部署具有经验证据的预测性和规范性分析,以帮助他们不断优化业务。

为成功做好准备

描述性分析的先决条件是创建数据资产知识库。我们称之为目录,也被描述为支持技术和非技术(业务)角色的以数据资产为中心的知识库。

目录中的集成资产类型包括术语词汇表、指标词汇表、关键资产的顶级用户、讨论线程、投票、收藏夹、报告和仪表盘清单、数据分类器和域、相关策略、质量指标、流行度、已发布的查询,以及数据产品。所有这些资产都可以使用基于文本的搜索和自然语言问题以及浏览器、电子表格或消息传递工具(例如 Slack)轻松访问。

领先公司采用的最佳做法是在准备目录的同时创建数据素养课程,将两者交织在一起。通常,数据素养课程存在于学习管理系统 (LMS) 中。将目录和 LMS 交织在一起,可以从目录中的关键资产页面为特定角色创建学习路径和数据素养课程链接。目标是在数据使用点和有人需要时提供学习,而不是单独的(旧的、失败的风格)和强制性的数据素养培训员工快速通过以检查老板的合规框。

超越描述性分析

一旦设置好,目录和数据素养课程就可以系统地跨业务部门推出。典型的推出包括为每个人提供基本识字水平的入职课程,以及用于理解预测和规范分析的更专业的课程。

数据素养是一项持续的计划,而不是一劳永逸的项目。任命鼓励参与并奖励员工持续参与的领导者。

同样重要的是培养一种不断捕捉和分享每个人从分析使用中学到的东西的文化。这创造了一个持续改进的循环和数据微观文化,反映了企业的战略目标。

预测性和规范性分析需要更高水平的数据素养和专门的统计/AI/ML 技能才能实施,这可能是一个重大障碍。目标应该是建立一个知识渊博的人才库来创建功能需求,监督、验证和签署由中央专家团队或外部顾问构建的分析模型的有效性。

无论谁创建了更复杂的模型,都应避免让它们成为没有绝对透明度的“黑匣子”。所有模型和分析方法都应添加到目录中,进行全面描述,并与其使用和产生的数据相关联。现在,您正在推动公开参与并优先考虑共享学习和理解。

掌握"数据驱动"的艺术

好消息是大多数公司都意识到他们需要一种数据文化来有效地利用他们的数据。事实上,将近80% 的企业都制定了战略计划,以变得更加数据驱动。但是知道一些事情并采取行动取得进步是不同的。数据文化不是你能买到的东西;这是你建造的东西。数据驱动的文化是从最高层开始的。

如果您的公司在数据管理实践方面需要帮助,现在是重新评估当前解决方案并实施新战略以重回正轨的时候了。现在有比以往更多的工具来帮助企业充分利用他们的信息并达到更高水平的分析,从新的软件平台和对数据素养重要性的更高认识,到可以帮助更有效地收集和组织数据的 AI 等技术。因此,重要的是从大处着眼,从小处着手,快速学习。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/487280.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【计算机网络】图解内容分发网络 CDN

【计算机网络】图解内容分发网络 CDN 参考资料: 用了CDN就一定比不用更快吗? 什么是内容分发网络 高性能利器:CDN我建议你好好学一下! 文章目录 【计算机网络】图解内容分发网络 CDN一、CDN 概述1.1、什么是 CDN1.2、为什么需要 …

数字化转型导师坚鹏:数字化转型背景下的企业人力资源管理

企业数字化转型背景下的企业人力资源管理 课程背景: 很多企业存在以下问题: 不清楚企业数字化转型目前的发展阶段与重要应用? 不知道企业数字化转型给企业人力资源管理带来哪些机遇与挑战? 不知道企业数字化转型背景下如何…

SpringBoot 项目如何实现动态配置多数据源?

简介: dynamic-datasource-spring-boot-starter 是一个基于springboot的快速集成多数据源的启动器。 其支持 Jdk 1.7, SpringBoot 1.4.x 1.5.x 2.x.x。 特性: 支持 数据源分组 ,适用于多种场景 纯粹多库 读写分离 一主多从 混合模式。支持…

认识JavaBean

什么是JavaBean? JavaBean是指符合特定规范以及定义的Java类,通常用于封装数据,提供访问数据的方法和属性,并且可以被其他程序重用。它具有以下特点: 遵循特定编程规范:JavaBean必须要遵循JavaBean编程规范&#xff…

分层领域模型相关总结(DO/PO/VO/BO/DTO/Query等概念)

分层领域模型(DO/PO/VO/BO/DTO/Query等概念) 1. 为什么会有这么多O的概念? 各种分层概念的提出都是为了解耦,增加逻辑/代码的复用,便于后期维护/开发,提高团队开发效率;but,过多的细分也会使得开发过程相对…

Chrome 113 发布,默认启用 WebGPU

经过四周时间开发,Chrome 113 稳定版正式推出,新版本包括用于视频电话会议的 AV1 视频编码、WebGPU,以及其他增强功能。 默认启用 WebGPU WebGPU 是用于 Web 的新 API,它使用了现代的硬件功能,允许在 GPU 上进行渲染和…

Unable to import maven project: See logs for details错误的多种解决方法

文章目录 1. 复现错误2. 分析错误3. 解决问题3.1 解决方法一3.2 解决方法二 4. 补充说明 1. 复现错误 今天从gitlab上下载完项目后,无法启动项目,留意到右下角的Evnet Log,点开如下图所示: 即Unable to import maven project: See…

vue-element-admin快速搭建后台模板

快速搭建后台模板 环境以及会出现的问题安装目录结构基本配置路由配置 环境以及会出现的问题 node版本17.0.0 python版本2.7.10(node-sass依赖) 运行项目报错Error: error:0308010C:digital envelope routines::unsupport 请看这篇文章 https://blog.cs…

FM33A048B I2C

I2C 模块实现MCU 与外部I2C 接口器件之间的同步通信,硬件实现串并转换。支持I2C 的主机模式,不支持从机模式和多主机模式。 特点: ⚫ 只支持I2C 主机模式, 不支持从机模式和多主机模式 ⚫ 支持7 位或10 位从机地址 ⚫ 传输速度支持标准模式(1…

Java面试题总结 | Java面试题总结10- Feign和设计模式模块(持续更新)

文章目录 Feign项目中如何进行通信Feign原理简述 设计模式spring用到的设计模式项目的场景中运用了哪些设计模式写单例的时候需要注意什么工厂模式的理解设计模式了解么工厂设计模式单例设计模式代理设计模式策略模式**模板方法模式**观察者模式**适配器模式**观察者模式**适配…

TimeScaleDB食用手册

TimescaleDB食用手册 一 TimescaleDB介绍 TimescaleDB是一种用于处理时间序列数据的开源时序数据库,它是PostgreSQL的扩展。它可以处理大量的时间序列数据,并且支持SQL查询和连续聚合功能。 1.TimescaleDB的优点 分布式架构:TimescaleDB利…

类和对象上

文章目录 一、类的定义1、声明和定义全部放在类体中2、 类声明放在.h文件中,成员函数定义放在.cpp文件中 二、类的访问限定符三、类的作用域类及其实例化1、作用域2、实例化 四、类对象大小的计算1、计算对象(仅成员变量)2、计算方式&#xf…

iMazing2官方下载最新iPhone/iPad手机设备管理工具

iMazing 2最新版它可以完美地在 iOS 设备之间传输数据。 该软件专门设计用于为用户提供对 iPhone、iPod 和 iPad 的更多控制和管理能力。 它将所有这些高价值设备变成了外部存储,以便您可以交换各种数据,例如短信、通话记录、视频或照片。值得信赖的是&a…

学习k近邻算法(KNN)【自学且自用】

文章目录 1 概念2 原理及举例3 KNN中最常用的距离度量——欧式距离4 K值的选择5 knn和k-means的区别 参考的一些网页: https://zhuanlan.zhihu.com/p/143092725 1 概念 k近邻算法(k-nearest neighbour,k-NN)是一种基本分类与回归…

JavaEE-HTML常用标签了解(二)

目录 表格标签合并单元格 列表标签表单标签无语义标签HTML特殊字符 表格标签 table 标签: 表示整个表格tr: 表示表格的一行td: 表示一个单元格th: 表示表头单元格. 会居中加粗thead: 表格的头部区域(注意和 th 区分, 范围是比 th 要大的)tbody: 表格得到主体区域. <table …

CAS简介

文章目录 前言一、锁&#xff1f; CAS?二、juc--java.util.concurrent1.CAS思想的落地2 ABA问题出现3 可以解决的问题 总结 前言 CAS的全称是&#xff1a;比较并交换&#xff08;Compare And Swap&#xff09;。在CAS中&#xff0c;有这样三个值&#xff1a; V&#xff1a;要…

基于YOLOv5的目标检测系统详解(附MATLAB GUI版代码)

摘要&#xff1a;本文重点介绍了基于YOLOv5目标检测系统的MATLAB实现&#xff0c;用于智能检测物体种类并记录和保存结果&#xff0c;对各种物体检测结果可视化&#xff0c;提高目标识别的便捷性和准确性。本文详细阐述了目标检测系统的原理&#xff0c;并给出MATLAB的实现代码…

IPRAN网络结构智能优化

IPRAN&#xff08;Internet Protocol Radio Access Network&#xff09;是指基于IP技术的无线接入网络&#xff0c;是当前移动通信重要基础网络。然而&#xff0c;随着技术的快速发展&#xff0c;IPRAN网络规模不断扩大&#xff0c;网络结构日趋复杂&#xff0c;运维网优愈发困…

基于数据和AI之上,数说故事首发“人、货、场、域”W-SCC测量体系|D3大会演讲实录

无测量&#xff0c;不营销。 品牌在加速更迭、场景在垂直发展、需求在不断升级&#xff0c;借助数字化力量可以实现更精准、长效的营销增长。但如果连营销效果都无法被量化测量&#xff0c;那么一切为了增长的“轮番”操作只会沦为“锦团花簇”&#xff0c;品牌营销的真正实效…

使用ChatGPT工具阅读文献的实战教程

大家好,我是herosunly。985院校硕士毕业,现担任算法研究员一职,热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名,CCF比赛第二名,科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法…