166_技巧_Power BI 窗口函数处理连续发生业务问题

news2024/11/28 21:54:22

166_技巧_Power BI 窗口函数处理连续发生业务问题

一、背景

在生产经营的数据监控中,会有一类指标需要监控是否连续发生,从而根据其在设定区间中的连续频次来评价业务。

例如:

  • 员工连续迟到天数。
  • 销售金额连续上升或者下降。
  • 用户连续登陆天数。
  • 找出设定区间符合销售金额连续增长产品明细,诸如此类…

在前面的文章其实已经对此类问题做了相应的演示(https://jiaopengzi.com/392.html)。

本次我们使用 Power BI 在 2022 年 12 月份更新的窗口函数来处理:找出设定区间符合销售金额连续增长产品明细 的问题。关于窗口函数的信息可以参考 Jeffrey Wang 在博客(https://pbidax.wordpress.com/2022/12/15/introducing-dax-window-functions-part-1/) 中的说明,已经非常的详细。本文我们将不花篇幅去讲解窗口函数了。我们重点来讲讲通过 DAX 去解决业务问题。

按照惯例还是先来看看结果

Power BI 公共 web 效果:https://demo.jiaopengzi.com/pbi/166-full.html

166-1

二、数据源及业务问题

首先感谢网友 @俊 提供数据,文中已经对数据进行了脱敏。

1、数据源

数据源非常简单,就一个销售数据表,其中包含日期、产品ID、销售金额

166-2

2、关系

建模必备的日期表,同时把 产品ID 单独拎出来做维度表,建立表间关系。

166-3

三、DAX

1、销售金额

基础度量没有什么好说的。

0000_销售金额 = SUM ( '销售数据'[销售金额] )

2、是否符合要求

0001是否符合要求 = 
VAR ROW_MAX = 
    /*当前事实表行数。*/
    COUNTROWS ( '销售数据' )
VAR T1 =
    /*准备好窗口函数需要的表格。*/
    SUMMARIZE ( ALLSELECTED ( '销售数据' ), '销售数据'[产品ID], 'A00_Calendar'[C01_Dates], '销售数据'[销售金额] )
VAR T2 =
    /*  
    1、根据产品ID和日期提前做好排序。
    2、需要注意这里使用的是绝对应用,之所以使用 N,是因为不会有比 N 更大的行数。
    3、因为要对每个 SKU 单独排序所以要使用 PARTITIONBY。
    */
    WINDOW (
        1,
        ABS,
        ROW_MAX,
        ABS,
        T1,
        ORDERBY ( '销售数据'[产品ID], ASC, 'A00_Calendar'[C01_Dates], ASC ),
        KEEP,
        PARTITIONBY ( '销售数据'[产品ID] )
    )
VAR T3 =
    /*使用 OFFSET 偏移一行,实现错位,拿到 N+1 的数据。*/
    ADDCOLUMNS (
        T2,
        "@N+1",
            CALCULATE (
                [0000_销售金额],
                T1,
                OFFSET (
                    1,
                    T2,
                    ORDERBY ( '销售数据'[产品ID], ASC, 'A00_Calendar'[C01_Dates], ASC ),
                    KEEP,
                    PARTITIONBY ( '销售数据'[产品ID] )
                )
            )
    )
VAR T4 =
    /*错位后,N+1 大于成交金额金额即为满足增加。*/
    ADDCOLUMNS ( T3, "@是否递增", IF ( [@N+1] > [销售金额], 1, 0 ) )
VAR T5 =
    /*
    1、计算每个 SKU 记录数量 @count。
    2、计算每个 SKU 总共与多少是符合递增的。
    */
    SUMMARIZE (
        T1,
        [产品ID],
        "@count", VAR SKU = [产品ID] VAR T = FILTER ( T1, [产品ID] = SKU ) RETURN COUNTROWS ( T ),
        "@growth", VAR SKU = [产品ID] VAR T = FILTER ( T4, [产品ID] = SKU ) RETURN SUMX ( T, [@是否递增] )
    )
VAR T6 =
    /*
    1、依据业务的要求,需要满足记录数大于5,则 @count > 5
    2、满足连续递增曾则表示表示 SKU 记录数量 @count 和 满足递增爽 @growth 差 1 即可,第一期是没有计算的递增的。
    */
    FILTER ( T5, [@count] - 1 = [@growth] && [@count] > 5 )
VAR TF =
    /*最有是要找出这些 SKU 那么输出表,在不建立计算表的情况下吗,那么就把使用度量值的设置是否等于1来实现筛选即可*/
    IF ( VALUES ( '产品表'[产品ID] ) IN SELECTCOLUMNS ( T6, "产品ID", [产品ID] ), 1, 0 )
RETURN
    /*符合要求度量值结果为 1 ,不符合要求度量值结果为 0*/
    TF

在上图 166-1 中,我们可以看到业务需求如下:找出成交金额随着日期连续大于5期递增的产品ID;找出产品ID后,计算出最小粒度日期环比(说明数据源的的产片销售日期不一定连续)

注意这里的度量值是否符合要求,我们是放到了切片器的视觉对象筛选器中,切片器的字段是产品ID。这里利用了度量值是否等于1的结果来判断是否符合要求。

我们通过切片器切换可以看到都是符合要求产品ID,表格所在区间都是符合连续递增的。

166-4

环比上期

环比上期度量值中我们可以看到,这个是一个日期维度的比较,我们并没有用到时间智能函数,同时注意结果中的日期都是不连续的。如果使用时间智能函数其实相对还比较麻烦。所以窗口函数在 DAX 中是一把利刃。

0002_环比上期 = 
VAR FZ = [0000_销售金额]
VAR T0 =
    SUMMARIZE ( ALLSELECTED ( '销售数据' ), '产品表'[产品ID], 'A00_Calendar'[C01_Dates] )
VAR FM =
    CALCULATE (
        [0000_销售金额],
        OFFSET ( -1, T0, ORDERBY ( 'A00_Calendar'[C01_Dates], ASC ) )
    )
VAR _PERCENT =
    DIVIDE ( FZ - FM, FM )
VAR RESULT =
    IF ( HASONEFILTER ( A00_Calendar[C01_Dates] ), _PERCENT, BLANK () )
RETURN
    RESULT

四、关于连续发生事件的分步解析。

166-5

在 DAX Studio 中使用如下 DAX 代码去分布理解,其实也就是上述 “是否符合要求” 的度量值中的核心部分。

在结合注释理解连续发生问题的处理过程。就是把这类连续发生问题,首先通过排序来抽象成 1 或者 0,当然也可以抽象成 YES 或者 NO, 抽象为 1 和 0 在 DAX 计算中会更加方便。

其实这里面最主要的问题是在 DAX 中生成的过程表要能排序是非常困难的,当然也可以结合前面的文章来看(https://jiaopengzi.com/392.html),现在有了窗口函数也就更加得心应手了。

DEFINE
VAR ROW_MAX = 
    /*当前事实表行数。*/
    COUNTROWS ( '销售数据' )
VAR T1 =
    /*准备好窗口函数需要的表格。*/
    SUMMARIZE ( ALLSELECTED ( '销售数据' ), '销售数据'[产品ID], 'A00_Calendar'[C01_Dates], '销售数据'[销售金额] )
VAR T2 =
    /*  
    1、根据产品ID和日期提前做好排序。
    2、需要注意这里使用的是绝对应用,之所以使用 N,是因为不会有比 N 更大的行数。
    3、因为要对每个 SKU 单独排序所以要使用 PARTITIONBY。
    */
    WINDOW (
        1,
        ABS,
        ROW_MAX,
        ABS,
        T1,
        ORDERBY ( '销售数据'[产品ID], ASC, 'A00_Calendar'[C01_Dates], ASC ),
        KEEP,
        PARTITIONBY ( '销售数据'[产品ID] )
    )
VAR T3 =
    /*使用 OFFSET 偏移一行,实现错位,拿到 N+1 的数据。*/
    ADDCOLUMNS (
        T2,
        "@N+1",
            CALCULATE (
                [0000_销售金额],
                T1,
                OFFSET (
                    1,
                    T2,
                    ORDERBY ( '销售数据'[产品ID], ASC, 'A00_Calendar'[C01_Dates], ASC ),
                    KEEP,
                    PARTITIONBY ( '销售数据'[产品ID] )
                )
            )
    )
VAR T4 =
    /*错位后,N+1 大于成交金额金额即为满足增加。*/
    ADDCOLUMNS ( T3, "@是否递增", IF ( [@N+1] > [销售金额], 1, 0 ) )
VAR T5 =
    /*
    1、计算每个 SKU 记录数量 @count。
    2、计算每个 SKU 总共与多少是符合递增的。
    */
    SUMMARIZE (
        T1,
        [产品ID],
        "@count", VAR SKU = [产品ID] VAR T = FILTER ( T1, [产品ID] = SKU ) RETURN COUNTROWS ( T ),
        "@growth", VAR SKU = [产品ID] VAR T = FILTER ( T4, [产品ID] = SKU ) RETURN SUMX ( T, [@是否递增] )
    )
VAR T6 =
    /*
    1、依据业务的要求,需要满足记录数大于5,则 @count > 5
    2、满足连续递增曾则表示表示 SKU 记录数量 @count 和 满足递增爽 @growth 差 1 即可,第一期是没有计算的递增的。
    */
    FILTER ( T5, [@count] - 1 = [@growth] && [@count] > 5 )
EVALUATE
T1
EVALUATE
T2
EVALUATE
T3
EVALUATE
T4
EVALUATE
T5
EVALUATE
T6

五、总结

1、本文使用 DAX 窗口函数处理连续发生问题的排序,也可以在 pq 中去处理,也能在 sql 一步到位。方式和工具还是比较多;一切工具都是为了业务服务的。

2、窗口函数在不连续的日期对比或者非日期的对比中都能实现, 极大的增加 Power BI 了数据的灵活性。

3、本文案例中,我们需求的是整个数据表为监控的区间,大家要能做到举一反三,如果需要监控不同日期区间或者不同产品ID区间只需要在在第一步中构造这样区间的上下文即可,在外部赋予它即可。

附件下载

https://jiaopengzi.com/2902.html

视频课

https://jiaopengzi.com/all-course

by 焦棚子

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/335564.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

卧槽!一个小时不到就把ChatGPT接入了微信!被问疯了~

大家好,我是鸟哥。一个半路出家的程序员。 最近ChatGPT又火了,一时兴起就把它接入我的微信机器人中。从账号注册到接入微信机器人,全程不到1个小时就搞定了!当然不是我牛逼而是Github上的人才太多了。 大家聊的还是很嗨的&#…

Hadoop自动安装JDK

目录 1、使用xftp工具 在opt目录下创建install和soft文件 ​2、使用xftp工具 将压缩包上传到install文件 3、编写shell脚本 3.1、创建目录来放shell脚本 3.2、创建autoinsatll.sh文件并修改权限 3.3、编写autoinsatll.sh 文件 4、 运行 5、测试 1、使用xftp工具 在opt目…

SpringBoot整合(二)MyBatisPlus技术详解

MyBatisPlus详解 一、标准数据层开发 MyBatisPlus(简称MP)是基于MyBatis框架基础上开发的增强型工具,旨在简化开发、提高效率 MyBatisPlus的官网为:https://mp.baomidou.com/ 1.1 标准CRUD 1.2 新增 int insert (T t)T:泛型&#xff0c…

SAP SD模块相关表的知识笔记

VBAK表 销售凭证(抬头数据) 主键为VBELN: 销售凭证 常用的有: kunnr : 售达方 erdat: 记录创建日期 vdatu: 请求交货日期 VBAP表 (销售凭证:项目数据) 主键为 vbeln销售凭证 和posnr 行号 常用的有&#x…

2年功能测试月薪9.5K,100多天自学自动化,跳槽涨薪4k后我的路还很长...

前言 其实最开始我并不是互联网从业者,是经历了一场六个月的培训才入的行,这个经历仿佛就是一个遮羞布,不能让任何人知道,就算有面试的时候被问到你是不是被培训的,我还是不能承认这段历史。我是为了生存,…

leaflet加载KML文件,显示图形(方法2)

第049个 点击查看专栏目录 本示例的目的是介绍演示如何在vue+leaflet中加载KML文件,将图形显示在地图上。 直接复制下面的 vue+openlayers源代码,操作2分钟即可运行实现效果; 注意如果OpenStreetMap无法加载,请加载其他来练习 文章目录 示例效果配置方式示例源代码(共66…

YOLOv5-Backbone模块实现

🍨 本文为🔗365天深度学习训练营 中的学习记录博客🍦 参考文章地址: 365天深度学习训练营-第P8周:YOLOv5-Backbone模块实现🍖 作者:K同学啊一、前期准备1.设置GPUimport torch from torch impor…

Node=>Express中间件分类 学习4

1.中间件分类 应用级别的中间件路由级别的中间件错误级别的中间件Express 内置的中间件第三方的中间件 通过app.use()或app.get()或app.post()绑定到app实力上的中间件,叫做应用级别的中间件 …

泼辣修图2023最新版本人像美白滤镜手机电脑修图工具

今天,小编分享的是泼辣修图2023最新版本,喜欢追新的朋友赶紧下载使用吧。新版本在图标设计和使用上都有了一些改变,简洁的操作是其一贯的风格。这是一款功能强大的手机及电脑修图app。具体包括了几十种滤镜、曲线调整、颜色调整、皮肤美白、脸…

Biotin-PEG-FITC 生物素聚乙二醇荧光素;FITC-PEG-Biotin 科研用生物试剂

结构式: ​Biotin-PEG-FITC 生物素聚乙二醇荧光素 英文名称:Biotin-PEG-Fluorescein 中文名称:生物素聚乙二醇荧光素 外观:黄色液体、半固体或固体,取决于分子量。 溶剂:溶于大部分有机溶剂,…

学弟学妹少走弯路,超完整算法刷题路线出炉

大家好,我是帅地。 本篇文章主要讲解下面三个事: 1、自己学习算法的一些经历 2、大家学习算法存在的一些普遍问题 3、给大家规划的算法刷题路线 一、算法学习往事 记得当初学了 C 语言就开始刷题了,刷题倒不是面试,而是为了…

图扑数字孪生智慧社区,助力社区数字化转型

前言 智慧社区是社区管理的一种新理念,是新形势下社会管理创新的一种新模式。智慧社区是指充分利用物联网、云计算、移动互联网等新一代信息技术的集成应用,为社区居民提供一个安全、舒适、便利的现代化、智慧化生活环境,从而形成基于信息化…

[Linux]-Ansible

[Linux]-Ansible 森格 | 2023年2月 介绍:本文旨在介绍ansible的基本使用,提高部署环境时的效率,避免重复操作带来的时间成本。 文章目录[Linux]-Ansible一、什么是Ansible1.1 基本介绍1.2 核心概念1.3 优点二、环境部署2.1 Ansible2.2 Docke…

帮中国人搞钱的ChatGPT,算不清自己的“经济账”

好消息,ChatGPT找到盈利模式了。坏消息,尽是“二道贩子”在赚钱。当OpenAI尝试着为红到发紫的ChatGPT推出20美元的Plus订阅服务时,大多数人已经忘记了这个“吞金兽”的成长耗费了多少财力物力。问答狂欢者的岁月静好靠的是OpenAI的负重前行&a…

可重构或可调谐微波滤波器技术

电子可重构,或者说电调微波滤波器由于其在改善现在及未来微波系统容量中不断提高的重要性而正吸引着人们越来越多的关注来对其进行研究和开发。例如,崭露头脚的超宽带(UWB)技术要求使用很宽的无线电频谱。然而,作为资源…

函数栈帧的创建和销毁——“C”

各位CSDN的uu们你们好呀,今天小雅兰来为大家介绍一个知识点——函数栈帧的创建和销毁。其实这个知识点,我们很早之前就要讲,但是因为我的一系列原因,才一直拖到了现在,那么,话不多说,让我们一起…

(C00036)基于SSM+VUE前后端分离的物流管理系统

基于SSMVUE前后端分离的物流管理系统项目简介项目获取开发环境项目技术运行截图项目简介 本基于SSMVUE前后端分离的物流管理系统,统一管理车辆、顾客、司机、订单等信息,方便企业对物流信息的管理。本系统通过对用户划分为三个角色进行实现,…

【内网安全-横向移动】基于SMB协议-PsExec

目录 一、SMB协议 1、简述: 2、工具: 二、PsExec 1、简述: 2、使用: 1、常用参数: 2、情况: 3、插件 三、PsExec(impacket) 1、简述: 1、impacket&#xff1…

C++-类和对象(上)

类和对象(上)一,构造函数1,概念2,特性二,析构函数1,概念2,特性三,拷贝构造1,概念2,特性四,运算符重载1,概念2,…

联合培养博士经历对于国内就业有优势吗?

2023年国家留学基金委(CSC)申请在即,很多在读博士在关心申报的同时,也对联培经历能否有助于国内就业心中存疑,故此知识人网小编重点解答此问题。之前,我们在“CSC联合培养-国内在读博士出国的绝佳选择”一文…