Power BI 数据处理介绍(数据初始调整、合并列及查看数据结构)

news2025/2/28 5:10:09

本系列的文章:

  • 安装流程和示例介绍:

    • 《Power BI windows下载安装流程)》
    • 《Power BI 11个必学官方示例数据案例(附下载链接)》
  • 数据导入阶段介绍:

    • 《Power BI 数据导入(SQL Server、MySQL、网页数据)》
    • 《Power BI 存储模式介绍(导入、DirectQuery、双))》
    • 《Power BI 常见数据导入错误(查询超时、找不到文件、数据类型错误、找不到表格)》

目录

  • 前言
  • Power Query
    • 打开Power Query
    • Power Query 编辑器
  • 一、初始数据调整
    • 1. 转换
      • 1)“将第一行用作标题”
      • 2) 替换值
      • 3. 数据类型转换
    • 2. 管理列
      • 1)选择所需的列(选择列)
      • 2)查找列(转到列)
  • 二、合并列
    • 1)快速合并列
    • 2)自定义格式合并列(添加列)
  • 三、查看数据结构

前言

从这篇文章起,将开始介绍Power BI数据清洗阶段的功能。本文总结了常用的基础数据调整技巧,包括初始的数据调整转换、合并及查看数据分布。

Power Query

Power BI的数据处理都是在Power Query 编辑器里面完成的。

打开Power Query

进入Power Query有两种途径:

  • 第一种是在导入数据时,通过导航器里的“转换数据”进入。 (此时如果点击”加载“就会直接加载数据,不进入Power Query)
    在这里插入图片描述

  • 第二种是直接点击主页的“转换数据”进入
    在这里插入图片描述

Power Query 编辑器

  • 自动记录调整步骤:(见下图中右下角)在 Power Query 编辑器中工作时,数据调整的所有步骤都会被记录下来。 随后,每次查询连接到数据源时,它会自动根据记录的步骤调整,相当于数据清洗调整的自动化程序。在这里插入图片描述

一、初始数据调整

基础的数据调整功能键都在“主页”页签下,包括列管理、行管理、转换(数据类型、替换值等)、排序、组合:合并查询、追加查询。
在这里插入图片描述

1. 转换

1)“将第一行用作标题”

如下图所示,导入数据后,标题行被识别成了第一行,而标题的列名是空白。
在这里插入图片描述

直接点击“转换”中的“将第一行用作标题” 进行处理。
在这里插入图片描述

2) 替换值

在“要查找的值”中填写需要替换的值,如果是Null值可以填Null, 然后在下面“替换为”的框中填写需要替换的数值。
在这里插入图片描述

3. 数据类型转换

选中需要查看的列,数据类型就会自动显示该列的数据类型。 如下图中,选中的Units Sold 的数据类型是小数。
在这里插入图片描述
方法一: 通过转换功能区中的“数据类型”进行修改。
在这里插入图片描述
方法二:点击列名旁边的数据类型图示。
在这里插入图片描述

2. 管理列

如下图所示,“管理列” 功能选项在“主页”页签下面,可以筛选、删除和查看列数据。
在这里插入图片描述

1)选择所需的列(选择列)

当数据中包含大量无用的信息时,将无用的数据列剔除,只保留需要的数据,可以简化数据模型,提高工作效率。

  • 只需要将需要的列挑选上,其他没被选中的列就会从数据中删除掉。
    在这里插入图片描述

2)查找列(转到列)

当数据量大的时候,尤其是表格中包含许多列,这是手动去查找就很麻烦,可以直接使用“转到列”功能。

  • 点击“转到列”选项,会显示表格中所有列名, 选择对应的列名(图中选择“Gross Sales”),点击“确认”, 就会跳转到选择的列。
    在这里插入图片描述

二、合并列

这里介绍了两种比较方便的合并列方式,快速合并示例中的列。 前者适合需要直接合并的情况,后者适合需要特殊处理的情况。

1)快速合并列

  1. 选择需要合并的列:按住Ctrl选择需要合并的列,右键打开菜单,点击“合并列”
    在这里插入图片描述
  2. 设置分隔符和列名:选择连接的分隔符是“空格”,新的合并列名字为“Country-Segment"
    在这里插入图片描述
  3. 结果展示:选中的两列已经合并了,并且中间用空格分隔开来。
    在这里插入图片描述
    PS:同样,按住Ctrl可以同时选择多列,一起批量处理,比如删除、复制等等。

2)自定义格式合并列(添加列)

根据原来的数据添加列,使用到的是“添加列”中 “示例中的列"功能。这个功能的优点是:1)提供了常用的数据合并方法;2)适合用于处理时间数据
在这里插入图片描述

  • 如下图所示,点击“示例中的列”后,双击最右边“列1”里任意空白单元格,就会显示下拉选项,展示了可选则的示例内容。
    在这里插入图片描述
  • 手动输入需要合并的列的样式, 比如需要合并Month和Year,手动输入后“2014-January”,系统就会自动展示其他行的合并结果。在这里插入图片描述
  • 也可以使用公式创建一个新列,比如根据提示内容中的转换公式。
    ![[Pasted image 20221219154211.png]]

三、查看数据结构

导入数据之后,第一步就是要检查数据的情况,比如总数、空值等统计信息和值的分布情况。

查看数据结构

  • 进入Power Query编辑器后,点击“视图”页签,在“数据预览”中,选择需要显示的信息选择框。
    在这里插入图片描述

查看列具体信息分布

  • 点击其中一列,在下方就会出现这一列的统计信息及值分布。
  • 下面图中选择了"国家(Country)" 一列。下半页窗口显示了5个国家名字,并且每个国家的值分布相同。 在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/361251.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

1802908-00-4,Dde Biotin-PEG4-alkyne,炔烃PEG4生物素Dde

Dde Biotin-PEG4-alkyne,Alkyne-PEG4-Biotin Dde,Dde 生物素-PEG4-炔烃,Dde 生物素PEG4炔基,炔烃PEG4生物素DdeProduct structure:Product specifications:1.CAS No:1802908-00-42.Molecular fo…

leetcode 540. Single Element in a Sorted Array(排序数组中的单个元素)

给一个已经排好序的升序数组,其中每个元素都会重复2次,只有一个元素只有一个, 找出这个只有一个的元素。 要求时间复杂度在O(logn), 空间复杂度在O(1). 思路: 时间复杂度为O(logn), 让人想到了binary search. 因为时间复杂度为…

keil5安装了pack包但是还是不能选择device

一开始,我以为是keil5无法安装 STM32 芯片包,打开device倒是可以看到stm公司的芯片包,但是没有我想要的stm32f1。 我按照网上的一些说法,找到了这个STM32F1 的pack芯片包,但是我双击安装的时候,它的安装位…

(HP)新手引导使用react-shepherd

1,官方参数文档:https://shepherdjs.dev/docs/tutorial-02-usage.html 2,基本代码 import { ShepherdTour } from react-shepherd; import ./index.less; // 自己的样式文件,用来修改样式 import ./shepherd.less; // 将shephe…

嵌入式C语言自我修养:从芯片、编译器到操作系统-习题、笔记

前沿 C语言测试(1):基本概念考查 什么是标识符、关键字和预定义标识符? 三者有何区别? 标识符(Identifier):由程序员定义,用来表示变量,包括了变量名、函数名、宏名、结构体名等。 标识符的命名规范:C语言规定&…

Android架构设计——【 APT技术实现butterknife框架 】

APT简介 APT英文全称:Android annotation process tool是一种处理注释的工具,它对源代码文件进行检测找出其中的Annotation,使用Annotation进行额外的处理。 Annotation处理器在处理Annotation时可以根据源文件中的Annotation生成额外的源文…

100种思维模型之启发式偏差思维模型-017

曾国藩在给儿子的一封家书中曾写道:余于凡事皆用困知勉行工夫,尔不可求名太骤,求效太捷也。熬过此关,便可少进。再进再困,再熬再奋,自有亨通精进之日。 不急躁不求捷径,小火慢炖,将事…

burp小程序抓包

身为一名码农,抓包肯定是一项必备技能。工作中遇到很多次需要对小程序进行抓包排查问题。下面分享一下我的抓包方式,使用的是电脑版小程序抓包,跟手机的方式都差不多的。 一、环境 微信版本:3.6.0.18 Burpsuite版本&#xff1a…

Python容器

容器 容器是一种可以容纳多份数据的数据类型,容纳的每一份数据称之为1个元素,每一个元素,可以是任意类型的数据,如字符串、数字、布尔等。 数据容器根据特点的不同,如: 是否支持重复元素是否可以修改是否…

k8s1.17.2+centos7.7+docker18.06

1.简介 1.1pod网络 总述:Kubernetes 的网络模型假定了所有Pod都在一个可以直接连通的扁平的网络空间中 Flannel:基于L2,构建用于各个pod通信的网络架构。使用iptables进行数据包过滤。Calico:纯L3,构建用于各个pod通…

【Java基础】反射

概述 引入 package ref;import java.io.FileInputStream;import java.io.FileNotFoundException;import java.io.IOException;import java.lang.reflect.Constructor;import java.lang.reflect.Field;import java.lang.reflect.InvocationTargetException;import java.lang.r…

VUCA项目环境中如何提升项目进度计划与控制工作有效性的系统思考【一杯咖啡谈项目】

VUCA环境下,项目进度延迟是经常遇见的问题,如何解决此类问题?今天分享一个案例,在这个案例中,基于“根因分析法”,对某主题客户端项目的进度延迟问题进行了分析,找到根本原因,提出了…

鼠标指针文件格式解析

鼠标指针文件格式解析 文章目录鼠标指针文件格式解析windowsico文件格式分析文件头:图像数据头段:图像数据段:Ani动态光标格式解析数据结构:anihseq **rate**LISTcur静态光标文件格式解析macOSLinuxwindows ico文件格式分析 是一…

2023年PMP考试复习攻略

如何备考PMP呢? 这本书是PMP认证考试的官方教材,体系完善,可以迅速帮助入门者搭建项目管理知识体系,备考PMP考试的伙伴,这本书一定要读一遍! 经验都是积累出来的,交流小队里有很多分享面试经验…

Vue3 中生命周期的使用

目录前言:一、什么是生命周期函数二、什么是 Keep-Alive 组件三、生命周期函数分为几种,分别有什么用?1. beforeCreate2. created3. beforeMount/onBeforeMount4. mounted/onMounted5. beforeUpdate/onBeforeUpdate6. updated/onUpdated7. be…

spring之事务概述

文章目录前言一、事务概述1、什么是事务2、事务的四个处理过程3、事务的四个特性二、引入事务场景1、引入依赖2、数据库创建3、建包4、spring.xml配置文件5、测试程序6、运行结果(成功)7、模拟异常三、Spring对事务的支持1、Spring实现事务的两种方式2、…

数值方法笔记4:插值、近似和拟合

1. 插值1.1 插值的一些概念1.1.1 插值的定义1.1.2 插值的存在性1.1.3 插值的误差分析1.2 拉格朗日插值(Lagrange Interpolation)1.2.1 拉格朗日插值误差分析1.3 Newton多项式插值1.3.1 Newton多项式插值误差分析1.4 Chebyshev多项式确定插值点1.4.1 Chebyshev多项式性质1.5 有理…

Green Hills Software(GHS)的安装

Green Hills Software(GHS)简介 Green Hills Software(GHS)是美国Green Hills软件公司提供的一种具有调试、编译器和闪存编程工具的集成开发环境,是汽车电子行业常用且重要的开发环境之一。它支持的功能包括:AUTOSAR感知、项目构建器、代码覆盖、运行时错误检查、MISRA C…

【HEC-RAS水动力】HEC-RAS 1D基本原理(恒定流及非恒定流)

一、数据说明 HEC-RAS模型主要由工程文件 (.prj) 文 件 、 河道地形数据文件 ( .g01)、运行文件(p01)、非恒定流文件 ( .u01) 等部分组成。 1. 一般数据 在创建并保存project文件(*.prj)后,其他data文件均会自动以同样的名字保存,但采用不同的后缀来区分各类文件。 &qu…

网络编程之IP 地址的介绍

IP 地址的介绍学习目标能够说出IP 地址的作用1. IP 地址的概念IP 地址就是标识网络中设备的一个地址,好比现实生活中的家庭地址。网络中的设备效果图:2. IP 地址的表现形式说明:IP 地址分为两类: IPv4 和 IPv6IPv4 是目前使用的ip地址IPv6 是未来使用的i…