在大数据时代,数据的来源具有多样性、复杂性。
针对数量庞大、渠道及格式多样的数据,数据清洗就成为刚需。
在数据分析中,数据清洗实际上是十分繁重且关键的一步。
Power Query作为数据清洗的工具,能将这些多源的数据集中并统一转换成所需要的格式,为数据分析创造前提条件。
此外,Power Query还能使办公自动化更进一步,与常用办公软件Excel无缝衔接,使日常的重复工作实现自动化,得到高效并准确的处理结果,不仅可以为企业节省人力成本,还可以为个人节省时间。
在未使用Power Query之前,《Power Query实战:Excel智能化数据清洗神器应用精讲》一书的作者常用的是Excel中的函数,但是自从使用了Power Query,很多在Excel中看似困难的操作只需要进行简单的处理即可完成,甚至都不需要自己编写函数,直接在操作界面中操作即可。
对于没有编程经验的人来说,使用Power Query的关键就是搞清楚数据的格式,如果理解了这一点,那么在使用函数的过程中会容易很多。
Power Query中的函数多达几百个,选择案例中介绍的那些常用的函数并熟练运用,基本上可以解决工作中遇到的大部分问题。
本书不仅说明了操作过程,还帮助读者拓展思路,使读者能够举一反三地来解决问题;同时,通过丰富的案例对函数的计算过程进行详细解释,使读者能够更好地理解函数的计算过程,更清楚函数的计算逻辑。
经常使用Excel的办公人员
经常需要整合各个渠道数据的人员
经常需要生成不同报表的统计人员
企业运营管理及分析人员
做市场分析的统计人员
其他对数据整理及分析感兴趣的人员
第1章:主要介绍Power Query的一些基本概念,如Power Query的作用、打开方式、主界面功能、数据类型、函数概况、基础语法、数据的引用方式等。
第2章:介绍Power Query中从多种数据源导入数据的方法,如从Excel工作簿、工作表、表格、文本文件、文件夹、MySQL数据库、Web页面及其他数据源导入数据。
第3章:以自制文件管理器作为案例,通过数据的获取、提取、判断和筛选等方式来熟悉一些基本操作,最后利用批处理文件来批量移动、复制、删除和重命名文件。
第4章:对比Excel中的条件计算公式,了解Power Query中的数据自动化清洗计算功能。
第5章:对比Excel中的数据去重及数据匹配功能,了解Power Query中VLOOKUP匹配函数的实现方法。
第6章:对比Excel中提取文本中数据的方法,了解Power Query中功能更强大的提取方式,包括提取任意数字、英文、符号及指定国家语言字符等。
第7章:对比Excel中的绝对引用和相对引用,了解在Power Query中实现相对引用、绝对引用和混合引用的方法。
第8章:以电商平台批量上传产品数据表作为案例,通过分析目标表格式,介绍如何使用Power Query对源数据表格进行清洗并达到目标表格式的要求,以及如何处理标题内容和列的顺序不符合要求的表格。
第9章:以库存的断码缺货及补货作为案例,通过Power Query对数据进行清洗,使其能自动显示断码缺货的情况及补货的需求。
第10章:对比Excel中的“分列”功能,Power Query中“拆分列”功能的规则具有多样性,不仅可以按分隔符、按字符数、按位置来拆分列,还可以按照既有规则转换拆分列,以及自定义规则转换拆分列(如中文转英文、英文转数字等)。
第11章:使用Power Query对合并单元格的数据进行处理,使其成为可用于分析的数据,包括列标题的合并、行标题的合并、数据值的合并等。
第12章:主要介绍Power Query中时间类函数的应用、日期及时间类函数的主要分类、日期格式的互相转换等,以排班表和账期计算作为案例来充分展示时间类函数的应用。
第13章:主要介绍如何提取带有table标签的网页数据,如何对JSON格式的数据进行清洗,以及如何提取代码中的指定数据。
第14章:主要介绍Power Query中的函数概念、自定义函数的备注,以及自定义函数实战。
第15章:使用Power Query进行人工智能开发,通过解读开放文档中的说明,连接开放的API,使数据处理更加智能化。