众所周知,数据分析经常出现在我们的日常生活中,各行各业都需要数据分析。可你知道什么是数据分析?它在企业里到底扮演什么角色?以及如果我们自己也想拥有数据分析的能力,以便更好的满足数据分析的需求,我们该怎么办?
今天给大家介绍一个保姆级别的规划,即一份书单,帮助大家自学数据分析。先上一个思维导图,方便大家收藏。(最后附带一些相关学习网站,方便大家学习)
数据分析的工作流程
看了数据分析工作流程图,我们可以大致总结出要想做好数据分析所需要的一些基本技能能力。
1.统计学知识;
2.SQL、Excel、Python等数据分析工具;
3.逻辑思维,分析方法。
现在了解了流程与所需技能,接下来我们就来对每本书进行细致的说明,帮助各位按需选择。
一、基础概念篇——统计学
数据分析在某种意义上就是统计的更进一步。没有统计学知识,就做不了数据分析。因此我们首先要学习统计学知识。推荐两本统计学书籍。《深入浅出统计学》与《商务与经济统计》。
1.从0到1:《深入浅出统计学》
为什么是它?借用一位读者的评价“我家的猫都喜欢这本书!”
推荐理由:书名已经很好地表现出了这本书的优点——“深入浅出”。什么是统计?什么是众数、异常值、四分位数?几何分布,泊松分布,二项分布又是什么?如何对数据进行预测?预测数据和置信区间又有什么关系?这些词语很可能让你头大,也可能让你回忆起大学概率论与数理统计的不太美妙经历。但是没关系,忘记这些烦恼,这本书与现实世界紧密互动,让你不再只有枯燥的理论,并且将知识图形化,复杂的概念简单化。
2.《商务与经济统计》
推荐理由:这本书与上一本书相比,在知识上有了更进一步的深化,并且全书覆盖了所有统计学基础知识难度也有了一定的提高,但本书最大的优点就是极为全面的介绍了常用的数据分析方法和统计学方法,且向读者展示了统计学在商务和经济中的实用性,让你在“有什么用,怎么用”不在那么迷茫。
二、分析工具篇
1.Excel
大家常说的Excel,但是不要以为你很会Excel!Excel是所有职场人必备的办公软件。很多人觉得Excel比较low,说出去不那么高大上。但是Excel功能非常强大,在数据量不是很大的情况下,基本上都能用Excel实现数据分析。推荐如下书籍:
(1)《Excel高效办公数据处理与分析》
推荐理由:神龙工作室编著的这本Excel指导书,很详尽的介绍了Excel的排序、筛选,函数,图表以及数据透视表的使用。并且也用了几个章节来结合业务进行实操,比如趋势分析、描述分析、对比分析、相关分析等。本书同时提供了大量需要你做的实例,学而不练是不存在的!
(2)《别怕,Excel函数其实很简单》
推荐理由:本书用浅显易懂的图文、生动形象的比喻以及大量实际工作中的经典案例,介绍了Excel常用的一部分函数的计算原理和应用技巧,包括逻辑运算、日期与时间运算、文本运算、查找与统计运算等,还介绍了数据的科学管理方法,以避免从数据源头就产生问题。同时本书适合希望提高办公效率的职场人士,特别是经常需要处理分析大量数据并制作统计报表的相关人员,以及相关专业的高校师生阅读,小白需谨慎!
2.SPSS
SPSS为IBM公司推出的一系列用于统计学分析运算、数据挖掘、预测分析和决策支持任务的软件产品及相关服务的总称。你可以看到有许多数据分析岗位要求会SPSS,但是SPSS并没有你想的那么神秘!自学没有想象的那么困难。
推荐书籍《量化研究与统计分析》,记住:一定要是重庆大学出版社的版本
推荐理由:SPSS有很多书籍教学,许多真的是一言难尽,小编就买过某些比较坑的,不点名批评了。但是这本书框架清晰,最关键是的——内容详细,充分的实操。小编一直认为工具类教材没有实操就是耍流氓。这本书基本可以手把手教你,当然,请先把统计学基础打好。
3.SQL
SQL是数据分析的基础,是想要学会数据分析能力的必备技能。那这里我只给大家介绍三本书,第一本书零基础入门,第二是进阶,第三本是SQL中的字典,话不多说,我们直接上干货。
(1)《SQL基础教程》
推荐理由:本书107张图表+209段代码+88个法则,是零基础进阶人士必备!
基于标准SQL编写,明示各RDBMS(PostgreSQL DB2 MySQL Oracle SQL Server)的差异,让你学起来不再困惑。
(2)SQL进阶:《SQL进阶教程》
推荐理由:放在前面,本书不适合小白!本书适合具有半年以上SQL使用经验、已掌握SQL基础知识和技能、希望提升自己编程水平的读者阅读。
(3)SQL辅导书籍
推荐理由:本书最大的特点是实例丰富,便于查阅。有一定SQL基础的人士可以将它当做一本字典使用,遇到问题可以查找相应内用。
4.Python
现在到了Python,Python在互联网上可以说是热词了,网上很多关于Python做数据分析的推荐,并且标上小白可入门,但是很多都是建立在已经有编程基础的小伙伴上,教会你如何去分析,并不是真真意义上的小白。
(1)《Python编程,从入门到实践》
推荐理由:本书最大的特点就是零基础完全不懂编程的小白也能够学习,新手想学习选它绝对错不了。知识点由浅入深循循渐进,并配有视频教程手把手教学。同时所需的软件也是免费的,可以直接去图灵社区下载。本书也配有相关辅导书籍,有兴趣的话可以去看看,但是请记住,这本书是最核心的。
(2)《利用Python进行数据分析》
推荐理由:不像别的编程书一样,从盘古开天辟地开始讲起。这本书是直接应用到数据分析的,所以很多在数据分析上应用不那么频繁的模块也就没有讲。
学完这本书,相信对于一般的数据处理和清洗已经不在话下了。阅读本书可以获得一份关于在Python下操作、处理、清洗、规整数据集的完整说明。本书第二版针对Python 3.6进行了更新,并增加实际案例向你展示如何高效地解决一系列数据分析问题。你将在阅读过程中学习到新版本的pandas、NumPy、IPython和Jupyter。
5.R语言
R是用于统计分析、绘图的语言和操作环境。但是R是有一定难度的,没有基础的话请谨慎尝试!推荐书籍:
(1)《R语言入门与实践》
推荐理由:本书通过三个精心挑选的例子,深入浅出地讲解如何使用R语言玩转数据。书中涵盖R语言编程的方方面面,内容涉及R对象的类型、R的记号体系和环境系统、自定义函数、if else语句、for循环、S3类、R的包系统以及调试工具等。本书还通过示例演示如何进行向量化编程,从而对代码进行提速并尽可能地发挥R的潜能。
(2)《R语言实战》
推荐理由:这本书非常的系统,分为入门,基本方法,中级方法,高级方法,技能拓展几大部分,循序渐进的介绍R语言,书中包含的知识点非常多,而且也比较全面。最好的一点是,本书配套有案例代码,可以直接运行,这对于学习计算机语言类的技能是非常有帮助的。
(3)《R数据可视化手册》
推荐理由:R一个重要的应用——数据可视化,首先这本书是全彩色的,能进一步帮助你体验数据可视化的的效果。同时本书提供了150多个技巧,借助这些技巧,科学家、工程师、程序员和数据分析师无须梳理出R绘图系统的全部细节就可以快速绘制出高质量的图形。每个技巧解决一个特定的问题,读者可以将这些技巧应用到自己的项目中。书中还包含图可视化设计的扩展内容。读者只要对R语言有基本的了解,就可以开始使用这本简单易用的参考书。
三、综合类
没错,到这里给大家介绍一些综合性很强的书,这些需要一定的综合数据处理能力才能开始学习。
1.《深入浅出数据分析》
推荐理由:前文已经说到,书如起名,深入简出,但是这本书类似“章回小说”的活泼形式,生动地向读者展现出色的数据分析人员应会的技术。并且图多字少,轻松入门。同时使用大量逻辑性极强的的思维导图,化大问题为小问题,环环相扣,拆解庞杂数据。怎么提升销量、怎么分析a门店比b门店好、怎么进行细分分析和对比分析......很多人在读完这本书之后,跟着Acme在重重挑战之下,对数据分析有一个清醒的认识,相信你读完后也一定会有令自己满意的收获。
2.《数据分析:从入门到进阶》
注意事项:本书适合有志于从事数据分析工作或已从事初级数据分析工作的人士自学,也可作为产品经理、运营人员、市场人员、对数据分析感兴趣的企业高管以及创业者的参考用书。
推荐理由:本书由一线数据分析师精心编写,通过大量案例介绍了数据分析工作中常用的数据分析方法与工具。本书包括5章内容,分别是数据分析入门、数据分析——从玩转Excel开始、海量数据管理——拿MySQL说事儿、数据可视化——Tableau的使用、数据分析进阶——Python数据分析。本书通俗易懂、通过大量贴近企业真实场景的案例,帮助读者在提高数据处理技能的同时加深对数据分析思维的理解。
四、思维逻辑篇
1.数据思维
数据分析不是某个固定的职位,而是人工智能时代的通用能力,更是一种思维模式——用数据说话!你会看到各行各业的招聘中都会要求应聘者具备数据分析能力。所以,具备数据分析能力可以极大地提升你在职场中的竞争力。
在这里,给大家推荐再推荐一本思维导向的书籍《数据分析思维》
推荐理由:很多人掌握了数据分析工具(如Excel、SQL、Python等),面对工作还是不知道如何展开分析,经常会遇到下面这些问题:
(1)手里拿了一堆数据,却不知道怎么去利用;
(2)业务部门不满意,总觉得你分析得不深入;
(3)准备面试或找到新工作后,不知道如何快速找到该行业的业务知识。
为了帮大家解决这些问题,本书“方法篇”介绍了数据分析中常用的业务指标、分析方法以及如何用数据分析解决问题的步骤。“实战篇”讲解了如何应用第一篇的方法来解决工作中的问题,让你既有方法,又有一定的实战经历,从而帮助你更好的帮你简历数据思维。
2.逻辑思维
我们做数据分析需要汇报,最后的分析结果要让听众理解意会,要让管理层信服,这时候就需要我们语言的逻辑能力。我们用数据说话,要让别人听得清清楚楚,明明白白,不然不就浪费了自己的分析?接下来推荐的这本书很多人都听过,小编并不介意再将它拿出来,《金字塔原理》。
推荐理由:这本书可以帮助我们思考问题,我们做数据分析,是要带着目的去分析的,不能为了分析而分析,这就要求我们提高结构化思维能力,化繁为简。同时数据分析工作最后要求我们汇报,如何汇报才最有效果?才能让自己的分析结果更好地传达?让自己汇报更具有说服力?这些都是需要进行训练的,显然《金字塔原理》就是你武装自己的利器!
五、结语
到这分享就要结束了,学无止境,在这里祝大家在数据分析的学习上都取得理想的进展。如有补充,欢迎各位在评论区留言。
相关学习网站:
1. github.com/pypa/pipenv
2. programcreek.com/python/
3. pythondoc.com/
4. reddit.com/r/Python/
5. py.checkio.org/
6. w3cschool.cn/r/
7. https://www.statmethods.net/index.html
8. github.com/search?