入职数据分析公认的好书|建议收藏

news2024/11/17 9:56:08

众所周知,数据分析经常出现在我们的日常生活中,各行各业都需要数据分析。可你知道什么是数据分析?它在企业里到底扮演什么角色?以及如果我们自己也想拥有数据分析的能力,以便更好的满足数据分析的需求,我们该怎么办?

今天给大家介绍一个保姆级别的规划,即一份书单,帮助大家自学数据分析。先上一个思维导图,方便大家收藏。(最后附带一些相关学习网站,方便大家学习)

数据分析的工作流程

看了数据分析工作流程图,我们可以大致总结出要想做好数据分析所需要的一些基本技能能力。

1.统计学知识;

2.SQL、Excel、Python等数据分析工具;

3.逻辑思维,分析方法。

现在了解了流程与所需技能,接下来我们就来对每本书进行细致的说明,帮助各位按需选择。

一、基础概念篇——统计学

数据分析在某种意义上就是统计的更进一步。没有统计学知识,就做不了数据分析。因此我们首先要学习统计学知识。推荐两本统计学书籍。《深入浅出统计学》与《商务与经济统计》。

1.从0到1:《深入浅出统计学》

为什么是它?借用一位读者的评价“我家的猫都喜欢这本书!”

推荐理由:书名已经很好地表现出了这本书的优点——“深入浅出”。什么是统计?什么是众数、异常值、四分位数?几何分布,泊松分布,二项分布又是什么?如何对数据进行预测?预测数据和置信区间又有什么关系?这些词语很可能让你头大,也可能让你回忆起大学概率论与数理统计的不太美妙经历。但是没关系,忘记这些烦恼,这本书与现实世界紧密互动,让你不再只有枯燥的理论,并且将知识图形化,复杂的概念简单化。

2.《商务与经济统计》

推荐理由:这本书与上一本书相比,在知识上有了更进一步的深化,并且全书覆盖了所有统计学基础知识难度也有了一定的提高,但本书最大的优点就是极为全面的介绍了常用的数据分析方法和统计学方法,且向读者展示了统计学在商务和经济中的实用性,让你在“有什么用,怎么用”不在那么迷茫。

二、分析工具篇

1.Excel

大家常说的Excel,但是不要以为你很会Excel!Excel是所有职场人必备的办公软件。很多人觉得Excel比较low,说出去不那么高大上。但是Excel功能非常强大,在数据量不是很大的情况下,基本上都能用Excel实现数据分析。推荐如下书籍:

(1)《Excel高效办公数据处理与分析》

推荐理由:神龙工作室编著的这本Excel指导书,很详尽的介绍了Excel的排序、筛选,函数,图表以及数据透视表的使用。并且也用了几个章节来结合业务进行实操,比如趋势分析、描述分析、对比分析、相关分析等。本书同时提供了大量需要你做的实例,学而不练是不存在的!

(2)《别怕,Excel函数其实很简单》

推荐理由:本书用浅显易懂的图文、生动形象的比喻以及大量实际工作中的经典案例,介绍了Excel常用的一部分函数的计算原理和应用技巧,包括逻辑运算、日期与时间运算、文本运算、查找与统计运算等,还介绍了数据的科学管理方法,以避免从数据源头就产生问题。同时本书适合希望提高办公效率的职场人士,特别是经常需要处理分析大量数据并制作统计报表的相关人员,以及相关专业的高校师生阅读,小白需谨慎!

2.SPSS

SPSS为IBM公司推出的一系列用于统计学分析运算、数据挖掘、预测分析和决策支持任务的软件产品及相关服务的总称。你可以看到有许多数据分析岗位要求会SPSS,但是SPSS并没有你想的那么神秘!自学没有想象的那么困难。

推荐书籍《量化研究与统计分析》,记住:一定要是重庆大学出版社的版本

推荐理由:SPSS有很多书籍教学,许多真的是一言难尽,小编就买过某些比较坑的,不点名批评了。但是这本书框架清晰,最关键是的——内容详细,充分的实操。小编一直认为工具类教材没有实操就是耍流氓。这本书基本可以手把手教你,当然,请先把统计学基础打好。

3.SQL

SQL是数据分析的基础,是想要学会数据分析能力的必备技能。那这里我只给大家介绍三本书,第一本书零基础入门,第二是进阶,第三本是SQL中的字典,话不多说,我们直接上干货。

(1)《SQL基础教程》

推荐理由:本书107张图表+209段代码+88个法则,是零基础进阶人士必备!

基于标准SQL编写,明示各RDBMS(PostgreSQL DB2 MySQL Oracle SQL Server)的差异,让你学起来不再困惑。

(2)SQL进阶:《SQL进阶教程》

推荐理由:放在前面,本书不适合小白!本书适合具有半年以上SQL使用经验、已掌握SQL基础知识和技能、希望提升自己编程水平的读者阅读。

(3)SQL辅导书籍

推荐理由:本书最大的特点是实例丰富,便于查阅。有一定SQL基础的人士可以将它当做一本字典使用,遇到问题可以查找相应内用。

4.Python

现在到了Python,Python在互联网上可以说是热词了,网上很多关于Python做数据分析的推荐,并且标上小白可入门,但是很多都是建立在已经有编程基础的小伙伴上,教会你如何去分析,并不是真真意义上的小白。

(1)《Python编程,从入门到实践》

推荐理由:本书最大的特点就是零基础完全不懂编程的小白也能够学习,新手想学习选它绝对错不了。知识点由浅入深循循渐进,并配有视频教程手把手教学。同时所需的软件也是免费的,可以直接去图灵社区下载。本书也配有相关辅导书籍,有兴趣的话可以去看看,但是请记住,这本书是最核心的。

(2)《利用Python进行数据分析》

推荐理由:不像别的编程书一样,从盘古开天辟地开始讲起。这本书是直接应用到数据分析的,所以很多在数据分析上应用不那么频繁的模块也就没有讲。

学完这本书,相信对于一般的数据处理和清洗已经不在话下了。阅读本书可以获得一份关于在Python下操作、处理、清洗、规整数据集的完整说明。本书第二版针对Python 3.6进行了更新,并增加实际案例向你展示如何高效地解决一系列数据分析问题。你将在阅读过程中学习到新版本的pandas、NumPy、IPython和Jupyter。

5.R语言

R是用于统计分析、绘图的语言和操作环境。但是R是有一定难度的,没有基础的话请谨慎尝试!推荐书籍:

(1)《R语言入门与实践》

推荐理由:本书通过三个精心挑选的例子,深入浅出地讲解如何使用R语言玩转数据。书中涵盖R语言编程的方方面面,内容涉及R对象的类型、R的记号体系和环境系统、自定义函数、if else语句、for循环、S3类、R的包系统以及调试工具等。本书还通过示例演示如何进行向量化编程,从而对代码进行提速并尽可能地发挥R的潜能。

(2)《R语言实战》

推荐理由:这本书非常的系统,分为入门,基本方法,中级方法,高级方法,技能拓展几大部分,循序渐进的介绍R语言,书中包含的知识点非常多,而且也比较全面。最好的一点是,本书配套有案例代码,可以直接运行,这对于学习计算机语言类的技能是非常有帮助的。

(3)《R数据可视化手册》

推荐理由:R一个重要的应用——数据可视化,首先这本书是全彩色的,能进一步帮助你体验数据可视化的的效果。同时本书提供了150多个技巧,借助这些技巧,科学家、工程师、程序员和数据分析师无须梳理出R绘图系统的全部细节就可以快速绘制出高质量的图形。每个技巧解决一个特定的问题,读者可以将这些技巧应用到自己的项目中。书中还包含图可视化设计的扩展内容。读者只要对R语言有基本的了解,就可以开始使用这本简单易用的参考书。

三、综合类

没错,到这里给大家介绍一些综合性很强的书,这些需要一定的综合数据处理能力才能开始学习。

1.《深入浅出数据分析》

推荐理由:前文已经说到,书如起名,深入简出,但是这本书类似“章回小说”的活泼形式,生动地向读者展现出色的数据分析人员应会的技术。并且图多字少,轻松入门。同时使用大量逻辑性极强的的思维导图,化大问题为小问题,环环相扣,拆解庞杂数据。怎么提升销量、怎么分析a门店比b门店好、怎么进行细分分析和对比分析......很多人在读完这本书之后,跟着Acme在重重挑战之下,对数据分析有一个清醒的认识,相信你读完后也一定会有令自己满意的收获。

2.《数据分析:从入门到进阶》

注意事项:本书适合有志于从事数据分析工作或已从事初级数据分析工作的人士自学,也可作为产品经理、运营人员、市场人员、对数据分析感兴趣的企业高管以及创业者的参考用书。

推荐理由:本书由一线数据分析师精心编写,通过大量案例介绍了数据分析工作中常用的数据分析方法与工具。本书包括5章内容,分别是数据分析入门、数据分析——从玩转Excel开始、海量数据管理——拿MySQL说事儿、数据可视化——Tableau的使用、数据分析进阶——Python数据分析。本书通俗易懂、通过大量贴近企业真实场景的案例,帮助读者在提高数据处理技能的同时加深对数据分析思维的理解。

四、思维逻辑篇

1.数据思维

数据分析不是某个固定的职位,而是人工智能时代的通用能力,更是一种思维模式——用数据说话!你会看到各行各业的招聘中都会要求应聘者具备数据分析能力。所以,具备数据分析能力可以极大地提升你在职场中的竞争力。

在这里,给大家推荐再推荐一本思维导向的书籍《数据分析思维》

推荐理由:很多人掌握了数据分析工具(如Excel、SQL、Python等),面对工作还是不知道如何展开分析,经常会遇到下面这些问题:

(1)手里拿了一堆数据,却不知道怎么去利用;

(2)业务部门不满意,总觉得你分析得不深入;

(3)准备面试或找到新工作后,不知道如何快速找到该行业的业务知识。

为了帮大家解决这些问题,本书“方法篇”介绍了数据分析中常用的业务指标、分析方法以及如何用数据分析解决问题的步骤。“实战篇”讲解了如何应用第一篇的方法来解决工作中的问题,让你既有方法,又有一定的实战经历,从而帮助你更好的帮你简历数据思维。

2.逻辑思维

我们做数据分析需要汇报,最后的分析结果要让听众理解意会,要让管理层信服,这时候就需要我们语言的逻辑能力。我们用数据说话,要让别人听得清清楚楚,明明白白,不然不就浪费了自己的分析?接下来推荐的这本书很多人都听过,小编并不介意再将它拿出来,《金字塔原理》。

推荐理由:这本书可以帮助我们思考问题,我们做数据分析,是要带着目的去分析的,不能为了分析而分析,这就要求我们提高结构化思维能力,化繁为简。同时数据分析工作最后要求我们汇报,如何汇报才最有效果?才能让自己的分析结果更好地传达?让自己汇报更具有说服力?这些都是需要进行训练的,显然《金字塔原理》就是你武装自己的利器!

五、结语

到这分享就要结束了,学无止境,在这里祝大家在数据分析的学习上都取得理想的进展。如有补充,欢迎各位在评论区留言。

相关学习网站:

1. github.com/pypa/pipenv

2. programcreek.com/python/

3. pythondoc.com/

4. reddit.com/r/Python/

5. py.checkio.org/

6. w3cschool.cn/r/

7. https://www.statmethods.net/index.html

8. github.com/search?

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/375849.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

系列六、存储引擎

一、存储引擎介绍 大家可能没有听说过存储引擎,但是一定听过引擎这个词,引擎就是发动机,是一个机器的核心组件。 比如,对于舰载机、直升机、火箭来说,他们都有各自的引擎,是他们最为核心的组件。而我们在选…

vue脚手架多页自动化生成实践

前言 在前端开发过程中,常常面对多种业务场景。到目前为止,前端对于不同场景的处理通常会采用不同的渲染方案来组合处理,常见的渲染方案包括:CSR(Client Side Rendering)、SSR(Server Side Rendering)、SSG(Static Site Generati…

2023年房地产行业研究报告

第一章 行业发展概况 房地产业是指以土地和建筑物为经营对象,从事房地产开发、建设、经营、管理以及维修、装饰和服务的集多种经济活动为一体的综合性产业,是具有先导性、基础性、带动性和风险性的产业。主要包括:土地开发,房屋的…

Vue3 -- PDF展示、添加签名(带笔锋)、导出

文章目录笔锋签名方案一实现要点实现过程组件引用页面元素添加引用实现代码效果展示缺点方案二修改页面元素替换引用修改代码效果展示完整代码地址实现功能的时候采用了两个方案,主要是第一个方案最后的实现效果并不太理想,但实现起来比较简单&#xff0…

JavaScript手写题

一、防抖 function debounce(fn, delay200) {let timeout null; // 定时器控制return function(...args) {if (timeout) { // 定时器存在,表示某个动作之前触发过了clearTimeout(timeout); // 清除定时器timeout null;} else {// 对第一次输入立即执行fn.apply…

【Leetcode 剑指Offer】第 5 天 查找算法(中等)

查找算法剑指 Offer 04. 二维数组中的查找剑指 Offer 11. 旋转数组的最小数字剑指 Offer 50. 第一个只出现一次的字符Python字典基础哈希表(python中是dict())有序哈希表第一个中等,后两个简单题。剑指 Offer 04. 二维数组中的查找 题&#…

Node.js的研究和应用

首先我们要知道什么是node.js? Node.js采用谷歌的V8引擎,是一个服务器端的、非阻断式I/O的、事件驱动的 JavaScript运行环境。 一、Node.js架构具体包含什么呢?咱们从一个图来看看会更加明白。 natives modules: 1.当前层内容由js实现 。…

不使用implements关键字实现实现类(类似于mapper)

首先,说明一下功能需求,平时定义一个接口,就要使用implements关键字来实现接口。那么,当不使用此关键字的时候,是否也能使相关接口也能够绑定实现类呢? 答案是肯定的。 此篇文章的主要功能有两个&#xf…

知识类问答数据集资源对外开放:百万级百度知道、社区问答及六大领域级小规模语料概述

随着chatgpt的火热,中文知识类问答数据集由收到诸多关注,其作为高质量的QA数据,可以用于SFT阶段以及pretrain预训练阶段。 本文主要介绍目前开源可下载的两个较大规模的知识类数据集,包括147万百度知道知识类数据集、425万社区问…

IOS逆向前期环境准备笔记

ios系统由于效验问题,只能升级不能降级,需要特别注意, 刷系统可以在爱思上搞定; 越狱推荐使用u盘镜像及本地启动盘制作: 注意,要进去bios,关闭安全启动,不然直接失败: Checkra1n镜…

linux升级gcc版本详细教程

0.前言一般linux操作系统默认的gcc版本都比较低,例如centos7系统默认的gcc版本为4.8.5。gcc是从4.7版本开始支持C11的,4.8版本对C11新特性的编译支持还不够完善,因此如果需要更好的体验C11以及以上版本的新特性,需要升级gcc到一个…

九、Vben之可拖拽穿梭框和水印背景如何添加

近期在开发的过程中遇到了两个难题,一个是目前的穿梭框不支持产品的要求,不能够上下拖拽,二是vben没有水印的api,需要我们自己来开发。 一、可拖拽穿梭框 做成功的效果如下: 思路: 将table放入transfer的…

操作系统权限提升(十七)之绕过UAC提权-Windows令牌概述和令牌窃取攻击

系列文章 操作系统权限提升(十二)之绕过UAC提权-Windows UAC概述 操作系统权限提升(十三)之绕过UAC提权-MSF和CS绕过UAC提权 操作系统权限提升(十四)之绕过UAC提权-基于白名单AutoElevate绕过UAC提权 操作系统权限提升(十五)之绕过UAC提权-基于白名单DLL劫持绕过UAC提权 操作系…

android EditText设置后缀

有两种实现方案。 方案一:是自己写一个TextWatcher。 方案二:是重写TextView的getOffsetForPosition方法,返回一个计算好的offset。 我在工作时,使用的是方案一。在离职之后,我还是对这个问题耿耿于怀,所以…

git在工作中的正常使用

开发A和B功能后进行发版。。 一、拉取代码 git clone http://ntc.ntsvars.com:8090/lvweijie/test.git二、开发功能A任务 创建A任务本地分支 #创建A分支,并切换A分支 git checkout -b A三、开发A任务 四、提交A功能文件到本地分支 git add .五、添加提交A功能备…

Tina_Linux打包流程说明指南_new

OpenRemoved_Tina_Linux_打包流程_说明指南_new 1 概述 1.1 编写目的 介绍Allwinner 平台上打包流程。 1.2 适用范围 Allwinner 软件平台Tina v3.0 版本以上。 1.3 相关人员 适用Tina 平台的广大客户,想了解Tina 打包流程的开发人员。 2 固件打包简介 固件…

Jenkins+Gitlab实现代码自动构建部署

一、环境准备 主机名ip安装软件jenkins192.168.75.149jenkinsgitlab192.168.75.147gitlabweb192.168.75.155部署应用 二、jenkins服务器配置 1、生产公钥 [rootjenkins ~]# ssh-keygen (2)获取公钥信息 公钥信息在配置 Gitlab SSH Keys 时用到。 &am…

Tcpdump抓包验证zookeeper的心跳机制

一、背景 在分布式系统中,zookeeper可以作为服务注册中心,所有提供服务的节点都可以在zookeeper上面注册,并作为一个node被组织起来,如下图: 在RPC框架中,这些服务提供者就是RPC服务的提供者。zookeeper注…

【测试】Python手机自动化测试库uiautomator2和weditor的详细使用

1.说明 我们之前在电脑操作手机进行自动化测试,基本上都是通过Appium的,这个工具确实强大,搭配谷歌官方的UiAutomator基本上可以完成各种测试,但缺点也很明显,配置环境太麻烦了,需要jdk、sdk等&#xff0c…

利用较新版本的IDEA 2022.3.2 创建Java Web的maven项目

1.创建项目 正常三步走,没什么可说的 2.用模板创建项目(重要) 第一步,一定要选Jakarta EE。这个模板是基于JavaWeb的一个标准模板,如果选了maven中的JavaWeb模板,那就变成了web目录在根目录下,…