【读书笔记】《深入浅出数据分析》

news2024/9/28 15:21:25

我最大的收获

试想你在经历一场英语考试,还有两分钟就要交卷了,而你还没有开始写作文。此时,你会怎么做?
利用2分钟时间写出的第一段,还是只写关键句子,搭出文章的开头、过程、结尾?
后者更加明智。这也告诉我们结构完整的重要性。
在工作中,结构性意味着全局思考、闭环、方法。这本书给我最大的帮助,也是再次认识到了结构重要性。确定-分解-评估-决策。

数据分析的目的:通过数据分析,做出更好的决策。认清问题并解决问题。

影响分析结果的关键:一个人的心智模型。一个人的假设+观点=心智模型。

优秀的数据分析师帮助客户思考自己的问题,他们不会等着客户告诉他们该做什么。

数据分析,无法得出适用于所有情况的正确的策略。

数据分析的步骤:

数据分析的方法:观察、对比、实验

使用正确的心智模型进行分析:知道自己知道的,知道自己不知道的。

知道自己知道的=认知可以用数据验证

知道自己不知道的=哪些方面缺乏了解

案例一:保湿霜生产厂商想要提升销售。

分析步骤:确定-分解-评估-决策方法使用。

分析过程:确定需求是销售额提升到目标值。分解销售额来源于不同的供应商。评估发现供应商将货品卖给了男性客户用于剃须。决策开发男性市场。

我学到的:外部世界信息很多,方向错误会迷失在数据的海洋里。找方向的关键是心智模型。心智模型=假设+观点。

案例二:咖啡店的销售额下降,需要找到原因进行提升。

分析方法:观察法、实验法、对比法

分析步骤:确定(已知)--分解(分区域)--评估(实验法)--决策(根据实验结果)

分析过程:观察发现用户调研显示咖啡价值下降。拆解问题发现是XX区域用户对咖啡价值评价下降。制定降价和游说用户两种提升方法,采取同期实验法测试。对比实验数据形成解决方法。

我学到的:实验法的使用。选择同期实验方法而不是历史实验法、排除混杂因素、随机分组(将咖啡店按照区域分组,然后使用RUND公式实现随机分组)。

案例三:生产商可以生产橡皮鸭和橡皮鱼两种商品,各自有不同的利润,各生产多少可以利润最大化?

数据分类,可控因素与不可控因素

明确决策变量、可控因素

使用Solver公式,求出可控因素为多少时,得出利润最大值。可控因素:具体生产多少只。限制条件:橡胶的数量、产能的限制、用户的需求。

我学到的:业务影响因素分可控和不可控,不可控因素无法干预,但应该知道并提前采取措施。

案例四:网站改版,有三套首页设计,应该选择哪种?

数据以图形方式呈现,简单直观。

图形数据化工具:excel、illustrator、R程序、Edward Tufte的书

案例五:生产手机壳的公司,怎么去预测新手机发布时间?

分析方法:假设检验的证伪法

分析步骤:收集信息、大胆预测、用证伪法排除错误预测、诊断证据和假设之间的关系,找到最强假设。

我学到的:证伪法可以克服人们专注于错误答案而无视其他答案的天然倾向。

案例六:检测结果阳性,真正患病的概率是多少?

分析方法:贝叶斯规则

分析步骤:社会中患病人数1%=基础概率,患病检测结果阳性概率90%、未患病检测结果阳性10%、条件概率。基础概率和条件概率结合算出检测结果阳性,患病概率。

案例七:分析师们对事情发生概率的看法不一,如何判断?

分析方法:主观概率

分析步骤:请分析师对于事情发生的概率用%表示。散点图每个点表示一位分析师的看法,可以直接观察出倾向性。使用标准偏差STDEV公式(Standard Deviation),可以计算出大家对于事情的实际争议程度大小。

案例八:宣传不要乱扔垃圾的公司,如何说服市政府持续对公司的投入?

治理扔垃圾的效果没有直接的数据、收集数据成本高、难以量化、用户调研不具有代表性。

分析方法:启发法,快省树

我理解是列出市民扔垃圾意识、行为改变的过程,体现这个公司的业务模型的价值。

案例九:直方图

已知公司内历史加薪情况,包含性别、提出加薪幅度、年份与实际加薪之间的对应关系。

如何表示加薪结果的分布?直方图

表现形式的积累:

1、折线图,X轴月份,Y轴销售额,目标值是虚线,实际值是实线,直接看出完成程度。

2、步骤A到B,中间用箭头表示,箭头上方文字写明AB之间的关系。

3、步骤A到B1、B2到C1-4到D,总分总形式,树形流程图,凸显过程与结论。

4、散点图:X轴代表自变量=原因、Y轴代表应变量=结果、散点体现数据分布。虚线代表散点的均值或者目标值。

5、两个变量之间,是正向关系还是负向关系,两个变量中间用双箭头表示,中间一个圆圈写+或者-,表示正负关系。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/487116.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【LeetCode】91. 解码方法

91. 解码方法(中等) 思路 这其实是一道字符串类的动态规划题,不难发现对于字符串s的某个位置i而言,我们只关心「位置 i 自己能否形成独立 item」和「位置 i 能够与上一位置(i-1)能否形成item 」&#xff0c…

无人机测试二维码降落。

一、首先要做的就是让NX板卡驱动usb摄像头: 1. 下载usb_cam软件包 sudo apt install ros-melodic-usb-cam2. 启动相机节点: A. 查找摄像头接口 ls /dev/video*B. 在该路径下修改launch文件,换成你自己的摄像头接口 我这里的摄像头接口为…

PySpark基础入门(3):RDD持久化

RDD的持久化 RDD 的数据是过程数据,因此需要持久化存储; RDD之间进行相互迭代的计算,新的RDD的生成代表着旧的RDD的消失;这样的特性可以最大化地利用资源,老旧地RDD可以及时地从内存中清理,从而给后续地计…

电脑发挥极致,畅游永恒之塔sf

随着22寸显示器的普及,玩永恒之塔势必会对显示卡造成了很大负担。不要说效果全开,就连简洁的玩,都成了问题,那是不是就要重金把才买的显示卡又要拿掉呢? 最出众的解决办法,是超频。 主要就具有以下条件最佳…

Azure DevOps Server 数据还原方式三:增量还原

Contents 1. 概述2. 操作方式 2.1 创建共享文件夹,并将备份文件复制到共享文件夹中2.2 还原数据3 验证还原的数据库 3.1 方式一:核对工作项所在的表的数据3.2 方式二:将数据库配置到应用层,在应用中验证数据4. 常见问题&#xff1…

FAST协议解析1 通过输入输出逆解析

一、前言 FAST协议可以支持金融机构间高吞吐量、低延迟的数据通讯,目前我知道的应用领域是沪深交易所的Level-2行情传输。网络上无论是FAST协议本身,还是使用相关工具(openfast、quickfast)对FAST行情进行解析,相关的…

MC9S12G128开发板—解决小车九宫格方位移动功能实现遇到的一些问题

接着我的上一篇文章:MC9S12G128开发板—实现按键发送CAN报文指示小车移动功能。本篇文章主要记录下在实现小车九宫格方位移动功能过程中,遇到的一些程序问题以及解决措施。 1. 上位机小车响应开发板按键CAN报文指令的响应出错问题 问题现象描述&#x…

自动驾驶行业观察之2023上海车展-----车企发展趋势(1)

新势力发展趋势 小鹏汽车:发布新车G6(中型SUV),将于2023年年中上市 发布新车G6:车展上,小鹏G6正式首发亮相,定位中型SUV,对标Tesla Model Y,将于2023年年中上市并开始交…

基于web的商场商城后台管理系统

该系统用户分为两类:普通员工和管理员。普通员工是指当前系统中的需要对商品和客户的信息进行查询的人。此类用户只能查看自己的信息,以及对商品和客户的信息进行查看。管理员用户可以对自己和他人的信息进行维护,包括对商品入库、销售、库存…

Redis缓存过期淘汰策略

文章目录 1、如何设置 Redis 最大运行内存?2、过期删除策略3、内存淘汰策略 1、如何设置 Redis 最大运行内存? 在配置文件 redis.conf 中,可以通过参数 maxmemory 来设定最大运行内存,只有在 Redis 的运行内存达到了我们设置的最…

代码命名规范

日常编码中,代码的命名是个大的学问。能快速的看懂开源软件的代码结构和意图,也是一项必备的能力。那它们有什么规律呢? Java项目的代码结构,能够体现它的设计理念。Java采用长命名的方式来规范类的命名,能够自己表达…

消息称苹果Type-C口充电未设MFi限制,iOS17将更新Find My服务

根据国外科技媒体 iMore 报道,基于消息源 analyst941 透露的信息,苹果公司目前并未开发 MFi 限制。 根据推文信息内容,两款 iPhone 15 机型的最高充电功率为 20W,而 iPhone 15 Pro 机型的最高支持 27W 充电。 此前古尔曼表示苹…

Python趋势外推预测模型实验完整版

趋势外推预测模型实验完整版 实验目的 通过趋势外推预测模型(佩尔预测模型),掌握预测模型的建立和应用方法,了解趋势外推预测模型(佩尔预测模型)的基本原理 实验内容 趋势外推预测模型 实验步骤和过程…

第4章-虚拟机栈(多使用到jclasslib工具查看字节码)

虚拟机栈 简介 虚拟机栈的出现背景 由于跨平台性的设计,Java的指令都是根据栈来设计的。不同平台CPU架构不同,所以不能设计为基于寄存器的【如果设计成基于寄存器的,耦合度高,性能会有所提升,因为可以对具体的CPU架…

警惕免杀版Gh0st木马!

https://github.com/SecurityNo1/Gh0st2023 经过调查发现,这款开源的高度免杀版Gh0st木马目前正在大范围传播,据称可免杀多种主流杀软:开发者不仅制作了新颖的下载页面,还设法增加了搜索引擎的收录权重,吸引了许多免…

Python基础合集 练习17(类与对象)

class Dog: pass papiDog() print(papi) print(type(papi)) 构建方法 创建类过后可以定义一个特殊的方法。在python中构建方法是__init__(),init()必须包含一个self参数 class pig(): #def__init__(self) -> None: print(‘你好’) pipgpig() 属性和方法 cl…

JDBC详解(六):数据库事务(超详解)

JDBC详解(六):数据库事务(超详解) 前言一、数据库事务介绍二、JDBC事务处理三、事务的ACID属性1、数据库的并发问题2、四种隔离级别3、在MySql中设置隔离级别 前言 本博主将用CSDN记录软件开发求学之路上亲身所得与所…

MySQL基础——数据模型·数据库操作

♥️作者:小刘在C站 ♥️个人主页:小刘主页 ♥️每天分享云计算网络运维课堂笔记,努力不一定有收获,但一定会有收获加油!一起努力,共赴美好人生! ♥️树高千尺,落叶归根人生不易&…

开放原子训练营(第一季)铜锁探密:基于铜锁,在前端对登录密码进行加密,实现隐私数据保密性

本文将基于 铜锁(tongsuo)开源基础密码库实现前端对用户登录密码的加密,从而实现前端隐私数据的保密性。 首先,铜锁密码库是一个提供现代密码学算法和安全通信协议的开源基础密码库,在中国商用密码算法,例…

vcruntime140_1.dll无法继续执行代码怎么修复

vcruntime140_1.dll 是 Microsoft Visual C 程序集中的一个动态链接库文件。该文件提供了一些 C 运行时函数,这些函数是由许多应用程序使用的。当一个程序需要某个 DLL 文件时,它会首先在系统目录和程序所在目录中查找该 DLL 文件。如果系统或程序目录中…