我最大的收获
试想你在经历一场英语考试,还有两分钟就要交卷了,而你还没有开始写作文。此时,你会怎么做?
利用2分钟时间写出的第一段,还是只写关键句子,搭出文章的开头、过程、结尾?
后者更加明智。这也告诉我们结构完整的重要性。
在工作中,结构性意味着全局思考、闭环、方法。这本书给我最大的帮助,也是再次认识到了结构重要性。确定-分解-评估-决策。
数据分析的目的:通过数据分析,做出更好的决策。认清问题并解决问题。
影响分析结果的关键:一个人的心智模型。一个人的假设+观点=心智模型。
优秀的数据分析师帮助客户思考自己的问题,他们不会等着客户告诉他们该做什么。
数据分析,无法得出适用于所有情况的正确的策略。
数据分析的步骤:
数据分析的方法:观察、对比、实验
使用正确的心智模型进行分析:知道自己知道的,知道自己不知道的。
知道自己知道的=认知可以用数据验证
知道自己不知道的=哪些方面缺乏了解
案例一:保湿霜生产厂商想要提升销售。
分析步骤:确定-分解-评估-决策方法使用。
分析过程:确定需求是销售额提升到目标值。分解销售额来源于不同的供应商。评估发现供应商将货品卖给了男性客户用于剃须。决策开发男性市场。
我学到的:外部世界信息很多,方向错误会迷失在数据的海洋里。找方向的关键是心智模型。心智模型=假设+观点。
案例二:咖啡店的销售额下降,需要找到原因进行提升。
分析方法:观察法、实验法、对比法
分析步骤:确定(已知)--分解(分区域)--评估(实验法)--决策(根据实验结果)
分析过程:观察发现用户调研显示咖啡价值下降。拆解问题发现是XX区域用户对咖啡价值评价下降。制定降价和游说用户两种提升方法,采取同期实验法测试。对比实验数据形成解决方法。
我学到的:实验法的使用。选择同期实验方法而不是历史实验法、排除混杂因素、随机分组(将咖啡店按照区域分组,然后使用RUND公式实现随机分组)。
案例三:生产商可以生产橡皮鸭和橡皮鱼两种商品,各自有不同的利润,各生产多少可以利润最大化?
数据分类,可控因素与不可控因素
明确决策变量、可控因素
使用Solver公式,求出可控因素为多少时,得出利润最大值。可控因素:具体生产多少只。限制条件:橡胶的数量、产能的限制、用户的需求。
我学到的:业务影响因素分可控和不可控,不可控因素无法干预,但应该知道并提前采取措施。
案例四:网站改版,有三套首页设计,应该选择哪种?
数据以图形方式呈现,简单直观。
图形数据化工具:excel、illustrator、R程序、Edward Tufte的书
案例五:生产手机壳的公司,怎么去预测新手机发布时间?
分析方法:假设检验的证伪法
分析步骤:收集信息、大胆预测、用证伪法排除错误预测、诊断证据和假设之间的关系,找到最强假设。
我学到的:证伪法可以克服人们专注于错误答案而无视其他答案的天然倾向。
案例六:检测结果阳性,真正患病的概率是多少?
分析方法:贝叶斯规则
分析步骤:社会中患病人数1%=基础概率,患病检测结果阳性概率90%、未患病检测结果阳性10%、条件概率。基础概率和条件概率结合算出检测结果阳性,患病概率。
案例七:分析师们对事情发生概率的看法不一,如何判断?
分析方法:主观概率
分析步骤:请分析师对于事情发生的概率用%表示。散点图每个点表示一位分析师的看法,可以直接观察出倾向性。使用标准偏差STDEV公式(Standard Deviation),可以计算出大家对于事情的实际争议程度大小。
案例八:宣传不要乱扔垃圾的公司,如何说服市政府持续对公司的投入?
治理扔垃圾的效果没有直接的数据、收集数据成本高、难以量化、用户调研不具有代表性。
分析方法:启发法,快省树
我理解是列出市民扔垃圾意识、行为改变的过程,体现这个公司的业务模型的价值。
案例九:直方图
已知公司内历史加薪情况,包含性别、提出加薪幅度、年份与实际加薪之间的对应关系。
如何表示加薪结果的分布?直方图
表现形式的积累:
1、折线图,X轴月份,Y轴销售额,目标值是虚线,实际值是实线,直接看出完成程度。
2、步骤A到B,中间用箭头表示,箭头上方文字写明AB之间的关系。
3、步骤A到B1、B2到C1-4到D,总分总形式,树形流程图,凸显过程与结论。
4、散点图:X轴代表自变量=原因、Y轴代表应变量=结果、散点体现数据分布。虚线代表散点的均值或者目标值。
5、两个变量之间,是正向关系还是负向关系,两个变量中间用双箭头表示,中间一个圆圈写+或者-,表示正负关系。