2023-01-29 学习笔记:常见28种数据分析模型
知乎上的一篇文章,虽然之前对深度学习相关模型有所了解,但通过这篇文章了解了更多模型的应用场景,同时也知道了日常一共有多少种实用模型。
Excel/Python/sql/PowerBI/Pyecharts这些只是工具,一些经典的数据分析模型和应用场景值得了解学习;
模型是指对于某个问题或客观事物、规律进行抽象后的一种形式化表达方法;
第一类,基于理论逻辑的弱数据商业模型
这一类模型来源于市场营销、战略管理领域,是成熟商业公司、咨询公司总结提炼的经典模型。面向对象往往是总裁、CEO,他们对此类模型的认知更加深刻,也只有他们才能推动这类模型结论的实施。对于数据分析师来说,在你的分析过程中可以使用,但是往往需要行业专家的指点,因为这些模型是弱数据支撑型,你没有行业和专业认知得出的结论难具说服力。
PEST模型
PEST模型或者PESTEL模型是从宏观角度出发分析企业的主要外部环境因素;
- Politics 政治:台湾统一 中美关系 国家制度 行政策略
- Economics 经济:经济周期 利率和汇率 财政和货币政策
- Social 社会:人口结构 消费观念 生活方式 传统 潮流 风尚
- Technological 技术:5G 元宇宙 区块链 新能源开发
- Enviroment 环境:气候 水资源 能源 污染
- Law 法律:行业法规
难点:缺乏客观性;
波特五力模型
用于行业战略制定的竞争力分析模型
- 同行业内现有竞争者的竞争能力:技术水平 成本控制
- 潜在竞争者进入的能力:新进入者的行业颠覆技术
- 替代品的替代能力
- 供应商的讨价还价能力
- 消费者的需求能力
难点:行业信息并非是透明的,同业之间除了竞争还有合作;
SPACE矩阵
SPACE矩阵有四个象限分别表示企业采取的进攻、保守、防御和竞争四种战略模式
- 纵轴:财务态势(financial position,FP)+ 环境稳定性态势(stability position,SP)
- 横轴:产业态势(industry position,IP) + 竞争优势(competitive position,CP)
其中,财务态势和竞争优势是内部因素,环境稳定性态势和产业态势是外部因素;这四个因素对于确定企业总体战略地位起决定性作用;
- 第一象限 进取:财务态势+、产品实力+;
- 第二象限 保守:财务态势+、竞争优势-;
- 第三象限 防御:竞争优势-、环境稳定-;
- 第四象限 竞争:环境稳定-、产品实力+;
SCP分析模型
SCP 框架的基本涵义是,市场结构决定企业在市场中的行为,而企业行为又决定市场运行在各个方面的经济绩效。应用在行业或者企业受到表面冲击时,分析可能的战略调整及行为变化;
- 市场结构 Structure:行业竞争 产品需求 细分市场 营销策略的变化
- 企业行为 Conduct:业务调整(整合 扩张 收缩)营运和管理的变革
- 经营绩效 Performance:利润 成本 市场份额的变化趋势
战略钟模型
战略钟模型将产品/服务价格和产品/服务附加值综合在一起考虑,企业实际上沿着以下8种途径中的一种来完成企业经营行为。其中一些的路线可能是成功的路线,而另外一些则可能导致企业的失败。
- x轴表示价格 从低到高
- y轴表示附加值 从低到高,原点为价格和附加值的最低点
- 价格和附加值 中间 的位置划分8个区域,其中设定在第7/8两个区域的战略可能导致失败
- 直观看就是 价格高、附加值低的策略,容易失败;
三四矩阵
在一个稳定的竞争市场中,参与市场竞争的参与者一般分为三类,领先者、参与者、生存者。优胜者一般是指市场占有率在15%以上,可以对市场变化产生重大影响的企业,如在价格、产量等方面;参与者一般是指市场占有率介于5%~15%之间的企业,这些企业虽然不能对市场产生重大的影响,但是它们是市场竞争的有效参与者;生存者一般是局部细分市场填补者,这些企业的市场份额都非常低,通常小于5%。这个模型用于分析一个成熟市场中企业的竞争地位。
以上6个模型都是战略管理类模型,应用对象和使用对象都是特定的,使用要求较高。
4P/4C理论模型
4P,即Product产品、Price价格、Place地点、Promotion促销,是站在企业立场的营销理论模型;4C模型则是站在客户立场的 Customer Value价值、Cost成本、Convenience便利、Communication沟通;
波士顿矩阵
决定产品结构的基本因素有两个:市场引力与企业实力;
- 反应市场引力的综合指标是
销售增长率
,这是决定企业产品结构是否合理的外在因素; - 企业实力包括市场占有率,技术、设备、资金利用能力等,其中市场占有率是决定产品结构的内在因素;
销售增长率和市场占有率相互影响、互为条件:
- 市场引力大,市场占有高,企业实力强;如果市场占有率不高,则说明企业尚无足够实力;
- 企业实力强,市场引力小,预示该产品市场前景不加;
最终出现四种不同性质的产品类型,对应不同的发展前景:
- x轴 从低到高,表示 相对市场占有率
- y轴 从低到高,表示 销售增长率,原点为最低点;
- 在两个因素 中间 的位置划分4个区域
- 1.明星产品(成长期):市场占有率高且销售增长率高;
- 2.问题产品(导入期):市场占有率低且销售增长率高;
- 3.瘦狗产品(导入期或衰退期):市场占有率低且销售增长率低;
- 4.金牛产品(衰退期):市场占有率高且销售增长率低;
GE行业吸引力矩阵
对波士顿矩阵的改进,应用于投资组合、业务组合的企业经营模型,可以更细化的说明产品的行业现状;
结构是一个九宫格:
行业竞争能力\市场吸引力 | 高 | 中 | 低 |
---|---|---|---|
强 | 扩张 | 扩张 | 维持 |
中 | 扩张 | 维持 | 退出 |
弱 | 维持 | 退出 | 退出 |
KANO模型
该模型是对用户需求分类 和 优先排序的有用工具;
- 用户满意度 与 产品性能 间的非线性关系;以对客户的不同需求进行区分处理,帮助企业找到提高顾客满意度的切入点;
- x轴 满意度 从低到高
- y轴 产品性能 从低到高,原点为 两个属性中间值;
- 五类:
- 基本型属性(必备):红色
- 期望型属性(意愿):绿色
- 兴奋型属性(魅力):黄色
- 无差异型属性:蓝色
- 反向型属性(逆向):褐色
缺点是:需求是因人而异的,因文化差异不同而不同,而且会随着时间变化;
上面4个模型,都是 市场、营销模型;
下面几个模型是数据分析师常用的工具模型(更像一种方法)
SWOT分析法
根据企业自身条件在既定范围内进行分析:
- 内部优势 S(strengths)
- 内部劣势 W(weaknesses)
- 外部机会 O(opportunities)
- 外部威胁 T(threats)
按照矩阵排列,将各种因素匹配起来加以分析,进而得出结论;
逻辑树分析法
把一个已知问题当成树干,相关问题或者子任务加做树枝,大的树枝还可以有自己的小树枝;找出问题的所有相关联项目;逻辑树主要是帮助你理清思路,高效思考;
- 问题树-子问题分支
- 假设树-支持/否定假设分支
- 是否树-判断分支
5W2H分析法
又叫七问分析法:
- what
- why
- who
- when
- where
- how
- how much
麦肯锡七步法
解决突发问题提供思路
- 1.界定问题:找准、描述清楚问题
- 2.分解问题:相互独立、完全穷尽
- 3.优先排序:根据重要程度排序
- 4.工作计划:将思维的过程转变为可行动的计划
- 5.关键分析:确定关键议题
- 6.汇总归纳:建立有结构的结论
- 7.沟通展示:整理过程及结果,以可接受的方式展示
以上4个模型是思维模型;
消费者行为模型
AIDMA法则:消费者看到广告,知道进行消费购买行为的心理引导过程;
评估指标:
- 展现量 营销策略及目的评估
- 到达率 传播效果评估
- 注意率 传播效果评估
- 好感率 心理效果评估
- 记忆率 心理效果评估
- 行动率 销售效果评估
AISAS法则:移动互联网时代,需要更加精准有效地获取用户消费者的注意;可以通过用户画像实现兴趣的精细化管理,进而达成用户搜索、行动、互动的分享扩散;
借助移动互联网,新媒体也成为了整合营销传播中的又一主力媒体渠道;
评估指标
- 广告印象 品牌认知 营销策略及目的评估
- 广告点击率 售前心理效果评估
- 品牌关键/相关词搜索次数/指数 售前行为效果评估
- 访问量(下载、注册、咨询、下单转化率) 销售效果评估
- 互动内容(话题发布/回复,产品评论/转发) 售后行为效果评估
SICAS法则:一套开放式的营销效果评估模型;通过互联网产品中的埋点,感知消费者行为动态来敏捷指导、评估销售决策,精细化销售效果评估数据精确考核ROI(投资回报率);品牌商家不仅要关注消费者的分享行为,还要参与、引导其行为;
评估指标
-
营销策略及目的评估
- 感知量、感知率、感知效率、到达率、被感知率、回馈率; 售前心里效果评估
- 互动成本效率指标、互动内容特性指标、互动品牌服务指标; 售前行为效果评估
- Social Ad App LBS EC CRM 系统分析; 售前行为效果评估
- 电商率、分布率、接通率、个性率、移动率、社会化率; 销售效果评估
- 分享内部指标、分享互动指标、分享对话指标、分享转化指标; 售后行为效果评估
第二类,基于指标计算组合的数据商业模型
用户增长模型
AARRR模型:即用户增长模型,又叫海盗模型、漏斗模型;
- A获取用户
- A激活活跃
- A用户留存
- R转化变现
- R传播分享
AIPL模型:阿里所用的电商分析模型,是AIDMA营销模型的变种;
- A 认知Awareness 参与了解品牌的人,广告曝光;
- I 兴趣Interest 对品牌感兴趣的人,浏览收藏
- P 购买Purchase 购买品牌商品的人,购买;
- L 忠实Loyalty 品牌忠诚人,包括复购、正面评论、分享的人;
用户价值模型
RFM模型,衡量用户价值和创利能力,该模型通过一个客户的近期购买行为R、购买的总体频率F和花了多少钱M三项指标来描述该客户的价值;
三个指标细分5份的话,就可以细分出125类用户,简单也可以只做2分,得到8组用户(编号RFM,1表示高,0表示低)
- 111 重要价值客户:消费时间近,频次高、金额贵;
- 011 重要保持客户:消费时间元,但频次高、金额贵;
- 101 重要发展客户:忠诚度不高的潜力用户;
- 001 重要挽留客户:将要流式或已流失用户,给予挽留措施;
- 110 价值价值客户
- 010 价值保持客户
- 100 价值发展客户
- 000 价值挽留客户
帕累托模型
著名的二八定律,也叫帕累托法则,衍生出ABC分类法,现在主要用于产品分析、库存管理、质量管理;
如20%产品的销量占总销量的80%;
第三类,基于运筹/统计的强数据数学模型
ARIMA模型、GARCH模型
时间序列分析,是根据时间序列测量数据,通过曲线拟合和参数估计来建立数学模型的理论和方法;常用于国民宏观经济控制、市场潜力预测等方面;
ARIMA模型,是实际案例中最常用的模型;
线性规划模型
目标函数和约束条件都是待求变量的线性函数、线性等式或线性不等式的数学规划问题;应用于经济分析、经营管理中,为合理利用有限的人力、物力、财力等资源做出最优决策;
建立线性规划模型的三步步骤:
- 1.根据影响所要达到目的的因素找到决策变量;
- 2.由决策变量和所要达到目的之间的函数关系确定目标函数;
- 3.由决策变量所受的限制条件确定决策变量所要满足的约束条件;
第四类,基于机器学习的强数据算法模型
线性回归模型(Linear Regression,LR)
线性回归利用数理统计中的回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法;
表达形式 y = w’x + e
- e为误差,服从均值为0的正太分布
- 通过最小二乘法或者梯度下降算法求解出系数矩阵,从而得到线性回归方程来对新样本进行预测;
- 常见的如一元线性回归模型;
线性回归模型 和 线性规划模型 都是在求解线性方程表达式,只不过应用对象不同、求解目的不同;
逻辑回归(Logistic Regression, LR)模型
逻辑回归模型是在线性回归的基础上加了一个非线性激活函数(Sigmoid激活函数)
sigmoid函数:
- 对数几率函数(应用于对数几率回归任务)是sigmoid函数的典型代表;
- 可以吧较大范围内变化的输入值积压到0~1输出值范围内,因而也被称为“挤压函数(squashing function)”;
KNN模型(K个最近邻nearest neighbor)
这个模型通过点与点之间距离远近来区分;
参考《机器学习》10.1节;
贝叶斯模型(Bayes)
参考《机器学习》第7章;
参考文章的这张图借用在这里
SVM模型(支持向量机,support vector machine)
通过计算离分割线最近的点,使得到分割线的距离之和最小的点,称为支持向量;
参考《机器学习》第6章;
通过与前面几个分类模型相比,SVM不仅找出了分割线(准确来说是个平面),还力求找到最佳的那一条,因此它在深度学习研究大火之前是最佳数据挖掘模型之一;
决策树模型(Decision tree, DT)
决策树模型的使用原理和贝叶斯定理很像,但他使用的不是条件概率而是条件经验熵,一步步筛选哪些条件最有效;
参考《机器学习》第4章;
集成学习模型(Ensemble Learning, EL)
集成学习模型是一种策略,将多个单模型放在一起进行分类预测;(注意这和深度学习中的模型融合不是一个);
神经网络模型(Neural Network,NN)
参考《机器学习》第5章;
逻辑回归模型可看做是单层神经网络。
笔记做完了,撒花!