1、概述
CRITIC客观评价法是一种基于指标的对比强度和指标之间的冲突性来确定指标客观权数的方法。 该方法适用于判断数据稳定性,并且适合分析指标或因素之间有着一定的关联的数据。
CRITIC方法的基本原理包括两个主要概念:对比强度和指标之间的冲突性。对比强度表示同一指标各个评价方案取值差距的大小,通常以标准差的形式来表现。标准差越大,说明各方案的取值差距越大。指标之间的冲突性则基于指标之间的相关性,如果两个指标之间具有较强的正相关,说明两个指标冲突性较低。CRITIC方法的步骤通常包括以下几个步骤:
- 数据预处理:确保数据的完整性和一致性。
- 计算对比强度:使用标准差来衡量每个指标的对比强度。
- 计算冲突性:通过计算指标之间的相关系数来衡量冲突性。
- 信息承载量和占比:将对比强度和冲突性相结合,进行归一化处理,得到最终的权重
本文通过实例 + Excel公式演算的方式,详细介绍CRITIC客观权重赋权法的计算过程,以及每一步需要重点注意的计算细节。这个实例是对多家银行的营业效果进行评分。示例中的评分维度包括资产收益、费用利润、逾期贷款率、资产使用率和自有资本率。如下图所示:
下面我们就正式进入计算过程的详细讲解。
2、计算过程
2.1、进行数据标准化
熟悉各种评分算法的读者应该知道,众多的评分算法基本上都是将数据标准化作为评分计算的第一步,CRITIC评分算法的计算过程也不例外。进行数据标准化的原因本文就不再赘述了,之前两篇文章(《利用熵权法进行数值评分计算——算法过程》、《利用模糊综合评价法进行数值评分计算——算法过程》)已经多次提到,不清楚的读者可以联机链接跳转查看。
以下是数据标准化的公式:
本示例中,第三项指标为负向指标(当然是贷款逾期率越高,评价值越低),其它指标均是正向指标,所以该实例中数值标准化后的结果,如下图所示:
需要注意的时,在前面两篇介绍熵权法和模糊评价法的文章中,我们提到可以在计算时试图通过分母和分子同时+1的方式,避免出现分母为零的情况。但是在本示例中,由于参加评分的各评分项分值都非常小(都是零点几的小数),如果这时再采用前面的方式,那么得到的标准化值误差将显著增大。
2.2、计算对比强度(波动性)
以上公式中,M表示为参与评分的数据条数(也就是评分的各个参与者数量),在本示例中有4个参与者所以M的值就是4,。Xij表示某个参与者在某评分项上的具体得分,例如银行A在“负债率”上的具体得分。 而带有上横杠的X(不好意思不知道怎么输入),表示该具体评分项的平均值,例如“负债率”评分项的平均值。
所以如果用Excel进行对比强度的计算演练,那么Excel的计算效果可以如下图所示:
Excel中的POWER函数,可以对一个数进行求幂或者开方。
2.3、基于指标相关性计算指标冲突性
指标的相关性是指两组数据的关联性,在实际生活中我们经常会发现两组数据具有一定的关联性,相关性的取值一般为[-1 , 1]。如果当A组数据下降,B组数据却上升,那么就认为这两组数具有负相关性(相关性取值趋近-1);如果A组数据上升,B组数据也上升,那么就认为两组数具有正相关性(相关性取值趋近1)。在统计领域中,两组数不具有任何相关性的情况几乎不存在,研究样本越多,对于两组数的相关性研究结果越精确。
通过以上公式,我们可以基于两组数的相关性,得到某一组指标与其它各组指标的冲突性。我们来分析以上公式。其中Rij就是指第i项指标与第j项的相关性。例如“资产收益”指标和“贷款逾期率”两项指标的相关性。m代表参与评分计算的评分项数量。所以整个计算冲入性的公式可以解释为:
1减去第j项指标和第1项指标的相关性 加上 1减去第j项指标和第2项指标的相关性 一直加加到 1减去第j项指标和第M项指标的相关性,就是第j项指标在该份样本中的冲突值。用Excel进行计算过程演练,可以如下图所示:
Excel中的CORREL函数,可以计算两组数的相关性。
2.4、计算信息承载量
这个步骤没有过多讲解的意义,就是用之前得到的某个评分项的比强度 乘以 这个评分项的冲突性,就是这个评分项的信息承载量。Excel的计算演练效果,如下图所示:
有了每个评分项的数据承载量,我们就可以计算每个评分项的信息占比情况。也是最简单的占比计算公式,如下图所示:
某个参与者,在某个评分项的信息占比,等于这个参与者在这个评分项的得分 除以 这个评分项的数据总和。得到的Excel演练结果如下图所示:
2.5、基于信息占比基准得分和百分制得分
通过2.4小节所介绍的计算过程,CRITIC客观权重赋权法最核心的计算过程介绍完毕,这一步就是计算每个参与者的基准得分,并将基准得分翻译成使用者能够看懂的10分制/100分制等结果。
首先通过以下公式,进行基准得分的计算:
公式中的W,表示某一评分项,基于信息承载量计算得到的信息占比值,X表示第i个参与者的在某一评分项的原始结果(当然是进行过数值标准化后的原始结果,否则无法区分正指标还是负指标);
所以第i个评分参与者的评分结果,就是这个参与者第J项指标的信息占比值 乘以 第J项指标的原始结果,再加上这个参与者第J+1项指标的信息占比值 乘以 第J+1项指标的原始结果……,直到最后一个指标。
最后转换为100分制的计算方式,就不再进行赘述了,前面多篇文章都已经提到这个问题。