一、基本原理
在信息论中,熵是对不确定性的一种度量。不确定性越大,熵就越大,包含的信息量越大;不确定性越小,熵就越小,包含的信息量就越小。
根据熵的特性,可以通过计算熵值来判断一个事件的随机性及无序程度,也可以用熵值来判断某个指标的离散程度,指标的离散程度越大,该指标对综合评价的影响(权重)越大。
样本数据在某指标下取值都相等,则该指标对总体评价的影响(贡献)为0,故其权重也应该为0.
熵权法是一种客观赋权法,因为它仅依赖于数据本身的离散性。
二、熵权法步骤
1.对n个样本,m个指标,则xij为第i个样本的第j个指标的数值(i=1,2...,n;j=1,2,...,m)
2. 指标的归一化处理:异质指标同质化
由于各项指标的计量单位并不统一,因此在用它们计算综合指标前,先要进行标准化处理,即把指标的绝对值转化为相对值,从而解决各项不同质指标值的同质化问题。
另外,正向指标和负向指标数值代表的含义不同(正向指标数值越高越好,负向指标数值越低越好),因此,对于正向负向指标需要采用不同的算法进行数据标准化处理:
这里就是之前说的极差变换法
例:某物流公司为了提高自身的服务水平,对拥有的11个部门进行了考核,考核标准包括9项,并对服务水平较好的部门进行奖励。下表是对各个部门指标考核后的评分结果。
1. 熵权法进行赋权
1)数据标准化
根据原始评分表,对数据进行标准化后可以得到下列数据标准化表
2)计算Pij
3)计算各指标熵值
4)计算各指标权重
熵值 | 0.95 | 0.87 | 0.84 | 0.96 | 0.94 | 0.96 | 0.96 | 0.96 | 0.96 | |
冗余度 | 0.05 | 0.13 | 0.16 | 0.04 | 0.06 | 0.04 | 0.04 | 0.04 | 0.04 | 0.6 |
权重 | 0.08 | 0.22 | 0.27 | 0.07 | 0.10 | 0.07 | 0.07 | 0.07 | 0.07 | 1.00 |
最后计算各部门得分
X1 | X2 | X3 | X4 | X5 | X6 | X7 | X8 | X9 | 得分 | |
A | 1 | 0 | 1 | 0 | 0.5 | 1 | 1 | 1 | 1 | 0.69 |
B | 1 | 1 | 0 | 1 | 0.5 | 1 | 1 | 1 | 1 | 0.71 |
C | 0 | 1 | 0.33 | 1 | 0.5 | 1 | 1 | 1 | 1 | 0.71 |
D | 1 | 1 | 0 | 1 | 0.5 | 1 | 0.87 | 1 | 1 | 0.70 |
E | 1 | 0 | 1 | 1 | 1 | 0 | 1 | 1 | 0 | 0.67 |
F | 1 | 1 | 1 | 1 | 0.5 | 1 | 1 | 0 | 1 | 0.91 |
G | 1 | 1 | 0 | 1 | 0.5 | 1 | 0 | 1 | 1 | 0.64 |
H | 0.5 | 1 | 0.33 | 1 | 1 | 1 | 1 | 1 | 1 | 0.81 |
I | 1 | 1 | 0.67 | 1 | 0 | 1 | 1 | 1 | 1 | 0.83 |
J | 1 | 0 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 0.81 |
K | 1 | 1 | 0.67 | 1 | 0.5 | 1 | 1 | 1 | 1 | 0.89 |
权重 | 0.08 | 0.22 | 0.27 | 0.07 | 0.11 | 0.07 | 0.07 | 0.07 | 0.07 | 8.35 |