利用熵权法进行数值评分计算——算法过程

news2024/9/21 16:45:11

1、概述

在软件系统中,研发人员常常遇上需要对系统内的某种行为/模型进行评分的情况。例如根据系统的各种漏洞情况对系统安全性进行评分、根据业务员最近操作系统的情况对业务员工作状态进行打分等等。显然研发人员了解一种或者几种标准评分算法是非常有利于开展研发工作的。

目前流行的评分方法有很多种,诸如wilson评分算法、模糊综合评价法、秩和比评分法等等,本文内容介绍一种容易理解和编码实现的评分算法——熵权评分法。熵权法是一种基于信息论的方法,其核心在于通过计算数据中的熵来评估数据的不确定性。在信息论中,熵是衡量信息不确定性的一个重要指标。当数据集合中的概率分布更加均匀时,信息熵较大,表示数据的不确定性较高;反之,当概率分布更加集中时,信息熵较小,表示数据的不确定性较低‌。

2、计算过程

本文通过一个给员工工作状态评分的示例,介绍熵权法在实际工作中的使用。这个示例中本文不但演示熵权法的每个计算步骤,还通过一个Excel表格对每个计算步骤进行演练。这个示例的背景是,某公司针对员工的工作状态进行打分,这些打分要素包括了“迟到次数”、“食物带入办公区次数”、“遗忘打卡次数”、“下班后电脑未关次数”、“上厕所次数”、“计件质检评分”。
在这里插入图片描述
需要说明的是,熵权法进行编码实现时可以支持对评价维度的扩展。也就是说评价维度的多少并不影响计算步骤,只对某些步骤的计算数值产生影响。

2.1、进行数据标准化

评分指标分为正向指标(正向因子)和负向指标(负向因子)。正向指标是指该数据分值越高,对最后的评分结果影响越正面,例如电视的尺寸数据在电视综合评分中就是一个正向数据——尺寸越大综合评分越高;负向指标是指该数据分值越高,对最后的评分结果影响越负面,例如在网络安全评分场景下,某台终端端口被扫描的次数越多,则终端安全性得分越低。因为评分数据有正向和负向之分,所以评分计算的第一步是将各个评分要素进行标准化处理。处理公式如下所示:

在这里插入图片描述
如上图所示,正向指标和负向指标的数据标准化公式是不一样的,正向指标进行数据标准化的公式可以解释为:从各个评分参与者的正向指标中,取得得分最高的值和得分最低的值,相减后最为分母;使用当前要进行标准化的值,减去得分最低的值,作为分子;以下为计算结果:

在这里插入图片描述

以上图中的迟到次数为例,由于迟到次数是一个负向指标,所以“社畜8197”的迟到次数标准化的计算方式就是:分母为最大得分3 减去 最小得分1;分子为最大得分3 减去 “社畜8197”的次数0,得到结果为1。

另外要说明的是,由于是取得各个分母是各个参与者中的最大值,减去各个参与者中的最小值,所以当最大值和最小值为一样时,分母就可能为0;所以在进行标准化计算时,可以通过分母分子同时+1的方式,修正这种极端情况下的问题。以下是Excel使用的计算公式,可以看到分子分母都加了“1”:

在这里插入图片描述

2.2、求每个数值在评分列中的数值占比(数值比例)

还是以“迟到次数”这个负向指标为例,上一步我们求得了每个参与者“迟到次数”的数据标准值,分别为0.75、0.75、0.5、0.75、0.25、1、1、1;下面我们求每一个数值的数值占比,公式为:
在这里插入图片描述
这个公式很好理解,分母就是所有评分参与者的“迟到次数”数据标准值的和;分子就是某个具体的某个“迟到次数”的标准值。所以求得的数据如下表所示:
在这里插入图片描述

使用Excel文件进行计算过程演练时,可以使用以下公式进行表达:

在这里插入图片描述

2.3、求数值占比与自身(数值占比)对数的积

上一步我们计算出了每一个评分参与者在“迟到次数”这个要素上的数值占比,分别是0.125、0.125、0.0833333、0.125…… 。接下来我们就每个数和自身对数(以2为底)的积。熵权法要求对数的原因在于对数函数能够有效地衡量数据的不确定性,并确保信息的可加性。

X i = P i L o g ( P i ) X_i = P_i Log(P_i) Xi=PiLog(Pi)

在这里插入图片描述

使用Excel文件进行计算过程演练时,可以使用以下公式进行表达:

在这里插入图片描述

这个数值将在下一步正式进行熵值计算时,起到关键作用。

2.4、计算每个评分要素的熵值‌

现在我们开始正式计算每个参与评分的要素的熵值。在本示例中,这些要素分别就是“迟到次数”、“食物带入办公区次数”、“遗忘打卡次数”、“未关电脑次数”等等。熵值的计算公式如下:

在这里插入图片描述

这个公式分为两部分进行理解,其中第一部分就是K值的定义:

K = 1 / L o g ( N ) K = 1 / Log(N) K=1/Log(N)

其中N为参与评分的参与者数量,这个示例中N的值就是8(“牛马3197”、“圣斗士打工者”、“天地会总舵主”、“太上老君丹童”……)。这个公式的第二部分就是“西格玛符号”(∑)描述的求和部分,刚好是对我们2.3小节得到的每个栏目的值进行的求和。所以通过以上公式,我们能得到的计算结果如下图所示:

在这里插入图片描述

同样使用Excel文件进行计算过程演练,可以使用以下公式进行表达:

在这里插入图片描述

其中公式中“B37到B44”的值,就是2.3小节中每一个“迟到次数”通过求对数得到的值。

2.5、计算每个评分要素的权重值

现在我们有了每个评分要素的熵值,基于熵值我们可以求得每个平分要素的权重值——实际上这里的权重值可以理解为每个评分要素的熵值在整个熵值体系中的占比,其公式为:
在这里插入图片描述
其中分母为所有要素熵值的累加(d代表每一个要素的熵值),分子为当前要素的熵值。计算过程的演练表格如下所示:

在这里插入图片描述

2.6、基于权重值转换为10分制/100分制/或者N分制

有了每个评分要素的权重值(基于熵值得出),以及每个评分栏目标准化值(本文2.1小节所描述),就可以进行每个参与者的评分了——这个评分不能是10分制或者100分制或者1000分制的,而是一个得分基数。最后操作者可以根据这个得分基数,转换成自己所需的10分制或者100分制得分——最终用户可以看懂的得分。

得分基数的计算公式为:

在这里插入图片描述
公式是一个西格玛(∑)求和公式,其中每一个从1到m的w值,代表每一个评分要素的值;每一个x的值,代表每一个平分栏目。如果不好理解,可以看下图的解释

在这里插入图片描述

可以看到每个评分参与者的得分分别是:“牛马3197”——0.847662689、“圣斗士打工者”——0.736605139、“天地会总舵主”——0.861913661、“太上老君丹童”——0.763879745、“太乙真人弟子”——0.765103166、“社畜8197”——0.805163424、“超人完整体”——0.776911214、“标准满分参考”——1;

但是最终用户是看不懂这些得分基数的,所以需要一些形式上的计算过程,将基准评分转换为10分制、100分制或者某种最终用户能看懂的分数,如下所示:

在这里插入图片描述
E x c e l 栏目公式 = 100 / R O U N D U P ( M A X ( I 56 : I 62 ) , 3 ) ∗ I 56 Excel栏目公式=100/ROUNDUP(MAX(I56:I62),3)*I56 Excel栏目公式=100/ROUNDUP(MAX(I56:I62),3)I56

以上评分结果,这只是一个形式主义的计算过程,目的是让最终使用者根据日常习惯的计分方式对评分结果进行理解。后文我们将介绍熵权法的编码实现过程。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2119019.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

mp4转文字怎么快速转换?5个软件教你快速进行视频提取文字

mp4转文字怎么快速转换?5个软件教你快速进行视频提取文字 将MP4视频转换为文字是一项常见的需求,尤其是在需要将视频中的对话、演讲或字幕转为文本时。通过使用AI转录软件,你可以快速将视频中的音频内容提取并转换为文字。以下介绍5款可以帮…

一个数组向左移动i位(学会分析问题,找出规律,不要小看任何一个小程序;小程序都是实现大的功能的基础--体现问题分解的思想)

学会分析问题,找出规律; 不要小看任何一个小程序,小程序都是实现大的功能的基础--体现问题分解的思想) 思想火花--好算法是反复努力和重新修正的结果 解法1:先将数组中的前i个元素存放在一个临时数组中,再将余下的n一i个元素左…

黑马点评15——分布式缓存-Redis分片集群

文章目录 搭建分片集群散列插槽集群伸缩故障转移RedisTemplate访问分片集群 搭建分片集群 参考我前面的文章:单机部署Redis集群 散列插槽 集群伸缩 添加新的节点后要重新分配插槽, 故障转移 这是自动的故障转移,但有时候需要手动的故障转移——比如更…

Hfinger:一款针对恶意软件HTTP请求的指纹识别工具

关于Hfinger Hfinger是一款功能强大的HTTP请求指纹识别工具,该工具使用纯Python开发,基于Tshark实现其功能,可以帮助广大研究人员对恶意软件的 HTTP 请求进行指纹识别。 该工具的主要目标是提供恶意软件请求的唯一表示(指纹&…

“CSS 定位”如何工作?(补充)——WEB开发系列34

CSS定位是一个非常重要的布局工具,它允许我们精确地控制元素的位置,从而创建复杂的布局效果。定位允许你从正常的文档流布局中取出元素,并使它们具有不同的行为,例如放在另一个元素的上面,或者始终保持在浏览器视窗内的…

Java代码审计篇 | ofcms系统审计思路讲解 - 篇2 | SQL注入漏洞审计

文章目录 Java代码审计篇 | ofcms系统审计思路讲解 - 篇2 | SQL注入漏洞审计1. 前言2. SQL注入代码审计【有1处】1)全局搜索Statement关键字,发现有几处,不过大多都是preparStatement预编译方式执行sql语句。2)点进第一个看看3&am…

matlab数据批量保存为excel,文件名,行和列的名称设置

Excel文件内数据保存结果如下: Excel文件保存结果如下: 代码如下: clear;clc; for jjjj1:10 %这个可以改 jname(jjjj-1)*10; %文件名中变数 这是EXCEL文件名字的一部分 根据自己需要改 jkkkk_num2str(jname); for …

物联网之Arduino开发环境的下载与安装、ESP32开发环境的下载与安装、常见环境配置问题的解决办法、COM端口不可用的解决方法

MENU 前言下载和安装Arduino安装ESP32开发环境常见问题JSON下载失败和下载速度慢配置解释器没有发现端口检测到端口,但是有警告图标,端口无法使用 前言 想玩开发板必须得写代码,要不然Arduino不知道怎么运行,Arduino的开发语言是C…

碳产品出口业务管理难?外贸软件ERP全流程管控降本增效

随着全球环保意识的增强和工业生产的需要,对碳产品的需求持续增长。特别是在新能源、环保、航空航天等高科技领域,碳产品的需求量更大。中国作为全球最大的碳产品生产国之一,拥有完整的产业链和丰富的生产经验,具备明显的产业优势…

【C++11 ——— 右值引用和移动语义】

C11 ——— 右值引用和移动语义 右值引用和移动语义左值引用和右值引用左值引用与右值引用比较右值引用使用场景和意义左值引用的使用场景:左值引用的短板:左值引用中编译器的优化右值引用和移动语义右值引用引用左值右值引用的其他使用场景 完美转发万能…

苹果系统安装的QT程序无法显示窗口问题的解决办法

1、问题的提出 苹果系统是可以安装QT(包含QT带来的集成开发环境QTCreator)的。但是,QT安装完毕跑运行测试程序的时候,却会发现窗口无法显示。 右下角的应用窗口程序无法打开。 2、问题的解决 其实原因就在警告之中: …

为单身人士定制的幸福计划:相亲交友系统

在忙碌的都市生活中,单身人士往往因为工作繁忙、社交圈有限等原因,难以遇到合适的伴侣。相亲交友系统,作为现代科技与人际关系结合的产物,为单身人士提供了一个全新的解决方案。本文将从客户角度出发,探讨相亲交友系统…

【计算机网络】UDP TCP介绍

UDP & TCP介绍 UDP报文格式报文内容介绍端口号报文长度校验和载荷 TCP报文格式初步了解TCP机制确认应答超时重传连接管理滑动窗口流量控制拥塞控制紧急传输数据推送延时应答捎带应答面向字节流异常处理心跳机制 UDP 和 TCP 的区别 UDP 报文格式 对于网络协议, 本质上就是…

软件工程技术专业软件开发综合实训室解决方案

一、行业背景与前景分析 1.1 软件工程技术专业就业前景 近年来,中国的软件行业取得了显著的成就,即便在全球经济受到新冠疫情冲击的情况下,仍保持了强劲的增长势头。据工业和信息化部发布的数据,2021年我国软件和信息技术服务业…

mysqldump 迁移至MySQL到Oceanbase-CE V4 和旁路导入语法的学习

闲着没事干,测试着玩。 一.数据库环境 mysql: oceanbase: mysql下的表: 二、mysqldump迁移数据到OceanBase # 通过mysqldump导出数据 mysqldump -h 192.168.80.16 -uroot -P3306 -p --databases test > toob.sql #传输脚本到o…

DDR3 SDRAM操作流程

天空灰暗到一定程度,星晨就会熠熠生辉。 ----一起加油 DDR3 SDRAM的相关操作主要包括上电(Power on)、复位(Reset procedure)、初始化(Initialization)、ZQ对齐(ZQ calibration)、模式寄存器配置(MRS)、自刷新(Selfrefresh)、刷新(Refreshing)、激活(Activating)、读…

线上VR虚拟展厅里可以展示3D模型么?

虚拟展厅里可以展示3D模型。 虚拟展厅利用数字技术和三维建模技术创建一个虚拟的展览环境,使得参观者可以通过计算机、智能手机、平板电脑等设备远程参观展览。在这个过程中,3D模型作为虚拟展厅的重要组成部分,扮演着至关重要的角色。 在虚…

Google AI 概述——喜欢的三点和不喜欢的两点

如果你在谷歌上搜索某些内容,你可能注意到谷歌AI概览已经回归。不过,对此功能的实用性我仍持观望态度。 对于那些还没有使用过的人来说,谷歌AI概览基本上是从各个网站收集信息并将其整合在搜索结果页面的顶部。理论上,这应该使用…

opencv将灰度图转为彩色图片

文章目录 背景灰度图优势opencv读取灰度图彩色转灰度算法需求 方法测试代码 背景 在图像处理中通常需要将图片转为灰度图 灰度图,也称为灰度图像或黑白图像,是一种只包含亮度信息而不包含颜色信息的图像。在灰度图中,每个像素的亮度级别通常…

【STL中容器汇总】map、list、vector等详解

容器学习分享 1、STL简介1.1、STL六大组件 2、vector容器2.1、vector 基本操作2.2、vector容器示例2.3、vector容器存放自定义数据类型示例2.3、vector嵌套vector示例 3、list 容器3.1使用示例3.2、list容器基本函数 4、map容器4.1、map函数原型4.2、map函数示例 1、STL简介 ST…