【数据分析】嫡权法EWM

news2024/11/20 9:31:13

总结:基于熵值信息来计算出权重,数据具有客观性。

目录

简介

计算步骤

案例


简介

熵值法原理
熵值法的基本思路是根据指标变异性的大小来确定客观权重信息熵:信息量的期望。可以理解成不确定性的大小,不确定性越大,信息熵也就越大

若某个指标的信息熵越小,表明指标值得变异程度越大,提供的信息量越多,在综合评价中所能起到的作用也越大,其权重也就越大。

1、背景说明

熵值法(熵权法)是一种研究指标权重的研究方法,比如有5个指标,分别为指标1到指标5,并且有很多样本(比如100个样本),即100行*5列数据,此时研究该5个指标的权重分别是多少。

但从上述可以看到,数据格式上为100个样本即100行数据。如果说当前是面板数据即比如100家公司分别5年,那么就是100*5=500行数据,依旧还是5个指标,即500行*5列数据。此时希望利用熵值法研究该5个指标的权重情况,应该如何处理呢?

2、数据格式

首先从数据格式上,应该类似下图,即有2列数据分别标识公司ID和年份,比如当前为100家公司分别5年,那么就有100*5行的数据。

3、面板数据如何进行熵值法?

熵值法的原理是利用‘熵’来计算权重,‘熵’用来标识信息的不确定性情况,熵越大意味着不确定性越大->信息量越小->权重越小,这是熵值法的原理。

从原理角度上看:

  • 面板数据要想计算出5个指标的权重,也是利用‘熵’来计算,也即说明只要能计算出数据的‘熵’值,即可得到权重。而‘熵值’的计算上,并不会考虑是否为面板数据,因而从原理角度,面板数据与普通数据完全一致,直接放入分析即可。

从分析角度上看:

  • 针对面板数据,通常有两种做法,分别是做1次,分别重复多次再汇总,如下表格所示:

分析做法说明
一次法完全不考虑是否面板数据,直接与普通数据一样做一次分析即可
多次法比如5年数据,先筛选出第1次的数据做1次,接着重复做另外4次,分别得到5次权重,然后将权重求平均值。

 一次法,此种做法非常常见,即完全不考虑是否为面板数据,在原理上并没有任何问题。因为熵值法计算权重的原理是利用‘熵’值信息,相当于把100家公司5年即500个数字当成一个序列,计算该序列的‘熵’用于判断该500个数字的不确定性情况。最终得到权重。

另外也可分别筛选出某年数据后,基于100家公司即100个数字看成1个序列,计算该100个数字的不确定性情况,并且最终得到权重,此法称作多次法。

计算步骤

(1) 数据标准化。由于一般会使用到多个评估指标,而这些指标的量纲和单位多数情况下都不相同,因此需要对这些指标数据进行归一化处理,以消除因量纲不同而对评价结果造成的影响,从而确保评价结果的客观性与公正性。单条标准化数据正向和负向指标公式分别如下所示:

对于正向指标希望值越大越好,负向指标希望越小越好,需保证标准化后都是正数

(2) 求各指标在各方案下的比值。计算第j项指标的第i个样本所占的比重,并将其看作信息熵计算中用到的概率,如下公式所示:

(3)求各指标的信息熵。 计算第 j 项指标的熵值ej ,如下公式所示:

(4) 计算各指标客观权重值wj ,如下公式所示:

案例

评价该年级的11个班级的整体情况,如下所示,11个班级有9个指标因素

第一步,进行数据标准化

数据标准化后的结果为:

第二步,求各指标在各方案下的比值

使用公式:

第三步,求各指标的信息熵

使用的公式:

第四步,确定各指标的权重

使用公式:

第五步,计算综合得分

使用公式:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1593910.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【Liunx】什么是vim?五大模式及转换方法详解

💐 🌸 🌷 🍀 🌹 🌻 🌺 🍁 🍃 🍂 🌿 🍄🍝 🍛 🍤 📃个人主页 :阿然成长日记 …

基于SSM的在线学习系统的设计与实现(论文+源码)_kaic

基于SSM的在线学习系统的设计与实现 摘要 随着信息互联网购物的飞速发展,一般企业都去创建属于自己的管理系统。本文介绍了在线学习系统的开发全过程。通过分析企业对于在线学习系统的需求,创建了一个计算机管理在线学习系统的方案。文章介绍了在线学习系…

程序员会营销,好比虎生双翅,不是牛叉,是牛叉大发了。

Hi,我是贝格前端工场,一般来讲程序员在语言表达和营销上都是弱项,你看头条上那些程序员XXX,嘚啵嘚的能说的,其实都是伪程序,都是大商务。 不过,如果程序员如果能够提升自己的营销能力&#xff0…

教你将配置好的conda环境迁移到其它设备

文章目录 问题分析存在的方法环境要求方法步骤1. 下载conda pack2. 打包原环境3. 新设备还原环境4. 查看环境 问题分析 好不容易配置好的conda环境,要在另一个设备上运行,还要重新配置,好麻烦。 存在的方法 pip install -r requirement.txt …

CMD 汉字乱码处理

windows 11 cmd汉字乱码问题处理 一 查看CMD编码 win R 输入 cmd 输入 chcp 查看回显信息 “936”代表的意思就是 GBK (汉字内码扩展规范),通常情况下GBK也是cmd的默认编码。 解决乱码需要把编码改为 utf-8 二 临时修改 在 终端中输入 chcp 65001 三 永久修改…

踩了一堆坑,终于掌握了postgreSQL主从流的精髓

📢📢📢📣📣📣 哈喽!大家好,我是【IT邦德】,江湖人称jeames007,10余年DBA及大数据工作经验 一位上进心十足的【大数据领域博主】!😜&am…

大模型化身数据魔法师,降低NLP高置信误判

关注公众号【AI论文解读】回复: 论文解读 获取本文论文 引言:NLP模型的高置信错误与脆弱性问题 在自然语言处理(NLP)领域,模型的预测性能优化往往伴随着高置信错误(high confidence errors)的产生&#x…

【python】python汽车之家数据抓取分析可视化(代码+报告+数据)【独一无二】

👉博__主👈:米码收割机 👉技__能👈:C/Python语言 👉公众号👈:测试开发自动化【获取源码商业合作】 👉荣__誉👈:阿里云博客专家博主、5…

2D AI交互数字人:赋能文旅、金融、政务、教育行业数字化转型

AI交互数字人结合了语音合成、语音识别、语义理解、图像处理、机器翻译、虚拟形象驱动等多项AI核心技术,可以提供服务导览、业务咨询、语音互动交流、信息播报等智能服务。 其中,2D AI交互数字人是采集真人视频,通过AI训练,生成逼…

C语言——字符函数与字符串函数

正文开始:在编程过程中,我们经常要处理字符和字符串,为了方便操作字符和字符串,C语⾔标准库中提供了 一系列库函数,接下来我们就学习⼀下这些函数。 1. 字符分类函数 C语⾔中有⼀系列的函数是专门做字符分类的&#…

基于ssm的智慧餐厅点餐管理系统设计与实现(java项目+文档+元)

风定落花生,歌声逐流水,大家好我是风歌,混迹在java圈的辛苦码农。今天要和大家聊的是一款基于ssm的智慧餐厅点餐管理系统。项目源码以及部署相关请联系风歌,文末附上联系信息 。 项目简介: 智慧餐厅点餐管理系统设计…

在Mac主机上连接Linux虚拟机

前言 最近醉心于研究Linux,于是在PD上安装了一个Debian Linux虚拟机,用来练练手。但是每次在mac和Linux之间切换很是麻烦,有没有一种方法,可以在mac终端直接连接我的虚拟机,这样在mac终端上就可以直接操控我的Linux虚…

资本涌向AI,AI规模将达2205亿美元?

随着科技的飞速发展,全球科技巨头瑞银(UBS)在其最新报告中预测,科技产业正迎来一个前所未有的增长浪潮。特别是在人工智能(AI)领域,预计到2027年,AI模型和应用程序的市场规模将达到惊…

Docker部署WebRTC-Streamer

文章目录 WebRTC-Streamer概述Docker部署WebRTC-StreamerVue使用WebRTC-Streamer一些问题 WebRTC-Streamer概述 WebRTC-Streamer是一个基于WebRTC技术的流媒体传输工具,它可以通过Web浏览器实现实时音视频流的传输和播放。它提供了一种简单而强大的方式&#xff0c…

21.5k Star , AI 智能体项目OpenDevin:少写代码,多创造(附部署教程)

Aitrainee | 公众号:AI进修生 这是一个旨在复制 Devin 的开源项目,Devin 是一位自主人工智能软件工程师,能够执行复杂的工程任务并在软件开发项目上与用户积极协作。该项目致力于通过开源社区的力量复制、增强和创新 Devin。 Devin 代表了一…

汇舟问卷:国外问卷调查适合哪些人?

在这个快节奏的时代,朝九晚五的工作模式似乎已经成为许多人的固定生活模式。然而,这种日复一日的工作方式往往让人感到疲惫和厌倦,我们渴望找到一种既能赚钱又能兼顾生活的方式。 海外问卷调查作为一种适合在家做的赚钱方式,这两…

前端知识学习笔记-六(vue)

简介 Vue是前端优秀框架是一套用于构建用户界面的渐进式框架 Vue优点 Vue是目前前端最火的框架之一 Vue是目前企业技术栈中要求的知识点 vue可以提升开发体验 Vue学习难度较低 Vue开发前准备 一、nodejs环境 Nodejs简介 Nodejs诞生于2009年,主攻服务器方向&#x…

Github Coplit的认证及其在JetBrains中的使用

原文地址:Github Coplit的认证及其在JetBrains中的使用 - Pleasure的博客 下面是正文内容: 前言 今天分享一个可有可无的小技巧,水一篇文。 如标题所述,Github Coplit的认证及其在JetBrains中的使用 正文 介绍JetBrains JetBrain…

BCD BIN 转换

1,BCD是将10进制的每一位转换成2进制 如22 的中数子2的2进制就是0010,那么22的BCD 嘛就是 0010 0010 2,bin 的就是将2进制的每4位转成10进制 如 34的2进制就是0010 0010 高四位和低四位都是 0010 ,0010对应的10进制就是2 那么…

ELFK日志分析系统之搭建ELF+Filebeaat+Zookeeper+Kafka

引言 结合前面所学 http://ELK日志分析系统 一、为什么要做日志分析平台 随着业务量的增长,每天业务服务器将会产生上亿条的日志,单个日志文件达几个GB,这时我们发现用Linux自带工具,cat grep awk 分析越来越力不从心了&#…