面板模型进行熵值法分析

news2025/1/12 9:04:59

背景说明

熵值法(熵权法)是一种研究指标权重的研究方法,比如有5个指标,分别为指标1到指标5,并且有很多样本(比如100个样本),即100行*5列数据,此时研究该5个指标的权重分别是多少。

但从上述可以看到,数据格式上为100个样本即100行数据。如果说当前是面板数据即比如100家公司分别5年,那么就是100*5=500行数据,依旧还是5个指标,即500行*5列数据。此时希望利用熵值法研究该5个指标的权重情况,应该如何处理呢?

数据格式

首先从数据格式上,应该类似下图,即有2列数据分别标识公司ID和年份,比如当前为100家公司分别5年,那么就有100*5行的数据。

熵值法的原理是利用‘熵’来计算权重,‘熵’用来标识信息的不确定性情况,熵越大意味着不确定性越大->信息量越小->权重越小,这是熵值法的原理。

从原理角度上看

面板数据要想计算出5个指标的权重,也是利用‘熵’来计算,也即说明只要能计算出数据的‘熵’值,即可得到权重。而‘熵值’的计算上,并不会考虑是否为面板数据,因而从原理角度,面板数据与普通数据完全一致,直接放入分析即可。

从分析角度上看:

针对面板数据,通常有两种做法,分别是做1次,分别重复多次再汇总,如下表格所示:

分析做法

说明

一次法

完全不考虑是否面板数据,直接与普通数据一样做一次分析即可

多次法

比如5年数据,先筛选出第1次的数据做1次,接着重复做另外4次,分别得到5次权重,然后将权重求平均值。

一次法,此种做法非常常见,即完全不考虑是否为面板数据,在原理上并没有任何问题。因为熵值法计算权重的原理是利用‘熵’值信息,相当于把100家公司5年即500个数字当成一个序列,计算该序列的‘熵’用于判断该500个数字的不确定性情况。最终得到权重。

另外也可分别筛选出某年数据后,基于100家公司即100个数字看成1个序列,计算该100个数字的不确定性情况,并且最终得到权重,此法称作多次法。

接下来将以案例进行说明:

案例说明

接下来以一份数据,9个公司id,并且5年(2008~2012)的数据进行熵值法。并且分别以整体做1次,和分别5年做5次。数据类似如下:

 

如果仅做1次分析,即将该5个指标直接放入分析框中,结果如下:

 接着分别筛选出2008年的数据做1次分析,并且重复另外4次,关于SPSSAU进行样本筛选,如下截图:

 分别进行5次,并且将5次的权重结果进行汇总整理如下表所示:

年份

指标1权重

指标2权重

指标3权重

指标4权重

指标5权重

2008

42.21%

9.21%

28.62%

10.01%

9.95%

2009

42.69%

9.48%

28.69%

8.49%

10.65%

2010

40.87%

9.25%

31.10%

8.51%

10.27%

2011

40.27%

9.27%

31.92%

7.77%

10.77%

2012

40.67%

9.28%

33.13%

7.43%

9.49%

求平均

41.34%

9.30%

30.69%

8.44%

10.23%

比如上表格,分别做5次分析,每次均得到5个指标的权重,然后整理后,再对某个指标下的几个权重,比如表格中第2列5个数字求平均得到41.34%,即为最终指标1权重。

特别提示:上述处理从原理上可行,并且此种做法是出于分析考虑,这种做法考虑了不同年份时数字的波动差异性。

其它说明

面板数据进行熵值法分析前是否需要进行量纲化处理?如果进行量纲化处理,比如归一化处理,其意味着将数据全部压缩在0~1之间,此时所有指标的数据量纲完全一致,即每个指标数据的信息熵的度量范围也完全一致。如果不进行量纲处理,意味着所有指标的大小有着相对大小意义,从数学原理上不进行量纲处理也可以进行熵值法分析。

是否需要量纲化处理,这本身没有固定要求,通常是结合实际研究意义和文献作为标准,如果有担心,建议进行归一化处理(也或者SPSSAU区间化处理)后再进行分析即可。

另提示:进行某些量纲处理比如归一化处理后会出现数字0,但是熵值时有求log处理,因而数字0会出现无法计算的现象,当然可使用SPSSAU的非负平移功能,选中SPSSAU非负平移,系统会在出现0的指标时,在该指标全部加上一个很小的数字0.001。非负平移也可在分析之前处理好数据再使用均可(SPSSAU数据处理->生成变量->非负平移)。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/45504.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

可编程直流电源的特点都有哪些呢?

可编程直流电源是用数字或编码器输入,非电位器调节电压、电流的直流电源。无论是在研发,还是生产测试中,可编程直流电源的宽范围电压输出都适于测试和分析组件、电路、模块和完整器件的特性。那么可编程直流电源的特点都有哪些呢?下面安泰测…

【Java系列】一篇文章阐述常见问题及解决方法

返回主篇章         👇 【Java】才疏学浅小石Java问道之路 Java常见问题及解决方法问题1问题2问题3问题4问题1 问题提出: 解决问题: 源文件名不存在或者写错当前路径错误后缀名隐藏问题 问题2 问题提出: 解决问题&a…

加码中文 AIGC,IDEA 推出“盖亚计划”

作者 | 伍杏玲 出品 | CSDN 近年来,AIGC 话题火爆 AI 技术人的朋友圈。由于深度学习模型不断完善、开源模式推动,AIGC 的迭代速度呈爆发式发展。据 Gartner 发布的 2022 年需要探索的重要战略技术趋势显示,生成式 AI 是其中引人注目的人工智…

uniapp开发小程序-工作笔记

开发背景 公司开始安排本人开发微信小程序,于是乎研究了一点关于uniapp的api和注意的点。仅仅是个人笔记…可能有错误,希望各位指出。 uniapp开发小程序 应用生命周期 onLaunch 初始化完成时 只触发一次 onShow 后台进入前台 显示页面的时候 onHide 前台…

全志V853 NPU 转换部署 YOLO V5 模型

NPU 转换部署 YOLO V5 模型 本文以 YOLO v5s 模型为例,详述 ONNX 模型在 V853 平台的转换与部署的流程。 模型的准备 YOLO v5 目前开源于 Github,链接【GitHub - ultralytics/yolov5: YOLOv5 🚀 in PyTorch > ONNX > CoreML > TF…

【Android App】实战项目之虚拟现实(VR)的全景相册(附源码和演示视频 可用于学习和大作业)

需要源码请点赞关注收藏后评论区留言私信~~~ 不管是绘画还是摄影,都是把三维的物体投影到平面上,其实仍旧呈现二维的模拟画面。 随着科技的发展,传统的成像手段越来越凸显出局限性,缘由在于人们需要一种更逼真更接近现实的技术&am…

基于有偏距离权值(Weighted cubic O-MOMS with warping)三次O-MOMS插值理论的图像超分辨重构研究-附Matlab程序

⭕⭕ 目 录 ⭕⭕✳️ 一、图像超分辨率重构原理✳️ 二、三次O-MOMS插值重构理论与实验分析✳️ 2.1 三次O-MOMS(Cubic O-MOMS)插值理论与实验验证✳️ 2.2 有偏距离三次O-MOMS插值重构理论与实验验证✳️ 2.3 权重三次O-MOMS插值理论与实验验证✳️ 2.4 有偏距离权值三次O-MOM…

[附源码]Python计算机毕业设计Django茶叶销售微信小程序

项目运行 环境配置: Pychram社区版 python3.7.7 Mysql5.7 HBuilderXlist pipNavicat11Djangonodejs。 项目技术: django python Vue 等等组成,B/S模式 pychram管理等等。 环境需要 1.运行环境:最好是python3.7.7,…

Hive 查看和修改 tez 容器的资源

1. 查看当前的配置 1.1 进入 AppMaster 或 History 进入运行中,或者运行完作业对应的 “Tracking URL”。以下示例是已经运行完的 job。 1.2 进入 tez-ui 进入 tez-ui 之后,点击 Configurations 1.3 查看配置 输入要查询的配置项,点击…

随smart登陆欧洲,亿咖通科技踏上出海新征程

随着全新smart精灵#1正式登陆欧洲,全球移动出行科技公司亿咖通科技同步向欧洲车主揭晓其搭载于新车上的下一代智能座舱系统,并正式将其出海战略向前推进关键一步,成为中国智能化出海的一座崭新里程碑。 全新smart精灵#1预计将于2022年底开始&…

π220N31兼容代替TI ISO1540DR 低功耗 3.0kVrms 双向I2C 隔离器

π220N31兼容代替TI ISO1540DR 低功耗 3.0kVrms 双向I2C 隔离器,I2C隔离器输入和输出采用二氧化硅(SiO2)介质隔离,可阻断高电压并防止噪声电流进入控制侧,避免电路干扰和损坏敏感器件。与光电耦合器相比,在功能、性能、尺寸和功耗…

2022年全国最新消防设施操作员模拟真题题库及答案

百分百题库提供消防设施操作员考试试题、消防设施操作员考试预测题、消防设施操作员考试真题、消防设施操作员证考试题库等,提供在线做题刷题,在线模拟考试,助你考试轻松过关。 124、消防电梯设置应符合下列哪些( )要求 A.消防电梯载重量不应小于800kg …

麦芽糖-阿奇霉素 maltose-Azithromycin

麦芽糖-阿奇霉素 maltose-Azithromycin 中文名称:麦芽糖-阿奇霉素 英文名称:maltose-Azithromycin 别称:阿奇霉素修饰麦芽糖,阿奇霉素-麦芽糖 PEG接枝修饰麦芽糖 麦芽糖-聚乙二醇-阿奇霉素 Azithromycin-PEG-maltose 阿…

@企业主们看过来,用华为云CDN给你的网页加个速

企业主们看过来,用华为云CDN给你的网页加个速 前段时间参加秋招的时候,被问到了一个问题,CND是干啥的,什么是CND,面试官问我这个问题的时候,我暗窃喜这不是我的强项吗!!!…

【C++面向对象程序设计】CH5 继承与派生(续)——虚基类

目录 前言 一、虚基类的作用 二、虚基类的初始化 三、例【5.9】在【例5.8】中在teacher类和student类之上增加一个共同的基类person,人员的一些基本数据放在person中 四、多层多重继承用虚基类 五、虚基类的构造函数 六、多重继承如何工作 七、虚拟继承 八…

【深入浅出Java并发编程指南】「难点 - 核心 - 遗漏」线程状态流转及生命周期的技术指南(知识点串烧)

前提介绍 本章主要介绍相关线程声明周期的转换机制以及声明周期的流转关系以及相关AQS的实现和相关的基本原理,配合这相关官方文档的中英文互译的介绍。 线程状态流转及生命周期 当线程被创建并启动以后,它既不是一启动就进入了执行状态,也不…

17. 电话号码的字母组合

17. 电话号码的字母组合 给定一个仅包含数字 2-9 的字符串,返回所有它能表示的字母组合。答案可以按 任意顺序 返回。 给出数字到字母的映射如下(与电话按键相同)。注意 1 不对应任何字母。 示例 1: 输入:digits …

R语言分布滞后非线性模型(DLNM)研究发病率,死亡率和空气污染示例

全文下载链接:http://tecdat.cn/?p21317本文提供了运行分布滞后非线性模型的示例,同时描述了预测变量和结果之间的非线性和滞后效应,这种相互关系被定义为暴露-滞后-反应关联(点击文末“阅读原文”获取完整代码数据)。…

C语言文件操作

目录序言文件程序文件&数据文件程序文件数据文件文本文件&二进制文件文件名操作初阶打开&关闭文件fopen读写文件fputc & fgetc文件缓冲区文件指针操作进阶打开方式"w"(只写)"r"(只读)"a"(追加)文件的顺序读写fgets & fputsf…

Mac安装rabbitmq延迟队列插件

Mac安装rabbitmq延迟队列插件我是通过brew安装的rabbitmq,没有安装Homebrew的需要安装一下查看我们rabbitmq版本,我这里的版本是3.11.3,我们下载的插件大版本必须是3.11 brew info rabbitmq下载rabbitmq_delayed_message_exchange插件&#…