数学建模笔记——熵权法(客观赋权法)

news2024/12/25 1:54:40

数学建模笔记——熵权法[客观赋权法]

  • 熵权法(客观赋权法)
    • 1. 基本概念
    • 2. 基本步骤
    • 3. 典型例题
      • 3.1 正向化矩阵
      • 3.2 对正向化矩阵进行矩阵标准化
      • 3.3 计算概率矩阵P
      • 3.4 计算熵权
      • 3.5 计算得分
    • 4. python代码实现

熵权法(客观赋权法)

1. 基本概念

熵权法,物理学名词,按照信息论基本原理的解释,信息是系统有序程度的一个度量,熵是系统无序程度的一个度量;根据信息熵的定义,对于某项指标,可以用熵值来判断某个指标的离散程度,其信息熵值越小,指标的离散程度越大,该指标对综合评价的影响(即权重)就越大,如果某项指标的值全部相等,则该指标在综合评价中不起作用。因此,可利用信息熵这个工具,计算出各个指标的权重,为多指标综合评价提供依据。

  • 熵权法是一种客观的赋权方法,它可以靠数据本身得出权重。
  • 依据的原理:指标的变异程度越小,所反映的信息量也越少,其对应的权值也应该越低。

另一种表述:越有可能发生的事情,信息量越少。越不可能发生的事情,信息量就越多。其中我们认为 概率 就是衡量事情发生的可能性大小的指标。

那么把 信息量 用字母 I I I表示,概率用 P P P表示,那么我们可以将它们建立一个函数关系:

image-20240827224149478

那么,假设 x 表示事件 X 可能发生的某种情况,p(x)表示这种情况发生的概率情况如上图所示,该图像可以用对数函数进行拟合,那
么最终我们可以定义: I ( x ) = − ln ⁡ ( p ( x ) ) I(x)=-\ln(p(x)) I(x)=ln(p(x)),因为 0 ≤ p ( x ) ≤ 1 0\leq p(x)\leq1 0p(x)1,所以 I ( x ) ≥ 0 I(x)\geq0 I(x)0

信息熵的定义

假设 x 表示事件 X 可能发生的某种情况,p(x) 表示这种情况发生的概率我们可以定义: I ( x ) = − ln ⁡ ( p ( x ) ) I(x)=-\ln(p(x)) I(x)=ln(p(x)) ,因为 0 ≤ p ( x ) ≤ 1 0\leq p(x)\leq1 0p(x)1 ,
所以 I ( x ) ≥ 0 I(x)\geq0 I(x)0。如果事件 X 可能发生的情况分别为: x 1 , x 2 , ⋯   , x n x_1,x_2,\cdots,x_n x1,x2,,xn ,那么我们可以定义事件 X X X 的信息熵为:
H ( X ) = ∑ i = 1 n [ p ( x i ) I ( x i ) ] = − ∑ i = 1 n [ p ( x i ) ln ⁡ ( p ( x i ) ) ] H(X)=\sum_{i=1}^n\left[p(x_i)I(x_i)\right]=-\sum_{i=1}^n\left[p(x_i)\ln(p(x_i))\right] H(X)=i=1n[p(xi)I(xi)]=i=1n[p(xi)ln(p(xi))]

那么从上面的公式可以看出,信息上的本质就是对信息量的期望值。

可以证明的是: p ( x 1 ) = p ( x 1 ) = ⋯ = p ( x n ) = 1 / n p(x_1)=p(x_1)=\cdots=p(x_n)=1/n p(x1)=p(x1)==p(xn)=1/n时, H ( x ) H(x) H(x)取最大值,此时 H ( x ) = ln ⁡ ( n ) H(x)=\ln(n) H(x)=ln(n)。(n表示事件发生情况的总数)

2. 基本步骤

熵权法的计算步骤大致分为以下三步:

  1. 数据标准化

    假设有 n n n个要评价的对象, m m m个评价指标(已经正向化了)构成的正向化矩阵如下:
    X = [ x 11 x 12 ⋯ x 1 m x 21 x 22 ⋯ x 2 m ⋮ ⋮ ⋱ ⋮ x n 1 x n 2 ⋯ x n m ] X=\begin{bmatrix}x_{11}&x_{12}&\cdots&x_{1m}\\x_{21}&x_{22}&\cdots&x_{2m}\\\vdots&\vdots&\ddots&\vdots\\x_{n1}&x_{n2}&\cdots&x_{nm}\end{bmatrix} X= x11x21xn1x12x22xn2x1mx2mxnm
    设标准化矩阵为 Z Z Z , Z Z Z中元素记为 z i j : z_{ij}: zij:
    z i j = x i j ∑ i = 1 n x i j 2 z_{ij}=\frac{x_{ij}}{\sqrt{\sum_{i=1}^nx_{ij}^2}} zij=i=1nxij2 xij
    判断 Z Z Z矩阵中是否存在着负数,如果存在的话,需要对 X X X使用另一种标准化方法对矩阵 X X X进行一次标准化得到 Z Z Z矩阵,其标准化的公式为:
    z i j = x i j − m i n { x 1 j , x 2 j , ⋯   , x n j } m a x { x 1 j , x 2 j , ⋯   , x n j } − m i n { x 1 j , x 2 j , ⋯   , x n j } z_{ij}=\frac{x_{ij}-min\{x_{1j},x_{2j},\cdots,x_{nj}\}}{max\{x_{1j},x_{2j},\cdots,x_{nj}\}-min\{x_{1j},x_{2j},\cdots,x_{nj}\}} zij=max{x1j,x2j,,xnj}min{x1j,x2j,,xnj}xijmin{x1j,x2j,,xnj}

    这样可以保证 z i j z_{ij} zij在 [0,1] 区间,没有负数。

  2. 计算概率矩阵P

    假设有 n n n个要评价的对象, m m m个评价指标,且经过了上一步处理得到的非负矩阵为:

    Z = [ z 11 z 12 ⋯ z 1 m z 21 z 22 ⋯ z 2 m ⋮ ⋮ ⋱ ⋮ z n 1 z n 2 ⋯ z n m ] Z=\begin{bmatrix}z_{11}&z_{12}&\cdots&z_{1m}\\z_{21}&z_{22}&\cdots&z_{2m}\\\vdots&\vdots&\ddots&\vdots\\z_{n1}&z_{n2}&\cdots&z_{nm}\end{bmatrix} Z= z11z21zn1z12z22zn2z1mz2mznm
    计算概率矩阵 P P P,其中 P P P中每一个元素 p i j p_{ij} pij,的计算公式如下:
    p i j   =   z i j ∑ i = 1 n z i j p_{ij}\:=\:\frac{z_{ij}}{\sum_{i=1}^nz_{ij}} pij=i=1nzijzij

    保证每一列的加和为1,即每个指标所对应的概率和为1。

  3. 计算熵权

    信息熵的计算:

    对于第 j j j个指标而言,其信息嫡的计算公式为:
    e j = − 1 ln ⁡ n ∑ i = 1 n p i j ln ⁡ ( p i j ) , ( j = 1 , 2 , ⋯   , m ) e_j=-\frac{1}{\ln n}\sum_{i=1}^np_{ij}\ln(p_{ij}),\quad(j=1,2,\cdots,m) ej=lnn1i=1npijln(pij),(j=1,2,,m)
    注意:这里如果说 p i j p_{ij} pij为0,那么就需要指定 l n ( 0 ) = 0 ln(0)=0 ln(0)=0

    信息效用值的定义:
    d j = 1 − e j d_j=1-e_j dj=1ej

    那么信息效用值越大,其对应的信息就越多。

    将信息效用值进行归一化,我们就能够得到每个指标的 熵权:
    ω j = d j ∑ j = 1 m d j , ( j = 1 , 2 , 3 , ⋯   , m ) \begin{aligned}\omega_{j}&=\frac{d_j}{\sum_{j=1}^md_j},\quad(j=1,2,3,\cdots,m)\end{aligned} ωj=j=1mdjdj,(j=1,2,3,,m)

3. 典型例题

明星Kun想找一个对象,但喜欢他的人太多,不知道怎么选,经过层层考察,留下三个候选人。他认为身高165是最好的,体重在90-100斤是最好的。

候选人颜值牌气(争吵次数)身高体重
A910165120
B8716680
C6316490
  • 观察候选人的数据我们可以发现,A,B,C三人的身高是极为接近的,那么对于找对象来说这个指标是不是就不重要了呢?

  • 对于体重这个指标来说,三人相差较大,那么找对象是不是就多考虑这个指标?

3.1 正向化矩阵

候选人颜值脾气(争吵次数)身高体重
A9000
B830.90.5
C670.21

3.2 对正向化矩阵进行矩阵标准化

因为指标中没有负数,采用 z i j = x i j ∑ i = 1 n x i j 2 z_{ij}=\frac{x_{ij}}{\sqrt{\sum_{i=1}^nx_{ij}^2}} zij=i=1nxij2 xij进行标准化

候选人颜值牌气(争吵次数)身高体重
A0.669000
B0.5950.3940.9760.447
C0.4460.9190.2170.894

3.3 计算概率矩阵P

计算标准化矩阵第 j j j项指标下第 i i i个样本所占的比重 p i j   =   z i j ∑ i = 1 n z i j p_{ij}\:=\:\frac{z_{ij}}{\sum_{i=1}^nz_{ij}} pij=i=1nzijzij

候选人颜值脾气(争吵次数)身高体重
A0.391000
B0.3480.3000.8180.333
C0.2610.7000.1820.667

3.4 计算熵权

颜值脾气(争吵次数)身高体重
0.00850.30720.39310.2912

3.5 计算得分

候选人得分
A0.0044
B0.5009
C0.4946

4. python代码实现

import numpy as np
# 定义一个自定义的对数函数,用于处理输入数组中的零元素


def mylog(p):
    n = len(p)
    lnp = np.zeros(n)
    for i in range(n):
        if p[i] == 0:
            lnp[i] = 0
        else:
            lnp[i] = np.log(p[i])
    return lnp


# 定义一个指标矩阵
X = np.array([[9, 0, 0, 0], [8, 3, 0.9, 0.5], [6, 7, 0.2, 1]])

# 对矩阵X的每一列进行标准化处理
Z = X/np.sqrt(np.sum(X**2, axis=0))
print("标准化后的矩阵为:\n{}".format(Z))

# 计算熵权所需的变量和矩阵初始化
n, m = Z.shape
D = np.zeros(m)

# 计算每个指标的信息效用值
for i in range(m):
    x = Z[:, i]
    p = x/np.sum(x)
    e = -np.sum(p*mylog(p))/np.log(n)
    D[i] = 1-e

# 根据信息效用值计算各指标权重
W = D/np.sum(D)
print("各指标权重为:\n{}".format(W))

输出:

标准化后的矩阵为:
[[0.66896473 0.         0.         0.        ]
 [0.59463532 0.3939193  0.97618706 0.4472136 ]
 [0.44597649 0.91914503 0.21693046 0.89442719]]
各指标权重为:
[0.00856537 0.30716152 0.39326471 0.2910084 ]

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2119177.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

大数据之Flink(四)

11、水位线 11.1、水位线概念 一般实时流处理场景中,事件时间基本与处理时间保持同步,可能会略微延迟。 flink中用来衡量事件时间进展的标记就是水位线(WaterMark)。水位线可以看作一条特殊的数据记录,它是插入到数…

Linux系统【RockyLinux9.4】下K8S集群【1.31.0】安装部署指南

1.概述 公司之前一直使用的是CentOS系统作为测试、开发、生产环境的基础系统镜像,由于最近的CentOS的镜像彻底终止维护之后,我们在为后续项目的基础系统镜像选型进行的调研, 最好是可以平替的进行类似系统的移植, 经过多番对比&a…

基于锁相环闭环控制AD2S1210旋转变压器测速原理及仿真

旋转变压器通过在转子施加高频励磁信号,通过电磁感应方式在两定子上输出正交的包含转子角度信号,数学建模公式如下: E为幅值,sinwt为转子输入的高频励磁信号,、为电机角度信号 AD2S1210 测角度原理是通过自动控制原理…

进程之间的通信方式

前言 每个进程的用户地址空间都是独立的,一般而言是不能互相访问的,但内核空间是每个进程都共享的,所以进程之间要通信必须通过内核。 Linux提供了以下进程通信方式: 一、管道 所谓的管道,就是内核里面的一串缓存。…

Iceberg与SparkSQL写操作整合

前言 spark操作iceberg之前先要配置spark catalogs,详情参考Iceberg与Spark整合环境配置。 有些操作需要在spark3中开启iceberg sql扩展。 Iceberg使用Apache Spark的DataSourceV2 API来实现数据源和catalog。Spark DSv2是一个不断发展的API,在Spark版…

12. GIS地图制图工程师岗位职责、技术要求和常见面试题

本系列文章目录: 1. GIS开发工程师岗位职责、技术要求和常见面试题 2. GIS数据工程师岗位职责、技术要求和常见面试题 3. GIS后端工程师岗位职责、技术要求和常见面试题 4. GIS前端工程师岗位职责、技术要求和常见面试题 5. GIS工程师岗位职责、技术要求和常见面试…

Mac强制删除文件,碰上“拖拽到废纸篓”无法删除时怎么办?

我们都特别喜欢Mac,不仅是因为它漂亮的外观,还有它的运行顺畅、界面友好。然而,就像所有技术产品一样,有时它也会让我们头疼——比如,当某个文件无论如何都删不掉时。你可能遇到过这样的情况:尝试删除一个文…

亿道三防AI加固平板电脑首亮相,工业级AI PC开启行业新纪元!

8月28日至30日,亿道三防在第22届国际物联网展深圳站上隆重发布了多款AI加固平板电脑和户外三防新品,首次亮相便赢得了现场观众的热烈好评。此外,还有三防平板电脑、工业平板电脑、车载平板电脑以及防爆平板等众多行业类明星产品也悉数登场&am…

【Leetcode算法面试题】-1. 两数之和

文章目录 算法练习题目思路参考答案算法1算法2算法3 算法练习 面试经常会遇到算法题目,今天开启算法专栏,常用算法解析 题目 ** 给定一个整数数组 nums 和一个整数目标值 target,请你在该数组中找出 和为目标值 target 的那 两个 整数&…

【服务器第一期】Xshell、Xftp下载及连接

服务器环境配置 1 Xshell 和 Xftp 的下载安装与使用2 连接服务器2.1. Xshell 连接服务器2.2 文件传输 参考 1 Xshell 和 Xftp 的下载安装与使用 进入 Xshell 下载页面,点击下载 官网-XSHELL-NetSarang Website 选择免费授权页面: 直接下载即可。 PS&…

目标检测从入门到精通——常见iou及变体算法介绍

目标检测中的 IoU 算法及其变体 绪论 在计算机视觉领域,目标检测是一个重要的研究方向,广泛应用于自动驾驶、安防监控、图像搜索等多个场景。为了评估目标检测模型的性能,Intersection over Union(IoU)作为一种常用的…

SpringBoot OAuth2自定义登陆/授权页

背景 5 月份的时候,我实践并整理了一篇博客:SpringBoot搭建OAuth2,该博客完成之后,很长一段时间里我都有种意犹未尽的感觉。诚然,我把OAuth2搭起来了,各种场景的用例也跑通了,甚至源码也看了&am…

HTTP请求⽅法

HTTP请求⽅法 1. GET :申请获取资源,不对服务器产⽣影响 2. POST : POST 请求通常⽤于发送数据,例如提交表单数据、上传⽂件等,会影响服务器,服务器可能动态创建新的资源或更新原有资源。 3. HEAD &#…

GPU 计算 CMPS224 2021 学习笔记 02

并行类型 (1)任务并行 (2)数据并行 CPU & GPU CPU和GPU拥有相互独立的内存空间,需要在两者之间相互传输数据。 (1)分配GPU内存 (2)将CPU上的数据复制到GPU上 &…

UE4_后期处理_后期处理材质四—场景物体描边

一、效果如下图: 二、分析: 回顾复习:在后期处理材质三中,我们通过计算开启自定义深度通道物体的像素点上下左右4个像素SceneTextureCustomDepth深度之和来判断物体的外部(包含物体的边)和内部&#xff0c…

【漏洞利用】2018年-2024年HVV 6000+个漏洞 POC 合集分享

此份poc 集成了Zabbix、用友、通达、Wordpress、Thinkcmf、Weblogic、Tomcat等 下载链接: 链接: https://pan.quark.cn/s/1cd7d8607b8a

Java小白一文讲清Java中集合相关的知识点(七)

LinkedHashSet LinkedHashSet是HashSet的子类 LinkedHashSet底层是一个LinkedHashMap,底层维护了一个数组双向链表 而在之前讲的HashSet中的链表是单向的哈,注意区分! LinkedHashSet根据元素的hashcode值来决定元素的存储位置,同时使用链表…

从搜索热度上看Arcgis的衰退

Arcgis已被qgis快速赶上 google trends是一个google综合了每日的搜索情况的统计网站,可以追踪从2004年开始各个关键字的搜索热度。 我用arcgis和qgis作为对比,简单探索了arcgis和qgis的全球相关热度。 假设,搜索arcgis越高的区域&#xff…

机器学习 第8章 集成学习

目录 个体与集成BoostingBagging与随机森林Bagging随机森林 结合策略平均法投票法学习法 个体与集成 定义:集成学习,也叫多分类器系统、基于委员会的学习等,它是一种通过结合多个学习器来构建一个更强大的学习器的技术。如下图所示 在这里&a…

轨道交通系统详解,以及地铁如何精准停靠站台

ATC系统 全称“自动列车控制系统”,Automatic Train Control,ATC ATC是地铁运行的核心系统,它包括列车自动防护(ATP)、列车自动运行(ATO)和列车自动监控(ATS)三个子系统。…