当前位置: 首页 > news >正文

评价类——熵权法(Entropy Weight Method, EWM),完全客观评价

目录

  • 一、 熵权法赋权代码说明
    • 1.1 介绍
  • 二、 手把手教你运行代码
    • 2.1 数据示例
    • 2.2 ==可直接运行代码,代码(完整代码关注底部微信公众号获取)==
    • 2.3 shangquanfa_eg_Sheet1.csv数据可视化
    • 2.4 代码运行过程截屏
    • 2.5 代码运行结果截屏
    • 2.6 对熵权法的结果分析
  • 三、 提供的代码如何修改?
  • 四、 为什么确定极小化指标?
    • 4.1 极小化和极大化的归一化原理
      • 1. 极大化指标的归一化
        • 归一化公式解释
      • 2. 极小化指标的归一化
        • 归一化公式解释
      • 3. 归一化的目的和意义
  • 四、熵权法的原理
    • 4.1 熵权法简介
    • 4.2 熵权法的原理
      • 4.2.1 信息熵的计算公式

一、 熵权法赋权代码说明

完整代码关注博客底部微信公众号获得!

1.1 介绍

熵权法(Entropy Weight Method, EWM)是一种客观赋权的方法,用于多指标决策分析。

我知道大家对原理不感兴趣,原理我放在最后,写论文的同学可以复制,但是记得改一改,否则查重率过不去。
代码可以直接运行,大家参考我的教程。

二、 手把手教你运行代码

接下来,我给大家提供一个示例数据,以这个数据教大家如何使用下述代码。

2.1 数据示例

假设你的数据存储在 data.csv 文件中,格式如下:

编号影响因素1影响因素2影响因素3
A70800030
B90700050
C60750040

首先将你的数据整理为这种格式,然后查看影响因素,对某个值越大约好的不用管,只需要找出影响因素越小越好的值(因为两者归一化的方法不一样),假如影响因素1和2 是越小越好,那么记住,影响因素在除了第一列以外,从0开始编号属于第1和2列,记住``和2

接下来给你提供代码,教你如何操作代码。

2.2 可直接运行代码,代码(完整代码关注底部微信公众号获取)

import pandas as pd
import numpy as npdef entropy_weight_method(csv_file, minimize_cols=None):scores = np.dot(normalized_data, weights)# 将结果保存到 CSV 文件result = pd.DataFrame({'Sample': samples,'Score': scores})result.to_csv('weighted_scores.csv', index=False, encoding='utf-8')return weights, scores# 用法
csv_file = 'shangquanfa_eg_Sheet1.csv'  # 假设数据存储在 data.csv 文件中# 指定极小化的指标列索引(从0开始计数,假设第二列和第三列是极小化指标)
minimize_cols = [0, 1]  # 比如这里的列索引根据你的数据来设置
# minimize_cols = []  # 无极小化因素则启用这行代码
weights, scores = entropy_weight_method(csv_file, minimize_cols)print("权重:", weights)
print("综合得分:", scores)

**首先注意的有3点,
1.你的数据文件必须经过我的转换,参考我的这篇播客:文件格式转换:EXCEL和CSV文件格式互相转换
对需要使用熵权法的数据进行转换,并且转换以后对csv文件不可以在进行操作,否则会报错字符编码错误。

2.找到这行代码minimize_cols = [0, 1] ,在里面填入1,2(注意英文半角)(原因我前文有说明,仔细看)
修改后minimize_cols = [1, 2](如果没有极小化,就是全部的影响因素越大越好,你就改为minimize_cols = []空列表)
3.csv_file = ‘shangquanfa_eg_Sheet1.csv’ 中,shangquanfa_eg_Sheet1.csv是你的csv文件的路径及名字,最终按顺序输出权重和综合得分。

运行代码:

2.3 shangquanfa_eg_Sheet1.csv数据可视化

在这里插入图片描述

2.4 代码运行过程截屏

在这里插入图片描述

2.5 代码运行结果截屏

在这里插入图片描述

2.6 对熵权法的结果分析

从结果:
权重: [0.36719405 0.31640297 0.31640297]
综合得分: [0.43880099 0.68359703 0.31640297]
可以看出:影响因素1、影响因素2、影响因素3的权重分别是:0.36719405 、0.31640297、 0.31640297,最终计算得出A、B、C三地的得分依次为:0.43880099 、0.68359703、 0.31640297,可知B地最佳。

三、 提供的代码如何修改?

**首先注意的有3点,
1.你的数据文件必须经过我的转换,参考我的这篇播客:文件格式转换:EXCEL和CSV文件格式互相转换
对需要使用熵权法的数据进行转换,并且转换以后对csv文件不可以在进行操作,否则会报错字符编码错误。

2.找到这行代码minimize_cols = [0, 1] ,在里面填入1,2(注意英文半角)(原因我前文有说明,仔细看)
修改后minimize_cols = [1, 2](如果没有极小化,就是全部的影响因素越大越好,你就改为minimize_cols = []空列表)
3.csv_file = ‘shangquanfa_eg_Sheet1.csv’ 中,shangquanfa_eg_Sheet1.csv是你的csv文件的路径及名字,最终按顺序输出权重和综合得分。

四、 为什么确定极小化指标?

看极小化和极大化的归一化过程你就懂了,过程如下:

4.1 极小化和极大化的归一化原理

在多指标决策分析中,不同的指标对决策的影响方向可能不同,有些指标是极大化指标(即指标值越大越好),而有些指标是极小化指标(即指标值越小越好)。为了将不同量纲和方向的指标转化到一个可比的尺度上,需要进行归一化处理,即将不同指标的值转换到相同的范围(通常为 [0, 1] 区间)。这样就可以在同一尺度上进行比较和计算。

1. 极大化指标的归一化

极大化指标是指指标的值越大越好,例如利润、效率、得分等。在归一化时,希望将指标值较大的样本归一化到更高的数值。归一化公式如下:

r i j = x i j − x min ⁡ ( j ) x max ⁡ ( j ) − x min ⁡ ( j ) r_{ij} = \frac{x_{ij} - x_{\min(j)}}{x_{\max(j)} - x_{\min(j)}} rij=xmax(j)xmin(j)xijxmin(j)

其中:

  • r i j r_{ij} rij 是第 i i i 个样本在第 j j j 个指标下的归一化值。
  • x i j x_{ij} xij 是第 i i i 个样本在第 j j j 个指标下的原始值。
  • x min ⁡ ( j ) x_{\min(j)} xmin(j) 是第 j j j 个指标的最小值。
  • x max ⁡ ( j ) x_{\max(j)} xmax(j) 是第 j j j 个指标的最大值。
归一化公式解释
  • x i j = x max ⁡ ( j ) x_{ij} = x_{\max(j)} xij=xmax(j) 时, r i j = 1 r_{ij} = 1 rij=1,表示该样本在该指标下的表现最好。
  • x i j = x min ⁡ ( j ) x_{ij} = x_{\min(j)} xij=xmin(j) 时, r i j = 0 r_{ij} = 0 rij=0,表示该样本在该指标下的表现最差。
  • 如果 x i j x_{ij} xij 介于 x min ⁡ ( j ) x_{\min(j)} xmin(j) x max ⁡ ( j ) x_{\max(j)} xmax(j) 之间, r i j r_{ij} rij 的值位于 0 和 1 之间。

2. 极小化指标的归一化

极小化指标是指指标的值越小越好,例如成本、污染物排放量、损失等。在归一化时,希望将指标值较小的样本归一化到更高的数值。归一化公式如下:

r i j = x max ⁡ ( j ) − x i j x max ⁡ ( j ) − x min ⁡ ( j ) r_{ij} = \frac{x_{\max(j)} - x_{ij}}{x_{\max(j)} - x_{\min(j)}} rij=xmax(j)xmin(j)xmax(j)xij

其中:

  • r i j r_{ij} rij 是第 i i i 个样本在第 j j j 个指标下的归一化值。
  • x i j x_{ij} xij 是第 i i i 个样本在第 j j j 个指标下的原始值。
  • x min ⁡ ( j ) x_{\min(j)} xmin(j) 是第 j j j 个指标的最小值。
  • x max ⁡ ( j ) x_{\max(j)} xmax(j) 是第 j j j 个指标的最大值。
归一化公式解释
  • x i j = x min ⁡ ( j ) x_{ij} = x_{\min(j)} xij=xmin(j) 时, r i j = 1 r_{ij} = 1 rij=1,表示该样本在该指标下的表现最好。
  • x i j = x max ⁡ ( j ) x_{ij} = x_{\max(j)} xij=xmax(j) 时, r i j = 0 r_{ij} = 0 rij=0,表示该样本在该指标下的表现最差。
  • 如果 x i j x_{ij} xij 介于 x min ⁡ ( j ) x_{\min(j)} xmin(j) x max ⁡ ( j ) x_{\max(j)} xmax(j) 之间, r i j r_{ij} rij的值位于 0 和 1 之间。

3. 归一化的目的和意义

  • 统一量纲:将不同量纲的指标统一到同一数值范围(通常为 [0, 1]),便于综合计算和比较。
  • 消除单位影响:通过归一化处理,消除不同单位对分析结果的影响。
  • 明确方向:根据指标的性质(极大化或极小化)调整数据方向,使得所有指标的优化目标一致(即越大越好)。

四、熵权法的原理

4.1 熵权法简介

熵权法(Entropy Weight Method, EWM)是一种客观赋权的方法,常用于多指标决策分析中。熵权法的基本思想是通过计算各指标的信息熵来衡量其在决策中的不确定性程度。指标的信息熵越大,说明该指标的信息越分散,差异性越小,对决策的影响程度越低;相反,信息熵越小,说明该指标的信息越集中,差异性越大,对决策的影响程度越高。

熵权法的优势在于它可以根据数据本身的分布情况,客观地确定各指标的权重,避免了人为主观赋权的干扰。

4.2 熵权法的原理

熵(Entropy)是信息论中的一个重要概念,用于度量系统的不确定性程度。在决策分析中,熵被用来表示指标值的离散程度。具体来说,信息熵越大,表明该指标的分布越均匀,对决策的贡献程度越小。因此,熵权法通过计算各指标的信息熵来确定其在决策中的权重。

4.2.1 信息熵的计算公式

给定一个指标 j j j,其在 n n n 个样本上的值为 x i j x_{ij} xij,熵权法的计算步骤如下:

  1. 标准化处理

    对原始数据进行标准化,消除量纲的影响。常用的标准化方法为极小化和极大化处理:

    r i j = x i j − x min ⁡ ( j ) x max ⁡ ( j ) − x min ⁡ ( j ) r_{ij} = \frac{x_{ij} - x_{\min(j)}}{x_{\max(j)} - x_{\min(j)}} rij=xmax(j)xmin(j)xijxmin(j)

    其中:

    • x i j x_{ij} xij是第 i i i个样本在第 j j j个指标上的值。
    • x min ⁡ ( j ) x_{\min(j)} xmin(j) 是第 j j j 个指标的最小值。
    • x max ⁡ ( j ) x_{\max(j)} xmax(j) 是第 j j j个指标的最大值。

    经过标准化后,所有数据都被归一化到 [0, 1] 区间。

  2. 计算各指标的比重

    计算每个样本在每个指标下的比重(比例系数):

    p i j = r i j ∑ i = 1 n r i j p_{ij} = \frac{r_{ij}}{\sum_{i=1}^{n} r_{ij}} pij=i=1nrijrij

    其中,$ p i j p_{ij} pij 表示第 i i i 个样本在第 j j j 个指标下的比重。

  3. 计算信息熵
    利用信息熵公式计算每个指标的信息熵:

    e j = − k ∑ i = 1 n p i j ln ⁡ ( p i j ) e_j = -k \sum_{i=1}^{n} p_{ij} \ln(p_{ij}) ej=ki=1npijln(pij)

    其中:

    • e j e_j ej 是第 j j j 个指标的信息熵。
    • k = 1 ln ⁡ ( n ) k = \frac{1}{\ln(n)} k=ln(n)1 是一个常数,用于标准化熵值。
    • n n n是样本的数量。
    • p i j = 0 p_{ij} = 0 pij=0 时,定义 p i j ln ⁡ ( p i j ) = 0 p_{ij} \ln(p_{ij}) = 0 pijln(pij)=0
  4. 计算熵权

    根据信息熵计算每个指标的权重:

    w j = 1 − e j m − ∑ j = 1 m e j w_j = \frac{1 - e_j}{m - \sum_{j=1}^{m} e_j} wj=mj=1mej1ej

    其中:

    • w j w_j wj 是第 j j j 个指标的权重。
    • m m m 是指标的数量。
  5. 计算综合得分

    使用计算出的权重,计算每个样本的综合得分:

    S i = ∑ j = 1 m w j ⋅ r i j S_i = \sum_{j=1}^{m} w_j \cdot r_{ij} Si=j=1mwjrij

    其中:

    • S i S_i Si 是第 i i i 个样本的综合得分。
    • r i j r_{ij} rij 是第 i i i 个样本在第 j j j 个指标下的标准化值。

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 老年人养生之道:岁月静好,健康常伴
  • 代码随想录 八股文训练营40天总结
  • Cypress初次安装启动常见问题
  • PyQt5 导入ui文件报错 AttributeError: type object ‘Qt‘ has no attribute
  • SpringCloud从零开始简单搭建 - JDK17
  • 【HTTP】请求“报头”,Referer 和 Cookie
  • Windows控制台中文乱码怎么解决?(nes,一些exe窗口程序)
  • k8s证书过期处理
  • 【2025】中医药健康管理小程序(安卓原生开发+用户+管理员)
  • C#基础知识-.NET,变量,容量单位,数据类型
  • MATLAB系列05:自定义函数
  • android设置实现广告倒计时功能
  • 基于协同过滤+python+django+vue的音乐推荐系统
  • MVC应用单元测试以及请求参数的验证
  • 你必须知道的C语言问题(12)
  • 0x05 Python数据分析,Anaconda八斩刀
  • 77. Combinations
  • Angular Elements 及其运作原理
  • Java方法详解
  • Java精华积累:初学者都应该搞懂的问题
  • jquery ajax学习笔记
  • JS实现简单的MVC模式开发小游戏
  • Linux学习笔记6-使用fdisk进行磁盘管理
  • Python学习之路16-使用API
  • SpiderData 2019年2月13日 DApp数据排行榜
  • vue-cli在webpack的配置文件探究
  • 对象管理器(defineProperty)学习笔记
  • 基于Vue2全家桶的移动端AppDEMO实现
  • 解决iview多表头动态更改列元素发生的错误
  • 今年的LC3大会没了?
  • 警报:线上事故之CountDownLatch的威力
  • 使用 5W1H 写出高可读的 Git Commit Message
  • 使用 Xcode 的 Target 区分开发和生产环境
  • 通过npm或yarn自动生成vue组件
  • 项目管理碎碎念系列之一:干系人管理
  • 学习笔记DL002:AI、机器学习、表示学习、深度学习,第一次大衰退
  • 在weex里面使用chart图表
  • 主流的CSS水平和垂直居中技术大全
  • PostgreSQL 快速给指定表每个字段创建索引 - 1
  • ​1:1公有云能力整体输出,腾讯云“七剑”下云端
  • ​LeetCode解法汇总2808. 使循环数组所有元素相等的最少秒数
  • ​人工智能书单(数学基础篇)
  • ​如何使用ArcGIS Pro制作渐变河流效果
  • #{}和${}的区别?
  • (13):Silverlight 2 数据与通信之WebRequest
  • (26)4.7 字符函数和字符串函数
  • (delphi11最新学习资料) Object Pascal 学习笔记---第2章第五节(日期和时间)
  • (附源码)计算机毕业设计ssm电影分享网站
  • (论文阅读31/100)Stacked hourglass networks for human pose estimation
  • (十八)SpringBoot之发送QQ邮件
  • (图文详解)小程序AppID申请以及在Hbuilderx中运行
  • .NET CF命令行调试器MDbg入门(二) 设备模拟器
  • .net core MVC 通过 Filters 过滤器拦截请求及响应内容
  • .Net Core 中间件验签
  • .net 提取注释生成API文档 帮助文档