【数学建模】数据的无量纲化处理 2005建模A题:长江水质综合评价与预测

news2024/11/16 19:56:06

数据的无量纲化处理是一种统计学中的预处理技术,主要用于消除数据中的量纲影响,使得不同单位或量级的指标可以相互比较和结合。无量纲化通过调整数据的范围或尺度,使得数据集中的每个特征或变量处于相似的数值区间内。以下是几种常见的无量纲化处理方法:

  1. 极值化(Min-Max Scaling 或 归一化 Normalization)
    将数据缩放到[0, 1]或[-1, 1]的区间内,公式为:
[
X_{\text{norm}} = \frac{X - X_{\text{min}}}{X_{\text{max}} - X_{\text{min}}}
]

  2. 标准化(Standardization 或 Z-score normalization)
    在这里插入图片描述

  3. 均值化(Mean Normalization)
    使数据具有零均值,但不一定单位方差,公式为:
[
X_{\text{mean}} = \frac{X - \mu}{X_{\text{max}} - X_{\text{min}}}
]

在这里插入图片描述

在具体应用中,选择哪种无量纲化方法取决于数据的特点和后续分析的需求。例如,如果数据的分布未知或非正态,可能更倾向于使用极值化;如果数据的分布接近正态,则标准化可能更为合适。

示例
假设我们有两个指标,一个是员工的年龄(范围从20到60),另一个是他们每天的步数(范围从5000到30000)。如果我们想对这两个指标进行比较,我们需要首先进行无量纲化处理。

对于年龄,假设最小值是20岁,最大值是60岁。使用极值化公式,我们可以将年龄缩放到[0, 1]的范围内。对于步数,同样地,我们可以用同样的方法进行缩放。这样,处理后的数据就可以在同一尺度上进行比较和分析了。

在这里插入图片描述
在这里插入图片描述
在进行综合评价之前,确实需要对评价指标进行标准化处理,以消除不同量纲和量级的影响。这个过程称为无量纲化,它确保了所有指标可以在同一尺度上比较,避免了综合评价中的偏差。对于效益型、成本型和固定型指标,无量纲化的方式有所不同。

给定的实测数据矩阵 (X) 和评价标准矩阵 (Y) 如下所示:
[
X = \begin{bmatrix}
130 & 10.3 & 0.35 & 2.76 \
105 & 10.7 & 0.4 & 2.0 \
20 & 1.4 & 4.5 & 0.22 \
30 & 6.26 & 0.25 & 1.67 \
20 & 10.13 & 0.5 & 0.23
\end{bmatrix},
Y = \begin{bmatrix}
4 & 23 & 110 & 660 \
0.09 & 0.36 & 1.8 & 7.1 \
12 & 2.4 & 0.55 & 19 \
0.02 & 0.06 & 0.31 & 1.2 \
0.1 & 0.1 & 0.1 & 0.1
\end{bmatrix}
]

其中,(X) 表示实测数据,(Y) 表示评价标准。接下来,我们构建无量纲化后的实测数据矩阵 (A) 和等级标准矩阵 (B)。

无量纲化方法

对于 效益型指标,使用最大值标准化,即 (\frac{x_{ij}}{\max(x_j)})。

对于 成本型指标,使用最小值标准化,即 (\frac{x_{ij}}{\min(x_j)})。

对于 固定型指标,可以使用目标值标准化,即 (\left|\frac{x_{ij}-target_j}{target_j}\right|),其中 (target_j) 是目标值。
在这里插入图片描述

建立无量纲化矩阵

对于实测数据矩阵 (X) 中的每一列(即每一个评价指标),根据其属性应用上述方法进行无量纲化,得到无量纲化实测数据矩阵 (A)。

同样地,对评价标准矩阵 (Y) 进行相应的无量纲化处理,得到无量纲化等级标准矩阵 (B)。

例如,对于 总磷(效益型指标),使用最大值标准化;对于 耗氧量(成本型指标),使用最小值标准化;对于 透明度总氨(假设为固定型指标),使用目标值标准化。

这样,通过无量纲化处理后,所有的指标都在同一尺度上,可以进行下一步的综合评价计算,比如使用加权平均法、TOPSIS法或其他多准则决策方法来得出最终的综合评价结果。

在这里插入图片描述
在这里插入图片描述
要对湖泊水质的富营养化进行综合评价,我们首先需要分析给定的四个指标(总磷、耗氧量、透明度、总氨)对水质评价的影响。富营养化通常是由过量的营养物质,尤其是磷和氮,导致藻类过度生长引起的,这会影响水体的透明度和溶解氧水平。接下来,我们将依据给定的评价标准,对这四个指标进行分析,并对湖泊水质进行综合评价。

分析指标作用

  1. 总磷(Total Phosphorus):总磷是富营养化的主要驱动因素,高浓度的总磷会导致藻类大量繁殖,加速富营养化进程。西湖、东湖和巢湖的总磷浓度远高于青海湖和滇池,显示出更高的富营养化风险。

  2. 耗氧量(Chemical Oxygen Demand, COD):耗氧量反映水中有机物含量,间接指示富营养化程度。西湖、东湖和巢湖的耗氧量较高,说明这些湖泊中可能有较多的有机污染物,这与总磷浓度高的趋势一致。

  3. 透明度(Transparency):低透明度往往与高藻类密度相关,藻类过多会降低水体的透明度。西湖、东湖和巢湖的透明度较低,表明藻类密度可能较高,滇池的透明度相对较好,但总磷和总氨的浓度仍显示其富营养化问题。

  4. 总氨(Total Ammonia):总氨是另一种重要的营养盐,虽然其对富营养化的影响不如总磷明显,但高浓度的总氨仍能促进藻类生长。西湖和巢湖的总氨浓度较高,表明它们也面临着氮源富营养化的压力。

综合评价

为了综合评价湖泊水质,我们将对照湖泊水质评价标准(表2-3),对每个湖泊进行等级评定。由于评价标准未提供确切的数值界限,我们将使用给出的区间进行大致判断。

杭州西湖
  • 总磷:富营养
  • 耗氧量:富营养
  • 透明度:极富营养
  • 总氨:中营养

综合来看,西湖水质等级接近富营养至极富营养。

武汉东湖
  • 总磷:富营养
  • 耗氧量:富营养
  • 透明度:极富营养
  • 总氨:贫营养

东湖水质等级接近富营养至极富营养。

青海湖
  • 总磷:贫营养
  • 耗氧量:贫营养
  • 透明度:中营养
  • 总氨:贫营养

青海湖水质等级接近贫营养。

巢湖
  • 总磷:中营养
  • 耗氧量:中营养
  • 透明度:极富营养
  • 总氨:贫营养

巢湖水质等级接近中营养至富营养。

滇池
  • 总磷:贫营养
  • 耗氧量:富营养
  • 透明度:贫营养
  • 总氨:贫营养

滇池水质等级接近贫营养至富营养。

综上所述,西湖、东湖和巢湖面临较为严重的富营养化问题,而青海湖和滇池的状况相对较好,但仍存在局部富营养化现象。对于治理措施,应当针对总磷和总氨的来源进行管控,比如减少农业面源污染,加强污水处理,控制入湖污染物排放,同时实施生态修复工程,提升湖泊自净能力。

% 实测数据矩阵
X = [130 10.3 0.35 2.76;
     105 10.7 0.4 2.0;
     20 1.4 4.5 0.22;
     30 6.26 0.25 1.67;
     20 10.13 0.5 0.23];

% 评价标准矩阵
Y = [1 4 23 110 660;
     0.09 0.36 1.8 7.1 27.1;
     37 12 2.4 0.55 0.17;
     0.02 0.06 0.31 1.2 4.6];

% 无量纲化处理
% 假设第1列和第2列为成本型指标,第3列和第4列为效益型指标
A1 = X(:,1) ./ max(X(:,1)); % 成本型指标 - 总磷
A2 = X(:,2) ./ max(X(:,2)); % 成本型指标 - 耗氧量
A3 = X(:,3) ./ min(X(:,3)); % 效益型指标 - 透明度
A4 = X(:,4) ./ min(X(:,4)); % 效益型指标 - 总氨
A = [A1 A2 A3 A4];

% 标准化评价标准
% 假设第1列至第5列为成本型指标
B = Y / max(Y); % 所有指标视为成本型指标进行标准化

% 计算权重
w = std(B) ./ sum(std(B));

% 计算距离
% 注意:dist() 和 mandist() 不是MATLAB内置函数,需要自定义或使用其他函数代替
% 这里使用欧式距离作为示例
jd = sqrt(sum((A - B') .^ 2, 2));
mjd = jd; % 假设 mjd 为某种距离计算方式,这里直接使用欧式距离

% 输出结果
disp('标准化后的实测数据矩阵 A:');
disp(A);
disp('标准化后的评价标准矩阵 B:');
disp(B);
disp('权重 w:');
disp(w);
disp('距离 jd:');
disp(jd);

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1909329.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

[图解]SysML和EA建模住宅安全系统-13-时间图

1 00:00:00,480 --> 00:00:02,280 首先,我们来看,图画在哪里 2 00:00:02,290 --> 00:00:04,380 这个图 3 00:00:04,390 --> 00:00:06,180 你看,它是描述,刚才讲的 4 00:00:06,190 --> 00:00:09,010 描述这个活动 …

【数学建模】2005建模A题:长江水质综合评价与预测

数据的无量纲化处理 数据的无量纲化处理是一种统计学中的预处理技术,主要用于消除数据中的量纲影响,使得不同单位或量级的指标可以相互比较和结合。无量纲化通过调整数据的范围或尺度,使得数据集中的每个特征或变量处于相似的数值区间内。以…

NISP证书备考指南与经验分享

在信息安全领域,NISP(国家信息安全水平考试)作为衡量专业能力的重要标尺,不仅是职场晋升的敲门砖,更是个人技能提升的关键一步。面对这一挑战,如何高效备考,成为众多学员关注的焦点。今天,为您精心打造这份…

Zotero软件翻译插件Translate for Zotero的API接入方法--百度垂直领域翻译

首先注册通用文本翻译API的token:百度翻译开放平台 (baidu.com)(可以免费认证 升级为高级版) 之后点击管理控制台,选择总览右侧最下方可以看到个人的id和密码 点击文档与支持, 在这里可以选择领域。 支持传入值描述支持语言方向…

matplotlib颜色对照表

matplotlib的色彩设置: #------------------------------------------------------------------------------------------------------------------------------- #-------------------------------------------------------------------------------------------------------…

本地LLM VLM性能评测

作为一名数据工程师,我对测试一些生成式 AI 模型并在本地安装/运行模型很感兴趣。大型语言模型 (LLM) 和视觉语言模型 (VLM) 是最有趣的。OpenAI 提供了 ChatGPT 网站和移动应用程序。微软创建了 Windows 11 Copilot 供我们使用。但是,我们无法控制哪些数…

PCB翘曲如何修复?

怎么样的PCB板才算板翘曲? 在实际生产中,PCB都不是100%平整,或多或少都会有点弯曲。那PCB翘曲标准是多少? 据IPC《刚性印制板的鉴定与性能规范》要求中,生产电路板允许最大翘曲和扭曲为0.75%-1.5%之间。 按照IPC标准&a…

DBA 数据库管理 部署Mysql 服务,基础查询

数据库:存储数据的仓库 数据库服务软件: 关系型数据库: 存在硬盘 ,制作表格的 数据库的参数 [rootmysql50 ~]# cat /etc/my.cnf.d/mysql-server.cnf 主配置文件 [mysqld] datadir/var/lib/mysql 存放数据库目录…

智谱AI开源代码生成大模型 CodeGeeX4-ALL-9B

智谱AI 旗下的代码生成大模型 CodeGeeX 正式发布第四代开源版本:CodeGeeX4-ALL-9B,其是集代码补全和生成、代码问答、代码解释器、工具调用、联网搜索、项目级代码问答等能力于一体的代码大模型,是目前百亿(10B)参数以…

299k stars利用Public APIs提升开发效率:探索APILayer提供的开源资源

299k stars利用Public APIs提升开发效率:探索APILayer提供的开源资源 在现代软件开发中,API(应用程序接口)是实现应用间通信和功能扩展的关键工具。公共API(Public APIs)则为开发者提供了宝贵的资源&#…

2024QS世界大学学科排名(各学科详细)

2024QS全球高校学科排名附榜单: 人文与艺术相关学科全球Top10 社会科学与管理相关学科全球Top10 自然科学相关学科全球Top10 工程与技术相关学科全球Top10 生命科学与医学相关学科全球Top10

Matlab基础语法篇(上)

Matlab基础语法(上) 一、基知(一)界面介绍(二)常用快捷键(三)常用指令(四)Matlab帮助系统 二、运算基础(一)变量(二&#…

几级系统需要做等保?

正常来说只要是在运营的系统都需要做等保,无论是内网还是外网,等保常见的系统一般分成五个级别,一级最低,五级最高,不同级别的系统国家的监管程度也不一样,具体如下: 第一级:系统运…

暑期备考2024小学生古诗文大会:吃透真题和知识点(持续)

2024年上海市小学生古诗文大会的自由报名初赛将于10月19日(星期六)正式开始,还有3个多月的时间。 为帮助孩子们备考,我持续分享往年上海小学生古诗文大会真题,这些题目来自我去重、合并后的1700在线题库,每…

跨境传输需要遵守哪些准则,如何做到有效管控?

在全球化的商业环境中,跨国企业面临着数据跨境传输的挑战。随着业务的扩展,企业需要在不同国家和地区之间高效、安全地传输大量数据。选择合适的跨境传输方案对于保障数据安全、提高业务效率、遵守法律法规至关重要。 跨境传输数据需要遵守的准则和规定主…

【机器学习】特征选择:精炼数据,提升模型效能

🌈个人主页: 鑫宝Code 🔥热门专栏: 闲话杂谈| 炫酷HTML | JavaScript基础 ​💫个人格言: "如无必要,勿增实体" 文章目录 特征选择:精炼数据,提升模型效能引言为何进行特征选择&a…

消费盲返模式,让消费者真实消费的钱返利回来?

盲返模式是一种基于消费者参与的商业模式,其核心在于通过购买指定产品或服务,消费者能够获得一定比例的利润分配,但具体返利金额是不确定的,因此被称为“盲返”。这种模式以其独特的优势和创新的玩法,在电商领域尤其是…

企业微信hook接口协议,移除群成员通知

移除群成员通知 返回示例 {"flag": 0, "receiver": 0, "sender_name": "", "is_room": 1, "server_id": 15318083, "send_time": 1687688952, "sender": 1688855749266556, "referid&…

编程范式之函数式编程

目录 前言1. 函数式编程的定义2. 函数式编程的特点2.1 纯函数2.2 不可变性2.3 高阶函数2.4 惰性求值 3. 函数式编程的应用场景3.1 并行计算3.2 数据分析3.3 Web开发 4. 函数式编程的优缺点4.1 优点4.2 缺点 5. 代表性的编程语言5.1 Haskell5.2 Scala5.3 Clojure 6. 示例代码结语…

Android手机恢复出厂设置后可以恢复数据吗?

“我有一台小米 8 Lite,上周我收到了 OTA 更新作为通知。在执行此操作时,手机崩溃并进入启动循环。没有办法检索数据,所以我最终擦除了它。现在,我想问一下是否真的有任何有用的应用程序/程序可以在恢复出厂设置后从Android手机恢…