如何评价2023年亚太杯数学建模竞赛?

news2024/11/25 23:25:59

APMCM亚太数学建模大赛的含金量在数学建模比赛中虽然不是最高水平,但是也属于比较高的水平了,值得参加试一试。

比如本次C题,

问题一:研究分析影响中国新能源汽车发展的主要因素,建立数学模型,描述这些因素对中国新能源汽车发展的影响。一般在建立模型前需要进行数据搜集与处理。

一般在数据分析或者建模前均需要进行数据预处理,比如对数据进行清洗,转换等等,数据预处理一般是减少数据分析和建模过程中的错误和偏差,所以进行数据预处理是十分有必要的,常见的数据预处理方式有异常值处理、缺失值处理、量纲化处理以及数据标签和数据编码。

异常值处理:

异常值也称离群值,也就是一组数据中,具有显著不同的特征或者数值的数据点,比如身高的数据中有一人身高为10m等等。常见的鉴别异常值标准由数字超过某个标准值,或者超过3倍标准差之外等。检验异常值的方法常见的有描述分析法、聚类、KNN以及图示法等,其中描述分析法和图示法比较简便,,如果数据中有异常值一般会设置null值(不参与分析)或者使用平均值、中位数、众数、随机数等进行填补。

4d09d4b9616c4f1cb64efe8765845153.jpg

缺失值处理

缺失值即在搜集数据或者进行实验等等,缺失的数据,对于缺失值处理常见的方法有将记录删除、直接分析(不进行处理)、线性插值以及该点线性趋势插值。

线性插值:在插值节点上的插值误差为0,只能用于一维数据。

线性趋势插值:在线性插值的基础上,对每个节点进行一次线性回归,得到该点的线性趋势,可以用于多维数据。

量纲化处理:

除了对异常值和缺失值处理外,一般数据还需要处理量纲问题,常见的量纲处理有标准化、归一化、中心化、正向化、逆向化、适度化、区间化等等。 

19a7b1e082934bf5898422014a8a1f0e.jpg

标准化:适用于数据分布不平衡情况,可以使得不同特征之间的数值范围不同的情况下,进行特征之间的比较,一般应用于聚类分析、主成分分析、探索性因子分析等较多。

归一化:适用于数据分布平衡的情况,使得不同特征之间的数值范围相同的情况下,进行特征之间的比较,但是如果数据中有异常值对归一化后的数据影响较大。

中心化:使不同特征之间的数据范围相同,中心化处理一般适用于数据分布不平衡且不需要进行特征之间的比较的情况。

正向化:一般多应用于评价模型中,正向的指标正向化,这种方法适用于指标值越大越好的情况,比如在分析中产品合格率等。

逆向化:一般多应用于评价模型中,逆向的指标逆向化,这种方法适用于指标值越小越好的情况,比如工厂的污染情况等。

适度化:这种方法适用于指标值差异较大的情况,比如消费者对某产品的满意度等。

区间化:这种方法适用于将数据固定压缩到某个范围内,区间化应该比较广,比如产品的质量控制等等。

数据编码及标签:

有的数据比如涉及赋值,1代表高中,2代表大专,3代表本科等等需要数据编码处理,其它如果数据组合形式或者反向题处理,也需要使用数据编码进行处理。数据标签一般用于标识数字的意义,比如某组数据中1代表不满足,2代表一般等等。

关系模型常见包括相关分析、差异分析、回归分析,在数学建模中关系模型可以解决很多问题。

相关分析

相关分析是解决数据之间相关性的一大类问题,不仅有常用的pearson相关,还有Spearman相关、kendall相关、偏相关分析。典型相关分析以及散点图等。 

a179d796bae24bf7bee072ee264a869d.jpg

差异分析

差异分析一般用于检测数据之间是否有差异以及差异是否显著,常见的差异分析有方差分析、t检验、卡方检验以及非参数检验,一般方差分析和t检验需要数据服从正态分布,如果不服从正态分布可以考虑使用非参数检验。

3029b8a37a094e45aa0cb4a35e8fb1a1.jpg

回归分析

回归分析一般研究变量间的影响关系,自变量对因变量的影响,常见的回归模型有线性回、logistic回归、生存分析等。如果因变量为定量数据则使用线性回归更合适,如果因变量为定类变量则使用logistic回归更合适。 

fae9d374b79b45b39a1f6d873415ae73.jpg

问题2 涉及预测模型

数学建模中的预测模型一般利用数据进行建立模型预测未来的趋势或者结果的方法,从而达到解决问题的目的,常见的方法有时间序列、回归分析、机器学习、马尔科夫预测或者其它方法组合预测等等。

d091aae9487341f5b127e49c3a7254cb.jpg

 

其中时间序列模型包括,ARIMA预测、指数平滑法、灰色预测模型、VAR模型以及季节Sarima模型。具体说明如下:

0098533e581847efa7adb06144164f0d.jpg 

 回归分析包括多元线性回归、logistic回归以及非线性回归等,机器学习包括决策树、随机森林、支持向量机、KNN、神经网络以及朴素贝叶斯等,具体可以参考以上描述的。

问题3分析对全球传统能源汽车行业的影响

可以使用回归模型或者权重评价分析等,具体的已经为大家整理好可以收藏此篇回答以备不时之需。

无论选择哪一个题型都需要使用数学模型进行解决模型,那么常见的数学模型有哪些呢?总结如下:

388c5e4cf14645a39396a6609f315802.jpg

01数据预处理

一般在数据分析或者建模前均需要进行数据预处理,比如对数据进行清洗,转换等等,数据预处理一般是减少数据分析和建模过程中的错误和偏差,所以进行数据预处理是十分有必要的,常见的数据预处理方式有异常值处理、缺失值处理、量纲化处理以及数据标签和数据编码。

异常值处理:

异常值也称离群值,也就是一组数据中,具有显著不同的特征或者数值的数据点,比如身高的数据中有一人身高为10m等等。常见的鉴别异常值标准由数字超过某个标准值,或者超过3倍标准差之外等。检验异常值的方法常见的有描述分析法、聚类、KNN以及图示法等,其中描述分析法和图示法比较简便,,如果数据中有异常值一般会设置null值(不参与分析)或者使用平均值、中位数、众数、随机数等进行填补。 

fded083d44dc4b1cbb539118c95327fd.jpg

 缺失值处理

缺失值即在搜集数据或者进行实验等等,缺失的数据,对于缺失值处理常见的方法有将记录删除、直接分析(不进行处理)、线性插值以及该点线性趋势插值。

线性插值:在插值节点上的插值误差为0,只能用于一维数据。

线性趋势插值:在线性插值的基础上,对每个节点进行一次线性回归,得到该点的线性趋势,可以用于多维数据。

量纲化处理:

除了对异常值和缺失值处理外,一般数据还需要处理量纲问题,常见的量纲处理有标准化、归一化、中心化、正向化、逆向化、适度化、区间化等等。

277f44e0da94426fbb3f5fa3809a0170.jpg

标准化:适用于数据分布不平衡情况,可以使得不同特征之间的数值范围不同的情况下,进行特征之间的比较,一般应用于聚类分析、主成分分析、探索性因子分析等较多。

归一化:适用于数据分布平衡的情况,使得不同特征之间的数值范围相同的情况下,进行特征之间的比较,但是如果数据中有异常值对归一化后的数据影响较大。

中心化:使不同特征之间的数据范围相同,中心化处理一般适用于数据分布不平衡且不需要进行特征之间的比较的情况。

正向化:一般多应用于评价模型中,正向的指标正向化,这种方法适用于指标值越大越好的情况,比如在分析中产品合格率等。

逆向化:一般多应用于评价模型中,逆向的指标逆向化,这种方法适用于指标值越小越好的情况,比如工厂的污染情况等。

适度化:这种方法适用于指标值差异较大的情况,比如消费者对某产品的满意度等。

区间化:这种方法适用于将数据固定压缩到某个范围内,区间化应该比较广,比如产品的质量控制等等。

数据编码及标签:

有的数据比如涉及赋值,1代表高中,2代表大专,3代表本科等等需要数据编码处理,其它如果数据组合形式或者反向题处理,也需要使用数据编码进行处理。数据标签一般用于标识数字的意义,比如某组数据中1代表不满足,2代表一般等等。

02基本描述

在正式分析前,还需要对数据的基本情况进行了解,比如数据最大值。最小值等等。常见查看数据基本特征的方法有统计分析法和图示法,统计分析法包括描述分析、频数分析以及分类汇总,图示法包括散点图、箱线图、直方图、簇状图、组合图以及帕累托图等。其中统计分析法是根据数据分析结果进行分析数据的特征,图示法主要是根据图形结合统计知识进行分析,图示法相对直观,统计分析法相对客观。

统计分析法: 

2f860e3c85474a349ba67c3d613d845a.jpg

03关系模型

关系模型常见包括相关分析、差异分析、回归分析,在数学建模中关系模型可以解决很多问题。

相关分析

相关分析是解决数据之间相关性的一大类问题,不仅有常用的pearson相关,还有Spearman相关、kendall相关、偏相关分析。典型相关分析以及散点图等。 

3726731e347c4bc1a70417b0249fd0b8.jpg

差异分析

差异分析一般用于检测数据之间是否有差异以及差异是否显著,常见的差异分析有方差分析、t检验、卡方检验以及非参数检验,一般方差分析和t检验需要数据服从正态分布,如果不服从正态分布可以考虑使用非参数检验。 

dd5c386c49df411abff14fafb09df8d9.jpg

920fcf7ef6164d318f4c07d01a037f10.jpg 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1835331.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

数据瀑布图升级(自备)

目录 数据整理 初级绘图 升级细节 绘制点图添加曲线和特征筛选-CSDN博客 肿瘤免疫反应瀑布图(源于The Miller Lab)_肿瘤瀑布图-CSDN博客 数据整理 rm(list ls()) library(ggplot2) library(dplyr) library(ggrepel)##防止标签重叠 #模拟数据 dat…

Linux-DNS域名解析服务01

BIND 域名服务基础 1、DNS(Domain Name System)系统的作用及类型 整个 Internet 大家庭中连接了数以亿计的服务器、个人主机,其中大部分的网站、邮件等服务器都使用了域名形式的地址,如 www.google.com、mail.163.com 等。很显然…

Vue02-第一个Vue程序

第一个Vue程序 1、什么是MVVM MVVM(Model-View-ViewModel)是一种软件设计模式,由微软WPF(用于替代WinForm,以前就是用这个技术开发桌面应用程序的)和Silverlight(类似于Java Applet&#xff0…

Windows 安装 java 环境

搭建java开发环境 java的产品叫JDK(java开发者工具包),必须安装JDK才能使用Java。 一、下载——java下载网址 二、安装 直接全部下一步就行,(安装路径可以更换一下)。 配置JAVA_HOME环境变量, 安装完成后…

css-Echarts图表柱状图,X轴横坐标值显示不完全问题

1.问题 在Echarts图表中当横坐标数值过多,或者数值过长时会导致部分横坐标不显示。数据量少或简单会默认显示完全,当放大时会导致部分横坐标隐藏。 更改第一个Mon字段名 会发现偶数横坐标显示隐藏; 2.解决方法 2.1 在x横坐标中添加interval…

办理无区域名称公司核名流程和条件及时间说明

无行政区划公司是指公司名称中不带有对应的行政区划,经营上不受地方限制。其名称需要通过国家工商总局核名,核名成功后会颁发《名称核准通知书》。之后便可以进行印章制作、银行开户等流程。详情致电咨询我或者来公司面谈。 公司国家局核名的步骤包括&am…

Node.js版本管理工具-NVM

在开发 Node.js 项目时,经常会遇到需要切换不同版本的 Node.js 的情况。为了方便管理和切换各个版本,我们可以使用一些 Node.js 版本管理工具。 Node Version Manager:简称NVM,最流行的 Node.js 版本管理工具之一。它允许我们在同…

AI大模型落地应用场景:LLM训练性能基准测试

随着 ChatGPT 的现象级走红,引领了AI大模型时代的变革,从而导致 AI 算力日益紧缺。与此同时,中美贸易战以及美国对华进行AI芯片相关的制裁导致 AI 算力的国产化适配势在必行。之前也分享过一些国产 AI 芯片、使用国产 AI 框架 Mindformers 基…

工业物联网关为智能制造业提供哪些支撑?天拓四方

随着科技的飞速发展,智能制造业已成为工业领域的转型方向。在这一转变中,工业物联网关发挥着至关重要的作用。作为连接物理世界与数字世界的桥梁,工业物联网关不仅实现了设备与设备、设备与云平台之间的互联互通,更通过实时数据采…

post为什么会发送两次请求详解

文章目录 导文跨域请求的预检复杂请求的定义服务器响应预检请求总结 导文 在Web开发中,开发者可能会遇到POST请求被发送了两次的情况,如下图: 尤其是在处理跨域请求时。这种现象可能让开发者感到困惑,但实际上它是浏览器安全机制…

Linux安装MySQL以及远程连接

1、Linux安装MySQL 1.1、准备解压包 MySQL5.x解压包 提取码:9y7n 1.2、通过rpm脚本安装 切记安装顺序:common --> libs --> client --> server 因为它们之间存在依赖关系,所以务必按照顺序安装 安装前请确保当前目录/文…

金融科技行业的融资趋势、投资者关注及未来预测

一、金融科技行业的融资趋势 金融科技行业的融资趋势近年来展现出强劲的增长势头,具体表现在以下几个方面: 融资规模持续扩大: 根据《全球金融科技投融资趋势报告(2023年上半年)》,2023年上半年全球金融科技行业投融资事件总次数…

防泄密解决方案

防泄密解决方案是一个系统性的策略,旨在保护敏感信息不被非法获取、泄露或滥用。以下是一个结构清晰、分点表示的防泄密解决方案,结合了参考文章中的关键信息和建议: 一、策略制定与政策明确 明确数据分类:将数据分为公开、内部…

【区块链】POS(Proof of Stake)权益证明算法深度解析

🌈个人主页: 鑫宝Code 🔥热门专栏: 闲话杂谈| 炫酷HTML | JavaScript基础 ​💫个人格言: "如无必要,勿增实体" 文章目录 POS(Proof of Stake)权益证明算法深度解析引言1. POS基本…

【方法】如何隐藏和保护Excel表格中的敏感数据?

在工作中,很多人经常需要处理包含敏感信息的Excel表格。 为了确保这些数据的安全性,我们可以通过隐藏单元格、行和列,以及设置密码保护工作表的方法,来保护数据,下面一起来看看吧! 一、隐藏数据&#xff1…

微信商城源码带分销功能 支持微信小程序+公众号端 含详细图文搭建教程

分享一款微商城源码系统,不仅支持微信公众号端和小程序端二合一管理,带分销机制,集合了市面上电商系统的功能,并增加了多项全新特色功能,如多商户商家入驻、区域代理、收银台、互动直播等,为商家提供了全方…

Go——channel

channel是Go在语言层面提供的协程间的通信方式。通过channel我们可以实现多个协程之间的通信,并对协程进行并发控制。 使用注意: 管道没有缓冲区时,从管道中读取数据会阻塞,直到有协程向管道中写入数据。类似地,向管道…

动手学深度学习(Pytorch版)代码实践 -深度学习基础-13Kaggle竞赛:2020加州房价预测

13Kaggle竞赛:2020加州房价预测 # 导入所需的库 import numpy as np import pandas as pd import torch import hashlib import os import tarfile import zipfile import requests from torch import nn from d2l import torch as d2l# 读取训练和测试数据 train_…

哈尔滨等保测评流程

哈尔滨的等保测评程序是一项严格的、系统化的检测程序,其目的在于保证信息系统的安全、稳定。下面详细介绍了这个过程: 一、引言 随着信息技术的飞速发展,信息系统在各行各业中的应用越来越广泛,信息安全问题也日益凸显。为了保障…

使用CSS常见问题解答卡片

常见问题解答卡片 效果展示 CSS 知识点 CSS 选择器的使用background 渐变背景色运用CSS 综合知识运用 页面整体布局 <div class"container"><h1>经常问的问题</h1><!-- 这里只是展示一个项目 --><div class"tab"><in…