2023mathorcup大数据竞赛选题建议及思路

news2025/1/23 10:24:52

大家好呀,昨天6点2023年第四届MathorCup高校数学建模挑战赛——大数据竞赛开赛,在这里给大家带来初步的选题建议及思路。

注意,本文章只是比较简略的图文讲解,更加详细完整的视频讲解请移步:

2023mathorcup大数据数学建模竞赛选题建议及A题B题思路_哔哩哔哩_bilibili

首先是主基调:

本次mathorcup大数据竞赛AB难度都不低,我个人更推荐小白选择A题,B题看似简单,实际上仅第一问就需要迭代最起码上千次时间序列模型做预测,求解十分繁琐,很容易卡壳,而且想做好是很难的。 A虽然略硬核,但只要有matlab,会最基础的导入数据操作(我会教),直接采用我提取特征数据的代码提取特征然后做机器学习分类预测即可。目前我已经提取了301个图片各自4096个特征,下一步准备降维或者直接进行机器学习分类。 预计28-29日更新A完整成品,B不一定做,具体看需求情况,建议尽量还是选A。

接下来详细讲讲初步思路吧:

赛道A:基于计算机视觉的坑洼道路检测和识别

问题1:结合给出的图像文件,提取图像特征,建立一个识别率高、速度快、分类准确的模型,用于识别图像中的道路是正常或者坑洼。

主要就是提取图像特征嘛,题目给了我们301张图片,看一下:

这些图片的名称本身是包含其是否为坑洼路面的信息的。也就是说后面做机器学习的标签是有的。

那第一步就是提取图像特征了,提取出来特征数据,后面就可以做机器学习分类。提取特征之前,先把图像处理成一样的大小,也就是说像素值要一样,不然我们不太方便采用深度学习算法进行特征提取:

像素值大家可以自由设置,具体怎么设置我在论文里到时候也会教。

之后就是深度学习提取特征:

我提取的特征数量是每个图片4096个,所以一共301*4096:

接下来用户这些特征做机器学习就行,当然了,特征数量太多,因此可能存在过拟合或者计算量过大,也许需要特征降维,这个等我具体训练之后看看精度吧。

给大家送一些部分图片的特征表格,看我文章最下方视频讲解。

问题2:对问题1中构建的模型进行训练,并从不同维度进行模型评估。

用一些指标评估精度,调优就行。

赛道B:电商零售商家需求预测及库存优化问题

问题一:使用附件1-4中的数据,预测出各商家在各仓库的商品2023-05-16至2023-05-30 的需求量,请将预测结果填写在结果表1并上传至竞赛平台,并对你们模型的预测性能进行评价。另外请讨论:根据数据分析及建模过程,这些由商家、仓库、商品形成的时间序列如何分类,使同一类别在需求上的特征最为相似?

B题看似简单,实则做起来会很麻烦。要预测各商家在各仓库的商品需求量,我们来看看数据表格:

35个商家:

1212个商品:

54个仓库:

一个商家-商品-仓库组合才是一个序列,每一个序列都有166个完整的时间数据。

所以,我们需要迭代计算最起码上千个时间序列模型并进行精度计算,这个计算量是非常非常大的,别说新手小白,我自己做起来估计也要很久。必须要有丰富的大数据处理相关经验。

当然了,简化一点的做法就是转化为机器学习模型或者先聚类,然后粗略地把每一类做一个预测,但最标准的做法肯定还是第一种。

之后研究如何分类使得特征需求相似:

两种做法,第一种是根据时间序列的特征进行分类,例如残差大小。

第二种更推荐,那就是根据题目的一些分类做分析。题目的附件2-4给出了商家仓库商品的各种分类信息,我们可以做一下统计,举个例子:

 seller_level
 Large      14.244694
 Medium      7.682062
 Small      31.873000
 Special    14.067908
 Name: qty, dtype: float64,
 warehouse _category
 中心仓 24.151613
 区域仓 8.616975
 Name: qty, dtype: float64,
 warehouse _region
 东北 3.384538
 华东 19.891776
 华中 9.006820
 华北 10.390700
 华南 10.989828
 西北 5.365153
 西南 6.719487

可以根据这些进行聚类。

OK,b先讲到这里。

AB的思路讲解后续都还会更新哈。总体而言,本次mathorcup大数据竞赛不算简单,推荐大家选择A,我预计29日前更新完整论文哈,B的话看大家需求的情况再定做不做吧。

OK以上只是比较简略的图文版讲解,我目前正在写A题完整论文,后续会更新哈,视频版讲解以及后续完整成品查看和免费资料领取请点击下方我的个人卡片领取↓:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1144541.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【Opencv4快速入门】轮廓检测findContours

7.2 轮廓检测findContours 7.2.1 轮廓查找findContours7.2.2 轮廓绘制drawContours图像轮廓是指图像中对象的边界,是图像目标的外部特征,这个特征对于图像分析、目标识别和理解更深层次的含义具有重要的作用。 7.2.1 轮廓查找findContours 图像的轮廓补单能够提供物体的边缘,…

Crypto(6)攻防世界-babyrsa

参考文章: [攻防世界adworld] Crypto - babyrsa - 知乎 (zhihu.com) 涉及到的RSA知识点:

systrace/perfetto如何看surfaceflinger的vsync信号方法-android framework实战车载手机系统开发

背景: hi,粉丝朋友们: 大家好!近期分享了surfaceflinger相关的一些blog,有同学就对相关的一些内容产生了一些疑问。 比如:vsync查看问题,即怎么才可以说是vsync到来了。 比如perfetto中surfac…

保姆级教学安装Linux操作系统,以及Linux的语法入门

🏅我是默,一个在CSDN分享笔记的博主。📚📚 🌟在这里,我要推荐给大家我的专栏《Linux》。🎯🎯 🚀无论你是编程小白,还是有一定基础的程序员,这个专…

【性能测试】初识 Jmeter 中的 BeanShell

初识 Jmeter 中的 BeanShell 1.简介1.1 应用场景1.2 BeanShell 类型 2.常用内置变量2.1 log 日志模块2.2 vars 模块2.3 props 模块2.4 prev 模块 3.常见应用场景3.1 Java 文件处理3.2 导入外部 jar 包 BeanShell 是一个小型嵌入式 Java 源代码解释器,完全兼容 Java …

大数据采集技术与预处理学习一:大数据概念、数据预处理、网络数据采集

目录 大数据概念: 1.数据采集过程中会采集哪些类型的数据? 2.非结构化数据采集的特点是什么? 3.请阐述传统的数据采集与大数据采集的区别? ​​​​​​​ ​​​​​​​4.大数据采集的数据源有哪些?针对不同的数…

二叉树的前序、中序和后序非递归

目录 一、前序 二、中序 三、后序 一、前序 力扣(LeetCode)官网 - 全球极客挚爱的技术成长平台 /*** Definition for a binary tree node.* struct TreeNode {* int val;* TreeNode *left;* TreeNode *right;* TreeNode() : val(0)…

C++ 类和对象 (查漏补缺)

Inline 内联函数 内联函数是为了替代宏函数而出来的。 下面用宏实现一个ADD宏函数: 为什么这个ADD宏函数要这么写,首先我们来看,假设这样写: #define ADD(x,y)(xy) 会有什么问题呢? 宏函数是直接替换了&#xf…

FileInputStream文件字节输入流

一.概念 以内存为基准,把磁盘文件中的数据以字节形式读入内存中 二.构造器 public FileInputStream(File file) public FileInputStream(String pathname) 这两个都是创建字节输入流管道与源文件接通 三.方法 public int read() :每次读取一个字节返回,如…

设计模式:原型模式(C#、JAVA、JavaScript、C++、Python、Go、PHP)

上一篇《访问者模式》 下一篇《享元模式》 简介: 原型模式,它是一种创建型设计模式,它允许通过复制原型对象来创建新的对象,而无需知道创建的细节。其工作原…

安装Spring Tool Suite 4的一些问题

1、安装lombok.jar (1)把lombok.jar放到Spring Tool Suite 4的根目录下,java -jar lombok.jar,选择Spring Tool Suite 4,安装。然后SpringToolSuite4.ini里面会自动写入一行 sts4需要额外配置一行参数【-javaagent:lo…

springboot+mybatis-plus实现读写分离

shigen坚持日更的博客写手,擅长Java、python、vue、shell等编程语言和各种应用程序、脚本的开发。坚持记录和分享从业两年以来的技术积累和思考,不断沉淀和成长。 最近shigen加班也比较严重,很多天文章没有更新了,各位读者和伙伴见…

2023/10/28 JAVA学习

导入模块 找到模块路径后,复制到上面,注意导入的是这个 还需要注意,这样导入的话,可能模块不在同一个工程文件里,如果不小心删除这个模块,就不能使用了,所以建议,把原本模块先复制到工程文件中,然后再找模块路径,进行上面操作 还有一种方式新创一个模块,然后把想要导入的模块代…

不一样的网络协议-------KCP协议

1、kcp 的协议特点 1.1、RTO 不翻倍 RTO(Retransmission TimeOut),重传超时时间。tcp x 2,kcp x 1.5,提高传输速度 1.2、选择重传 TCP丢包时会全部重传从该包开始以后的数据,而KCP选择性重传,只重传真正丢失的数据包…

『力扣刷题本』:移除链表元素

一、题目 给你一个链表的头节点 head 和一个整数 val ,请你删除链表中所有满足 Node.val val 的节点,并返回 新的头节点 。 示例 1: 输入:head [1,2,6,3,4,5,6], val 6 输出:[1,2,3,4,5]示例 2: 输入&a…

时序预测 | Matlab实现ARIMA-LSTM差分自回归移动模型结合长短期记忆神经网络时间序列预测

时序预测 | Matlab实现ARIMA-LSTM差分自回归移动模型结合长短期记忆神经网络时间序列预测 目录 时序预测 | Matlab实现ARIMA-LSTM差分自回归移动模型结合长短期记忆神经网络时间序列预测预测效果基本介绍程序设计参考资料 预测效果 基本介绍 时序预测 | Matlab实现ARIMA-LSTM差…

开源B2B网站电子商务平台源码下载搭建 实现高效交易的桥梁

随着互联网的普及和电子商务的快速发展,B2B(Business-to-Business)网站电子商务平台在商业领域中发挥着越来越重要的作用。通过开源B2B网站电子商务平台源码搭建,企业可以构建自己的电子商务平台,实现高效交易的桥梁。…

Claim Proof Bug——Aztec最大的45万美金bug bounty

1. 引言 近期,Aztec Labs通过其Immunefi bug bounty program,发出了其有史以来最大的bug bounty——45万美金,给白帽独立安全研究员lucash-dev,以感谢其所发现的Aztec Connect Claim Proof Bug,基本时间轴为&#xff…

EASEX绘制卡通头像

#include <stdio.h> #include <easyx.h> #include <iostream> #include <math.h> #define PI 3.14 // 1PI 180度 2PI 360度int main() {// 创建1024*1024的窗体initgraph(1024, 1024);// 将背景颜色设施为白色setbkcolor(WHITE);cleardevice();// to…