2024年美赛F题超详细思路

news2024/10/6 4:07:06

Problem F: Reducing Illegal Wildlife Trade

美赛F题以非法野生动物贸易为背景进行命题,需要我们选择客户进行一系列的问题。本文正式解题前需要收集客户的数据以及数据预处理。对于客户的选择,这里考虑的点在于该客户需要能够对非法贸易交易产生影响。因此,本次基于这一点选择了国家为客户,收集了现在世界上253个国家的1000多项指标数据作为自变量。这也是跟大家免费分享的数据集中所提及的数据。

(注释:大家如果需要其他,数据集中没有的数据,欢迎大家留言,我们会尽力帮大家收集)

美赛分享数据

https://pan.baidu.com/s/17IX4yZKr_CadiOJIp7yLYQ
提取码:sxjm

对于选择因变量,即使用何种数据表示非法野生动物贸易,这里再第二波给大家收集的数据中为大家分享了各种美国野生动物、非法获取动物数据中有所展示。(该数据集还不完善,后续会继续补充)使用该数据中的部分指标作为因变量即可。 

刚才所有的工作可以理解为是指标的构建,我们需要构建去解决这个问题的大致框架,类似于之前助攻的华数杯、亚太,形成下面的框架体系。 

问题一、您的客户是谁?那个客户到底能做些什么呢?(换句话你的客户应该拥有实施你 提出的项目所需的权力、资源和兴趣。)

问题一,题设是客户是谁,其实问题一的本质就是让我们选择本次的客户主体并构建指标评价体系,根据指标评价体系收集数据。对于收集的数据集我们还需要进行数据清洗工作,即进行异常值、缺失值、数据降维等工作。

确定收集到的数据指标后,就是整理数据。建议大家可以绘制几张折线图(图一这种的)等,完成对收集到数据的描述,对于数据预处理,包括缺失值处理、异常值处理、数据降维等。异常值处理,首先判定数据分布方式,对于正态分布的数据利用3西格玛原则判定异常值;非正态分布的数据利用箱型图判定异常值。对于判定的异常值进行剔除处理,变为缺失值。

对缺失值,两部分既有数据收集本身所有的,还有就是异常值处理带来的异常值。这里比较建议大家选择线性插值(平均值插值、克里斯插值等都是可以的)。对于较高维度的数据,还可以选择就降维处理。

如果大家选择了7-10个指标,数量合适不需要进行降维。但是如果选择了超过十个指标,使用过多的指标分析问题会使得问题复杂化。对于过多的指标,我们需要进行降维处理。即使用KMO检验判定指标之间关系,通过检验使用线性降维:主成分分析等方法,未通过检验则应该使用T-SNE等非线性降维方法。

 

问题二、解释为什么您开发的项目适合这个客户。从已发表的文献和你自己的分析中,有哪些 研究支持你所提议的项目的选择?使用数据驱动的分析,你将如何说服你的客户,这是一个他们应该承担的项目?

问题二,有两部分其一,需要我们对选择的指标评价体系进行分析。其二,需要进行驱动分析说服客户。对于第一小问,我们可以使用一些文献支撑或文章报道进行验证即可。对于第二问,需要我们使用数据分析驱动,即我们可以使用原有数据直接进行预测,与我们5年项目进行比对分析,根据结果来说服客户即可。

对于预测模型的选择,我们可以在下图根据介绍进行选择。回归预测、灰色预测、时间序列、机器学习都是可以的。模型的选择大家只需要知道,只要大方向对即可。数模是没有绝对的对与错之分。对于问题二,使用数据驱动,个人认为可以使用有无五年项目的干预的预测结果进行会对即可。

对于该问题,应该就是小样本短期预测,大家可以根据使用范围选择合适的方法即可。

 

问题三、您的客户执行该项目还需要哪些额外的权力和资源?(记住要使用假设,但也要尽可 能地把你的工作建立在现实中。)

问题三,初步看来可以理解为是一个定性分析的问题,也可以理解为指标体系的扩建。即问我们还可以能加那些指标来表示额外的权力和资源。既可以用一定的文字进行描述分析;也可以根据一些文献支撑寻找一些其他的指标描述权利和资源。

问题四、如果这个项目得以实施,将会发生什么?换句话说,对非法野生动物贸易的可衡量的影响将是什么?你做了什么分析来确定这个问题?

问题四、问题实质在于需要我们确定影响非法野生动物贸易影响。即在问题三的基础上,进一步改进指标评价体系。利用新的指标评价体系预测实行五年项目后会出现什么样的结果。即需要我们利用五年项目进行预测。

这里两种方法,一、进行十年乃至二十年的中长期预测,对之后长久地事件进进行分析。二、仅仅预测五年项目实现后,五年内每一年的具体数据,分析五年内的数据。无论那种方式,究其本质还是预测。这一问的预测可以与问题二相同,这样可以凸显问题的整体性。也可以比问题二的预测模型高级一些,这样增增递进,整体复杂度不错。

比如,问题二是三元线性预测模型,问题四经过问题三的新指标引入变成了五元非线性模型,从而实现模型的改进,这是可行的。

还可以使用更加高级、复杂度更好的预测模型:建立加权平均预测(arima、lstm、多元回归模型),个人最喜欢的模型,模型复杂度很高,但是主要问题就是篇幅很长,可能25页的篇幅限制会超出限制。有点自卖自夸的嫌疑,但是这个就是我们保奖模版的预测模版。该模型也是本次我论文写作的模型,下面是其原理图,会在更新的视频里面进行说明,看不懂的,只能使用方案其他方案即可。

 

问题五、该项目达到预期目标的可能性有多大?此外,基于上下文化的敏感性分析,是否存在一些条件或事件可能会不成比例地帮助或损害项目达到其目标的能力?

问题五本质在问能够实现该目标能够实现,还是验证预测的结果能否达成具体的要求。即分析问题四的预测结果与五年项目目标即可。主要在于后半问,敏感性分析,通俗一下即我们需要判定一些指标是否对我们的结果存在非常关键的影响。例如,对于一个五元线性模型,我们剔除一个自变量好,四元线性预测的结果与五元结果的差异。也可以是使得五元线性回归模型的输入值发生变化,查看具体的Y是怎么变化的。

问题六、非技术型文章,须为你的客户提交一份1页的备忘录,其中包括你的重点,强调你的5 年项目提案,以及为什么这个项目适合他们作为客户(例如,获取资源,他们的部分任 务,与他们的使命声明一致,等等)。

非技术型文章,八仙过海各显神通即可。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1428366.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

el-upload子组件上传多张图片(上传为files或base64url)

场景: 在表单页,有图片需要上传,表单的操作行按钮中有上传按钮,点击上传按钮。 弹出el-dialog进行图片的上传,可以上传多张图片。 由于多个表单页都有上传多张图片的操作,因此将上传多图的el-upload定义…

6、基于机器学习的预测

应用机器学习的任何预测任务与这四个策略。 文章目录 1、简介1.1定义预测任务1.2准备预测数据1.3多步预测策略1.3.1多输出模型1.3.2直接策略1.3.3递归策略1.3.4DirRec 策略2、流感趋势示例2.1多输出模型2.2直接策略1、简介 在第二课和第三课中,我们将预测视为一个简单的回归问…

Python开源项目周排行 2024年第3周

ython 趋势周报,按周浏览往期 GitHub,Gitee 等最热门的Python开源项目,入选的项目主要参考GitHub Trending,部分参考了Gitee和其他。排名不分先后,都是当周相对热门的项目。 入选公式=70%GitHub Trending20%Gitee10%其他 关注微…

K8S-NFS-StorageClass

工作流程 K8s中部署NFS-StorageClass K8s的StorageClass提供了为集群动态创建PV的能力。 1.部署NFS服务 2.选择NFS的Provinisoner驱动 K8S中没有内置的NFS的制备器,而定义StorageClass的时候需要指定制备器(Pervisioner),所以需要&#xf…

Pycharm Community 配置调试Behave

前提:python小白,临时搞python项目,公司限制使用Pycharm版本,故只能使用社区版,然而官方有明确说明:只有Professional版支持Behave。故研究了半天才整清楚社区版调试Behave的设置 没有进行下面的步骤之前&…

C++面试宝典第26题:螺旋矩阵

题目 给你一个正整数n,生成一个包含1到n的平方的所有元素,且元素按顺时针顺序螺旋排列成n x n的正方形矩阵。 示例: 输入:n = 3 输出:[[1,2,3],[8,9,4],[7,6,5]] 解析 螺旋矩阵是指按照顺时针(或逆时针)螺旋顺序排列元素的二维矩阵。比如:给定一个如下的3x3矩阵,按顺…

PSoc62™开发板之WDT应用

看门狗 看门狗定时器(WDT)是一种硬件定时器,在出现意外固件时自动复位设备执行路径。如果启用了WDT,则必须在固件中定期进行服务,以避免复位。否则,计时器失效并产生一个设备复位。此外,WDT可以用作中断源或在低功耗唤…

正点原子--STM32定时器学习笔记(1)(更新中....)

F1系列基本定时器(TIM6 / TIM7) 我们的目标是通过TIM6基本定时器定时500ms,让LED0每隔500ms闪一下! 思路:使用定时器6,实现500ms产生一次定时器更新中断,在中断里执行“翻转LED0”。 定时器什…

2024021期传足14场胜负前瞻

2024021期赛事由亚洲杯2场、英超5场,德甲6场、非洲杯1场组成。售止时间为2月3日(周六)19点00分,敬请留意: 本期1.5以下赔率3场,1.5-2.0赔率3场,其他场次基本皆是平半盘、平盘。本期14场整体难度…

第三百零三回

文章目录 1. 概念介绍2. 实现方法2.1 文字信息2.2 红色边框 3. 示例代码4. 内容总结 我们在上一章回中介绍了"如何实现密码输入框"相关的内容,本章回中将介绍如何在在输入框中提示错误.闲话休提,让我们一起Talk Flutter吧。 1. 概念介绍 我们…

LabVIEW CVT离合器性能测试

介绍了CVT(连续变速器)离合器的性能测试的一个应用。完成了一个基于LabVIEW软件平台开发的CVT离合器检测与控制系统,通过高效、准确的测试方法,确保离合器性能达到最优。 系统采用先进的硬件配合LabVIEW软件,实现了对…

python-自动化篇-运维-实现读取日志文件最后一行的时间

文章目录 1. 使用Python打开日志文件2.python读取文件最后一行两种方式3.读取当前时间,进行两者相减,超时报警4.将内容推送到企业微信5. 关闭日志文件整体代码 1. 使用Python打开日志文件 在开始实时读取日志文件之前,我们首先需要打开一个日…

深入了解键盘:分类、工作原理与操作指南

键盘 键盘是计算机使用的主要输入设备之一,键盘主要由创建字母、数字和符号并执行附加功能的按钮组成,通常用于向计算机或其他数字设备输入文本、命令和各种控制信号。 键盘是计算机中最重要的字符输入设备,其基本组成元件是按键开关&#…

画质和场景双需求下,海信电视U8KL的变与不变

又到一年春节,最近几年大家过年的方式越来越丰富,但是跟家人在一起看春晚依然是主流,电视也是过年不可或缺的家庭成员。 当然,随着大家对生活品质的要求更高,对电视的要求也变得更高了。比如,现在春晚直播…

ESP-IDF增加自定义组件开发过程记录

ESP-IDF增加自定义组件开发过程记录 记录一下,自定义组件开发方式容易实现代码的复用。比如说在实现一些芯片或者模块的代码上,网上先找找有的话就可以不用自己写了,实在没有的时候只能自己辛苦摸索编写了。 前言: 因为对cmake也不懂&…

纯血鸿蒙来了,鸿蒙App开发该如何提速

“全世界做产品挣钱的公司很多,但有能力打造操作系统的公司没有几家,最后世界上的操作系统就只有三套:鸿蒙、iOS和安卓。” --- 360集团创始人、董事长周鸿祎 “HarmonyOS实现了AI框架、大模型、设计系统、编程框架、编程语言、编译器等全栈…

Google Earth Engine tools——利用geetools中的algorithms算法实现hsv

简介 锐化HSV是一种图像处理技术,它是通过调整图像的颜色分量来增强图像的细节和清晰度。HSV是一种颜色空间模型,它基于人类视觉感知的方式来描述颜色。HSV代表色调(Hue)、饱和度(Saturation)和明度&…

正点原子--STM32中断系统学习笔记(1)

1、什么是中断? 原子哥给出的概念是这样的:打断CPU正常执行的程序,转而处理紧急程序,然后返回原暂停的程序继续运行,就叫中断。 当发生中断时,当前执行的程序会被暂时中止,进而进入中断处理函…

Vector CANdb++ Editor和CANdb++ Admin的区别

目录 1 CANdb Editor和CANdb Admin的功能偏差 2 CANdb Program窗口 3 下载并安装CANdb Editor和CANdb Admin 3.1 安装CANdb Admin.J1939 3.0 SP27 优质博文推荐阅读(单击下方链接,即可跳转): Vector工具链 CAN Matrix DBC …

解析Excel文件内容,按每列首行元素名打印出某个字符串的统计占比(超详细)

目录 1.示例: 1.1 实现代码1:列数为常量 运行结果: 1.2 实现代码2:列数为变量 运行结果: 1.示例: 开发需求:读取Excel文件,统计第3列到第5列中每列的"False"字段占…