【2023年4月美赛加赛】Y题:Understanding Used Sailboat Prices 三篇完整论文及代码

news2024/10/5 21:22:05

【2023年4月美赛加赛】Y题:Understanding Used Sailboat Prices 建25页完整论文及代码

请添加图片描述

1 题目

2023年MCM 问题Y:理解二手帆船价格

和许多奢侈品一样,帆船的价值也会随着年代和市场条件的变化而变化。所附的“2023_MCM_Problem_Y_Boats.xlsx”文件包括2020年12月在欧洲、加勒比地区和美国销售的约3500艘36至56英尺长的帆船的数据。一名划船爱好者向COMAP提供了这些数据。像大多数现实世界的数据集一样,它可能有缺失的数据或其他问题,需要在分析之前进行一些数据清理。Excel文件包括两个选项卡,一个用于单体帆船,另一个用于双体船。在每个excel中的列包括:

  • Make:船的制造商名称。

  • Variant:标识特定型号的船名。

  • Length (ft):以英尺为单位的船的长度。

  • Geographic Region:船所在的地理区域(加勒比海、欧洲、美国)。

  • Country/Region/State:船只所在的具体国家/地区/州。挂牌价格(USD):以美元标价购买该船的广告价格。

  • Year:船的制造年份。

对于给定的制造、变体和年份,除了提供的Excel文件之外,还有许多其他来源可以提供特定帆船特征的详细描述。你可以用你选择的任何额外数据来补充所提供的数据集;但是,你必须在建模中包含“2023_MCM_Problem_Y_Boats.xlsx”中的数据。一定要完全识别并记录所使用的任何补充数据的来源。帆船经常通过经纪人出售。为了更好地了解帆船市场,中国香港(SAR)的一位帆船经纪人委托您的团队准备一份关于二手帆船定价的报告。该经纪人希望您:

  • 开发一个数学模型,解释提供的电子表格中每艘帆船的挂牌价格。包括任何你认为有用的预测因素。您可以利用其他来源来了解给定帆船的其他特征(如横梁、吃水、排水量、索具、帆面积、船体材料、发动机小时数、睡眠容量、净空、电子设备等)以及按年份和地区划分的经济数据。识别和描述所使用的所有数据来源。包括对每个帆船变种价格估计精度的讨论。

  • 用你的模型解释地区对上市价格的影响(如果有的话)。讨论是否所有帆船变体的区域效应是一致的。说明所注意到的任何区域影响的实际和统计意义。

  • 讨论你对给定地理区域的建模如何在香港(SAR)市场上发挥作用。从提供的电子表格中选择一个信息丰富的帆船子集,分为单船体和双体船。从香港(SAR)市场找到该子集的可比上市价格数据。建模香港(特区)对子集中帆船的每艘帆船价格的区域影响(如果有的话)。双体帆船和单体帆船的影响是一样的吗?

  • 识别并讨论你的团队从数据中得出的任何其他有趣和有信息的推论或结论。

  • 为香港(SAR)帆船经纪人准备一到两页的报告。包括一些精心挑选的图表,以帮助经纪人理解你的结论。

总页数不超过25页的PDF解决方案应包括:

  • 一页总结表,清楚地描述你解决问题的方法,以及在问题的背景下分析得出的最重要的结论。

  • 目录。

  • 您的完整解决方案。

  • 给经纪人一到两页的报告。

附件

**数据文件。**2023_MCM_Problem_Y_Boats.xlsx

Monohulled Sailboats:单体帆船

Catamarans:双体船

数据文件条目描述

  • Make:船的制造商名称。Make、Variant、Length、Geographic Region

  • Variant:标识特定型号的船名。

  • Length (ft):以英尺为单位的船的长度。

  • Geographic Region:船所在的地理区域(加勒比海、欧洲、美国)。

  • Country/Region/State:船只所在的具体国家/地区/州。挂牌价格(USD):以美元标价购买该船的广告价格。

  • Year:船的制造年份。

术语表

  • 横梁(Beam):船最宽处的宽度。

  • Broker: 一艘帆船。

  • 双体船(Catamarans):一种多体船,有两个大小相等的平行船体。

  • 排水量(Displacement):一艘船排水量的重量。

  • 吃水(Draft): 使船在不触底的情况下浮起来所需要的最小水深。

  • 发动机小时数(EngineHours):自新船以来,船舶发动机运行的小时数。

  • 净空高度(Headroom):在船舱中可以站立的高度。

  • 船体(Hull): 船或其他船只的主体或外壳,包括底部、侧面和甲板。

  • 船壳材料(Hull Materials):制作船壳的材料。所用的材料包括玻璃纤维、钢、木材和复合材料。

  • 挂牌价格(Listing Price): 卖方要求的价格。这艘船可能会以不同的价格出售。

  • 制造商(Make):帆船的制造商。

  • 单体帆船(Monohull Sailboats):只有一个船体的帆船,通常以一个沉重的龙骨(中心桨叶)为中心。

  • 索具(Rigging) :由绳索、缆索和滑轮组成的系统,用来支撑和控制帆船的帆、舵和其他系统。

  • 帆面积(Sail Area): 一艘船的帆完全扬起时的总表面积。

  • 变体(Variant):表示某一特定型号帆船的名称。例如,“Sun Odyssey 54 DS”。

2 论文

2.1 论文一:二手游艇市场研究(27页)

随着经济的发展,二手游艇市场日益繁荣,但价格因地区而异。为了让买卖双方知情,我们使用PLSR-GA-BP模型研究了不同型号游艇的价格预测,并使用参数检验分析了区域有效性。

针对问题1,首先从区域效应和船体属性两方面对数据进行重构,然后对数据进行清洗,利用三次样条插值方法对缺失数据和异常数据进行填充;然后运用PLSR分析了各指标的重要性。单体游艇中影响最大的指标是排水量(0.773),影响最小的指标是GDP(0.008),双体游艇中影响最大的指标是使用年份(0.537),影响最小的指标是总物流成本(0.003);采用PLSR-GA-BP模型进行预测研究,PLSR预测大量数据,GA-BP预测残差序列对大量数据进行校正。模型的最终性能为:单体游艇的RMSE=0.019, MAPE=0.154, R2=0.844;双体游艇的RMSE=0.028, MAPE=0.211, R2=0.837。

为了解决问题二,我们首先对两艘游艇的数据进行整合,然后将其按区域划分,并将各区域的价格变化作为变异量进行分析,采用单因素方差分析,结果显示P=0.003<0.05,说明各区域的价格存在变异性,然后使用Kendall一致性检验分析四个区域属性与价格变化之间的一致性,P= 0.000<0.05;这证明了结果是可信的,一致性系数为0.996,说明我们的区域属性是造成区域价格差异的主要因素,最后分析了造成区域价格差异的可能原因;我们还研究了区域效应对船体硬件指标造成的变异性,结果表明,只有风帆面积不存在变异性,其余五个指标都存在变异性。这些变化主要是由各区域的地理环境决定的。

对于问题三,我们从香港收集相关数据,模拟香港市场的区域效应,筛选出符合要求的游艇模型,如BavariaCruiser46(单体游艇)和Lagoon450(双体游艇),将相应数据带入PLSR-GA-BP模型进行训练,拟合曲线如图7.2所示。BavariaCruiser46的检验结果为MAPE=0.188,RMSE=0.026,R2=0.881, Lagoon450的检验结果为RMSE=0.041,MAPE=0.174,R2=0.904,可见检验结果非常好,这足以证明我们的区域效应分析的检验结果非常好,这证明我们的区域效应分析是足够适合实际的。

针对问题四,我们从订单的洲际分布、游艇价格的大陆分布等方面挖掘了更多的信息。我们发现,双体船的产量逐年增加,而单体船的产量逐年减少
最后,我们对PLSR-GA-BP模型进行了灵敏度测试,对影响游艇价格的两个最重要因素进行了噪声测试,结果表明,MAPE和RMSE的变化小于10%,因此我们的模型非常稳健;然后我们在给香港地区负责人的信中总结了这篇文章。

在这里插入图片描述

2.2 论文二:基于多项式回归的帆船价格预测研究(26页)

摘要

随着帆船运动的逐渐流行,越来越多的人开始接触并爱上这项运动,帆船的消费市场也随之扩大。如何合理地对帆船进行定价,是帆船经销商需要着重考虑的问题。
本文探讨了帆船的制造年份、尺寸、吃水深度、帆面积、排水量这些帆船自身的因素以及GDP这一地区因素对当地帆船定价的影响。首先,我们从帆船数据网sailboatdata.com上搜集帆船数据,结合各地GDP数据,组成帆船特征矩阵。之后再用主成分分析对特征矩阵进行降维。实验表明,只需要两个主成分,即可涵盖所有特征99.8%的信息。最后,我们用多项式回归算法,训练出可以预测帆船价格的回归函数,从而得到各特征与帆船定价的关系,预测精确率达到98.4%
为了探讨地区对不同型号帆船的影响是否相同,我们针对各种型号的帆船分别建立回归模型。通过对比不同型号帆船对应模型的主成分权重与多项式回归系数,我们发现地区因素对不同型号帆船的影响是相似的。
通过搜集香港地区的GDP以及帆船售价数据,套用相同的多项式回归模型,可以计算出我们的模型在香港地区也是适用的,并且地区因素对单体船和双体船的影响是一样的。
针对模型中计算出的主成分与原始特征对应的权重,我们可以看出,像吃水深度、GDP这样的特征对帆船定价的影响是相当大的,而制造年份的影响可以忽略不计。

最后,我们根据数学建模的结果,给香港的帆船经销商提出了相应的建议。

关键词:帆船定价,主成分分析,多项式回归

在这里插入图片描述

2.3 论文三:二手帆船市场:因素分析与定价模型(35页)

二手物品的价值往往受到多种因素的影响,二手帆船也不例外。本文的目的是建立一个帆船定价模型,以评估不同因素对二手帆船定价的影响。研究这一问题可以为市场参与者提供更可靠的价格参考,从而提高整个市场的交易效率。

对于Factor Analysis Model,我们从相关网站获取更多的数据,并对数据进行相关性分析。为了探究分类变量与价格之间的关系,我们使用了方差分析,结果表明所有分类变量对价格都有显著影响。对于连续变量,我们使用Pearson相关分析,结果表明,一些连续变量与价格相关,而另一些则可能呈现非线性关系。

对于二手帆船定价模型,我们使用五重交叉验证方法对数据进行分割,并在8个不同模型中使用贝叶斯优化对模型进行优化。基于极度随机树(ERT)算法在评价中的优越性能,选择ERT作为二级帆船定价模型。此外,我们使用梯度增强决策树(GBDT)算法计算特征重要性,并将其与ERT算法进行比较。模型建立后,我们计算了各个影响因素的重要性,发现横梁因素对价格的影响最大,其他因素的影响如表所示
6.最后,我们计算了每个类别的预测精度,发现有276个类别的预测精度超过70%。

对于香港市场模型,我们将香港加入我们的数据集,并对香港进行一热编码后重新训练模型。然后,我们使用方差分析来探讨地理区域与香港上市价格之间的关系。结果显示,即使在加入香港数据后,地理区域对上市价格仍有显著影响。香港对价格的影响为0.0038,小于美国和欧洲。最后,我们发现香港地区对双体船价格的影响大于对单体船价格的影响。

同时,我们还发现了其他有益的结论。我们通过方差分析探讨了各帆船品种的地理区域与上市价格之间的关系,统计结果显示,18%的品牌与地区显著相关。但在整体二手帆船市场中,这一比例相对较小,80%以上的帆船品牌不受地域限制。最后,我们写了一份报告,向经纪人展示了数据分析结果和相关结论。

关键词:方差分析,梯度增强决策树,极度随机树,表征

在这里插入图片描述

3 获取方式

见知乎文章底部,或者私信我

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/554860.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【dfn序+DP】树

把一棵树转化成一个序列有三种方法&#xff1a; dfs序 dfn序&#xff08;时间戳&#xff09; 欧拉序 关于这三者的区别&#xff0c;参考这篇博客&#xff0c;讲的超级好&#xff01; 重谈DFS序、时间戳和欧拉序 - Seaway-Fu - 博客园 (cnblogs.com) 题意&#xff1a; 思路…

【SpringBoot】七:Web服务---Servlet Filter Listener

文章目录 1.Servlet1.1 使用WebServlet创建Servlet1.2 使用编码方式创建Servlet 2.Filter2.1 使用WebFilter创建Filter2.2 使用编码方式创建Filter2.3 Filter排序2.4 使用框架中的 Filter 3. Listener 1.Servlet 1.1 使用WebServlet创建Servlet (1)编写servlet WebServlet(…

数仓建模理论

一、数仓建模理论 &#xff08;一&#xff09;前言 数仓建模就好比是图书馆的书能够分门别类的存放&#xff0c;不仅合理&#xff0c;齐全&#xff0c;而且易于查找。 数据模型就是数据组织和存储方法&#xff0c;强调从业务、数据存取和使用角度合理存储数据。只有将数…

数据结构课程设计——航空客运订票系统

航空客运订票系统 一、引言 1.1 问题的提出 随着时代的发展&#xff0c;智能化生产给社会带来方便与精确&#xff0c;本系统以方便大众&#xff0c;妥善管理机场票务操作为基旨而开发。 本程序以数据结构&#xff08;c语言描述)存储结构进行开发。利用单链表等存储方式为基础…

字节技术面都过了,薪资都谈好了20K*13结果还是被刷了,问HR,原因是。。

面试被拒开端 分享下自己的求职小故事。在一家公司软件测试技术面试已经过了&#xff0c;然后和最终面试官沟通了下&#xff0c;面试官提出来一个薪资数字&#xff0c;我接受了这个提议并和hr同步了这个数字。再然后被拒了&#xff0c;理由就是期望薪资和职级不匹配。我询问后…

鸿蒙元服务万能卡片开发-stage模型和fa模型的卡片区别

一、项目类型 Application&#xff1a; 应用开发 Atomic Service&#xff1a;原子化服务开发 这里选择Empty Ability模板创建项目。 二、Stage模型卡片开发 Api&#xff1a;9 Model&#xff1a;stage Language&#xff1a;ArkTS AppScope &#xff1a;应用的全局配置信息。…

Flutter非常常用的几个布局小控件Center,SizeBox,Divider

Center简介 Center是Flutter中的一个布局小部件&#xff0c;用于将其子部件居中显示在父部件中。 Center的特点 Center小部件具有以下特点&#xff1a; 将子部件在水平和垂直方向上居中显示。默认情况下&#xff0c;Center会尽可能将子部件展开以填充可用空间。如果Center没…

docker未授权rce+docker逃逸复现

docker未授权rcedocker逃逸复现 前言&#xff1a;这段时间跟着bnessy师傅一起打内网&#xff0c;跟着bnessy师傅也学到了很多有用的姿势&#xff0c;这里就来复现几个内网的漏洞&#xff08;大佬轻喷&#xff09; 1、老规矩&#xff0c;还是fscan扫到的漏洞 通过访问&#xff1…

AI突袭景观设计界,这次是真的卷起来了!

目前&#xff0c;AI已经成为内容创作者的灵感来源和效率工具&#xff0c;从设计、内容、视频等创意性工作中&#xff0c;我们看到AI助力下提升了数倍效率&#xff0c;正是如此&#xff0c;也迎来了更多企业的关注&#xff0c;想要将AI融入到各行各业中。 神采PromeAI在不断更新…

Mybatis源码

Mybatis简介 持久层ORM框架&#xff0c;执行sql比较简单&#xff0c;扩展性强&#xff0c;与传统jdbc相比&#xff0c;省去了手写连接的几个步骤&#xff0c;可以通过配置。 节约数据库连接资源&#xff0c;代码易于维护。mybatis 在SqlMapConfig.xml 中配置数据库连接池&#…

【服务器数据恢复】raid离线磁盘上线失败导致分区不识别的数据恢复

服务器数据恢复环境&#xff1a; HP ProLiant DL某系列服务器&#xff0c;三块SAS硬盘组建raid阵列。 上层系统部署有数据库&#xff0c;数据库存放在D分区&#xff0c;备份存放在E分区。 服务器故障&#xff1a; 磁盘故障导致RAID瘫痪&#xff0c;其中一块硬盘状态灯显示红色…

接口测试:Eolink Apikit 和 Postman 哪个更好用?

接口测试&#xff1a;Eolink Apikit 和 Postman 哪个更好用&#xff1f; 很多做服务端开发的同学&#xff0c;应该基本都用过 Postman 来测试接口&#xff0c;虽然 Postman 能支撑日常工作&#xff0c;但是总感觉还是少了点什么&#xff0c;比如需要 Swagger 来维护接口文档&am…

故障分析 | innodb_thread_concurrency 导致数据库异常的问题分析

作者通过分析源码定位数据库异常&#xff0c;梳理参数 innodb_thread_concurrency 设置的注意事项。 作者&#xff1a;李锡超 一个爱笑的江苏苏宁银行数据库工程师&#xff0c;主要负责数据库日常运维、自动化建设、DMP 平台运维。擅长 MySQL、Python、Oracle&#xff0c;爱好骑…

【coding加油站】vue单页面手机商城设计

1、引言 设计结课作业,课程设计无处下手&#xff0c;网页要求的总数量太多&#xff1f;没有合适的模板&#xff1f;数据库&#xff0c;java&#xff0c;python&#xff0c;vue&#xff0c;html作业复杂工程量过大&#xff1f;毕设毫无头绪等等一系列问题。你想要解决的问题&am…

【Python】判断语句 ② ( if else 语句 | if else 语句语法 | Python 中的空格缩进 | 代码示例 )

文章目录 一、if else 语句语法二、Python 中的空格缩进三、代码示例 一、if else 语句语法 if else 语句语法 : if 条件判定:满足条件要执行的代码1满足条件要执行的代码2满足条件要执行的代码3 else:不满足条件要执行的代码1不满足条件要执行的代码2不满足条件要执行的代码3…

佳能打印机删掉又会自动加载的原因及解决方案

驱动人生分析出现佳能打印机删掉又会自动加载的原因可能是因为在系统中&#xff0c;存在着佳能打印机的自动驱动程序。将打印机删除后&#xff0c;系统会自动重新安装该驱动程序&#xff0c;导致打印机重新加载。 特别在一台新的佳能打印机设备到位时&#xff0c;也会出现电脑…

2023自动化测试工具还有什么新鲜事?

我们准备了一份详细指南&#xff0c;介绍了在一个好的测试自动化工具中应该寻找什么&#xff0c;以及哪些工具在 2023 年值得考虑。 尽管手动测试仍然是软件质量保证的强大工具&#xff0c;正如我们在最近关于手动测试与自动测试的长期阅读中再次确立的那样&#xff0c;越来越…

1700页,卷S人的 软件测试《八股文》PDF手册,涨薪跳槽拿高薪就靠它了

大家好&#xff0c;最近有不少小伙伴在后台留言&#xff0c;又得准备面试了&#xff0c;不知道从何下手&#xff01; 不论是跳槽涨薪&#xff0c;还是学习提升&#xff01;先给自己定一个小目标&#xff0c;然后再朝着目标去努力就完事儿了&#xff01; 为了帮大家节约时间&a…

【Linux】权限管理,谁动了我代码?!

目录 一&#xff0c;shell命令以及运行原理 二 &#xff0c;Linux用户权限 1. su —— 用户切换 三&#xff0c;权限管理 1. 理解 2. 用户 3. 文件类型 4. 文件基本权限 5. 设置文件权限方法 1. chmod —— 修改文件访问权限 2. chown —— 修改文件拥有者 3. chg…

2023年5大风口行业

今天就来和大家分享一下&#xff0c;在时代的洪流下&#xff0c;普通人如何顺应大势抓住机遇&#xff01; 实现人在风口上&#xff0c;猪都会飞起来。 根据对市场的观察及各平台数据分析结果&#xff0c;小编总结了了2023年将会迎来大爆发的5个行业&#xff0c;带大家看看新的…