2024 年华数杯全国大学生数学建模竞赛C 题 老外游中国 完整思路 源代码 模型结果(仅供学习)

news2025/1/20 18:21:13

最近,“city 不 city”这一网络流行语在外国网红的推动下备受关注。随着我国过境免签政策的落实,越来越多外国游客来到中国,通过网络平台展示他们在华旅行的见闻,这不仅推动了中国旅游业的发展,更是在国际舞台上展现了一个真实而生动的中国,一举多得。

假设外国游客入境后能在中国境内逗留144小时,且能从任一城市附近的机场出境。由于每个城市景点较多,为了便于外国游客能够游览到更多的城市,现假定“每个城市只选择一个评分最高的景点游玩”,称之为“城市最佳景点游览原则”。

现有一个包含中国(不含港澳台)352个城市的旅游景点的数据集,每个城市的 csv 文件中有 100个景点,每个景点的信息包含有景点名称、网址、地址、景点介绍、开放时间、图片网址、景点评分、建议游玩时长、建议游玩季节、门票信息、小贴士等。

请建立数学模型,回答下列问题:

问题一:请问 352 个城市中所有 35200 个景点评分的最高分(Best Score,简称 BS)是多少?全国有多少个景点获评了这个最高评分(BS)?获评了这个最高评分(BS)景点最多的城市有哪些?依据拥有最高评分(BS)景点数量的多少排序,列出前 10 个城市。

  1. 问题描述
    我们需要在352个城市中寻找景点评分的最高分(Best Score, 简称BS),并统计获得这个最高评分的景点数量,最后找出拥有最高评分景点最多的前10个城市。由于数据中存在空值和地址格式不一致的问题,需要进行适当的数据清洗和处理。
  2. 数据预处理
    为了确保数据的准确性和有效性,我们首先进行数据预处理。数据预处理包括以下步骤:
    移除无效评分和缺失评分的行:对于评分列中的非数值字符,我们将其转换为缺失值,然后移除这些行。
    清理地址字段:由于地址字段中可能包含多余的空格、换行符和无效字符,需要对其进行清理以便后续提取城市名称。
  3. 评分数据处理
    我们将评分列转换为数值类型,并计算数据集中评分的最大值,即最高评分(Best Score, BS)。记为:

  1. 景点数量统计
    统计获得最高评分的景点数量,记为:

  1. 城市名称提取
    从地址字段中提取城市名称。我们定义一个函数 clean_city(address)来清理地址并提取城市名称。具体步骤如下:
    使用 re.sub 去除地址中的多余空格和换行符。
    尝试匹配“省”后的城市名称,若成功匹配则返回该城市名称。
    尝试匹配“自治区”后的城市名称,若成功匹配则返回该城市名称。
    尝试直接匹配城市名称,若成功匹配则返回该城市名称。
    若上述匹配均失败,则返回“未知”。
    清理后的城市名称记为:

  1. 排除无效城市
    为了确保结果的准确性,我们将标记为“未知”的城市排除在外。记为清理后的数据集:

  1. 统计各城市的最高评分景点数量
    在清理后的数据集中,统计每个城市中获得最高评分的景点数量。记为:

  1. 排序并找出前10个城市
    对统计结果按景点数量进行降序排序,取前10个城市。记为:


求解结果如下:
 


问题二:假如外国游客遵循“城市最佳景点游览原则”,结合城市规模、环境环保、人文底蕴、交通便利,以及气候、美食等因素,请你对 352 个城市进行综合评价,选出“最令外国游客向往的 50个城市”。


    1. 问题描述

假如外国游客遵循“城市最佳景点游览原则”,我们需要综合评价352个城市,并选出最令外国游客向往的50个城市。综合评价需要考虑以下因素:城市规模、环境环保、人文底蕴、交通便利、气候、美食等。

2. 数据准备与清理

为了确保数据的准确性和有效性,我们首先对数据进行清理和处理。现有的数据包含景点名称、链接、地址、介绍、开放时间、评分等字段。我们需要从地址字段中提取城市名称,并移除无效的评分数据。

3. 城市评分计算

基于现有的景点评分数据,我们将构建以下评分:

城市规模评分:假设城市景点数量与城市规模成正比。

环境环保评分:假设评分较高的景点更多集中在环境更好的城市。

人文底蕴评分:假设评分较高的景点更多集中在人文底蕴深厚的城市。

交通便利评分:假设评分较高的景点更多集中在交通便利的城市。

气候评分:假设评分较高的景点更多集中在气候宜人的城市。

美食评分:假设评分较高的景点更多集中在美食丰富的城市。

这些评分均假设与景点评分成正比,使用景点评分的平均值作为基准:

4. 数据标准化

为了使不同单位的指标进行比较,我们需要对数据进行标准化处理。我们采用Min-Max标准化方法,将每个指标缩放到0到1的范围内。

5. 综合评分计算

在获得标准化后的各个因素评分后,我们需要对每个城市的多个评分进行加权求和,计算综合评分。设定各个因素的权重为:

城市规模评分权重:0.2

环境环保评分权重:0.2

人文底蕴评分权重:0.2

交通便利评分权重:0.2

气候评分权重:0.1

美食评分权重:0.1

综合评分的计算公式为:

6. 排名与选择

根据综合评分对城市进行排序,选择综合评分前50的城市。

求解结果如下:

问题三:现有一名外国游客从广州入境,他想在144小时以内游玩尽可能多的城市,同时要求综合游玩体验最好,请你规划他的游玩路线。需要结合游客的要求给出具体的游玩路线,包括总花费时间,门票和交通的总费用以及可以游玩的景点数量。他的要求有:

遵循城市最佳景点游览原则:

城市之间的交通方式只选择高铁;

只在“最令外国游客向往的 50 个城市”中选择要游玩的城市。

问题四:如果将问题3的游览目标改为:既要尽可能的游览更多的城市,又需要使门票和交通的总费用尽可能的少。请重新规划游玩路线,并给出门票和交通的总费用,总花费时间以及可以游玩的城市数量。

问题五:现有一名外国游客只想游览中国的山景,他乘飞机入境中国的城市不限。请你为他选择入境的机场和城市,并个性化定制他的144小时旅游路线既要尽可能的游览更多的山,又需要使门票和交通的总费用尽可能的少。需要结合游客的要求给出具体的游玩路线,包括总花费时间,门票和交通的总费用以及可以游玩的景点数量。他的要求有:

每个城市只游玩一座评分最高的山;

城市之间的交通方式只选择高铁;

旅游城市不局限于“最令外国游客向往的50个城市”,游览范围拓展到352 个城市。

 完整内容与源代码: 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1978684.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

基于X86+FPGA助力实现电力系统的智能监测与高效管理

电力监控 信迈提供基于Intel平台、Xilinx平台、Rockchip平台、NXP平台、飞腾平台的Mini-ITX主板、Micro-ATX主板、ATX主板、嵌入式准系统/工业整机等计算机硬件。产品算力强大,支持高速存储,提供丰富串口、USB、LAN、PCIe扩展接口、显示接口等I/O接口&am…

【python】数据类型之列表类型(上)

本篇文章将讲解列表类型。 列表(list),是一个有序且可变的容器,在里面可以存放多个不同类型的元素。 列表中的元素之间用逗号(英文中的逗号)相隔。 1、定义: 例如: user_list[]…

stl容器 vector的基本操作

目录 1.vector构造 1.1默认构造函数 1.2 fill 填充构造函数 ​编辑 1.3 范围构造函数(Range Constructor) 1.4拷贝构造函数 2.initializer_list初始化vector 3.迭代器 4.常用的几个成员 4.1 size()统计当前有效字符个数 4.2 capacity ve…

青甘环线游记|day(2)|西宁、青海湖

坐动车 早上7:30醒来,在8:00左右起床,下楼吃兰州拉面。面煮的很好吃,就是还是不是很适应。看到8元的牛肉面感觉很震惊,没想到是面8元,牛肉另加,10元。 坐上动车前往西宁,12点左右到了。虽然在…

PXE实现自动安装部署操作系统

PXE(Preboot eXecution Environment)是一种在计算机启动时使用网络接口从远程服务器获取操作系统安装和启动信息的技术。通过PXE,计算机可以从局域网中的PXE服务器上下载操作系统安装文件,并进行自动化的操作系统部署或故障排除。…

25考研数据结构复习·7.4B树和B+树7.5散列(Hash)表

目录 B树和B树 B树 m阶B树的核心特性 B树的插入 B树的删除 非终端结点关键字 终端结点关键字 低于下限 B树 散列(Hash)表 基本概念 散列函数的构造 👩‍💻 除留余数法 直接定址法 数字分析法 平方取中法 处理冲突…

动手学深度学习V2每日笔记(池化层)

本文主要参考沐神的视频教程 https://www.bilibili.com/video/BV1EV411j7nX/spm_id_from333.999.0.0&vd_sourcec7bfc6ce0ea0cbe43aa288ba2713e56d 文档教程 https://zh-v2.d2l.ai/ 本文的主要内容对沐神提供的代码中个人不太理解的内容进行笔记记录,内容不会特别…

Linux基础环境开发工具(二)

目录 一、前言二、make和makefile工具1.快速认识一下2.依赖关系和依赖方法3.执行原理 三、Git工具1.快速认识一下2.git的使用 四、gdb工具1.快速认识一下2、类比Windows使用 一、前言 在开发工具第一篇中我们介绍了yum,vim,gcc/g编译器这几种工具&#…

C++ 继承 派生类的拷贝构造

继承 派生类的拷贝构造构造顺序拷贝构造 引例1: 当子类,不自实现拷贝构造时,默认调用父类的拷贝构造引例2: 子类自实现拷贝构造,不做特殊处理时,只会调用父类的构造器.引例3: 显示的调用父类的拷贝构造器。案例: 内嵌函数的拷贝构造 引例1 :当内嵌子对象,子类不自实现拷贝构造时…

Netty二

Netty 问题分析 bootstrap serverBootstrap pipeline和channelPipeline EventLoopGroup和实现类NioEventLoopGroup

U2net论文复现-简单解读-以及奇奇怪怪的改进-测试roc以及pr

论文地址:U2net论文地址 显著性目标检测: Salient ObjectDetetion(SOD)显著性目标检测,就是要把图片中最显著的物体分割出来,所以是二分类任务,只需要背景和前景。 1、Introduce 1.1、目前存在的2个挑战&#xff1…

Day-11 员工管理案例 增删改查、配置文件

SpringBootWeb案例 前面我们已经实现了员工信息的条件分页查询以及删除操作。 关于员工管理的功能,还有两个需要实现: 新增员工修改员工 首先我们先完成"新增员工"的功能开发,再完成"修改员工"的功能开发。而在"新…

Midjourney、Sora和硅谷机密-《分析模式》漫谈15

DDD领域驱动设计批评文集 做强化自测题获得“软件方法建模师”称号 《软件方法》各章合集 “Analysis Patterns”的Preface(前言)有这么一句: Kent Beck, Ward Cunningham, and Jim Coplein encouraged me to get involved with the commu…

《Advanced RAG》-02-揭开 PDF 解析的神秘面纱

摘要 PDF 文件是非结构化文档的代表,但从 PDF 文档中提取信息是一个具有挑战性的过程。 PDF 文件由一系列指令组成,这些指令指示 PDF 阅读器或打印机在屏幕或纸张上显示符号的位置和方式。与 HTML 和 docx 等文件格式不同,后者使用标记来组织…

8月2日,贪心-买卖股票的最佳时期

大家好呀,今天我们看两道用贪心算法解的两道题,150道经典面试题中的买卖股票的最佳时期1和2。 1.买卖股票的最佳时期1 . - 力扣(LeetCode) 思路 对于这题,我们其实很容易想出暴力解,那就是从后往前找值&…

【文件系统】抽象磁盘的存储结构 CHS寻址法 | sector数组 | LAB数组

目录 1.为什么要抽象 2.逻辑抽象_版本1 2.1sector数组 ​2.2index转化CHS 3.逻辑抽象_版本2 3.1LBA数组 3.2LAB下标转化sector下标 文件其实就是在磁盘中占有几个扇区的问题❗文件是很多个sector的数组下标❗文件是有很多块构成的❗❗文件由很多扇区构成------>文件…

C语言刷题小记3

题目1 序列中删除指定数字 分析:本题要求我们来删除一个序列中指定的数字,这里大家要注意我们要删除的数字可能不止出现一次,所以我们需要用两个变量来进行处理,一个变量来遍历数组,一个变量来存储数组的位置&#xff…

H5 上使用腾讯位置服务选择收货信息

效果图 首先需要在腾讯位置服务上申请你自己的key,可参考地图选点组件 // 点击打开地图 backurl 是点击选中的位置点后,页面跳转至要返回的地址(backurl),会将位置信息添加到回跳地址(backurl&#xff0…

【威胁情报】新的 BingoMod Android 安卓恶意软件伪装成安全应用程序,清除数据

关注公众号网络研究观获取更多内容。 小心 BingoMod!这种危险的 Android 恶意软件会窃取您的钱财、清除您的手机数据并控制您的设备。 了解如何保护自己免受这种阴险威胁。保持在线安全! 计算机安全解决方案提供商 Cleafy 发现了一种狡猾的远程访问木…

PCIe总线-RK3588 PCIe RC初始化流程分析(十二)

1.简介 RK3588 PCIe RC的初始化涉及PCIe设备枚举、中断(INTx、MSI、MSI-X)配置、BAR配置、ATU配置、链路训练等,下面一一介绍。 2.初始化 当RC的模式为RK_PCIE_EP_TYPE时,平台驱动调用rk_add_pcie_port函数初始化RC&#xff0c…