【2024年华数杯全国大学生数学建模竞赛】C题:老外游中国 问题思路分析及Python代码实现

news2024/11/20 9:23:45

【2024 年华数杯全国大学生数学建模竞赛】C题:老外游中国 问题思路分析及Python代码实现

1 题目

最近,“city 不 city”这一网络流行语在外国网红的推动下备受关注。随着我国过境免签政策的落实,越来越多外国游客来到中国,通过网络平台展示他们在华旅行的见闻,这不仅推动了中国旅游业的发展,更是在国际舞台上展现了一个真实而生动的中国,一举多得。

假设外国游客入境后能在中国境内逗留 144 小时,且能从任一城市附近的机场出境。由于每个城市景点较多,为了便于外国游客能够游览到更多的城市,现假定“每个城市只选择一个评分最高的景点游玩”,称之为“城市最佳景点游览原则”。

现有一个包含中国(不含港澳台)352 个城市的旅游景点的数据集,每个城市的 csv 文件中有 100 个景点,每个景点的信息包含有景点名称、网址、地址、景点介绍、开放时间、图片网址、景点评分、建议游玩时长、建议游玩季节、门票信息、小贴士等。

请建立数学模型,回答下列问题:

问题 1 请问 352 个城市中所有 35200 个景点评分的最高分(Best Score,简称 BS)是多少?全国有多少个景点获评了这个最高评分(BS)?获评了这个最高评分(BS)景点最多的城市有哪些?依据拥有最高评分(BS)景点数量的多少排序,列出前 10 个城市。

问题 2 假如外国游客遵循“城市最佳景点游览原则”,结合城市规模、环境环保、人文底蕴、交通便利,以及气候、美食等因素,请你对 352 个城市进行综合评价,选出“最令外国游客向往的 50 个城市”。

问题 3 现有一名外国游客从广州入境,他想在 144 小时以内游玩尽可能多的城市,同时要求综合游玩体验最好,请你规划他的游玩路线。需要结合游客的要求给出具体的游玩路线,包括总花费时间,门票和交通的总费用以及可以游玩的景点数量。他的要求有:

① 遵循城市最佳景点游览原则;

② 城市之间的交通方式只选择高铁;

③ 只在“最令外国游客向往的 50 个城市”中选择要游玩的城市。

问题 4 如果将问题 3 的游览目标改为:既要尽可能的游览更多的城市,又需要使门票和交通的总费用尽可能的少。请重新规划游玩路线,并给出门票和交通的总费用,总花费时间以及可以游玩的城市数量。

问题 5 现有一名外国游客只想游览中国的山景,他乘飞机入境中国的城市不限。请你为他选择入境的机场和城市,并个性化定制他的 144 小时旅游路线, 既要尽可能的游览更多的山,又需要使门票和交通的总费用尽可能的少。需要结合游客的要求给出具体的游玩路线,包括总花费时间,门票和交通的总费用以及可以游玩的景点数量。他的要求有:

① 每个城市只游玩一座评分最高的山;

② 城市之间的交通方式只选择高铁;

③ 旅游城市不局限于“最令外国游客向往的 50 个城市”,游览范围拓展到352 个城市。

2 问题重述

问题1:主要关注所有城市中景点评分的最高分及分布情况。

问题2:评价城市的综合吸引力,选择最令外国游客向往的50个城市。

问题3:在144小时内规划最优的游玩路线,以最大化游玩的城市数量和体验。

问题4:在144小时内游览尽可能多的城市,重点降低门票和交通总费用。

问题5:专注于景点的游览,入境城市不限,要求在144小时内尽可能多地游览山景,且控制费用。

3 思路分析

3.1 问题一

第一题是统计问题,用python遍历所有景点的评分列,找到其中的最大值,过滤出评分等于最高评分(BS)的所有景点,并统计其数量。按城市分组,统计每个城市中评分等于最高评分(BS)的景点数量。根据统计结果,按景点数量排序,获取前10个城市。实现过程见以下第4部分。

3.2 问题二

要对352个城市进行综合评价,选出最向往的50个城市,简单的话可以采用加权评分模型,将城市规模、环境环保、人文底蕴、交通便利、气候、美食等因素量化并赋予不同权重,综合计算每个城市的综合评分,选择得分最高的前50个城市。或者建立多属性决策分析(MADA),应用MADA方法,如TOPSIS或AHP,对城市进行多属性评价。将每个因素转换为标准化的评分,并根据决策矩阵进行排名,从而选出最受欢迎的城市。或者使用聚类算法将城市按综合特征进行分组,分析每个群体的特点,选出代表性最强的50个城市。或者利用主成分分析算法将多个因素的影响降维至少量主成分,通过主成分得分对城市进行排名,选出得分最高的前50个城市。复杂一点的话,从推荐系统的角度去做,建立基于内容的推荐系统或协同过滤系统,结合外国游客的历史游览数据和对城市的偏好,预测并推荐最受欢迎的城市。这个角度的推荐算法比较多,创新性搞,新颖一些。
在这里插入图片描述

参考文献

  • [1]杨小玲.多属性决策分析及其在洪灾风险评价中的应用研究[D].华中科技大学,2012.
  • [2]廖思思,朱锦程.陕甘宁20个旅游城市旅游竞争力评价[J].绿色科技,2023,25(15):221-226.DOI:10.16663/j.cnki.lskj.2023.15.048.
  • [3]高珺.基于子空间聚类算法的湖南旅游推荐研究[D].中南林业科技大学,2023.DOI:10.27662/d.cnki.gznlc.2023.000899.
  • [4]陈红玲,叶玫,卢淑萍,等.基于旅游资源画像的个性化旅游推荐系统[J].信息技术与信息化,2022,(11):115-118.
  • [5]陈源鹏.基于序列挖掘的个性化旅游景点推荐研究[D].桂林电子科技大学,2020.DOI:10.27049/d.cnki.ggldc.2020.000496.
  • [6]张诗梦.基于“城市画像”与“用户画像”的个性化旅游推荐系统实践[D].东北财经大学,2019.DOI:10.27006/d.cnki.gdbcu.2019.000861.

3.3 问题三

这个问是路径规划问题,经典的代表性算法有旅行商问题(TSP)优化问题,将城市视为图中的节点,使用旅行商问题算法(如遗传算法、模拟退火等)优化游客的游玩路径。在限制条件下(如总时间和交通方式),找到最优路线,以最大化景点数量和体验。

在这里插入图片描述

  • [1]王梦甜.基于遗传算法的南京周边城市旅游规划研究[J].市场周刊,2021,34(02):180-181+188.

  • [2]唐存花,汤可宗.求旅行商问题的幂律变换优化蚁群算法[J].软件导刊,2024,23(02):74-83.

  • [3]丁增良,陈珏,邱禧荷.一种应用于旅行商问题的莱维飞行转移规则蚁群优化算法[J].计算机应用研究,2024,41(05):1420-1427.DOI:10.19734/j.issn.1001-3695.2023.09.0450.

  • [4]边锦华,张晓霞.求解TSP问题的一种变领域遗传算法[J].福建电脑,2023,39(12):24-27.DOI:10.16707/j.cnki.fjpc.2023.12.005.

3.4 问题四

问题3的基础上,建立一个多目标优化模型,将游览城市数量和总费用作为优化目标,使用线性规划、整数规划或混合整数规划方法。模型中需要包括时间限制(144小时),门票和交通费用的约束。通过求解优化模型,可以找到在总费用最小的情况下游览最多城市的最佳路线,同时计算总花费时间、门票和交通费用及游玩城市数量。论文的写作上,在数学模型上差异较小,创新点注重在求解算法上的创新。
在这里插入图片描述

参考文献

  • [1]梁健恒.基于改进蚁群算法的旅游园区观光路径规划优化[J].控制与信息技术,2024,(03):80-85.DOI:10.13889/j.issn.2096-5427.2024.03.011.
  • [2]董玮明,邱灿华.基于时间优化的旅游园区路径规划研究[J].信息技术与信息化,2023,(04):203-205+209.
  • [3]崔喜宁.基于蚁群算法的陕西红色旅游线路优化[J].信息技术与信息化,2021,(11):170-172.
  • [4]周生超.基于蚁群算法的寿光市文化旅游路径优化研究[J].潍坊工程职业学院学报,2021,34(03):100-103.
  • [5]李磊,张延星,谢超.基于旅游线路规划的蚁群优化算法研究[J].现代电子技术,2020,43(17):115-118.DOI:10.16652/j.issn.1004-373x.2020.17.026.
  • [6]李梦丹.基于蚁群算法西安旅游路线的优化研究[J].价值工程,2020,39(20):136-137.DOI:10.14018/j.cnki.cn13-1085/n.2020.20.058.

3.5 问题五

这个问和以上几个问有一些不同,是一个综合优化问题。这一问专注于景点的游览,入境城市是不限的,要求在144小时内尽可能多地游览山景,且控制费用。在山景游览的基础上,进一步复杂化了问题,包括选择入境城市和城市之间的高铁交通限制,同时要求控制费用。在问题4的多目标优化模型中加入山景因素,考虑山景数量、门票和交通费用。重新设计目标函数,平衡山景数量与费用。利用问题3和4中的路径优化方法,筛选出入境城市,并在全范围内规划山景游览路线。综合考虑高铁路线、时间限制和山景优化。对问题5中的复杂情况,应用动态规划方法进行路线规划,同时剪枝以减少计算量。结合山景的特点,优化选择城市和游玩顺序。使用启发式搜索算法和模拟退火技术优化山景游览路线,调整入境城市和游玩城市,以实现山景数量最多且费用最低的目标。

总之,这一问需要使用问题1中的景点评分数据、问题2中的城市选择、问题3和4中的路径规划方法。问题1的数据用于确定山景的评分,问题2的城市排名可作为入境城市的参考,问题3和4的优化技术可以应用于问题5的路线规划。

4 代码实现

4.1 问题一

import os
import pandas as pd

# 定义数据文件夹路径
folder_path = '附件'
# 初始化一个空的数据框
all_data = pd.DataFrame()
# 遍历文件夹中的所有CSV文件并加载数据
for file_name in os.listdir(folder_path):
    if file_name.endswith('.csv'):
        file_path = os.path.join(folder_path, file_name)
        
        # 提取城市名称(去掉文件扩展名)
        city_name = os.path.splitext(file_name)[0]
        
        # 读取CSV文件
        city_data = pd.read_csv(file_path)
        
        # 为数据框添加城市列
        city_data['城市'] = city_name
        
        # 确保 '景点评分' 列为浮点数类型
        city_data['评分'] = pd.to_numeric(city_data['评分'], errors='coerce')
        
        # 合并到总数据框中
        all_data = pd.concat([all_data, city_data], ignore_index=True)
all_data

在这里插入图片描述

# 确保 '景点评分' 列为浮点数类型
all_data['评分'] = pd.to_numeric(all_data['评分'], errors='coerce')

# 获取最高评分
best_score = all_data['评分'].max()

# 统计获得最高评分的景点数量
best_score_count = all_data[all_data['评分'] == best_score].shape[0]

# 按城市分组,统计每个城市中评分等于最高评分的景点数量
best_score_by_city = all_data[all_data['评分'] == best_score].groupby('城市').size().reset_index(name='景点数量')

# 按景点数量排序,获取前10个城市
top_10_cities = best_score_by_city.sort_values(by='景点数量', ascending=False).head(10)

# 打印结果
print(f"最高评分(BS):{best_score}")
print(f"获得最高评分(BS)的景点总数:{best_score_count}")
print("获得最高评分(BS)景点最多的前10个城市:")
print(top_10_cities)
最高评分(BS):5.0
获得最高评分(BS)的景点总数:2563
获得最高评分(BS)景点最多的前10个城市:
       城市  景点数量
4      三沙    36
25    五家渠    28
224    玉溪    21
233    益阳    20
91     天门    19
310   阿拉尔    18
215    潍坊    18
220    烟台    18
84   大兴安岭    18
283    邢台    17

4.2 问题二、三、四、五

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1979027.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【Nuxt】约定式路由和内置组件

约定式路由 手动创建&#xff1a; 或者还可以使用终端创建页面&#xff1a;nuxi-add-page npx nuxi add page about — about.vue npx nuxi add page about/index — about/index.vue <NuxtLink to"/"><button>Home</button></NuxtLink><…

宅家也能高效办公?试试这四款款远程控制神器!

因为工作时不时需要出差 &#xff0c;所以自打有出差以来遇到同事需要远程求助的情况都会想到远程控制电脑的方式&#xff0c;不仅仅解决了异地无法处理的情况&#xff0c;还能够及时快速并且零成本处理问题&#xff0c;所以今天就整理了四款很适合打工人的远程控制电脑的工具&…

C# Unity 面向对象补全计划 七大原则 之 开闭原则

本文仅作学习笔记与交流&#xff0c;不作任何商业用途&#xff0c;作者能力有限&#xff0c;如有不足还请斧正 本系列作为七大原则和设计模式的进阶知识&#xff0c;看不懂没关系 请看专栏&#xff1a;http://t.csdnimg.cn/mIitr&#xff0c;查漏补缺 1.开闭原则&#xff08;OC…

Linux 命令安装

系列文章目录 提示&#xff1a;仅用于个人学习&#xff0c;进行查漏补缺使用。 1.Linux介绍、目录结构、文件基本属性、Shell 2.Linux常用命令 3.Linux文件管理 4.Linux 命令安装 提示&#xff1a;写完文章后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助…

力扣——572.另一个树的子树

题目&#xff1a; 思路&#xff1a; 深度优先搜索&#xff0c;遍历root的每一个节点代表的整棵树是否和subroot一样。比较是否一样的时候可以从根节点开始递归&#xff0c;首先查看是否为空&#xff0c;然后值是否一样。 代码&#xff1a; vs可运行代码&#xff1a; &#…

【C++】异常处理:深度解析与实战精髓,不容错过的编程秘籍

&#x1f308; 个人主页&#xff1a;Zfox_ &#x1f525; 系列专栏&#xff1a;C从入门到精通 目录 &#x1f680; 前言&#xff1a;C语言传统的处理错误的方式 一&#xff1a; &#x1f525; C异常概念二&#xff1a; &#x1f525; 异常的使用 2.1 &#x1f4d6; 异常的抛出和…

后端学习笔记(4)--MyBatis

1.MyBatis ​ *MyBatis是一款优秀的持久层框架&#xff0c;用于简化JDBC开发 *持久层 ​ *负责将数据保存到数据库的那一层代码 ​ *JavaEE三层架构&#xff1a;表现层、业务层、持久层 *框架 ​ *框架是一个半成品软件&#xff0c;是一套可重用的、通用的、软件基础代码…

52 break 与 continue 语句

break 与 continue 语句在 while 循环和 for 循环中都可以使用&#xff0c;并且一般常与选择结构或异常处理结构结合使用。 ① 一旦 break 语句被执行&#xff0c;将使得 break 语句所属层次的循环提前结束。 ② continue 语句的作用是提前结束本次循环&#xff0c;忽略 contin…

量产部落RTS5765DL量产工具,RTS5765DL+三星SSV6顺利开卡,假金士顿固态完美修复,RTS5765、RTS5766固件量产教程

朋友电脑开不了机&#xff0c;判断是硬盘坏了&#xff0c;从上面拆下来一个1TB的金士顿固态盘。 居然用的是RTS5765DL主控三星SSV6颗粒&#xff0c;100%假货了&#xff0c;看来只能用开卡软件来修复。 开卡前必须准备一个开卡转接板&#xff0c;方便固态硬盘通过USB连接电脑&am…

Nginx解析漏洞~CVE-2013-4547漏洞分析

Nginx解析漏洞 这个解析漏洞其实是PHP CGI的漏洞&#xff0c;在PHP的配置文件中有一个关键的选项cgi.fix_pathinfo默认是开启的&#xff0c;当URL中有不存在的文件&#xff0c;PHP就会向前递归解析。在一个文件/xx.jpg后面加上/.php会将 /xx.jpg/xx.php 解析为 php 文件。 CVE-…

实验4-1-7 特殊a串数列求和

//实验4-1-7 特殊a串数列求和/* 给定两个均不超过9的正整数a和n&#xff0c;要求编写程序求aaaaaa⋯aa⋯a&#xff08;n个a&#xff09;之和。 输入格式&#xff1a;输入在一行中给出不超过9的正整数a和n。 输出格式&#xff1a;在一行中按照“s 对应的和”的格式输出。 */#in…

Stegdetect教程:如何用Stegdetect检测和破解JPG图像隐写信息

一、Stegdetect简介 Stegdetect 是一个开源工具&#xff0c;专门设计用于检测图像文件&#xff08;JPG格式&#xff09;中的隐写信息。Stegdetect 可以检测多种常见的隐写方法&#xff0c;比如 JSteg、JPHide 和 OutGuess 等。 二、使用Stegdetect检测图像隐写 官方描述&#…

javaI/O|day2. javaI/O模型、 具体I/O流程、 具体模型

文章目录 javaI/O模型定义具体I/O流程图示过程讲解 具体模型I/O调用两个阶段同异步阻塞非阻塞BIO(同步并阻塞)NIO(同步非阻塞)AIO(异步非阻塞) javaI/O模型 定义 用什么样的通道或者通信模式和架构进行数据的传输和接收,很大程度上决定了程序的性能 具体I/O流程 图示 过程 …

36k Star的开源大模型应用开发平台,太强了!

引言 Dify是一款开源的大语言模型&#xff08;LLM&#xff09;应用开发平台&#xff0c;它帮助开发者和非技术人员&#xff0c;快速构建生产级别的生成式AI应用。 该项目设立于2023 年 3 月&#xff0c;开源协议是基于 Apache License 2.0 有限商业许可&#xff0c;后端技术P…

nginx自动续期ssl证书

&#x1f534; 大家好&#xff0c;我是雄雄&#xff0c;欢迎关注微信公众号&#xff1a;雄雄的小课堂。 &#x1f534;前言 前年&#xff0c;阿里将免费的ssl证书从一年调整成了三个月&#xff1b; 去年&#xff0c;腾讯将免费的ssl证书从一年调整成了三个月&#xff1b; 以…

【文献阅读】Balancing the Scales: HyperSMOTE for Enhanced Hypergraph Classification

Abstract 真实用户与机器人数量之间的固有不平衡带来了巨大的挑战&#xff0c;常常导致分类器的偏差。本文引入了HyperSMOTE&#xff0c;这是一种利用超图丰富结构的不平衡节点分类的新方法。通过将X平台用户表示为节点&#xff0c;并将他们的互动表示为超边&#xff0c;构建了…

给水排水杂志

一、基本信息 《给水排水》创刊于1964年&#xff0c;是国内创刊早、发行量大、内容涵盖广的水行业权威期刊&#xff0c;在业内享有盛誉。期刊现由中国建设集团股份有限公司主管&#xff0c;亚太建设科技信息研究院有限公司、中国土木工程学会主办。现任名誉主编&#xff1a…

【Java】深度解析Java的反射机制

反射&#xff08;Reflection&#xff09; 一、 反射的基本概念二、 获取类的信息三、 获取类的成员四、 动态创建对象五、 动态调用方法六、 动态访问和修改字段 总结 一、 反射的基本概念 反射是一种运行时机制&#xff0c;允许程序在运行时检查和操作类、方法、字段等。通过…

告别异地烦恼,这四款远程控制工具一键掌控千里之外的电脑!

现在的科技水平真是越来越强大了&#xff0c;以前都是必须要在电脑跟前才可以解决的问题&#xff0c;现在可以安装通过远程控制的软件来实现在家就可以办公&#xff0c;解决了这当中的时间和金钱成本&#xff0c;所以今天就具体来聊聊四款好用的远程控制工具&#xff0c;协助我…

学python的第一天:PyCharm创建项目

创建项目 打开工具 PyCharm 点击“新建项目” 点击“创建” 环境 系统会创建虚拟环境&#xff0c;稍等 初始设置 创建完成后会进入main.py文件 性能 可以看到 右下角提示我们增强性能&#xff0c;点“自动” 会获取到管理员权限 完成后会提示完成