2024美国大学生数学建模C题网球运动中的势头详解思路+具体代码

news2024/10/7 7:24:50

2024美国大学生数学建模C题网球运动中的势头详解思路+具体代码

在这里插入图片描述

E题数据已更新,做E题的小伙伴推荐看看博主的E题解析文章。那么废话不多说我们继续来做C题。

赛题分析

我们先阅题:

在2023年温布尔登男单决赛中,20岁的西班牙新星卡洛斯·阿尔卡拉兹击败了36岁的 诺瓦克·德约科维奇。这是德约科维奇自2013年以来在温布尔登的首次失利,也终结 了这位历史上最伟大的大满贯选手之一的辉煌战绩。

这场比赛本身就是一场非凡的战斗。[1]德约科维奇似乎注定要轻松获胜,因为他以6比1 控制了第一局(7局中赢了6局)。然而,第二盘比赛气氛紧张,最终阿尔卡雷斯在抢七局 中以7 - 6获胜。第三局与第一局相反,阿尔卡拉斯以6 - 1轻松获胜。这位年轻的西班 牙人在第四盘开始时似乎完全控制了比赛,但不知怎么的,比赛再次改变了方向,德约 科维奇完全控制了比赛,以6比3赢得了比赛。第五盘也是最后一盘,德约科维奇从第四 盘开始保持优势,但再次改变方向,阿尔卡拉兹获得控制并以6比4获胜。本次比赛的数 据在提供的数据集中,“match_id”为“2023-wimbledon1701”。你可以用“set_no” 列= 1看到德约科维奇在第一盘领先时的所有得分。令人难以置信的挥杆,有时是在许多 分甚至是比赛中,发生在似乎有优势的球员身上,通常被归因于“势头”。

读到这里感觉这个题有点意思,比较抽象。这美赛难道是想让我们建模找出势头?说实话这玩意多半是和时间序列预测有关,而且这东西预测出来有点虚无缥缈,也就是言之有理即可,重要的是有过程的数据分析,题目不会算很难,给了很多答主自由选择模型的空间。我们继续往下读题:

字典上对动量的一个定义是“通过运动或一系列事件获得的强度或力”。[2]在体育运 动中,一个团队或球员在比赛中可能会感到他们有动力,或“力量/力量”,但很难衡 量这种现象。此外,我们也不清楚比赛中的各种事件是如何创造或改变动量的。 2023年温布尔登男单前两轮之后的每一分数据。你可以选择包含额外的玩家信息或其他 数据,但你必须完整地记录这些来源。使用这些数据:

(1).开发一个模型,在游戏流程捕捉势头,并将其应用于一场或多场比赛。你的模型应该识别出哪名球员在比赛的特定时间表现更好,以及他们的表现有多好。 提供基于您的模型的可视化来描述匹配流。注:在网球比赛中,发球的选手赢得得 分/比赛的可能性要大得多。您可能希望以某种方式将此因素纳入您的模型中。

(2).一位网球教练怀疑“势头”在比赛中是否起作用。相反,他假设一个玩家在游戏中 的波动和成功的运行是随机的。使用你的模型/指标来评估这种说法。

(3).教练们很想知道,是否有一些指标可以帮助确定比赛流程何时会从有利于一名球员转变为有利于另一名球员。

  • 使用至少一场比赛提供的数据,开发一个预测比赛中这些摆动的模型。哪些因素看起来最相关(如果有)?
  • 考虑到过去比赛中动量波动的差异,你如何建议一个球员在新的比赛中面对不同的球员?

(4).在一个或多个其他比赛中测试你开发的模型。你对比赛结果的预测有多准确?如果模 型有时表现不佳,您能否确定可能需要包括在未来模型中的任何因素?您的模型对 其他比赛(如女子比赛)、锦标赛、球场表面和其他运动(如乒乓球)的通用性如何?

(5).提交一份不超过25页的调查报告,并包括一到两页的备忘录,总结你的结果,并就“ 势头”的作用向教练提出建议,以及如何让球员准备好应对影响网球比赛过程的事件。

题一、抓捕势头模型

不看数据集不知道,一看数据集单场比赛居然可以有这么多特征,那么该题的最大问题就是如何用好这些数据集了。首先我们要明白一点,就是这些数据是建立在时间之上的,也就是时序数据。时序数据不能用传统的数据分析方法,而是要尽可能将时间视为一个特征链去分析,也就是视为一个x轴,在时间轴上去衡量计算各个维度的特征关联。模型应该能够在比赛的任何给定时间点评估哪位选手表现更好,以及他们的表现优势有多大。此外,模型应该考虑到发球方赢得得分/局的概率通常更高这一因素。

单次比赛数据包含了详细的比赛信息,包括比赛ID、选手姓名、比赛经过的时间、盘数、局数、分数等多达46个字段。这些数据提供了每一分的详细记录,包括选手的得分情况、发球速度、发球方向、球的落点深度、选手跑动距离、连续击球数(rally count)等。

数据处理和分析

首先,需要整理和分析提供的数据。这可能包括每个得分的详细信息,比如哪位选手得分、得分是如何获得的(例如,发球得分、主动得分或对手失误)以及得分时的比赛状态(例如,比分、局数、盘数)。

附加数据:可能还需要考虑选手的一些基本信息,如世界排名、赛前状态、历史对决记录等,这些都可能影响比赛动力的评估。

我们需要详细分析每个得分事件,并根据比赛情况(如谁赢得了分数)来更新得分,所以进行积分规则编程尤为重要。

建模思路

  1. 解析规则:根据提供的计分规则,我们需要一个函数来解释每个得分事件,并更新每位选手的得分。
  2. 计算得分:我们将使用比赛的得分事件来模拟每个游戏内的得分变化。每位选手的得分将根据比赛规则更新。
  3. 确定动力:我们可以通过考虑比赛中的关键事件(如破发点、保发、发球优势)来确定每位选手的动力。动力可以用得分差异来表示,也可以通过其他衡量方式来衡量,比如连续得分或突然得分变化。
  4. 可视化:使用得分差异和比赛关键时刻,我们可以创建一个时间序列图来显示比赛动力的变化。

规则题目已经给出:

在这里插入图片描述

那么我们开始进行仿真模拟单场发球规则,而且这么多维度的数据,必须要进行降维或者是优化得分更新逻辑,或者将数据分批处理,在更新得分之前先预处理数据以减少需要处理的数据量。

由于网球比赛的计分规则相对复杂,我们需要确保模型能够处理以下情况:

  • 普通得分,从0(Love)开始,到15、30、40,然后赢得游戏。
  • 当双方得分都达到40(Deuce)时,需要赢得连续两分才能赢得游戏。
  • 盘的胜利需要赢得至少6个游戏,并且至少领先对手2个游戏。如果双方都赢得6个游戏,那么进行决胜局。
  • 比赛的胜利需要赢得3个盘。

在网球得分系统中,当比分到达40-40(Deuce)时,需要连续赢得两分才能赢得该游戏。此外,在6-6平局时,通常会进行决胜局(Tie-break),其计分规则与普通游戏不同。在决胜局中,首先赢得7分(必须领先2分)的选手将赢得该盘。如果是比赛的最后一盘(通常是第五盘),则可能需要10分来赢得胜利。所以我们还需要加入Deuce规则:

考虑以上40-40(Deuce)的情况:

Rowcolumn(s)Value(s)Description
Row 8p1_score, p2_score40, 40The score is 40 – 40 meaning each player has won 3 previous points (this is also called “deuce”)
point_victor1Alcaraz wins point 7 (in row 8)
Row 9p1_score, p2_scoreAD,40Since Alcaraz won the previous point (point 7) the score on point 8 is now “AD” for Alcaraz and “40” for Jarry meaning Alcaraz has won one more point and could win the game on the next point.
point_victor2Jarry (player 2) wins point 8 (in row 9).
Row 10p1_score, p2_score40, 40The score returns to 40 – 40 (“deuce”) meaning each player has won the same number of previous points although now it is 4 points each.
point_victor1Alcaraz wins point 9 (in row 10).
Row 11p1_score, p2_scoreAD,40Alcaraz again has the advantage having won point 9
point_victor1Alcaraz wins point 10 (in row 11) which means he has won the game (has score 2 more points now).
Row 12game_no2This is now the first point of game 2.
p1_games1Alcaraz won game 1.
# 定义更新得分的函数,考虑到deuce和advantage的情况
def update_match_scores(df):
    p1_points, p2_points = 0, 0  # Points in a game
    p1_games, p2_games = 0, 0  # Games in a set
    p1_sets, p2_sets = 0, 0  # Sets in the match
    for index, row in df.iterrows():
        
        if row['point_victor'] == 1:
            p1_points += 1
        else:
            p2_points += 1

        if p1_points >= 4 and p1_points - p2_points >= 2:
            p1_games += 1
            p1_points, p2_points = 0, 0  # Reset points
        elif p2_points >= 4 and p2_points - p1_points >= 2:
            p2_games += 1
            p1_points, p2_points = 0, 0  # Reset points

        if p1_games >= 6 and p1_games - p2_games >= 2:
            p1_sets += 1
            p1_games, p2_games = 0, 0  # Reset games
        elif p2_games >= 6 and p2_games - p1_games >= 2:
            p2_sets += 1
            p1_games, p2_games = 0, 0  # Reset games

        df.loc[index, 'p1_points'] = p1_points
        df.loc[index, 'p2_points'] = p2_points
        df.loc[index, 'p1_games'] = p1_games
        df.loc[index, 'p2_games'] = p2_games
        df.loc[index, 'p1_sets'] = p1_sets
        df.loc[index, 'p2_sets'] = p2_sets
    
    return df

在这里插入图片描述

这样一来我们就先完成了捕捉赛点发生时的比赛流程模拟,现在捕捉势头也就是预测峰值走向,其实就是梯度的概念,下一步我们开始进行时序预测模型的建模处理:

在这里插入图片描述

这样一来我们就先完成了捕捉赛点发生时的比赛流程模拟,现在捕捉势头也就是预测峰值走向,其实就是梯度的概念,下一步我们开始进行时序预测模型的建模处理。

对时序预测算法不是很有把握的推荐去看看博主之前写的专栏,很有帮助。先记录到这里后面整理一下,期待大家的关注和支持!就是我一直以来写作的动力!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1427980.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

2024最新版IntelliJ IDEA安装使用指南

2024最新版IntelliJ IDEA安装使用指南 Installation and Usage Guide to the Latest JetBrains IntelliJ IDEA Community Editionn in 2024 By JacksonML JetBrains公司开发的IntelliJ IDEA一经问世,就受到全球Java/Kotlin开发者的热捧。这款集成开发环境&#xf…

match-case与if/elif/else(python)

if/elif/else语句应对一般场景,match-case主打复杂条件分支语句。 (笔记模板由python脚本于2024年01月28日 18:27:37创建,本篇笔记适合有一定编程基础,对python基础已比较扎实的coder翻阅) 【学习的细节是欢悦的历程】 Python 官网&#xff1…

Java Swing实现思聪吃热狗游戏

引言 Java Swing,一种灵活的图形用户界面库,让我们可以以相对简便的方式创建图形化应用程序。在本文中,我们将讲述如何借助Swing构建一个简单的游戏:DogGame,它的规则是控制一只名为Wsc的狗来捕捉飞来的热狗。让我们浏…

Github 2F2【解决】经验帖-PPHub登入

最近在做项目时,Github总是出问题,这是一经验贴 Github 2F2登入问题【无法登入】PPhub 2F2是为了安全,更好的生态 启用 2FA 二十八 (28) 天后,要在使用 GitHub.com 时 2FA 检查 物理安全密钥、Windows Hello 或面容 ID/触控 ID、SMS、GitHub Mobile 都可以作为 2F2 的工…

架构学习(三):scrapy-redis源码分析并实现自定义初始请求

scrapy-redis源码分析并实现自定义初始请求 前言关卡:如何自定义初始请求背景思考简单又粗暴的方式源码分析 结束 前言 通过这篇文章架构学习(二):原生scrapy如何接入scrapy-redis,初步入局分布式,我们正式开启scrapy-redis分布式…

MySQL EXPLAIN查询执行计划

EXPLAIN 可用来查看SQL执行计划,常用来分析调试SQL语句,来使SQL语句达到更好的性能。 1 前置知识 在学习EXPLAIN 之前,有些基础知识需要清楚。 1.1 JSON类型 MySQL 5.7及以上版本支持JSON数据类型。可以将数组存为JSON格式的字符串&#…

【CSS】css选择器和css获取第n个元素(:nth-of-type(n)、:nth-child(n)、first-child和last-child)

:nth-of-type、:nth-child的区别 一、css选择器二、:nth-of-type、:nth-child的区别:nth-of-type(n):选择器匹配属于父元素的特定类型的第N个子元素:nth-child(n):选择器匹配属于其父元素的第 N 个子元素,不论元素的类型:first-child&#xf…

2017 年全国职业院校技能大赛高职组“信息安全管理与评估”赛项任务书(笔记解析)

1. 网络拓扑图 2. IP 地址规划表 3. 设备初始化信息 阶段一 任务1:网络平台搭建 1 根据网络拓扑图所示,按照 IP 地址参数表,对 WAF 的名称、各接口 IP 地址进 行配置。 主机名称 模式选择:透明模式 IP 地址:匹配参数表 WAF IP 地址 子网掩码 网口列表: eth0 和 eth1 2…

【操作宝典】IntelliJ IDEA新建maven项目详细教程

目录 🌼1. 配置maven环境 🌼2. 创建maven项目 🌼3. 创建maven项目完整示例 a. 导入spring boot环境 b. 修改maven配置 c. 下载jar包 d. 创建Java类 🌼1. 配置maven环境 【安装指南】maven下载、安装与配置详细教程-CSDN博客…

Vue3+vite引入Tailwind CSS

Tailwind CSS 是一个为快速创建定制化 UI 组件而设计的实用型框架。与其他 CSS 框架或库不同,Tailwind CSS 组件没有预先设置好样式。可以使用 Tailwind 的低级实用类来为 CSS 元素设置样式,如 margin、flex、color 等。 自从 2017 年发布以来&#xff…

基于python flask茶叶网站数据大屏设计与实现,可以做期末课程设计或者毕业设计

基于Python的茶叶网站数据大屏设计与实现是一个适合期末课程设计或毕业设计的项目。该项目旨在利用Python技术和数据可视化方法,设计和开发一个针对茶叶行业的数据大屏,用于展示和分析茶叶网站的相关数据。 项目背景 随着互联网的快速发展,越…

【Java程序设计】【C00196】基于(JavaWeb+SSM)的旅游管理系统(论文+PPT)

基于(JavaWebSSM)的旅游管理系统(论文PPT) 项目简介项目获取开发环境项目技术运行截图 项目简介 这是一个基于ssm的旅游平台 本系统分为前台、管理员2个功能模块。 前台:当游客打开系统的网址后,首先看到的…

使用 Dockerfile 定制镜像详解

使用 Dockerfile 定制镜像详解 1.DockerfileFROM 指定基础镜像RUN 执行命令构建镜像 2.COPY 复制文件3.ADD 更高级的复制文件4.CMD 容器启动命令5.ENTRYPOINT 入口点6.ENV 设置环境变量7.ARG 构建参数8.VOLUME 定义匿名卷9.EXPOSE 暴露端口10.WORKDIR 指定工作目录11.USER 指定…

鸿道(Intewell)操作系统是什么?

科东软件自主研发的鸿道(Intewell)新型工业操作系统历经30多年研发积累,采用业界领先的微内核架构,具备高实时、高安全及强扩展的特性,与自主研发的Hypervisor虚拟化技术相结合,既能满足工业现场对设备控制…

Ray on ACK 实践探索之旅 - RayCluster 篇

作者:张杰、霍智鑫、行疾 什么是 Ray? Ray 是一个开源框架,专为构建可扩展的分布式应用程序而设计,旨在通过提供简单直观的 API,简化分布式计算的复杂性,让开发者能够便捷高效地编写并行和分布式 Python …

Git 指令

Git 安装 操作 命令行 简介: Git 是一个开源的分布式版本控制系统,用于敏捷高效地处理任何或小或大的项目。 Git 是 Linus Torvalds 为了帮助管理 Linux 内核开发而开发的一个开放源码的版本控制软件。 Git 与常用的版本控制工具 CVS, Subversion …

Iceberg从入门到精通系列之二十一:Spark集成Iceberg

Iceberg从入门到精通系列之二十一:Spark集成Iceberg 一、在 Spark 3 中使用 Iceberg二、添加目录三、创建表四、写五、读六、Catalogs七、目录配置八、使用目录九、替换会话目录十、使用目录特定的 Hadoop 配置值十一、加载自定义目录十二、SQL 扩展十三、运行时配置…

avast网页随机密码生成器

随机密码生成器 | 告别 12345 | Avast 可以生成随机密码 按需调整

Vue3学习记录(二)--- 组合式API之计算属性和侦听器

一、计算属性 1、简介 ​ 计算属性computed(),用于根据依赖的响应式变量的变化,进行自动的计算,并返回计算后的结果。当依赖的响应式变量发生变化时,computed()会自动进行重新计算,并返回最新的计算结果。如果依赖的…