巴西队提前出线,预定大力神杯?数据分析告诉你,到底谁才是冠军

news2024/11/26 23:32:48

2022年卡塔尔世界杯的第一轮小组赛,已经在众多惊诧、悲伤、惊喜的情绪中结束,而仅仅是第一轮的小组比赛,不断爆出的冷门就足以使人大跌眼镜了:

连续34场世界大赛不败的潘帕斯雄鹰——阿根廷,1-2负于世界排名51的沙特;

四届世界杯冠军得主的德意志战车——德国队,1-2负于从未进过8强的日本;

让无数强队忌惮的南美洲天蓝军团——乌拉圭,0-0被称为世界杯鱼腩的韩国队逼平;在这里插入图片描述

自从揭幕战上卡塔尔打破了“世界杯揭幕战东道主必胜”的铁律,就预示了2022年卡塔尔世界杯注定是一场不平凡的大戏,也许世界杯冠军的宝座上会迎来又一位新王。

欢喜的背面一定是悲伤,此时一定有无数的球迷为自己的球队欢欣鼓舞,也一定有无数的球迷正在黯然神伤,最终究竟谁能捧起大力神杯,是众星璀璨的新人、还是老骥伏枥的旧主,没有人能猜得出,但我们或许可以从大数据预测中窥得一二。

构建世界杯预测的模型

(想看预测的直接略过这部分)

自从现代足球逐渐商业化之后,无数人开创了大数据分析模型来试图预测足球比赛的胜负,然而因为足球比赛的影响因素比吃饭喝水要复杂的多,球队阵容、球员能力、球员状态、球员心理、球队战术、球队磨合度、球队配合度等等,每一个因素的风吹草动,都会牵一发而动全身,影响最终的结果,预测的结果可能会与现实大相径庭。

但是大多数模型背后的机理,基本都有着泊松概率分布模型的影子:
在这里插入图片描述

这个模型看起来复杂难懂,其实它有着朴素且美丽的魔力,能够“准确”预测几乎所有事件的发生概率,它的原理则更为简单,可以用几句话就解释清楚:

我工作时会喝水这个事情,要么发生、要么不发生;
我喝水这个事情在某个时间段内我是已知的,比如平均一上午喝两次水;
我喝水这个事情在某个时间段内发生的概率是一样,任何时候都可能喝水;
我这次喝水和下次喝水的事件是独立的,互不影响;
那么,这个事件就可以用泊松分布的公式进行解释,以足球预测为例,我们可以以“某队在一场比赛中进球”为事件,用K表示我们期望球队进几个球(事件发生多少次),用λ表示在一场比赛的时间内发生事件的平均数,这个我们可以通过每个球队世界杯上每场比赛的场均进球即可,最后得到一个概率图形,进而得出一个球队进1个球的概率、进2个球的概率、进N个球的概率分别是多少:在这里插入图片描述

而正是因为足球是复杂多变的,不能仅仅用场均进球来估计结果,因此我们通过球队的场均进球、场均失球、场均胜率、场均败率、场均平率等数据来综合估算出一个球队的实力,当然这个模型就各有各的算法,我们就取最简单的“攻击力”模型。

通过BI进行分析和解释

首先就是解决数据的问题,好在所有国家队的数据都可以从网上进行下载,然后在excel中计算出每个球队进球的泊松概率:在这里插入图片描述

然后我们将数据导入到专业的数据分析软件FineBI中,进行进一步的数据清洗和处理,首先就是对数据进行数据合并,按照世界杯小组赛的分组将不同的数据进行合并,组建出“某队对战某队”的数据格式,然后利用我们的“攻击力”模型,导入数据函数新建出几个数据列,表示球队的进攻力指数:在这里插入图片描述

具体过程这里就不赘述了,数据清洗阶段结束后就要对数据进行可视化分析了,利用FineBI的可视化操作界面可以很轻松的组合出我们想要的数据,比如身价对比、夺冠对比、净胜球对比等等,最终美化一下就可以呈现出这样的效果:在这里插入图片描述

预测出线概率详解
最重点的是我们根据“进攻力指数”估算出了每个球队的进攻强度,然后利用泊松概率就可以算出每场比赛球队最可能的比分,这里我们用场均进球展示:在这里插入图片描述

表中像卡塔尔这种第一次参加世界杯的国家,因为缺少历史数据参考,因此只能根据亚洲成绩将攻击力人为地设定一个值,所以是比实际实力要虚高的。

我们可以以G组为例,表格中的数据展示,喀麦隆对瑞士的净胜球大概率为-0.57,而瑞士对喀麦隆的净胜球大概率为0.71,即双方差距1.28个球;而现实结果中,瑞士与喀麦隆的成绩是1:0,与数据预测的相差无几;

这时候我们再来看一看为什么说开头的那三场比赛,冷门的离谱:

数据预测,阿根廷对沙特的净胜球大概率为3.29,比分预测为3:0,而实际结果是1:2落败;

德国对日本的净胜球大概率为2.48,比分预测为2:0,而实际结果是1:2落败;

乌拉圭对韩国的净胜球大概率为1.06,比分预测为1:0小胜,而实际结果确实0:0被韩国逼平;

根据其他专业机构的预测数据现实,赛前沙特战胜阿根廷的胜利不足1%,然而种种因素却造就了本届世界杯上最大最大的冷门,也让阿根廷人品尝了亚洲足球的苦果。

用这个模型继续推导可以模型出最终淘汰赛的最终结果,这里因为系统还需要优化就没有继续推导,但是在finebi里计算了一下,结果显示巴西本届世界杯夺冠的概率是最大的,概率与前几天疯狂流传的大数据机构预测机构相差不多:在这里插入图片描述

此外我还做了一些其他有意思的数据统计,比如球员身价统计:在这里插入图片描述

冠亚军数量对比:在这里插入图片描述

国家队平均年龄对比:在这里插入图片描述

加纳平均年龄只有24岁,绝对的青春风暴;而西班牙也只有25岁,这支斗牛士军团正在更新换代的关键期,以加维为代表将继续扛起伊比利亚足球的大旗;

巴西、比利时、阿根廷、克罗地亚的平均年龄都在27岁以上,阵中老将非常多,如内马尔、德布劳内、莫德里奇、梅西、迪马利亚等足球历史上闪耀的明星,都已进入了职业生涯末期,世人最不肯见英雄迟暮,但他们都将为了自己一生的理想而拼尽最后一秒。

数据是冰冷的,足球是温暖的,数据预测并不能取代和代表现实,赢负胜败并不全部,真正让我们着迷的是场上的22名球员、与场下的教练、球迷一起为追求理想而不断敲开紧闭的大门,奋力揭开幸运女神身上冰冷的面纱,而这正是足球、正是世界杯的魅力所在。

因为,我们爱足球当然不是爱他的成败,我们爱的就是那种气质,不是吗?

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/48075.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

天宇优配|百股涨停再现,沪指盘中创近两个月新高

周二A股商场呈现普涨格局,上证指数上涨2.31%,盘中最高点位创出最近两个月新高。各大职业板块近乎全线上涨,地产板块个股掀起涨停潮,数十只地产债盘中涨光临停。此外,A股大金融体现强势,疫苗股则尾盘忽然暴力…

号称Java圣经,Github上爆火的1058页JVM全栈小册到底有什么魅力

对于JVM,我想大部分小伙伴都是要面试了才会去学,其余时间基本不会去看(掐指一算,你们书架上面的深入理解Java虚拟机第三版应该都一层灰了吧【手动狗头】)。但值得一说的是,当你工作多年之后,你遇…

基于LSCF和LSFD算法在频域中识别快速实现的MIMO研究(Matlab代码实现)

👨‍🎓个人主页:研学社的博客 💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜…

TensorFlow Lite 是什么?用 TensorFlow Lite 来转换模型(附代码)

文章目录TensorFlow Lite 做了什么?将一个模型用 TensorFlow Lite 转换训练一个简易模型保存模型转换模型加载 TFLite 模型并分配张量进行预测将在猫狗大战数据集上进行迁移学习的 MobileNetV2 转换到 TensorFlow Lite将模型转换到 TensorFlow Lite优化模型Referenc…

DFL3:软件版本的选择和安装详解

这本是一个简单的问题,但是对于新手而言,所有问题,总是说的越清楚越仔细越好。我之所以这么说,肯定是有人问了。所以我就专门开一篇文章来说一说,软件版本的异同,以及如何选择。针对不同的语言,…

如何快速定位到报错日志中的关键信息,一招学会,赶快GET吧

一般的服务器日志一个可能大的有几十上百m,小的也得几百k,里面内容是比较多的,如拿到日志没思路去看的话,下面一些办法可以让你快速定位到日志中的异常错误信息 文章目录步骤1:定位到错误信息再那个日志中(grep)步骤2:查看日志上下…

[附源码]计算机毕业设计springboot教育企业网站

项目运行 环境配置: Jdk1.8 Tomcat7.0 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: SSM mybatis Maven Vue 等等组成,B/S模式 M…

鲲鹏devkit性能分析工具介绍(三)

鲲鹏devkit性能分析工具介绍(三) 本篇主要讲解鲲鹏devkit性能分析工具的访存分析功能 访存分析 访存统计分析基于CPU访问缓存和内存的PMU事件,分析存储的访问次数、命中率、带宽等情况。 Miss事件分析基于ARM SPE(Statistical…

固话号码认证有什么好处?固话号码认证有什么作用?

固话号码认证为企业提供号码认证服务,在来电时显示企业信息,可提高电话号码辨识度,防止错误标记,确保展现的企业信息与企业的手机终端、APP等多平台展示信息一致,保证品牌企业的身份及商业价值。 那如何上线号码认证服…

图的初识·基本概念

文章目录基本概念图有两种基本形式无向图的表示有向图的表示基本概念 图结构也是数据结构的一部分。而且还有一点小难。图是由多个结点链接而成的,但是一个结点可以同时连接多个其他结点,多个节点也可以同时指向一个节点。【多对多的关系】 图结构是任意…

iPhone升级iOS 16后出现提示“面容ID不可用”怎么办?

最近,很多用户在苹果社区反馈,iPhone升级iOS 16后Face ID不能用了,尝试重置Face ID时,系统会弹窗提示“面容ID不可用,稍后尝试设置面容ID。” 如果你的iPhone在没有摔落手机或是手机进水的情况下出现这个弹窗&#xff…

电脑游戏录屏哪个好用免费?这2款录屏软件,用过都说好!

​相信很多小伙伴都有过在游戏中的精彩操作吧。有些小伙伴想要把自己在游戏中的精彩操作分享给朋友,可是却不知道有什么好用免费的游戏录屏软件,能够将自己游戏里的亮眼表现录制下来。那么电脑游戏录屏哪个好用免费?接下来小编分享2款永久免费…

PyQt5 窗口数据传递

PyQt5 窗口数据传递单一窗口数据传递多窗口数据传递:调用属性多窗口数据传递:信号与槽开发应用程序时,若只有一个窗口则只需关心这个窗口里面的各控件之间如何传递数据。如果程序有多个窗口,就要关心不同的窗口之间是如何传递数据…

History、Location

History、Location 学习路线:JavaScript_BOM->Window对象->confirm()、setInterval()、setTimeout()->History、Location->闪烁的灯泡 History History 对象是 JavaScript 对历史记录进行封装的对象。 History 对象的获取 使用 window.history获取&a…

云小课|云小课教您如何选择Redis实例类型

阅识风云是华为云信息大咖,擅长将复杂信息多元化呈现,其出品的一张图(云图说)、深入浅出的博文(云小课)或短视频(云视厅)总有一款能让您快速上手华为云。更多精彩内容请单击此处。 摘要:购买Redis实例时,实例类型有单机、主备、Pr…

vmware安装openEuler20.03

一,直接看图。 点击创建虚拟机。 这里如果是21.03版本的话,版本需要选择Linux5.x内核64位。 20.03选择Linux4.x的内核。 2个或者4个都行。 内存不要小于4G。 官方推荐不要小于32G。 直接下一步即可。 然后等待,进入配置。 安…

数据结构学习:Trie树

Trie一、概念二、代码实现三、Tire树的时间复杂度和空间复杂度四、Tire树的优势一、概念 Trie树,也叫"字典树",顾名思义,是一种专门处理字符串匹配的树形结构,用来解决在一组字符串集合中快速找到某个字符串类似于这种字符串匹配问题,可以使用RF暴力匹配、RK哈希匹配…

RabbitMQ 快速入门七种简单模式

RabbitMQ 快速入门七种简单模式起步七种模式项目依赖1、"Hello World!"(1) Connection 方式(2) RabbitTemplate 方式2、Work Queues生产者消费者3、Publish/Subscribe关系绑定生产者消费者4、Routing消费者生产者5. Topics消费者生产者6、RPC7、Publisher Confirms起…

面试又卡在多线程?那就来分享几道 Java 多线程高频面试题,面试不用愁

多线程中的忙循环是什么?忙循环就是程序员用循环让一个线程等待,不像传统方法 wait()、 sleep() 或 yield(),它们都放弃了 CPU 控制,而忙循环不会放弃 CPU,它就是在运行一个空循环。 这么做的目的是为了保留 CPU 缓存&#xff0c…

用于大规模 MIMO 检测的近似消息传递 (AMP)(Matlab代码实现)

👨‍🎓个人主页:研学社的博客 💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜…