DolphinScheduler 机器学习工作流预测今年 FIFA 世界杯冠军大概率是荷兰!

news2025/1/17 6:08:38

7138c0191c585626f7ade3fdf357837e.gif

点击蓝字,关注我们

33fd68cb7d3b34cdb4bce1c9ce5bca65.jpeg

作者 | DolphinScheduler Committer 周捷光

2022 FIFA 世界杯火热进行中!这段时间,这场盛宴吸引了全球球迷的目光。除了让人心跳加快的赛况和被大家调侃像馄饨皮的吉祥物之外,预测和投注哪支队伍将会夺冠绝对是球迷最大的乐趣之一。

我也是众多想要知道今年谁会夺冠的球迷之一。想到就要去做!于是我花了 2 天时间,用 DolphinScheduler 制作了一个机器学习预测模型来预测 2022 年 FIFA 世界杯的冠军,而且每天能获得一个 betting_stratrgy。

这个事情并不复杂,实际上只需要 3 个步骤就可以完成预测,我把实现的过程在 GitHub 上分享出来了:https://github.com/jieguangzhou/FIFA-World-Cup-2022/tree/master

这是我的预测结果:

cd0f8f6fd9d17cf457a10263e0998291.png

我还录制了一个视频来解释整个工作的过程和原理,希望能帮助你享受这场体育盛宴,或者只是娱乐一下:)

视频口误纠正:41s 处应为“塞尔维亚获胜的几率”,12:15s 处应为“葡萄牙 vs. 加纳”。

视频中演示所用的 GitHub 地址:https://github.com/jieguangzhou/FIFA-World-Cup-2022/tree/master

下面是这个项目的具体实现方法,感兴趣的朋友不妨试试。

70cba07fc6c2082a8d5671dc8a157696.gif

赛事播报

世界杯冠军预测

使用两种不同预测方法的结果:

1. 基于球队获胜概率模拟 1000 次世界杯预选赛结果

获得冠军的概率

f32c9348ba3bc023d945e3dbf21b1889.png

前四名

4d8069b96fefa1d8bf5d38e7646e2a88.png

2. 选择获胜概率高的球队

b74ae59c92d37ca8fcf864daa3be8459.png

所有比赛结果可在以下两个文件中查看

  • https://github.com/jieguangzhou/FIFA-World-Cup-2022/blob/workflow-pro/results/predict.txt

  • https://github.com/jieguangzhou/FIFA-World-Cup-2022/blob/workflow-pro/results/results.csv

以上结果来自分支 workflow-pro。该分支将训练更长的模型并运行更多次的模拟比赛。

7e15f572510341f427f03fba8a97bfe5.gif

赛事播报

我是如何建立这个模型的?

1

三步构建预测系统

  • Step-1 启动 DolphinScheduler

我们可以使用 Docker 启动 Dolphinscheduler 独立服务

docker run --name dolphinscheduler-standalone-server -p 12345:12345 -p 25333:25333 -d jalonzjg/dolphinscheduler-fifa

如果没有安装 Doker,可到 https://www.docker.com/ 下载

接着,你可以在 http://localhost:12345/dolphinscheduler/ui 登录 DolphinScheduler

用户:admin 密码:dolphinscheduler123

9232db8514121cf782efa1b74c11fe7e.png

  • Step-2 提交流程

python3 -m pip install apache-dolphinscheduler==3.1.1
export PYDS_HOME=./
python3 pyds.py

您可以单击Project -> FIFA

da45a2315c4bfaf3e659805401b9d981.png

然后,我们可以看到 2 个工作流程

  • training:使用 FLAML 训练模型

  • predict:使用模型预测哪个国家会赢得世界杯

52b47344669651f4afd6c8ff879398eb.png

  • Step-3 运行工作流

    • 开始训练工作流程

8fb76a2eef72e87de203cce258f38272.png

我们可以在工作流完成后查看日志。

8f78dbde7d48eebf8fd2fae9316a05ca.png

    • 开启预测工作流

工作流完成后可查看日志。

b18679d8c7dd1dff0c0cf660af228617.png

2

赛事时间表

附上比赛时间表,看球愉快!

371ab4019eb46729be20d3bb559cb090.png

你觉得这个预测符合你的预期吗?哪支球队将赢得最后一场比赛,请在下方投票!⚽️⚽️⚽️

ff40dd3dca4a078eaf721f1a3203d1d9.gif

赛事播报

加入社区

对 Apache DolphinScheduler 感兴趣的朋友,欢迎添加小助手(Leonard-ds)加入社区交流群!

fdc4b3dd2bc4df08734b9312f50fbd57.jpeg

a3cafdf1f3c7f9898572453c59ffdc04.png 加入 Slack:https://bit.ly/dolphinscheduler

6d3c964fd4978ae6f68a928c82e4f649.gif

赛事播报

参与贡献

参与 DolphinScheduler 社区有非常多的参与贡献的方式,包括:

d338898a01576db6a60e65f37bab2e95.png

贡献第一个PR(文档、代码) 我们也希望是简单的,第一个PR用于熟悉提交的流程和社区协作以及感受社区的友好度。

社区汇总了以下适合新手的问题列表:https://github.com/apache/dolphinscheduler/issues/5689

非新手问题列表:https://github.com/apache/dolphinscheduler/issues?q=is%3Aopen+is%3Aissue+label%3A%22volunteer+wanted%22

如何参与贡献链接:https://dolphinscheduler.apache.org/zh-cn/community/development/contribute.html

来吧,DolphinScheduler开源社区需要您的参与,为中国开源崛起添砖加瓦吧,哪怕只是小小的一块瓦,汇聚起来的力量也是巨大的。

< 🐬🐬 >

活动推荐

dde7cf57a466a2f624e9fea56928ce06.png

海豚调度&Linkis强强结合

探索计算治理难题的终极密码

2022 年 12 月 1 晚 20:00-21:30,Apache DolphinScheduler&Apache Linkis(Incubating) 线上Meetup活动即将来袭!来自DolphinScheduler和Linkis社区的核心贡献者将带来两个项目整合的技术分享,聚焦解决计算治理难题的方法,干货满满,欢迎报名参加!

预约报名

点击阅读原文报名!

我知道你在看919d7ac9e8cc7684da5c392f323f3204.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/44668.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Antd中Table列表行默认包含修改及删除功能的封装

一、前言 ant-design是非常不错、方便的一款前端组件库&#xff0c;而这次用到的ProComponents则是在 Ant Design 上进行了自己的封装&#xff0c;更加易用&#xff0c;与 Ant Design 设计体系一脉相承&#xff0c;无缝对接 antd 项目&#xff0c;样式风格与 antd 一脉相承&am…

Java:多线程基础(二)-线程生命周期

目录 线程生命周期 Thread类的常用方法 构造方法 静态方法 常用实例方法 线程生命周期 线程有其创建、就绪、运行、阻塞、死亡的过程&#xff0c;将其称之为“线程的生命周期”。如下图所示&#xff0c; 对应以上5个状态&#xff0c;jdk-Thread类的源码中定义了枚举类Stat…

计算机网络第五章知识点回顾(自顶向下)

1. 网络层控制面 1.1 网络层功能 1.2选路问题 选路问题的描述&#xff1a; 给定一组路由器和连接路由器的链路&#xff0c;寻找一条从源路由器到目的路由器的最佳路径。 1.3 什么是最佳路径&#xff1f; 1.4 图抽象 1.5 选路算法分类 1.6 链路状态&#xff08;LS&#xff0…

“生成式技术”正在颠覆人类创作!

整理 | 王启隆在过去的半年里&#xff0c;AI 写小说、绘画和剪视频等热点新闻火爆全球&#xff0c;现在只需要在键盘上敲几个关键词&#xff0c;AI 就能在烧着我们显卡的同时画出一幅幅优美的图画&#xff0c;一个全新的应用世界向未来的初创公司敞开了大门。人类现在拥有着一大…

碳中和专利创新专题:各省市县专利面板(原始文件)、低碳专利授权数等多指标数据

一、各省市县专利面板含原始文件 1、数据来源&#xff1a;国家知识产权局 2、时间跨度&#xff1a;1985-2019年 3、区域范围&#xff1a;全国 4、指标说明&#xff1a; 来源 序号 标题 合享价值度 链接到incoPat 公开&#xff08;公告&#xff09;号 公开&#xff08…

数据结构之线性表中的栈和队列【详解】

文章目录引言&#xff1a;栈和队列的讲解&#xff08;一、&#xff09;什么是栈1.栈的概念、结构和图解&#xff1a;&#xff08;1.&#xff09;顺序表和链表的对比&#xff08;严格来说这两个结构是相辅相成的&#xff09;&#xff08;2.&#xff09;栈的概念和结构&#xff0…

[MyBatis]一级缓存/二级缓存/三方缓存

缓存是一种临时存储少量数据至内存或者是磁盘的一种技术.减少数据的加载次数,可以降低工作量,提高程序响应速度 缓存的重要性是不言而喻的。mybatis的缓存将相同查询条件的SQL语句执行一遍后所得到的结果存在内存或者某种缓存介质当中&#xff0c;当下次遇到一模一样的查询SQL时…

[附源码]Python计算机毕业设计Djangossm新能源电动汽车充电桩服务APP

项目运行 环境配置&#xff1a; Pychram社区版 python3.7.7 Mysql5.7 HBuilderXlist pipNavicat11Djangonodejs。 项目技术&#xff1a; django python Vue 等等组成&#xff0c;B/S模式 pychram管理等等。 环境需要 1.运行环境&#xff1a;最好是python3.7.7&#xff0c;…

UICollectionView

文章目录前言基础概念UICollectionView与相关对象关系注意事项强大的控件相关的类重新使用视图提高性能例子一些方法前言 本篇&#xff1a;进行UICollectionView的学习 提示&#xff1a;以下是本篇文章正文内容&#xff0c;下面案例可供参考 基础 概念 UICollectionView是我…

【毕业设计】31-基于单片机的农业蔬菜大棚温度自动控制系统设计(原理图工程+源码工程+仿真工程+答辩论文+答辩PPT)

typora-root-url: ./ 【毕业设计】31-基于单片机的农业蔬菜大棚温度自动控制系统设计&#xff08;原理图工程源码工程仿真工程答辩论文答辩PPT&#xff09; 文章目录typora-root-url: ./【毕业设计】31-基于单片机的农业蔬菜大棚温度自动控制系统设计&#xff08;原理图工程源…

NetCore OpenIdConnect验证为什么要设置Authority?

在使用Identity Server作Identity Provider的时候&#xff0c;我们在NetCore的ConfigureServices((IServiceCollection services))方法中,常需要指定options的Authority&#xff0c;如下代码所示&#xff1a; 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 …

基于PHP+MYSQL酒店管理系统的设计与开发

随着人们生活条件的提高,旅游和出差已经成了家常便饭,但是因为他向异地所以第一个要解决的问题就是吃住问题,吃先对是比较好解决的一个问题,随便一个超市或者饭店甚至地摊就能解决这一问题,但是总不能露宿街头吧,所以很多人在到达目的地的第一时间就是去寻找一个能够入住的酒店…

一文彻底搞懂Mysql索引优化

专属小彩蛋&#xff1a;前些天发现了一个巨牛的人工智能学习网站&#xff0c;通俗易懂&#xff0c;风趣幽默&#xff0c;忍不住分享一下给大家。点击跳转到网站&#xff08;前言 - 床长人工智能教程&#xff09; 目录 一、索引介绍 二、性能分析 三、查询优化 一、索引介绍…

Python使用矩阵分解法推荐系统找到类似的音乐

这篇文章是如何使用几种不同的矩阵分解算法计算相关艺术家。最近我们被客户要求撰写关于的矩阵分解法推荐系统研究报告&#xff0c;包括一些图形和统计输出。代码用Python编写&#xff0c;以交互方式可视化结果。 加载数据 这可以使用Pandas加载到稀疏矩阵中&#xff1a; # r…

Jmeter 使用BeanShell断言,实现自动获取文章列表,并判断文章是否为当天发布的

系列文章目录 提示&#xff1a;阅读本章之前&#xff0c;请先阅读目录 文章目录系列文章目录前言一、正则表达式提取器&#xff0c;提取所有文章id二、循环控制器&#xff0c;读取每篇文章的创建时间三、JSON提取器&#xff0c;提取创建时间&#xff0c;然后进行判断四、运行结…

Java设计模式七大原则-里氏替换原则

里氏替换原则 OO中的继承性的思考和说明 继承包含这样一层含义&#xff1a;父类中凡是已经实现好的方法&#xff0c;实际上是在设定规范和契约&#xff0c;虽然它不强制要求所有的子类必须遵循这些契约&#xff0c;但是如果子类对这些已经实现的方法任意修改&#xff0c;就会对…

1540_AURIX_TriCore内核架构_FPU

全部学习汇总&#xff1a; GreyZhang/g_tricore_architecture: some learning note about tricore architecture. (github.com) 这一次看一下TriCore的FPU&#xff0c;浮点处理单元。说起来&#xff0c;这算是很多MCU中的一个高级模块了。 1. 在TriCore中FPU其实是可选实现的&a…

动画演示选择排序(Selection Sort)

1、排序规则 1.1 一句话总结选择排序 从数组中第一个数字开始&#xff0c;数组中每个数字都要和后面所有数字比一次大小&#xff0c;每每次循环遍历当前最小值&#xff0c;放在当前循环范围内的最小位置。当完成第 N - 1 次循环之后&#xff0c;排序完成。N 数组长度 - 1。 …

113.(leaflet篇)leaflet根据距离截取线段

听老人家说:多看美女会长寿 地图之家总目录(订阅之前建议先查看该博客) 文章末尾处提供保证可运行完整代码包,运行如有问题,可“私信”博主。 效果如下所示: 下面献上完整代码,代码重要位置会做相应解释 <!DOCTYPE html> <html>