【足球走地软件】走地数据分析预测【大模型篇】走地预测软件实战分享

news2024/11/14 13:34:10

了解什么是走地数据?

走地数据分析,在足球赛事的上下文中,是一种针对正在进行中的比赛进行实时数据分析的方法。这种方法主要用于预测比赛中的某些结果或趋势,如总进球数、比分变化、球队表现等。

在足球走地数据分析中,大小球策略是一种非常实用的投注方式。它主要预测的是一场比赛中的总进球数是否超过或低于一个预设的数值。例如,如果盘口设置为“2.5球”,那么投注“大球”意味着预测比赛的总进球数将至少为3个,而投注“小球”则意味着预测比赛的总进球数将少于或等于2个1。

之前研究过一款软件,是根据预设条件来推断比赛的结果,效果也还可以,但是入门比较高,适合资深的足球专家,有自己的一套分析思路,也是功能很强大的一款产品。
软件地址:http://lcsjfx.com/web/zqds.html
后面就想着,弄否把这个数据模型化,通过现在比较流行的AI模型去预测,效果也还可以。

下面是大概的实战流程,感兴趣可以看看。

该篇章主要讲的是以python为基础,其他技术暂时不在这里延申。

说明技术
数据采集request 库
数据清理pandas 库
模型训练pycaret 库

第一步:数据采集

这里采集的是国外比较权威的足球赛事,因为比较简单,所有没用爬虫框架,直接用request.get(),就能把数据采集下来的,这里需要获取过去5年的历史数据作为训练数据。

import requests

url = 'https://kto/lib/api/v1/overview/sport/1/live'

headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/125.0.0.0 Safari/537.36",
    "Content-Type": "application/json",
    "Accept": "application/json",
    "path": '/kto/lib/api/v1/overview/sport/1/live'
}

response = requests.get(url=url, headers=headers)
if response.status_code == 200:
    response.encoding = 'utf-8'
    content = response.content.decode('utf-8')
    print(content)
    # 处理数据
if response.status_code != 200:
    print('---sbCorner获取结果异常---', response.status_code)

第二步:数据清洗

获取的数据包含很多无用字段,比如比赛ID,比赛时间,比赛队名等等,这些对模型没有任何意义的数据,比如清理掉。

在这里插入图片描述

# 用pandas进行数据处理
df_filtered = df_filtered.drop(columns=['match_id','match_date','league_id','home_id','away_id', 'zjq_res'])

查看清理后的数据
在这里插入图片描述

原则上这里用一下数据归一化会好一点,但是我们可以先直接把数据拿去训练看一下效果

大小球计算公式:主队比分-客队比分>盘口,及全大0,反之则全小1

# 导入pycaret分类模块和初始化设置
from pycaret.classification import *

# 初始化设置
# data: 数据集,包含特征和目标变量
# target: 目标变量的名称
# session_id: 用于重现实验结果的随机种子
s = setup(df_filtered, target='sfp_res', session_id=123)

在这里插入图片描述

# 比较基准模型

# 使用compare_models()函数比较不同的基准模型,并返回最佳模型

best = compare_models()

看模型返回最优的是GBC模型,但是预测率不高,还需要对数据进行进一步清洗

在这里插入图片描述

# 缺失值补充 简单补充
imputation_type = 'simple',
# 数值型变量补充缺失策略
numeric_imputation = 'mean', # drop,mean,median,mode,knn,int or float
# 类别型变量补充缺失策略
categorical_imputation = 'mode', # drop,mode,str

)

清洗之后再拿数据去模型比较
在这里插入图片描述

评分那么高,肯定有猫腻,检查发现,没有数据里面还有很多null的数据
在这里插入图片描述
继续清理数据


# 缺失值补充 迭代补充
imputation_type = 'iterative',
# 迭代次数
iterative_imputation_iters 5, # 当simple时忽略
# 数值型迭代策略
numeric_iterative_imputer = 'lightgbm',
#  如果 =None,则用LGBClassifier,当simple时忽略

在这里插入图片描述
拿数据预测一下,看起来还行,但是还是有点小问题,正常那么高分就无敌了,里面的数据实时数据有些是拿不到的,所以还需要再处理一下。
在这里插入图片描述

这里只是简单的用pycaret进行模型训练,实际应用中,比这个场景肯定复杂很多,
里面还涉及到球队的评分、elo、rang等,这些这里就不赘述了,有兴趣可以交流一下,后续有空再分享一下。

一个基于大模型为基础的数据分析平台,有兴趣可以自行了解。

http://lcsjfx.com/web/sjfxpt.html

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1957258.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

仕考网:公务员可以报考军队文职吗?

公务员可以报考军队文职考试,但是需要满足前提条件。 对于已经与国家、地方的用人单位建立劳动关系的社会人才,在获得当前用人单位的许可后才可以申请报考。 在面试过程中,考生必须出示一份由其用人单位出具的且加盖公章的同意报考证明。一…

C++: set容器

一、关联式容器 我们已经了解了STL中的部分容器,比如vector、list、deque等,这些容器被称为序列式容器,其底层为线性序列的数据结构,里面存储的是元素本身。 关联式容器也是用来存储数据的,与序列式容器不同&#xf…

Windows中启用Linux命令功能WSL,并安装Linux子系统

文章目录 一、WSL简介 二、启用WSL 三、参考文章 一、WSL简介 WSL(Windows Subsystem for Linux,适用于 Linux 的 Windows 子系统)允许用户直接在 Windows 上运行Linux 环境(包括大多数命令行工具、实用程序和应用程序&#x…

汽车软件开发中的功能安全挑战与应对策略:基于Jira平台构建端到端的可追溯性,实现精细化需求管理

2024年7月18-19日,龙智携汽车软件开发及管理解决方案创新亮相2024 ATC汽车软件与安全技术周。龙智技术支持部负责人&Atlassian认证专家叶燕秀、龙智功能安全高级工程师景玉鑫在活动主会场联合发表了精彩演讲,分享推动汽车软件开发与功能安全的创新实…

硬核产品经理

链接:硬核产品经理 (qq.com)

DNS劫持实验

实验背景 利用ettercap进行DNS欺骗,攻击者冒充域名服务器,也就是把查询的IP地址设为攻击者 的IP地址,这样用户上网就只能看到攻击者设计的网页。 实验设备 一个网络 net:cloud0 一台模拟黑客主机 kali 一台靶机 windows 主机 实验拓扑 …

消息队列-rabbitmq(生产者.消费者. 消息.可靠性)

生产者者的可靠性 为了保证我们生产者在发送消息的时候消息不丢失,我们需要保证发送者的可靠性 1.生产者重试 假如发送消息的时候消息丢失 ,我们可以使用发送者 重试机制,尝试重新发送消息 实现该机制非常简单,只需要在yml文…

The Llama 3 Herd of Models.Llama 3 模型第1,2,3部分全文

现代人工智能(AI)系统是由基础模型驱动的。本文提出了一套新的基础模型,称为Llama 3。它是一组语言模型,支持多语言、编码、推理和工具使用。我们最大的模型是一个密集的Transformer,具有405B个参数和多达128K个tokens的上下文窗口。本文对Llama 3进行了广泛的实证评价。我们…

系统架构师考点--系统架构设计(中)

大家好。今天继续总结一下系统架构设计的一些考点。 一、软件架构复用 软件产品线是指一组软件密集型系统,它们共享一个公共的、可管理的特性集,满足某个特定市场或任务的具体需要,是以规定的方式用公共的核心资产集成开发出来的。即围绕核…

CVPR 2024 最佳论文分享┆物体用体积表示:一种不透明固体图形的随机几何表示方法

本文详细介绍了一篇获得CVPR 2024最佳论文提名的论文《Objects as volumes: A stochastic geometry view of opaque solids》。该论文的作者为Bailey Miller等人。论文提出了一种新的理论框架,从随机几何学的角度解释和改进当前体积表示方法,即将不透明固…

OZON大健康热卖产品,OZON大健康产品有哪些

在俄罗斯,随着全球健康意识的提升,特别是在新冠疫情之后,人们对于增强免疫力和保持健康的关注度显著增加。这种趋势在俄罗斯尤为明显,其中天然食品补剂、家居清洁用品以及个人护理产品等大健康领域的产品需求激增。以下是根据当前…

线上红酒品鉴会:与专业人士面对面交流

在繁忙的现代生活中,我们时常渴望寻找一个安静的角落,与志同道合的朋友共同品味生活的美好。当红酒的醇香与线上交流的便捷相结合,一场别开生面的线上红酒品鉴会便应运而生。今天,让我们一同走进这场与专业人士面对面交流的线上红…

WSL for Windows

1、安装 超详细Windows10/Windows11 子系统(WSL2)安装Ubuntu20.04(带桌面环境)_wsl安装ubuntu20.04-CSDN博客https://blog.csdn.net/weixin_44301630/article/details/122390018 注意,安装之后首次启动 Ubuntu 时&…

当我们谈论前端性能时,我们在谈论什么

前端岗位内推来了 本文结合Google官方工具 Lighthouse 分析最新的前端页面性能评分标准,帮助大家更好地理解各种性能指标,以改进和优化相关前端项目。 前端页面性能一直是大家持续关注的话题,因为用户留存率与页面加载性能密切相关。根据Goog…

全球模块化机器人市场展望与未来增长机遇预测:未来六年CAGR为14.9%

在全球自动化和智能化水平提升的背景下,模块化机器人正成为市场的焦点。本文详细分析了全球模块化机器人市场的现状、增长趋势及未来前景,旨在为投资者和业内人士提供深入的市场洞察和指导。 市场概览 据恒州诚思团队研究分析显示,2023年&am…

zeal 开发者离线文档工具

zeal是一款程序开发者不可或缺的离线文档查看器 下载地址 官网地址: windows版csdn下载(开箱即用含):https://download.csdn.net/download/xzzteach/89588765 已离线 Android.docset Apache_HTTP_Server.docset Bash.docset Bootstrap_4.docset Bootst…

QT6安装

我是直接使用 qt-online-installer-windows-x64-4.8.0.exe 安装包一键安装的 需要安装包的可以在此路径下载: qt-online-installer-windows-x64-4.8.0.exe,qt6一键安装包资源-CSDN文库

C#编写软件发布公告2——服务端

简单说明 框架:.NET 6.0 MVC 数据库:sqlLite3(当然这是为考虑本地数据简单,可以考虑使用大型数据库) 一、界面效果展示 1、启动主页面 2、记录摘要界面 3、对应版本详细 二、实现代码逻辑 1、启动主页面 //关联日志文件写 builder.Loggi…

音频处理过程

1、音频 (1)打开设备 (2)从音频设备中读取数据 (3)将音频设备中读取的数据写入文件夹中 (4) 通过界面控制开始录制和结束录制(使用多线程和状态码控制) &…

Spring监听器不同的注册方式下带来的监听范围的变化

事件监听注册的几种方式 ApplicationContext下面简称AC 1.构建SpringApplication时注册(可以监听AC启动阶段事件) // 方式一: //写法1 SpringApplication application new SpringApplicationBuilder().listeners(new ApplicationPidFileWriter()).bu…