基于SVM+Webdriver的智能NBA常规赛与季后赛结果预测系统——机器学习算法应用(含python、ipynb工程源码)+所有数据集(三)

news2024/11/16 21:40:29

目录

  • 前言
  • 总体设计
    • 系统整体结构图
    • 系统流程图
  • 运行环境
  • 模块实现
    • 1. 数据预处理
    • 2. 特征提取
    • 3. 模型训练及评估
      • 1)常规赛预测模型
      • 2)季后赛模型创建
    • 4. 模型训练准确率
  • 相关其它博客
  • 工程源代码下载
  • 其它资料下载


在这里插入图片描述

前言

本项目使用了从NBA官方网站获得的数据,并运用了支持向量机(SVM)模型来进行NBA常规赛和季后赛结果的预测。此外,项目还引入了相关系数法、随机森林分类法和Lasso方法,以评估不同特征的重要性。最后,使用Python库中的webdriver功能实现了自动发帖,并提供了科学解释来解释比赛预测结果。

首先,项目采集了NBA官方网站上的各种数据,这些数据包括球队与对手的历史表现、球员数据、赛季统计等。这些数据用于构建常规赛或季后赛结果的预测模型。

其次,支持向量机(SVM)模型被用来分析这些数据以进行常规赛或季后赛结果的预测。SVM是一种强大的机器学习算法,可以通过分析数据来确定不同特征对比赛结果的影响。

项目还使用了相关系数法、随机森林分类法和Lasso方法,以评估每个特征对常规赛或季后赛结果的重要性。这有助于识别哪些因素对比赛胜负有更大的影响。

最后,项目利用Python中的webdriver库自动发帖,在开源中国论坛中发布关于比赛预测的帖子。这些帖子不仅提供了预测结果,还附带了科学解释,以便其他球迷能够理解模型如何得出这些预测。这对于NBA球迷和数据科学爱好者来说可能是一个非常有趣的项目,能够帮助他们更好地理解比赛和预测比赛结果。

总体设计

本部分包括系统整体结构图和系统流程图。

系统整体结构图

系统整体结构如图所示。

在这里插入图片描述

系统流程图

模型处理流程如图所示。

在这里插入图片描述

自动发帖流程如图所示。

在这里插入图片描述

运行环境

本部分包括Python环境、Jupyter Notebook环境、PyCharm环境和Matlab环境。

详见博客。

模块实现

本项目包括4个模块:数据预处理、特征提取、模型训练及评估、模型训练准确率,下面分别介绍各模块的功能及相关代码。

1. 数据预处理

数据处理分为常规赛和季后赛。

详见博客。

2. 特征提取

本部分包括常规赛特征提取和季后赛特征提取。

详见博客。

3. 模型训练及评估

本部分包括常规赛预测模型和季后赛模型创建。

1)常规赛预测模型

相关代码如下:

#定义预测数据集数组生成函数
def predict_dataset(df):
    X=[]
    for index,row in df.iterrows():
        team1=row['Vteam']
        team2=row['Hteam']
        team1_ELO=get_ELO(team1)
        team2_ELO=get_ELO(team2)
        feature_team1 = [team1_ELO,0]
        feature_team2 = [team2_ELO,1]
        for key,value in team_stats.loc[team1].iteritems():
            feature_team1.append(value) #不要加赋值语句
        for key,value in team_stats.loc[team2].iteritems():
            feature_team2.append(value)
        X.append(feature_team1+feature_team2)
    return X
#将18~19赛季比赛日历进行处理
X=predict_dataset(schedule1617)
#form_df函数是将数组转化为数据框的函数
X=form_df(X,z='test')
#删除不显著特征
X=processdf(X)
#产生预测结果
pred_y=model.predict(X)
#产生概率预测结果
pred_y_pro=model.predict_proba(X)
model=DecisionTreeClassifier()
model.fit(X,y)

采用决策树建模,模型参数如下图所示。其中criterion为确定特征选择标准; gini为依据基尼系数进行选择; splitter为确定特征划分标准; best为找出最优的划分点; max_depth为决策树最大深度; min_samples_leaf为叶子节点最少样本数; max_leaf_nodes为最大叶子节点数;class_weight为指定样本各类别的权重,主要是为了防止训练集某些类别的样本过多,导致决策树过于偏向这些类别。由于样本类别分布没有明显的偏倚,选择默认的None, 最后使用model.fit函数进行训练。

在这里插入图片描述

2)季后赛模型创建

本部分代码用于生成训练数据,调用sklearn中的SVM分类器进行拟合。

#引用库
import pandas as pd
import glob
import random
from sklearn import svm
from sklearn.model_selection import cross_val_score
from sklearn.tree import DecisionTreeClassifier
#读入球队特征数据
team_stats = pd.read_csv('data_final.csv')
#根据比赛形成训练用的数据
def data_form(stringa, z='train'):
    X = []
    y = []
    for fname in glob.glob(stringa):
        result_data = pd.read_excel(fname)
        result_data.replace(['New Orleans Hornets', 'Charlotte Bobcats'], ['New Orleans Pelicans', 'Charlotte Hornets'],
          inplace=True)
        #标记数据赛季
        year = result_data['Yr'][0]
        season = year - 2000 + (year - 2001) * 100
        #print(season)
        for index, row in result_data.iterrows():
            Wteam = row['Teamw']
            Lteam = row['Teaml']
            #print(Wteam)
            aw = team_stats[(team_stats['Team'] == Wteam) & (team_stats['season'] == season)]
            bw = aw.drop(['season', 'Team'], axis=1)
            team1_features = bw.values
            al = team_stats[(team_stats['Team'] == Lteam) & (team_stats['season'] == season)]
            bl = al.drop(['season', 'Team'], axis=1)
            team2_features = bl.values
            #训练集随即划分左右,左边的特征减右边的特征,赢标记为1,输标记为0
            if z == 'train':
                if random.random() < 0.5:
                    feature = team1_features - team2_features
                    X.extend(feature.tolist())
                    y.append(1)
                else:
                    feature = team2_features - team1_features
                    X.extend(feature.tolist())
                    y.append(0)
            else:
                feature = team1_features - team2_features
                X.extend(feature.tolist())
                y.append(1)
    return X, y
#生成训练集10~11赛季至17~18赛季
fname1 = 'data/playoff/*playoff.xlsx'
X, y, = data_form(fname1)
SVC分类器使用“sigmoid”核函数,惩罚系数为1
#调用SKlearn svm
model = svm.SVC(kernel='sigmoid', C=1)
model.fit(X, y)

4. 模型训练准确率

常规赛使用决策树模型,准确率如下:

model.score(X, y)

计算结果为0.99924012158054709。

使用十折交叉验证,准确率如下:

cross_val_score(model, X, y, cv= 10, scoring='accuracy', n_jobs=-1).mean()

计算结果为0.61396768625776255。

季后赛十折交叉验证的准确率如下:

cross_val_score(node1, X, y, cv= 10, scoring ='accuracy', n_jobs=-1).mean()

计算结果为0.516666666666676。

相关其它博客

基于SVM+Webdriver的智能NBA常规赛与季后赛结果预测系统——机器学习算法应用(含python、ipynb工程源码)+所有数据集(一)

基于SVM+Webdriver的智能NBA常规赛与季后赛结果预测系统——机器学习算法应用(含python、ipynb工程源码)+所有数据集(二)

基于SVM+Webdriver的智能NBA常规赛与季后赛结果预测系统——机器学习算法应用(含python、ipynb工程源码)+所有数据集(四)

工程源代码下载

详见本人博客资源下载页


其它资料下载

如果大家想继续了解人工智能相关学习路线和知识体系,欢迎大家翻阅我的另外一篇博客《重磅 | 完备的人工智能AI 学习——基础知识学习路线,所有资料免关注免套路直接网盘下载》
这篇博客参考了Github知名开源平台,AI技术平台以及相关领域专家:Datawhale,ApacheCN,AI有道和黄海广博士等约有近100G相关资料,希望能帮助到所有小伙伴们。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1106619.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

如何使用 Disco 将黑白照片彩色化

Disco 是一个基于视觉语言模型&#xff08;LLM&#xff09;的图像彩色化工具。它使用 LLM 来生成彩色图像&#xff0c;这些图像与原始黑白图像相似。 本文将介绍如何使用 Disco 将黑白照片彩色化。 使用 Disco 提供了一个简单的在线演示&#xff0c;可以用于测试模型。 访问…

关于gt_sampling的理解

pcdet/datasets/augmentor/data_augmentor.py def gt_sampling(self, configNone):db_sampler database_sampler.DataBaseSampler(root_pathself.root_path,sampler_cfgconfig,class_namesself.class_names,loggerself.logger)return db_sampler此函数指向DataBaseSampler类&a…

【vSphere 8 自签名证书】企业 CA 签名证书替换 vSphere Machine SSL 证书Ⅱ—— 创建和添加证书模板

目录 博文摘要3. 使用 Microsoft 证书颁发机构创建 Machine SSL 和 Solution User 证书模板3.1 打开 Certificate Template Console3.2 复制模板3.3 修改 Compatibility 选项卡3.4 修改 General 选项卡3.5 修改 Extensions 选项卡3.6 修改 Subject Name 选项卡3.7 确认新模板 4…

【送书福利-第十九期】《C++ Core Guidelines解析》

&#x1f60e; 作者介绍&#xff1a;我是程序员洲洲&#xff0c;一个热爱写作的非著名程序员。CSDN全栈优质领域创作者、华为云博客社区云享专家、阿里云博客社区专家博主、前后端开发、人工智能研究生。公粽号&#xff1a;程序员洲洲。 &#x1f388; 本文专栏&#xff1a;本文…

Ant Eclipse插件使用

Eclipse默认带了ant插件 编辑build.xml文件给出提示 编辑的时候&#xff0c;会给出提示&#xff0c;方便编辑&#xff1a; 将鼠标放在属性上方&#xff0c;会将属性的值显示出来&#xff1a; 在Eclipse中运行ant 运行默认的target build.xml文件的内容如下&#xff0c;…

编程入门到精通:开源学习资料整理 | 开源专题 No.37

ascoders/weekly Stars: 24.8k License: NOASSERTION 前端精读是一个每周更新的前端好文精选项目。该项目涵盖了多个领域&#xff0c;包括结合大厂工作经验解读的前沿技术、源码解读、一些后端技术解读和商业思考等内容。主要功能是为开发者提供优质的文章资源&#xff0c;帮…

springBoot web开发自动配置和默认效果

web开发自动配置和默认效果 自动配置默认配置 自动配置 绑定了配置文件的一堆配置项 1、springMVC的所有配置 spring.mvc 2、Web场景通用配置 spring.web 3、文件上传配置 spring.servlet.multipart 4、服务器的配置serve: 比如&#xff1a;编码方式等 默认配置 重要&#xf…

【异常、线程】全网最详细解读

【异常、线程】 主要内容 异常、线程 教学目标 能够辨别程序中异常和错误的区别 说出异常的分类 说出虚拟机处理异常的方式 列举出常见的三个运行期异常 能够使用try…catch关键字处理异常 能够使用throws关键字处理异常 能够自定义异常类 能够处理自定义异常类 说出进程的概…

python案例:六大主流小说平台小说下载

嗨喽~大家好呀&#xff0c;这里是魔王呐 ❤ ~! python更多源码/资料/解答/教程等 点击此处跳转文末名片免费获取 很多小伙伴学习Python的初衷就是为了爬取小说&#xff0c;方便又快捷~ 辣么今天咱们来分享6个主流小说平台的爬取教程~ 一、流程步骤 流程基本都差不多&#x…

Pi-hole:Linux 硬件级别的广告拦截器 | 开源日报 No.58

pi-hole/pi-hole Stars: 44.0k License: NOASSERTION Pi-hole 是一个通过自己的 Linux 硬件实现网络广告拦截的 DNS 陷阱&#xff0c;无需安装任何客户端软件即可保护设备免受不需要的内容干扰。 安装简单&#xff1a;对话框引导您在十分钟内完成简单安装过程坚决有效&#…

Linux进程上下文切换:理解特权模式和进程切换

Linux进程上下文切换&#xff1a;理解特权模式和进程切换 在Linux中&#xff0c;进程的运行空间被划分为内核空间和用户空间&#xff0c;而从用户态向内核态转换需要进行系统调用。这一过程中发生了两次CPU上下文切换&#xff1a; 00001. 保存用户态&#xff1a;将CPU寄存器…

数组之移除元素

本文旨在复习巩固 此题为leetcode上的27题 数组的元素在内存地址中是连续的&#xff0c;不能单独删除数组中的某个元素&#xff0c;只能覆盖。 1 暴力解法 如图所示&#xff0c;该方法是十分麻烦的&#xff0c;因为每次找到val&#xff0c;都要删除它&#xff0c;让后面的元…

软件开发“自我毁灭”的七宗罪

软件开发是一门具有挑战性的学科&#xff0c;它建立在数以百万计的参数、变量、库以及更多必须绝对正确的因素之上。即便是一个字符不合适&#xff0c;整个堆栈也会随之瓦解。 多年来&#xff0c;软件开发团队已经想出了一些完成工作的规则。从复杂的方法论到新兴的学科和哲学…

Linux文件系统 struct inode 结构体解析

文章目录 前言一、inode 简介二、dentry 简介三、struct inode3.1 字段说明3.2 inode链表3.3 struct inode_operations3.4 inode相关函数 参考资料 前言 这篇文章介绍了VFS - struct file&#xff1a;Linux文件系统 struct file 结构体解析 接下来介绍VFS - struct inode&…

回首往昔,初学编程那会写过的两段愚蠢代码

一、关于判断两个整数是否能整除的GW BASIC创意代码 记得上大学时第一个编程语言是BASIC&#xff0c;当时Visual Basic还没出世&#xff0c;QBASIC虽然已经在1991年随MS-DOS5.0推出了&#xff0c;但我们使用的还是 GW-BASIC&#xff0c; 使用的教材是谭浩强、田淑清编著的《BA…

Linux虚拟机静态IP设置

1.环境配置 首先要准备好两台centos虚拟机&#xff0c;在高级篇部分可能有数据库主从复制&#xff0c;所以暂时先开两台虚拟机。 两台虚拟机需要更改&#xff1a; mac地址主机名ip地址UUID 1.更改主机名 更改虚拟机的主机名 vim /etc/hostname2.更改静态ip地址 /etc/sysc…

basic_sr介绍

文章目录 pytorch基础知识和basicSR中用到的语法1.Sampler类与4种采样方式2.python dict的get方法使用3.prefetch_dataloader.py4. pytorch 并行和分布式训练4.1 选择要使用的cuda4.2 DataParallel使用方法常规使用方法保存和载入 4.3 DistributedDataParallel 5.wangdb 入门5.…

5秒用Java写一个快速排序算法?这个我在行

快速排序是一种非常高效的排序算法&#xff0c;由英国计算机科学家霍尔在1960年提出。它的基本思想是选择一个基准元素将待排序数组分成两部分&#xff0c;其中一部分的所有元素都比基准元素小&#xff0c;另一部分的所有元素都比基准元素大&#xff0c;然后对这两部分再分别进…

雷军在微博发文:小米澎湃 OS(Xiaomi HyperOS)正式版已完成封包

本心、输入输出、结果 文章目录 雷军在微博发文&#xff1a;小米澎湃 OS&#xff08;Xiaomi HyperOS&#xff09;正式版已完成封包前言搭载 小米澎湃 OS&#xff08;Xiaomi HyperOS&#xff09;的小米 14回顾 MIUI小米澎湃 OS&#xff08;Xiaomi HyperOS&#xff09; 相关跳转小…

spring boot MongoDB实战

项目搭建 <?xml version"1.0" encoding"UTF-8"?><project xmlns"http://maven.apache.org/POM/4.0.0"xmlns:xsi"http://www.w3.org/2001/XMLSchema-instance"xsi:schemaLocation"http://maven.apache.org/POM/4.0.0 …