【机器学习系列】使用高斯贝叶斯模型进行数据分类的完整流程

news2026/2/13 15:07:28

一、导入数据

二、选择特征

三、十折交叉验证

四、划分训练集和测试集

五、训练高斯贝叶斯模型

六、预测测试集

七、查看训练集和测试集上的分数

八、查看混合矩阵

九、输出评估指标

一、导入数据

# 根据商户数据预测其是否续约案例
import pandas
#读取数据到 data 变量中
data = pandas.read_csv('高斯贝叶斯.csv', encoding='ansi')

二、选择特征

features = [ '注册时长', '营收收入', '成本']
x=data[features]
y=data['是否续约']

三、十折交叉验证

#高斯贝叶斯
from sklearn.naive_bayes import GaussianNB
gaussianNB = GaussianNB()

from sklearn.model_selection import cross_val_score
#进行K折交叉验证
cvs = cross_val_score(gaussianNB, x, y, cv=10)
cvs.mean()

分数如下：

四、划分训练集和测试集

from sklearn.model_selection import train_test_split
 
#把数据集分为训练集和测试集
x_train, x_test, y_train, y_test = train_test_split(
    x, y, test_size=0.3)

五、训练高斯贝叶斯模型

gaussianNB = gaussianNB.fit(x_train, y_train)

六、预测测试集

predict=gaussianNB.predict(x_test)

七、查看训练集和测试集上的分数

gaussianNB.score(x_train, y_train)

gaussianNB.score(x_test, y_test)

八、查看混合矩阵

gaussianNB = GaussianNB()
#使用所有数据训练模型
gaussianNB.fit(x, y)
#对所有的数据进行预测
data['预测是否续约'] = gaussianNB.predict(data[features])
from sklearn.metrics import confusion_matrix
#计算混淆矩阵，labels参数，可由 gaussianNB.classes_ 得到
confusion_matrix(
    data['是否续约'], 
    data['预测是否续约'], 
    labels=['不续约', '续约']
)

九、输出评估指标

from sklearn.metrics import classification_report
# 输出评估指标
print(classification_report(y_test, predict))

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1694178.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

【机器学习系列】使用高斯贝叶斯模型进行数据分类的完整流程

一、导入数据

二、选择特征

三、十折交叉验证

四、划分训练集和测试集

五、训练高斯贝叶斯模型

六、预测测试集

七、查看训练集和测试集上的分数

八、查看混合矩阵

九、输出评估指标

相关文章

【PostgreSQL001】比较开发生产2个数据库结构方法

《AI学习笔记》大模型-微调/训练区别以及流程

【机器学习】大模型在机器学习中的应用：从深度学习到生成式人工智能的演进

电信光猫的USB存储对外网开放访问

国产信创数据库：使用MySQL等开源产品能做信创替换吗？

常见算法（3）

WordPress 发布了独立的 SQLite 插件

linux文件权限常用知识点，基于Linux(openEuler、CentOS8)

原生js实现拖拽改变元素顺序

基于HTML5和CSS3搭建一个Web网页（二）

2024年上半年软件系统架构师论文【回忆版】

第十节 SpringBoot Starter 实战之 redis 滑动窗口

内网渗透（不出网上线CS）

Pandas高效数据清洗与转换技巧指南【数据预处理】

Leetcode - 398周赛

开源的在线JSON数据可视化编辑器jsoncrack本地部署与远程访问

一篇文章讲透排序算法之希尔排序

结构体；结构成员访问操作符

手把手一起学习Python NumPy

python-绘制五星红旗（非标准）