对鸢尾花进行分类预测-----pycharm

news2026/2/15 18:46:54

项目说明

#项目：  对鸢尾花进行分类预测
#实例数量150个(3类各50个)
#属性数量：4(数值型，数值型，帮助预测的属性和类)
#特征：花萼长度，花萼宽度，花瓣长度，花瓣宽度  单位：厘米
#类别：山鸢尾，变色鸢尾，维吉尼亚鸢尾

导包

from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.neighbors import KNeighborsClassifier
from sklearn.model_selection import GridSearchCV
from sklearn.tree import DecisionTreeClassifier,export_graphviz

用KNN算法对鸢尾花进行分类

def knn_iris():
    """
    用KNN算法对鸢尾花进行分类
    :return:
    """
    """
        1.获取数据
    """
    iris = load_iris()

    """
        2.数据集划分
    """
    # train_test_split(要分割的数据集【可以是一个或多个数组，每个数组代表一个特征或标签】，测试集的大小，训练集的大小，随机数种子【用于控制数据的随机分割】，是否在分割数据前进行洗牌)
    # 把iris.data和iris.target按照相同的随机种子6进行随机分割，生成训练集和测试集
    x_train,x_test,y_train,y_test = train_test_split(iris.data,iris.target,random_state=6)      # 此处数据集划分不一样对结果影响不一样，划分为6时，准确率约为0.92
    #x_train【训练模型的鸢尾花数据集的特征】，x_test【测试模型的鸢尾花数据集的特征】，y_train【训练集标签】，y_test【测试集标签】
    #X_train 中的数据是来自原始 X 数据集的随机选择的 6 行数据，而 X_test 中的数据则是剩下的 2 行数据。
    # 这种分割方法确保了训练集和测试集的数据是随机且保持了原始数据的分布特性，从而可以用来训练模型和评估模型的泛化能力

    """ 
        3.特征工程：无量纲化(标准化)
    """
    transfer = StandardScaler()
    x_train = transfer.fit_transform(x_train)
    x_test = transfer.transform(x_test)     #用训练集特征中的平均值和标准差对测试集数据进行标准化
    #print("无量纲化后的x_train:\n",x_train)
    #print("无量纲化后的x_test:\n",x_test)

    """
        4.训练    KNN预估
    """
    estimator = KNeighborsClassifier(n_neighbors=3)
    estimator.fit(x_train,y_train)

    """
        5.模型评估
    """
    #方法1：直接比对真实值和预估值
    y_predict = estimator.predict(x_test)
    print("y_predice:\n",y_predict)
    print("y_test:\n",y_test)
    print("直接比对真实值和预估值是否一样:\n",y_test == y_predict)
    #方法2：计算准确率
    score = estimator.score(x_test,y_test)
    print("准确率为：\n",score)

    return None

if __name__ == "__main__":
	  # 用KNN算法对鸢尾花进行分类
	  knn_iris()

效果：
在这里插入图片描述

KNN算法加入网格搜索交叉验证

def knn_iris_gscs():
    """
    用KNN算法对鸢尾花进行分类，添加网格搜索交叉验证
    :return:
    """
    """
        1.获取数据
    """
    iris = load_iris()

    """
        2.数据集划分
    """
    x_train, x_test, y_train, y_test = train_test_split(iris.data, iris.target, random_state=6)

    """ 
            3.特征工程：无量纲化(标准化)
    """
    transfer = StandardScaler()
    x_train = transfer.fit_transform(x_train)
    x_test = transfer.transform(x_test)  # 用训练集特征中的平均值和标准差对测试集数据进行标准化
    # print("无量纲化后的x_train:\n", x_train)
    # print("无量纲化后的x_test:\n", x_test)

    """
        4.训练    KNN预估
    """
    estimator = KNeighborsClassifier(n_neighbors=3)

    """
        5.网格搜索交叉验证
    """
    #参数准备
    param_dict = {"n_neighbors":[1,3,5,7,8,11]}
    estimator = GridSearchCV(estimator,param_grid=param_dict,cv=10)
    estimator.fit(x_train,y_train)

    """
        6.模型评估
    """
    # 方法1：直接比对真实值和预估值
    y_predict = estimator.predict(x_test)
    print("y_predice:\n", y_predict)
    print("y_test:\n", y_test)
    print("直接比对真实值和预估值是否一样:\n", y_test == y_predict)
    # 方法2：计算准确率
    score = estimator.score(x_test, y_test)
    print("准确率为：\n", score)

    print("最佳参数：\n",estimator.best_params_)
    print("最佳结果：\n",estimator.best_score_)
    print("最佳估值器：\n",estimator.best_estimator_)
    print("交叉验证结果：\n",estimator.cv_results_)

    return None
if __name__ == "__main__":
	 # 用KNN算法对鸢尾花进行分类，添加网格搜索和交叉验证
	 knn_iris_gscs()

效果：
在这里插入图片描述

决策树算法对鸢尾花进行分类

def decision_iris():
    """
    用决策树对鸢尾花进行分类
    :return:
    """
    """
        1.获取数据
    """
    iris = load_iris()

    """
        2.划分数据集
    """
    x_train,x_test,y_train,y_test = train_test_split(iris.data,iris.target,random_state=6)

    """
        3.决策树预估器
    """
    estimator = DecisionTreeClassifier(criterion="entropy")  #按entropy信息增益进行分类
    estimator.fit(x_train,y_train)

    """
        4.模型评估
    """
    # 方法1：直接比对真实值和预估值
    y_predict = estimator.predict(x_test)
    print("y_predice:\n", y_predict)
    print("y_test:\n", y_test)
    print("直接比对真实值和预估值是否一样:\n", y_test == y_predict)
    # 方法2：计算准确率
    score = estimator.score(x_test, y_test)
    print("准确率为：\n", score)

    return None
  if __name__ == "__main__":
   #用决策树对鸢尾花进行分类
   decision_iris()

效果
决策树算法对鸢尾花进行分类结果

决策树对鸢尾花分类可视化

先保存树的结构到dot文件
在这里插入图片描述
方法def decision_iris()末尾加入代码运行

 #可视化决策树
export_graphviz(estimator,out_file="iris.tree.dot")

在这里插入图片描述

然后可以在线可视化dot文件或者下载可视化工具可视化决策树

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1420916.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

对鸢尾花进行分类预测-----pycharm

项目说明

导包

用KNN算法对鸢尾花进行分类

KNN算法加入网格搜索交叉验证

决策树算法对鸢尾花进行分类

决策树对鸢尾花分类可视化

相关文章

C#需要学到什么程度才能做MES系统开发工作？

读书人必须知道的9个搜书引擎

1分钟内生成美妙歌曲：Suno AI的音乐魔法

全国网络安全行业职业技能大赛WP

【lesson2】定长内存池的实现

C++ Qt开发：运用QJSON模块解析数据

vue 使用echarts-gl实现3d旋转地图

WebGL开发艺术和创意项目

正则表达式文本三剑客

openGauss学习笔记-210 openGauss 数据库运维-常见故障定位案例-谓词下推引起的查询报错

这些好用小众的知识库软件，快收藏起来

由于系统注册表文件丢失或损坏，因此Windows无法加载，如何解决？

尝试搭建域

Java 面向对象进阶 01（黑马）

四、ES集群安全策略设置 X-pack

故障脚本的重要作用：预防、诊断与恢复

互联网加竞赛基于深度学习的人脸性别年龄识别 - 图像识别 opencv

idea创建golang项目

string的基本概念及常用接口

通过docker构建基于LNMP的WordPress项目