【实验练习】基于SVM的实现鸢尾花(Iris)数据集分类 (Python实现)

news2024/10/6 2:28:49

题目

采用SVM方法实现鸢尾花(Iris)数据集分类

数据集

iris.name是关于数据集的属性说明;

iris.data是实际的数据集,它包含三类数据,每类数据有50条数据。

要求

训练集:选取Iris数据集中80%的数据,即120个数据,每类含有40个数据。

测试集:采用除训练集外的30个数据。

具体SVM方法:自由根据情况来选择。

评价指标:选取分类相关的评价指标来衡量分类结果。

# -*- coding: utf-8 -*- #
"""
@Project    :NIR-Mathematical-Modeling-Tool 
@File       :main.py 
@Author     :ZAY
@Time       :2023/6/4 15:44
@Annotation : " "
"""

import os
import torch
import sklearn
import numpy as np
from sklearn import svm
from sklearn.metrics import accuracy_score,auc,roc_curve,precision_recall_curve,f1_score, precision_score, recall_score
from Exp.Exp3.Plot import plotShow

os.environ["CUDA_VISIBLE_DEVICES"] = "0"
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

# 将标签由文字映射为数字
def Iris_label(s):
    it = {b'Iris-setosa': 0, b'Iris-versicolor': 1, b'Iris-virginica': 2}
    return it[s]

if __name__ == "__main__":

    txt_path = './/Result//SVM.txt'

    data = np.loadtxt("./Data/iris.data", dtype = float, delimiter = ',', converters = {4: Iris_label})

    data_x, label_y = np.split(data, indices_or_sections = (4,), axis = 1)  # x为数据,y为标签
    data_x = data_x[:, 0:2]
    train_data, test_data, train_label, test_label = sklearn.model_selection.train_test_split(data_x, label_y,
                                                                                              random_state = 1,
                                                                                              train_size = 0.8,
                                                                                              test_size = 0.2)
    # 训练 SVM 分类器
    classifier = svm.SVC(C = 2, kernel = 'rbf', gamma = 10, decision_function_shape = 'ovr')
    classifier.fit(train_data, train_label.ravel())

    train_label_pre = classifier.predict(train_data)
    test_label_pre = classifier.predict(test_data)
    print('训练集:', accuracy_score(train_label, train_label_pre))
    print('测试集:', accuracy_score(test_label, test_label_pre))

    # 查看内部决策函数(返回的是样本到超平面的距离)
    train_decision_function = classifier.decision_function(train_data)
    predict_result = classifier.predict(train_data)

    print('train_decision_function:', classifier.decision_function(train_data))
    print('predict_result:', classifier.predict(train_data))

    plotShow(test_data, test_label, data_x, label_y, classifier)

 plotShow.py

# -*- coding: utf-8 -*- #
"""
@Project    :NIR-Mathematical-Modeling-Tool 
@File       :plot.py 
@Author     :ZAY
@Time       :2023/6/5 21:41
@Annotation : " "
"""

# 确定坐标轴范围
import matplotlib
import matplotlib.pyplot as plt
import numpy as np


def plotShow(test_data, test_label, data_x, label_y, classifier):
    x1_min, x1_max = data_x[:, 0].min(), data_x[:, 0].max()  # 第0维特征的范围
    x2_min, x2_max = data_x[:, 1].min(), data_x[:, 1].max()  # 第1维特征的范围
    x1, x2 = np.mgrid[x1_min:x1_max:200j, x2_min:x2_max:200j]  # 生成网络采样点
    grid_test = np.stack((x1.flat, x2.flat), axis = 1)  # 测试点

    # 指定默认字体
    matplotlib.rcParams['font.sans-serif'] = ['SimHei']

    # 设置颜色
    cm_light = matplotlib.colors.ListedColormap(['#A0FFA0', '#FFA0A0', '#A0A0FF'])
    cm_dark = matplotlib.colors.ListedColormap(['g', 'r', 'b'])

    grid_hat = classifier.predict(grid_test)  # 预测分类值
    grid_hat = grid_hat.reshape(x1.shape)  # 使之与输入的形状相同

    plt.pcolormesh(x1, x2, grid_hat, cmap = cm_light)  # 预测值的显示
    plt.scatter(data_x[:, 0], data_x[:, 1], c = label_y[:, 0], s = 30, cmap = cm_dark)  # 样本
    plt.scatter(test_data[:, 0], test_data[:, 1], c = test_label[:, 0], s = 30, edgecolors = 'k', zorder = 2,
                cmap = cm_dark)  # 圈中测试集样本点
    plt.xlabel('花萼长度', fontsize = 13)
    plt.ylabel('花萼宽度', fontsize = 13)
    plt.xlim(x1_min, x1_max)
    plt.ylim(x2_min, x2_max)
    plt.title('鸢尾花SVM二特征分类')
    plt.savefig('./Result/iris-cla.png')
    plt.show()

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/612856.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

小程序容器技术:数字门户的创新引擎

数字门户是指提供一站式访问和集成多个在线服务、信息和资源的网络平台。它通常是一个网站或应用程序,为用户提供广泛的功能和服务,如新闻、天气预报、电子邮件、在线购物、社交媒体、银行服务、电子支付、在线学习、政府服务等。数字门户的目标是通过集…

Laravel 招聘系统 - 求职者和雇主的解决方案

您是否正在寻找一个将求职者和雇主联系起来的解决方案?那就不要再找了!我们隆重推出 Laravel 招聘板,这是一个使用 Laravel 9.x 框架构建的尖端招聘板脚本。凭借其简洁而优雅的设计,该脚本旨在创建一个用于广告职位空缺、寻找合适…

【Python小技巧】Python操控Chrome浏览器实现网页打开、切换、关闭(送独家Chrome操作打包类源码、Chrome浏览器Cookie在哪里?)

文章目录 前言一、什么时候需要用Python控制浏览器?二、下载Chrome浏览器驱动文件1. 安装Chrome浏览器并查看版本2. 下载浏览器驱动文件3. 解压到python编译器目录(python.exe所在目录) 三、Python控制Chrome浏览器(附源代码&…

基于国产RK3588+多路H.265视频编解码 转码 3U VPX 方案

一、概述 3U VPX音视频转码模块是信迈科技推出的基于RK3588平台用于音视频的编解码、转码,本模块SDI视频、模拟音频输入,视频进行分辨率和帧率的变换,音频进行采样率和码率等的变换,网口输入的视频流进行解码或者转码&…

Linux——进程优先级环境变量

目录 1、进程优先级 1.1 基本概念 1.2 查看系统进程 1.3 PRI and NI 1.4 PRI vs NI 1.5 查看进程优先级的命令 1.6 其他概念 2、环境变量 2.1 基本概念 2.2 常见环境变量 2.3 查看环境变量方法 2.4 测试PATH 2.5 测试HOME 2.6 和环境变量相关的命令 2.7 环境变量…

Springboot配置文件中的明文密码漏洞

目录 一、背景 二、本地修复测试 1、maven中引入jasypt 2、编写加密解密工具类 3、修改配置文件,增加秘钥 4、秘钥放在启动项 三、生产实现 1、升级打包代码 2、生产yml修改明文密码处 3、修改启动命令 一、背景 最近接收到网安的系统安全…

c++类和对象【3】(static成员,友元内部类,匿名对象等)

文章目录 1.友元函数1.1友元函数1.2友元类 2内部类3.匿名对象4.拷贝对象的一些编译器优化5.static成员 1.友元函数 我们在类外面去访问类里的私有成员,就要突破类的访问限定因此就有了友元,它提供了一种突破封装的方式,但是友元会增加耦合度…

GPT时代,一定要收藏的结构化提问技巧

有一种被称为“SMART”的结构化提问方法,可以帮助你更好的组织和明确提出的问题。“SMART”是一个缩写,它代表了以下几个关键元素: S:Specific(具体) 确保问题具体明确,避免模糊或含糊不清的表…

基于SVPWM调制的三相整流器_Simulink仿真模型

文章目录 模型总览特性功能实现输入三相交流电压220Vac 经过三相整流器进行功率变换,输出电压750V,输出功率10kW,同时实现功率因数校正/PFC功能(控制输入电流与输入电压同相且为正弦电流),输入电流THD为1.3…

spring cloud搭建(zuul)

天行健,君子以自强不息;地势坤,君子以厚德载物。 每个人都有惰性,但不断学习是好好生活的根本,共勉! 文章均为学习整理笔记,分享记录为主,如有错误请指正,共同学习进步。…

路径规划算法:基于黏菌优化的路径规划算法- 附代码

路径规划算法:基于黏菌优化的路径规划算法- 附代码 文章目录 路径规划算法:基于黏菌优化的路径规划算法- 附代码1.算法原理1.1 环境设定1.2 约束条件1.3 适应度函数 2.算法结果3.MATLAB代码4.参考文献 摘要:本文主要介绍利用智能优化算法黏菌…

一百二十二、Git——Git上传代码(完善中)

方式一、用IDEA 第一步,IEDA拉项目 File——New——Project from Version Control——Git 输入URL,选择Directory,点击clone 第二步,把上传文件拉到IDEA项目,然后选中文件,右击Git,选择Reposity,如果上传…

中国人口增长预测

目录 问题分析 模型建立 Logistic模型 Leslie模型 模型求解 问题一 问题二 问题三 问题分析 问题 基本假设 (1)不考虑移民对人口总数的影响 (2)超过90岁按照90岁计算 (3)在较短时间内,平均…

深度学习预预训练与MMPretrain

MMPretrain算法库 优势: 含有各种主干网络模型自监督学习功能多模态学习功能丰富的数据集含有训练技巧和策略易用,例如可解释性分析、推理api 包含多种丰富任务的开箱即用推理api 图像分类图像语义描述视觉问答视觉定位检索 安装步骤 配置文件中含有…

python 社区发现算法

转载:这个Python库超级棒啊,包含Louvain 算法、Girvan-Newman 算法等多种社区发现算法,还具有可视化功能_11205354的技术博客_51CTO博客 熟知社区发现算法,你不能错过这个 Python 库。它涵盖 Louvain 算法、Girvan-Newman 算法等…

Java基础(项目2)——项目案例:控制台的一个云就业平台项目【应聘+招聘】

目录 引出项目的分层固定的流程反思1.entity --- 实体类2.dao ---数据库的CRUD【进化到Spring的JdbcTemplate】以职位投递的dao为例---进化到Spring的JdbcTemplate: 3.service --- 组织代码的业务【进化到servlet调用service】4.util ---需要用到的工具【进化到duri…

leetcode450. 删除二叉搜索树中的节点(java)

删除二叉搜索树中的节点 leetcode450. 删除二叉搜索树中的节点题目描述 解题思路代码演示二叉树专题 leetcode450. 删除二叉搜索树中的节点 来源:力扣(LeetCode) 链接:https://leetcode.cn/problems/delete-node-in-a-bst 题目描述…

【SpringCloud——Elasticsearch(下)】

一、数据聚合 聚合,可以实现对文档数据的统计、分析、运算。常见的聚合有三类: ①、桶聚合:用来对文档做分组 TermAggregation:按照文档字段值分组。Date Histogram:按照日期解题分组,例如一周为一组&am…

10 - Linux进程层次分析

---- 整理自狄泰软件唐佐林老师课程 查看所有文章链接:(更新中)Linux系统编程训练营 - 目录 文章目录 1. 详解Linux进程组1.1 Linux进程组1.2 进程组示例程序1.3 编程实验:Linux进程组1.4 深入理解进程组1.4.1 进程组标识设置技巧…

Java实习生面试实录

你平时是怎么使用多线程的 我认为多线程使用我们可以就是你手动的,最初始学多线程就是可以去new Thread,然后去创建别的线程去异步执行一些任务,但是多线程的话最多使用可能在线程池这块会用到吧多线程技术就是创建线程池,然后由…