吴恩达机器学习课后作业-06支持向量机(SVM)

news2024/9/25 19:22:32

SVM

  • 线性可分SVM
    • 题目
    • 绘制决策边界
    • 改变C,观察决策边界
    • 代码
  • 线性不可分SVM
    • 核函数
    • 代码
  • 寻找最优C、gamma
  • 垃圾邮件过滤

线性可分SVM

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

题目

在这里插入图片描述
数据分布
在这里插入图片描述

绘制决策边界

import numpy as np
import matplotlib.pyplot as plt
import scipy.io as sio
from scipy.optimize import minimize
import pandas as pd
from sklearn.svm import SVC

def plot_data():
    plt.scatter(x[:,0],x[:,1],c = y.flatten(), cmap ='jet')
    plt.xlabel('x1')
    plt.ylabel('y1')



"""
绘制决策边界
"""

def plot_boundary(model):
    x_min,x_max =-0.5,4.5
    y_min,y_max =1.3,5
    xx,yy = np.meshgrid(np.linspace(x_min,x_max,500),
    np.linspace(y_min,y_max,500))
    z = model.predict(np.c_[xx.flatten(),yy.flatten()])
    zz = z.reshape(xx.shape)
    plt.contour(xx,yy,zz)

data=sio.loadmat("E:/学习/研究生阶段/python-learning/吴恩达机器学习课后作业/code/ex6-SVM/data/ex6data1.mat")

x,y=data['X'],data['y']
#
plot_data()
# plt.show()

svc1 = SVC(C=1,kernel='linear')
svc1.fit(x,y.flatten())
svc1.predict(x)
print(svc1.score(x,y.flatten()))
plot_boundary(svc1)
plt.show()


在这里插入图片描述

改变C,观察决策边界


svc100 = SVC(C=100,kernel='linear')
svc100.fit(x,y.flatten())
svc100.predict(x)
print(svc100.score(x,y.flatten()))



plot_boundary(svc100)
plt.show()

在这里插入图片描述

代码

import numpy as np
import matplotlib.pyplot as plt
import scipy.io as sio
from scipy.optimize import minimize
import pandas as pd
from sklearn.svm import SVC

def plot_data():
    plt.scatter(x[:,0],x[:,1],c = y.flatten(), cmap ='jet')
    plt.xlabel('x1')
    plt.ylabel('y1')



"""
绘制决策边界
"""

def plot_boundary(model):
    x_min,x_max =-0.5,4.5
    y_min,y_max =1.3,5
    xx,yy = np.meshgrid(np.linspace(x_min,x_max,500),
    np.linspace(y_min,y_max,500))
    z = model.predict(np.c_[xx.flatten(),yy.flatten()])
    zz = z.reshape(xx.shape)
    plt.contour(xx,yy,zz)

data=sio.loadmat("E:/学习/研究生阶段/python-learning/吴恩达机器学习课后作业/code/ex6-SVM/data/ex6data1.mat")

x,y=data['X'],data['y']
#
plot_data()
# plt.show()

svc1 = SVC(C=1,kernel='linear')
svc1.fit(x,y.flatten())
svc1.predict(x)
print(svc1.score(x,y.flatten()))
plot_boundary(svc1)
# plt.show()


svc100 = SVC(C=100,kernel='linear')
svc100.fit(x,y.flatten())
svc100.predict(x)
print(svc100.score(x,y.flatten()))



plot_boundary(svc100)
plt.show()

线性不可分SVM

核函数

在这里插入图片描述
在这里插入图片描述
数据集
在这里插入图片描述


svc1 = SVC(C=1,kernel='rbf',gamma=1)
svc1.fit(x,y.flatten())
svc1.score(x,y.flatten())

plot_boundary(svc1)
plot_data()
plt.show()

Gamma越小,模型复杂度越低,Gamma越大,模型复杂度越高
gamma=1
在这里插入图片描述
gamma=50
在这里插入图片描述
gamma=1000
在这里插入图片描述

代码

import numpy as np
import matplotlib.pyplot as plt
import scipy.io as sio
from scipy.optimize import minimize
import pandas as pd
from sklearn.svm import SVC

def plot_data():
    plt.scatter(x[:,0],x[:,1],c = y.flatten(), cmap ='jet')
    plt.xlabel('x1')
    plt.ylabel('y1')

def plot_boundary(model):
    x_min,x_max =0,1
    y_min,y_max =0.4,1
    xx,yy = np.meshgrid(np.linspace(x_min,x_max,500),
    np.linspace(y_min,y_max,500))
    z = model.predict(np.c_[xx.flatten(),yy.flatten()])
    zz = z.reshape(xx.shape)
    plt.contour(xx,yy,zz)



data=sio.loadmat("E:/学习/研究生阶段/python-learning/吴恩达机器学习课后作业/code/ex6-SVM/data/ex6data2.mat")

x,y=data['X'],data['y']


svc1 = SVC(C=1,kernel='rbf',gamma=1000)
svc1.fit(x,y.flatten())
svc1.score(x,y.flatten())

plot_boundary(svc1)
plot_data()
plt.show()

寻找最优C、gamma

数据集
在这里插入图片描述

Cvalues =[0.01,0.03,0.1,0.3,1 ,3,10,30,100]
gammas =[0.01,0.03,0.1, 0.3,1 ,3, 10,30,100]
best_score=0
best_params=(0,0)
best_score = 0
best_params = (0,0)
for c in Cvalues:
    for gamma in gammas:
        svc = SVC(C=c,kernel='rbf',gamma=gamma)
        svc.fit(x,y.flatten())
        score = svc.score(xval,yval.flatten())
        if score > best_score:
            best_score = score
            best_params = (c,gamma)
print(best_score,best_params)
结果
0.965 (0.3, 100)

绘制决策边界

svc1 = SVC(C=best_params[0],kernel='rbf',gamma=best_params[1])
svc1.fit(x,y.flatten())
plot_boundary(svc1)
plot_data()
plt.show()

全部代码

import numpy as np
import matplotlib.pyplot as plt
import scipy.io as sio
from scipy.optimize import minimize
import pandas as pd
from sklearn.svm import SVC

def plot_boundary(model):
    x_min,x_max =-0.6,0.4
    y_min,y_max =-0.7,0.6
    xx,yy = np.meshgrid(np.linspace(x_min,x_max,500),
    np.linspace(y_min,y_max,500))
    z = model.predict(np.c_[xx.flatten(),yy.flatten()])
    zz = z.reshape(xx.shape)
    plt.contour(xx,yy,zz)


def plot_data():
    plt.scatter(x[:,0],x[:,1],c = y.flatten(), cmap ='jet')
    plt.xlabel('x1')
    plt.ylabel( 'y1')

mat=sio.loadmat("E:/学习/研究生阶段/python-learning/吴恩达机器学习课后作业/code/ex6-SVM/data/ex6data3.mat")

x,y=mat['X'], mat['y']
xval, yval =mat['Xval'], mat['yval']
plot_data()
# plt.show()
Cvalues =[0.01,0.03,0.1,0.3,1 ,3,10,30,100]
gammas =[0.01,0.03,0.1, 0.3,1 ,3, 10,30,100]
best_score=0
best_params=(0,0)
best_score = 0
best_params = (0,0)
for c in Cvalues:
    for gamma in gammas:
        svc = SVC(C=c,kernel='rbf',gamma=gamma)
        svc.fit(x,y.flatten())
        score = svc.score(xval,yval.flatten())
        if score > best_score:
            best_score = score
            best_params = (c,gamma)
print(best_score,best_params)
svc1 = SVC(C=best_params[0],kernel='rbf',gamma=best_params[1])
svc1.fit(x,y.flatten())
plot_boundary(svc1)
plot_data()
plt.show()

在这里插入图片描述

垃圾邮件过滤


import numpy as np
import matplotlib.pyplot as plt
import scipy.io as sio
from scipy.optimize import minimize
import pandas as pd
from sklearn.svm import SVC




data1=sio.loadmat("E:/学习/研究生阶段/python-learning/吴恩达机器学习课后作业/code/ex6-SVM/data/spamTrain.mat")

x,y=data1['X'], data1['y']
data2=sio.loadmat("E:/学习/研究生阶段/python-learning/吴恩达机器学习课后作业/code/ex6-SVM/data/spamTest.mat")

xtest, ytest =data2['Xtest'], data2['ytest']

Cvalues = [3,10,30,100,0.01, 0.03,0.1,0.3,1]
best_score = 0
best_param = 0
for c in Cvalues:
    svc= SVC(C=c,kernel='linear')
    svc.fit(x,y.flatten())
    score= svc.score(xtest,ytest.flatten())
    if score > best_score:
        best_score = score
        best_param =c
# print(best_score,best_param)

svc2 = SVC(C=best_param,kernel='linear')
svc2.fit(x,y.flatten())
score_train= svc2.score(x,y.flatten())
score_test= svc2.score(xtest,ytest.flatten())
print(score_train,score_test)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2073620.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

电子电路学习之二极管-1

特别感谢:B站博主:唐老师讲电赛 工科男孙老师 本文图片出自两位博主视频 再次感谢 1 半导体 1. 本征半导体 (Intrinsic Semiconductor) 定义:本征半导体是指纯净的、不掺杂任何杂质的半导体材料,如硅(Si)…

日本人形机器人仿真环境搭建

机器人 官网在这里 http://ai2001.ifdef.jp/uvc/uvc.html 我们可以下载他们的源码 ODE引擎安装 这个是刚体动力学模拟引擎,我用的是windows,大家可以自己参考着官网来(http://ode.org/wiki/index.php/Manual#Install_and_Use)…

【SpringBoot】自定义spring-boot-starter

目录 定义和目的# 命名规范# 准备阶段# 开发步骤# 一、创建 Starter 项目# 二、导入必要的依赖# 三、编写属性类# 四、自定义业务类# 五、编写自动配置类# 六、编写 spring.factories# ​编辑 七、编写配置提示文件# 八、测试 starter# 测试 starter# 一、导入自…

如何玩转CentOS Linux内核升级?手把手教你内核编译升级至最新版本

文章目录 如何玩转CentOS Linux内核升级?手把手教你内核编译升级至最新版本1 升级环境2 升级需求2.1 升级前的内核版本2.2 升级后的内核版本 3 升级步骤3.1 安装编译环境3.2 更新GCC版本3.2.1 多GCC版本共存3.2.2 永久替换旧的GCC 3.3 下载内核源代码并解压3.4 配置…

《数据结构》(408代码题及应用题)(王道收编真题)

一、线性表 1、线性表的线性表示 分析: “循环”左移,那这个循环就应该是我们需要重点思考的点。先考虑最简单的我们可以设置两个数组,其中一个数组保存的是原数据,另一个初始为空。接着想要实现循环左移就只需要找出相对应的位…

2002-2023年中债国债3年期到期收益率

国债是一种政府发行的债券,它为投资者提供了一种相对安全的投资渠道,因为背后有国家信用的支撑。国债的发行可以帮助政府筹集资金,用于公共支出、基础设施建设、社会福利等项目。国债通常分为两种形式:固定利率国债和浮动利率国债…

PHP 7.4.21 development server 源码泄露漏洞复现

原漏洞地址&#xff1a;https://blog.projectdiscovery.io/php-http-server-source-disclosure/ 版本&#xff1a;PHP<7.4.21 漏洞成因&#xff1a; 通过&#xff1a;PHP -s 开启的内置web服务器存在源码泄露漏洞&#xff0c;可以将PHP文件作为静态代码直接输出源码 POC&…

【区间dp】 P1775 石子合并(弱化版) 题解

题目描述 设有 N ( N ≤ 300 ) N(N \le 300) N(N≤300) 堆石子排成一排&#xff0c;其编号为 1 , 2 , 3 , ⋯ , N 1,2,3,\cdots,N 1,2,3,⋯,N。每堆石子有一定的质量 m i ( m i ≤ 1000 ) m_i\ (m_i \le 1000) mi​ (mi​≤1000)。现在要将这 N N N 堆石子合并成为一堆。每…

20240825 每日AI必读资讯

超6亿&#xff01;文心大模型日调用量半年增长超10倍&#xff0c;AI成百度最强加速引擎 - 文心大模型日调用量超过6亿次&#xff0c;日均处理Tokens文本超1万亿。与23年Q4公布的5000万次日均调用量相比&#xff0c;半年增长超10倍。 - 第二季度&#xff0c;百度云业务营收51亿…

【计算机网络】socket网络编程 --- 实现简易UDP网络程序之字符串回响

&#x1f466;个人主页&#xff1a;Weraphael ✍&#x1f3fb;作者简介&#xff1a;目前正在学习c和算法 ✈️专栏&#xff1a;Linux &#x1f40b; 希望大家多多支持&#xff0c;咱一起进步&#xff01;&#x1f601; 如果文章有啥瑕疵&#xff0c;希望大佬指点一二 如果文章对…

【北京仁爱堂】脖子歪斜,拉扯疼痛怎么办?规律的生活让痉挛性斜颈的恢复事半功倍!

痉挛性斜颈是一种肌张力障碍性疾病&#xff0c;也是一种让人非常痛苦不堪的疾病&#xff0c;他不仅影响患者的外貌&#xff0c;也会对患者的身体和心理造成双重的打击&#xff0c;严重影响正常的生活&#xff0c;社交和工作。 痉挛性斜颈的病因尚不明确&#xff0c;因为做任何仪…

Java Web —— 第八天(登录功能)

基础登录功能 LoginController 类 RestController //用于处理 HTTP 请求 Slf4j //记录日志 RequestMapping("/login") public class LoginController {Autowiredprivate EmpService empService;PostMappingpublic Result login(RequestBody Emp emp){log.info(&quo…

FFmpeg的入门实践系列六(编程入门之常见处理流程)

欢迎诸位来阅读在下的博文~ 在这里&#xff0c;在下会不定期发表一些浅薄的知识和经验&#xff0c;望诸位能与在下多多交流&#xff0c;共同努力 文章目录 前期博客参考书籍一、FFmpeg常见的处理流程复制编解码器的参数完整代码 二、创建并写入音视频文件三、总结附页 前期博客…

《黑神话:悟空》中的实景三维建模

这几天&#xff0c;国产游戏《黑神话:悟空》终于面世&#xff0c;迅速引爆了全球游戏市场。作为一款以《西游记》为背景的3A级动作角色扮演游戏&#xff0c;《黑神话:悟空》不仅在文化表达上极具吸引力&#xff0c;其背后的技术实力更是令人瞩目。本文将深入探讨&#xff0c;3A…

新“冰桶挑战”风靡奥运年,荣耀让科技有温度

巴黎奥运会落幕之后&#xff0c;残奥会即将在8月28日正式开赛&#xff0c;“超越自我&#xff0c;挑战极限”的拼搏精神仍在延续。 而挑战精神&#xff0c;不分场上或台下&#xff0c;存在于生活中的每个角落。 2024年不仅是奥运年&#xff0c;也是“冰桶挑战”的十周年&…

DMP调研(Data Management Platform-数据管理平台)

基础概念 数据资产 CRM、DMP、CDP 定义 Customer Data Platform&#xff08;CDP,客户数据平台&#xff09;&#xff1a;对于企业来说&#xff0c;CDP是作为全链路运营的核心数据系统。是汇集所有客户数据并将数据存储在统一的、可多部门访问的数据平台中&#xff0c;让企业各…

【Remi Pi使用HDMI屏幕显示QT界面】将QT工程在Ubuntu虚拟机交叉编译好拷贝到开发板并运行

开发板和Ubuntu虚拟机ssh连接 可以成功点亮hdmi屏幕&#xff08;默认是运行的mxapp2程序显示如下&#xff09; 可以在开发板上运行自己的qt程序界面 手动配置开发板以太网ip ip addr add 192.168.43.101/24 brd dev eth0 ip link set eth0 &#xff08;2&#xff09;虚拟机…

Vue3.0项目实战(一)——Vue3 大事件管理系统项目搭建

目录 1. 大事件项目介绍和创建 1.1 Vue3 大事件管理系统 1.2 pnpm 包管理器 - 创建项目 1.3 创建项目 2. Eslint 配置代码风格 2.1 环境同步 2.2 Eslint 配置代码风格 3. 基于 husky 的代码检查工作流 3.1 提交前做代码检查 3.2 暂存区 eslint 校验 3.3 总结 4. 目…

i.MX6裸机开发(9):CCM时钟控制模块

本章参考资料&#xff1a;《IMX6ULRM》&#xff08;参考手册&#xff09;。 学习本章时&#xff0c;配合《IMX6ULRM》第18章Clock Controller Module (CCM)&#xff0c;效果会更佳&#xff0c;特别是涉及到寄存器说明的部分。 本章我们主要讲解时钟部分&#xff0c;芯片内部的…

TensorFlow实现Softmax回归

原理 模型 相比线性回归&#xff0c;Softmax只多一个分类的操作&#xff0c;即预测结果由连续值变为离散值&#xff0c;为了实现这样的结果&#xff0c;我们可以使最后一层具有多个神经元&#xff0c;而输入不变&#xff0c;其结构如图所示&#xff1a; 为了实现分类&#xf…