基于Python实现线性分类器

news2024/11/20 2:40:40

访问【WRITE-BUG数字空间】_[内附完整源码和文档]

在机器学习领域,分类的目标是指将具有相似特征的对象聚集。而一个线性分类器则透过特征的线性组合来做出分类决定,以达到此种目的。对象的特征通常被描述为特征值,而在向量中则描述为特征向量。

  1. 理论知识
    1.1 从线性回归到线性多分类
    回归是基于给定的特征,对感兴趣的变量进行值的预测的过程。在数学上,回归的目的是建立从输入数值到监督数值的函数: y ^ = f ( x 1 , . . . , x m ) \hat y=f(x_1,...,x_m) y^=f(x1,...,xm) 线性回归限制函数为线性形式,即为: f ( x 1 , . . . x m ) = w 0 + w 1 x 1 + . . . + w m x m = x w f(x_1,...x_m)=w_0+w_1x_1+...+w_mx_m=\bold x\bold w f(x1,...xm)=w0+w1x1+...+wmxm=xw 其中, x = [ 1 , x 1 , x 2 , . . . , x m ]   w = [ w 0 , w 1 , w 2 , . . . , w m ] T \bold x = [1,x_1,x_2,...,x_m]\ \bold w = [w_0,w_1,w_2,...,w_m]^T x=[1,x1,x2,...,xm] w=[w0,w1,w2,...,wm]T 也就是找一组参数 w k k = 1 m {w_k}^m_{k=1} wkk=1m,使得在训练集上,函数与预测值尽可能接近。

对于本次的分类问题来说,线性回归的输出值与分类任务中的目标值不兼容。线性回归的结果范围为全体实数,而对于本次实验的多分类问题,变量结果即属于的类别,换言之,我们期望的结果标签的种类数量和训练样本的总类别数量一致。因此考虑使用softmax函数来将回归结果映射到种类上,从而表示分类结果。对于K分类问题,有: s o f t m a x i ( z ) = e z i ∑ k = 1 K e z k   f i ( x ) = s o f t m a x i ( x W ) = e x w i ∑ k = 1 K e x w k softmax_i(\bold z)=\frac{e^{z_i}}{\sum^K_{k=1}e^{z_k}}\ f_i(\bold x)=softmax_i(\bold{xW})=\frac{e^{\bold{xw_i}}}{\sum^K_{k=1}e^{\bold{xw_k}}} softmaxi(z)=k=1Kezkezi fi(x)=softmaxi(xW)=k=1Kexwkexwi 其中, W \bold W W为: W ≜ [ w 1 , w 2 . . . , w K ] \bold W\triangleq \left[\begin{matrix}{\bold w_1,\bold w_2...,\bold w_K}\end{matrix}\right] W[w1,w2...,wK] 易见,所有类的softmax函数值之和为1。每一类的函数值就为它的概率。

1.2 损失函数表示与优化
经过上面的讨论与操作,对于多分类问题,预测结果是在每一类上的概率,即维度数等于类数的向量。与之对应的实际结果可以用独热向量表示,即是本类的那一维度为1,其他维度为0的向量。为了使得预测结果与实际结果尽量接近,我们考虑用损失函数用于衡量预测结果和实际结果的差距。在数学上,该分类问题等价于找到合适的向量 w \bold w w,使得损失函数最小化。依据本次实验的要求,损失函数需要分别考虑交叉熵损失和均方误差损失,即损失函数分别为: L 1 ( w 1 , w 2 , . . . , w K ) = − 1 N ∑ l = 1 N ∑ k = 1 K y k ( l ) log ⁡ s o f t m a x k ( x ( l ) W )   L 2 ( w 1 , w 2 , . . . , w K ) = 1 N ∑ l = 1 N ∑ k = 1 K ( s o f t m a x k ( x ( l ) W ) − y k ( l ) ) 2 L_1(\bold w_1,\bold w_2,...,\bold w_K)=-\frac1N\sum^N_{l=1}\sum^K_{k=1}y_k^{(l)}\log softmax_k(\bold x^{(l)}\bold W)\ L_2(\bold w_1,\bold w_2,...,\bold w_K)=\frac1N\sum^N_{l=1}\sum^K_{k=1}(softmax_k(\bold x^{(l)}\bold W)-y^{(l)}_k)^2 L1(w1,w2,...,wK)=N1l=1Nk=1Kyk(l)logsoftmaxk(x(l)W) L2(w1,w2,...,wK)=N1l=1Nk=1K(softmaxk(x(l)W)yk(l))2 其中, y k ( l ) y_k^{(l)} yk(l)是第 k k k y ( l ) y^{(l)} y(l)的元素。

考虑使用梯度下降法使得损失函数最小化。两个损失函数的梯度分别为: KaTeX parse error: Undefined control sequence: \part at position 8: \frac{\̲p̲a̲r̲t̲ ̲L(\bold W)}{\pa…

梯度下降法的参数更新方式为: KaTeX parse error: Undefined control sequence: \part at position 45: …}-r\left.\frac{\̲p̲a̲r̲t̲ ̲L(\bold W)}{\pa…

其中 r r r为学习率。对于凹函数,通过适当的学习率,对模型参数进行迭代更新,最终可以收敛到最小值点。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/541283.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Visual studio 配置intel realsense sdk环境

前面的部分已经有博主写过了,这里就不赘述了,附上链接:VS配置使用realsense相机SDK 仅仅配置上述文章中的部分,运行realsense example的部分例子程序时会出现找不到glfw3.h的问题。我查找了github上的提问发现这个问题原因是没有…

网络安全中NISP二级证书和CISP证书的优势有什么

优势?那就需要多个点展开说说啦~ 1.权威含金量高 我国信息安全领域唯一的国家级注册安全专业人员证书 2.就业面宽,企业优先选择证书持有者 通过专业培训和考试提高个人信息安全从业水平,证明具备从事信息安全技术和管理工作的能力&#x…

opencv二值化详解

大家好,今天来跟大家讲讲 opencv二值化。 先从一个比较经典的方法开始讲解,看 opencv官方文档: 二值化(binary)的定义:在一个输入图像中,将其一个像素点设置为0,将其两个像素点设置为1。 二值化…

开发笔记之:文件读取值溢出bug分析(QT C++版)

(1)引言 以下是QT C读取数据文件(QDataStream)的代码: /*** 按双字读取* param fis 文件输入流* param isBigEndian 是否大头(字节序)* return 双字值*/ DWORD FsFileUtil::readAsD…

怎么用问卷工具做市场调研?

对于希望开发新产品或服务、拓展新市场或确定潜在客户的公司来说,市场调查是一个至关重要的过程。然而,进行市场调查可能既耗时又昂贵,特别是在涉及对大量人群进行调查的情况下。今天,小编将来聊一聊调查问卷工具如何帮助企业进行…

微信小程序-基础知识

文章目录 AppIdOpenIDUnionId处理方法session_key AppId appid 是微信账号的唯一标识,这个是固定不变的; 如果了解微信公众号开发的就需要注意一下,小程序的appid 和 公众号的appid 是不一致的 OpenID 为了识别用户,每个用户针…

如何成为自动化测试工程师?8年测试总结,自动化测试岗晋升的技能...

目录:导读 前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结(尾部小惊喜) 前言 Python自动化测试&…

程序设计入门——C语言2023年5月18日

程序设计入门——C语言 第二周 计算表达式 课程来源:链接: 浙江大学 翁恺 程序设计入门——C语言 学习日期:2023年5月18日 第二周 计算 表达式 有两个变量a和b,交换a和b的值。 老师举例:有两杯液体,一杯茶&#xff…

03)FastDFS配置nginx 服务,使用http方式访问图片

FastDFS是没有文件访问功能的,需要借助其他工具实现图片HTTP访问的。 没安装nginx时比如前端html网页想获取 FastDFS的一张图片显示,需要java写个controller,然后使用 FastDFS-java client客户端调用文件获取api,HttpServletResponre在返回图片流.给前端显示。 安装了nginx…

HTTP介绍、原理

HTTP 与 HTTPS 有哪些区别? HTTP 是超文本传输协议,信息是明文传输,存在安全风险的问题。HTTPS 则解决 HTTP 不安全的缺陷,在 TCP 和 HTTP 网络层之间加入了 SSL/TLS 安全协议,使得报文能够加密传输。HTTP 连接建立相…

带头 双向 循环 链表——C语言实现

既然有带头 那么就有不带头 为什么我要将带头 而不讲不带头? 在之前我讲单链表时就说过 如果不带头会出现讨论的情况 为什么会出现讨论的情况 假设链表有一个节点 进行尾插 就只是将新的节点连接到链表的尾节点之后 那么如果链表没有节点 就没有尾节点 自然也就不能…

网络编程 (一)网络协议TCP,UDP

文章目录 🐒个人主页🏅JavaSE系列专栏📖前言:🎀计算机网络概述🎀网络编程🎀那么是如何精确找到计算机网络中的目标主机呢?🎀网络模型🎀TCP协议🎀U…

GitLAB CI-CD语法

GitLAB CI-CD语法 目录 1、Pipeline核心语法 gitlab-ci语法: https://docs.gitlab.com/ee/ci/yaml/ stages 阶段控制 .pre阶段的作业总是在流水线开始时执行;.post阶段的作业总是在流水线结束时执行; CI代码: stages:- build…

Servlet的详解

Servlet 的主要工作 允许程序员注册一个类,在 Tomcat 收到的某个特定的 HTTP 请求的时候,执行这个类中的一些代码 帮助程序员解析 HTTP 请求,把 HTTP 请求从一个字符串解析成一个 HttpRequest 对象 帮助程序员构造 HTTP 响应,程序…

用 CSS 自定义滚动条

简介 首先需要介绍一下滚动条的组成部分。滚动条包含 track 和 thumb&#xff0c;如下图所示&#xff1a; track是滚动条的基础&#xff0c;其中的 thumb是用户拖动支页面或章节内的滚动。 案例&#xff1a; 案例代码&#xff1a; <!DOCTYPE html> <html><he…

python 递归下降分析法的设计与实验原理 编译原理

本文内容&#xff1a; 本文章实现的文法&#xff1a; E->T|ET; T->F|T*F; F->i|(E);利用上一篇文章&#xff1a;python 预备实验2 LL(1)文法构造转化后的输出&#xff1a; E->TE; T->FT; F->i|(E); E->TE|; T->*FT|; 手工测试&#xff0c;是LL(1)文…

Flink+Pulsar、Kafka问题分析及方案 -- 事务阻塞

Pulsar、Kafka的事务设计 Pulsar跟Kafka在设计事务功能时&#xff0c;在消费者读取消息的顺序方面&#xff0c;都采用了类似的设计。 比如说&#xff0c;先创建txn1&#xff0c;然后创建txn2&#xff0c;这两个事务生产消息到同一个topic/partition里&#xff0c;但是txn2比tx…

【前端知识】常见的加密算法介绍

【前端知识】常见的加密算法介绍 1 常见的加密算法&#xff08;1&#xff09;哈希函数&#xff08;2&#xff09;对称加密&#xff08;3&#xff09;非对称加密&#xff08;4&#xff09;消息认证码&#xff08;MAC&#xff09; 2.总结 1 常见的加密算法 略微介绍一下前端中常…

Kerberos

序言 kerberos 除了说帮我们验证Java程序是否具有权限来请求Hadoop的服务,也可以来帮助我们检查新增的节点是是否是真实的节点,还是黑客为了套取数据的节点. 比如为HDFS新增一个DataNode节点,如果没有Kerberos验证, 随便一个节点只要连接上NameNode就会存储数据,黑客就可以获…

LeetCode:23. 合并 K 个升序链表

23. 合并 K 个升序链表 1&#xff09;题目2&#xff09;过程3&#xff09;代码1. 最开始2.初步优化 4&#xff09;结果1. 最开始2. 初步优化 1&#xff09;题目 给你一个链表数组&#xff0c;每个链表都已经按升序排列。 请你将所有链表合并到一个升序链表中&#xff0c;返回合…