DataWhale-吃瓜教程学习笔记(四)

news2024/11/26 15:29:25

学习视频:第3章-二分类线性判别分析_哔哩哔哩_bilibili
西瓜书对应章节: 3.4


文章目录

  • - 算法原理
  • - 损失函数推导
        • -- 异类样本中心尽可能远
        • -- 同类样本方差尽可能小
        • -- 综合
    • 知识点补充 - 二范数
        • 二范数(2-norm)详解
          • 定义
          • 几何意义
          • 性质
          • 应用
          • 示例
    • 求解 w
      • 知识点补充 - 广义瑞利商
        • 定义
        • 解释
        • 应用
      • 优化广义瑞利商


- 算法原理

image.png


- 损失函数推导

--------------------------------------- 投影后 ----------------------------------------------

– 异类样本中心尽可能远

image.png

– 同类样本方差尽可能小

image.png

– 综合

image.png

分母为 同类样本之间的关系,分子为异类样本之间的关系,使分子尽量小(同类样本方差尽可能小),分母尽量大(异类样本中心尽量远),则有 M a x Max Max J J J


知识点补充 - 二范数

二范数(2-norm)详解
定义

对于一个n维欧几里得空间中的向量 x = [ x 1 , x 2 , … , x n ] T \mathbf{x} = [x_1, x_2, \ldots, x_n]^\text{T} x=[x1,x2,,xn]T,其二范数定义为: ∥ x ∥ 2 = x 1 2 + x 2 2 + ⋯ + x n 2 = x T x \|\mathbf{x}\|_2 = \sqrt{x_1^2 + x_2^2 + \cdots + x_n^2} = \sqrt{\mathbf{x}^\text{T} \mathbf{x}} x2=x12+x22++xn2 =xTx

几何意义

在二维或三维空间中,二范数表示向量末端到原点的欧几里得距离。例如,在二维空间中,向量 x = [ x 1 , x 2 ] T \mathbf{x} = [x_1, x_2]^\text{T} x=[x1,x2]T 的二范数表示为:
∥ x ∥ 2 = x 1 2 + x 2 2 \|\mathbf{x}\|_2 = \sqrt{x_1^2 + x_2^2} x2=x12+x22
这正是勾股定理的直接应用,表示向量 x \mathbf{x} x 在平面上的长度。

性质
  1. 非负性:对于所有向量 x , ∥ x ∥ 2 ≥ 0 ,且 ∥ x ∥ 2 = 0 当且仅当 x = 0 \mathbf{x},\|\mathbf{x}\|_2 \geq 0,且 \|\mathbf{x}\|_2 = 0 当且仅当 \mathbf{x} = \mathbf{0} xx20,且x2=0当且仅当x=0
  2. 齐次性:对于所有向量 x \mathbf{x} x 和所有标量 c c c ∥ c x ∥ 2 = ∣ c ∣ ∥ x ∥ 2 \|c\mathbf{x}\|_2 = |c|\|\mathbf{x}\|_2 cx2=c∣∥x2
  3. 三角不等式:对于所有向量 x \mathbf{x} x y \mathbf{y} y ∥ x + y ∥ 2 ≤ ∥ x ∥ 2 + ∥ y ∥ 2 \|\mathbf{x} + \mathbf{y}\|_2 \leq \|\mathbf{x}\|_2 + \|\mathbf{y}\|_2 x+y2x2+y2
应用

二范数在数值分析、机器学习、信号处理等领域有广泛应用。例如,在机器学习中,二范数常用于正则化项,以防止模型过拟合;在信号处理中,二范数用于衡量信号的能量。

示例

考虑向量 x = [ 3 , 4 ] T \mathbf{x} = [3, 4]^\text{T} x=[3,4]T,其二范数为: ∥ x ∥ 2 = 3 2 + 4 2 = 9 + 16 = 25 = 5 \|\mathbf{x}\|_2 = \sqrt{3^2 + 4^2} = \sqrt{9 + 16} = \sqrt{25} = 5 x2=32+42 =9+16 =25 =5

这表示向量 (\mathbf{x}) 在二维空间中的长度为5。

image.png


求解 w

  • 利用 拉格朗日乘子法 对该式子进行转化
    image.png

image.png

image.png

知识点补充 - 广义瑞利商

广义瑞利商(Generalized Rayleigh Quotient)是一种在数学和工程中广泛使用的概念,特别是在信号处理、模式识别和最优化问题中。它是经典瑞利商的推广,用于衡量向量在不同矩阵(通常是对称正定矩阵)下的分布情况。

定义

广义瑞利商的形式如下:

R ( w ) = w ⊤ A w w ⊤ B w R(\mathbf{w}) = \frac{\mathbf{w}^\top \mathbf{A} \mathbf{w}}{\mathbf{w}^\top \mathbf{B} \mathbf{w}} R(w)=wBwwAw

其中, A \mathbf{A} A B \mathbf{B} B 是对称矩阵, B \mathbf{B} B 通常是正定的, w \mathbf{w} w 是一个非零向量。

解释
  • A \mathbf{A} A 通常表示待优化的问题中涉及的矩阵,例如散布矩阵或相关矩阵。
  • B \mathbf{B} B 通常表示一个约束矩阵,比如在模式识别中的类内散布矩阵或协方差矩阵。
  • w \mathbf{w} w 是我们要寻找的向量,使得广义瑞利商 R ( w ) R(\mathbf{w}) R(w) 达到最大或最小。
应用
  1. 线性判别分析 (LDA)
    在模式识别中,LDA 通过最大化类间散布矩阵 S \mathbf{S} S与类内散布矩阵 S w \mathbf{S}_w Sw的广义瑞利商来找到最优的投影方向:
    R ( w ) = w ⊤ S b w w ⊤ S w w R(\mathbf{w}) = \frac{\mathbf{w}^\top \mathbf{S}_b \mathbf{w}}{\mathbf{w}^\top \mathbf{S}_w \mathbf{w}} R(w)=wSwwwSbw

  2. 特征值问题
    广义瑞利商的极值问题可以转化为广义特征值问题,解决矩阵 A w = λ B w \mathbf{A}\mathbf{w} = \lambda \mathbf{B}\mathbf{w} Aw=λBw 中的特征值 λ \lambda λ 和特征向量 w \mathbf{w} w

  3. 振动分析
    在结构工程和机械工程中,用于分析系统在不同状态下的振动模式。

优化广义瑞利商

求解广义瑞利商最大化或最小化的问题通常涉及求解广义特征值问题:
A w = λ B w \mathbf{A} \mathbf{w} = \lambda \mathbf{B} \mathbf{w} Aw=λBw
其中, λ \lambda λ 是广义瑞利商的极值。

通过解这个特征值问题,可以得到使广义瑞利商达到极值的 w \mathbf{w} w 和对应的特征值 λ \lambda λ


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1875711.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Bridging nonnull in Objective-C to Swift: Is It Safe?

Bridging nonnull in Objective-C to Swift: Is It Safe? In the world of iOS development, bridging between Objective-C and Swift is a common practice, especially for legacy codebases (遗留代码库) or when integrating (集成) third-party libraries. One importa…

链表-求链表中环的入口结点(easy)

目录 一、问题描述 二、解题思路 三、代码实现 四、刷题链接 一、问题描述 二、解题思路 本题基本思路: 1.设置一个hashSet来存储已经访问过的链表结点地址,注意不要直接存储链表内元素,因为链表内元素可能存在重复的,地址是不…

APP项目测试 之 开发模型和发布

项目客户端一般分为:浏览器端和APP端 APP端分为:手机端(安装在手机上的软件)和PC端(安装在电脑上的软件) 1.开发模型 项目迭代速度不同:开发模型不一样 传统行业:瀑布模型 互联网行业…

C++实现简化版Qt信号槽机制(2):增加内存安全保障

在上一篇文章中《C实现一个简单的Qt信号槽机制》,我们基于前面的反射代码实现了信号槽的功能。 但是上一篇的代码中没有对象生命周期管理的机制,如果在对象的生命周期结束后还存在未断开的信号和槽连接,那么信号触发时可能会尝试访问已经被析…

乐鑫 Matter 技术体验日|快速落地 Matter 产品,引领智能家居生态新发展

随着 Matter 协议的推广和普及,智能家居行业正迎来新的发展机遇,众多厂商纷纷投身于 Matter 产品的研发与验证。然而,开发者普遍面临技术门槛高、认证流程繁琐、生产管理复杂等诸多挑战。 乐鑫信息科技 (688018.SH) 凭借深厚的研发实力与行…

AI周报(6.23-6.29)

AI应用-巴西医生成功用Vision Pro做手术 巴西外科医生布鲁诺戈巴托(Bruno Gobbato)在2024年4月22日首次成功使用Apple Vision Pro进行了肩袖撕裂的手术。这次手术采用了肩关节镜技术,通过关节内的摄像头捕捉图像,并通过高分辨率的…

建议csdn赶紧将未经作者同意擅自锁住收费的文章全部解锁,别逼我用极端手段让你们就范

前两天我偶然发现csdn竟然将我以前发表的很多文章锁住向读者收费才让看。 csdn这种无耻行径往小了说是侵犯了作者的版权著作权,往大了说这是在打击我国IT领域未来的发展,因为每一个做过编程工作的人都知道,任何一个程序员的学习成长过程都少不…

校企携手,探索“最强大脑”电子科技大学特聘研究员Minati教授访问阿尔泰科技:探索大脑与电子系统的交叉点

近日,成都电子科技大学意籍著名教授Minati教授应邀访问了阿尔泰科技,展开了一场富有深度和成果的学术交流。作为一位专注于大脑和电子系统非线性动力学研究的领军人物,Minati教授此次访问旨在探索科技前沿,特别是关注阿尔泰科技的…

fiddler抓https包

1,安装fiddler省略 2,下载证书步骤:tools-options-https 点击确认,点击OK,点击是 把证书安装到谷歌浏览器上步骤:点击谷歌浏览器右上角的设置,在搜索框中搜索证书,点击“证书管理”…

【Redis】-缓存以及Serializable接口

问题 当用户访问量比较大时,某个业务功能需要频繁查询数据库,会让数据库访问压力增大,会导致系统响应慢,用户体验差 解决 通过Redis来缓存数据,减少数据库查询操作 实例 当我们在小程序点餐时,每次都需要通…

打开数据结构的大门——顺序表详解

前言: 小编在近日刚开始学顺序表,为了巩固学习,小编先写一篇关于顺序表的文章来加强记忆,写完这一篇我将继续书写C语言相关的文章,那么废话不多说,下面小编将打开数据结构的大门!顺序表来喽&…

GPT-4o技术粗粗粗解

GPT-4o是一个非常优秀的多模态大模型。它的输入是语音、文字、图像/视频。输出自然有语音、文字、图像。如果说它像一个人的能力,那还真的差不多了。可能离AGI就不远了吧!在现有的AI能力路上,SamAltman那句逆言的忠耳一定要听:不要…

如何利用React和Python构建强大的网络爬虫应用

如何利用React和Python构建强大的网络爬虫应用 引言: 网络爬虫是一种自动化程序,用于通过互联网抓取网页数据。随着互联网的不断发展和数据的爆炸式增长,网络爬虫越来越受欢迎。本文将介绍如何利用React和Python这两种流行的技术&#xff0c…

测定分子结构丨核磁共振(NMR)测试原理、制样要求以及常见问题深度解密!...

✨【元素魔方学术俱乐部】✨ 👩‍🏫👨‍🏫我们创建了一个学术交流群 给全国各地以及各种研究方向的硕博 和老师们提供一个交流的平台📚🧪 感兴趣的话欢迎加入 📲本公众号中回复“社群” 会自动发…

六、资产安全—信息分级资产管理与隐私保护练习题(CISSP)

六、资产安全—信息分级资产管理与隐私保护(CISSP): 六、资产安全—信息分级资产管理与隐私保护(C

【知识学习】阐述Unity3D中Profile和性能的概念及使用方法示例

在Unity3D中,"Profile"和"性能"是两个相关但不同的概念,它们在游戏开发中扮演着重要的角色。 Profile(配置文件) "Profile"在Unity中通常指的是一种配置文件,它包含了一系列的设置和参…

在线AI聊天对话机器人,答你所问!

随着AI人工智能技术的不断进步,AI聊天对话机器人已经成为我们日常生活中常用的工具。这些智能助手不仅能够提供信息查询、生活娱乐、学习辅导等服务,还能通过自然语言处理和机器学习技术理解用户的需求,提供个性化的回答和建议。下面小编就和…

多功能引流必备神器!评论区关键词采集!斗音平台引流

大家好我今天带来的这款软件,就像是抖音引流界的“多功能引流神器”,功能全面到让你眼花缭乱,而且操作简便到连你的宠物金鱼都能学会! 下面开看看都有哪些功能​: 高级截流拓客功能:想象一下,你…

【redis】redis RDB

1、概述 1.1定义 RDB (Redis Database) 是 Redis 的默认持久化机制,它能够在指定的时间间隔内将内存中的数据集快照写入磁盘。RDB 持久化产生的文件是一个经过压缩的二进制文件,通过该文件可以还原生成 RDB 文件时的数据库状态。 1.2特点 一次性全量备…

高性价比 ESP32 网络收音机:OLED 显示+编码器控制 (源码开源)

摘要: 本文将详细介绍如何使用 ESP32 开发板制作一个功能完备的网络收音机。我们将涵盖硬件选择、软件架构、网络连接、音频流解码、用户界面设计等方面,并提供完整的代码示例和详细的解释,帮助您轻松构建自己的网络收音机。 关键词: ESP32, 网络收音机…