【机器学习】必会降维算法之:独立成分分析(ICA)

news2024/10/3 18:24:56

独立成分分析(ICA)

  • 1、引言
  • 2、独立成分分析(ICA)
    • 2.0 引言
    • 2.1 定义
    • 2.2 应用场景
    • 2.3 核心原理
    • 2.4 实现方式
    • 2.5 算法公式
    • 2.6 代码示例
  • 3、总结

1、引言

小屌丝:鱼哥,最近胡塞武装很哇塞啊。
小鱼:你什么时候开始关注军事了?
小屌丝:这…还用关注吗? 都上新闻了。
小鱼:嗯,那你知道胡塞武装为什么这么厉害吗?
小屌丝:额… 当然是光脚不怕穿鞋的。
小鱼:… 你可真是…
小屌丝:真是啥?
小鱼:一个字,自己体会
在这里插入图片描述

小屌丝:网友都这么说啊,我这是引用而已。
小鱼:… 看来,你还有很长一段距离要走啊。
小屌丝:那你倒是说说啊,
小鱼:我不说,我不说,我写我的博客了
小屌丝:唉~~ 看来你也不是很了解啊
小鱼:去…
小屌丝:说说嘛,
小鱼:别撒娇, 你特喵的 是个爷们。
小屌丝:你不说,我就这样。

在这里插入图片描述

2、独立成分分析(ICA)

2.0 引言

在机器学习和数据分析领域,降维是一项至关重要的技术。

通过降维,我们可以简化数据的复杂性,去除噪声,并提高模型的性能。

其中,独立成分分析(Independent Component Analysis, ICA)作为一种高级的降维算法,旨在从观测数据中分离出独立的源信号,广泛应用于信号处理、图像处理及金融数据分析等领域。

接下来,就跟着小鱼一起,详细探究独立成分分析(ICA)

2.1 定义

独立成分分析(ICA)是一种用于寻找潜在变量(或称为源信号)的统计和计算方法,这些潜在变量通过线性混合产生观察到的数据。

与主成分分析(PCA)不同,ICA 强调信号的统计独立性,而不仅仅是去相关性。

具体来说,ICA 希望从混合信号中提取出尽可能独立且非高斯的信号。

2.2 应用场景

ICA 在多个领域有广泛的应用,以下是一些典型的应用场景:

  • 信号处理:例如,从混杂的音频信号中分离出单独的声音源,这在「鸡尾酒会问题」中尤为经典。
  • 图像处理:用于提取图像的基本构建块,应用于人脸识别和特征提取。
  • 生物医学信号处理:如从脑电图(EEG)中分离独立的脑信号及去除噪声。
  • 金融:分析金融时间序列,分离出独立的市场因素,为投资决策提供支持。

2.3 核心原理

ICA 的核心思想是将观测到的多维信号表示为多个独立源信号的线性组合。

假设我们有观测信号 ( X ) ( \mathbf{X} ) (X),并且这些信号是未知的独立信号 ( S ) ( \mathbf{S} ) (S) 的线性组合:

[ X = A S ] [ \mathbf{X} = \mathbf{A} \mathbf{S} ] [X=AS]

其中, ( A ) ( \mathbf{A} ) (A) 是一个未知的混合矩阵,目标是通过对 ( X ) (\mathbf{X}) (X)进行操作,分离出独立的信号 ( S ) (\mathbf{S}) (S)

2.4 实现方式

ICA 有多种实现方式,最常见的算法是 FastICA。

FastICA 通过最大化信号的非高斯性来估计独立成分,使用定量标准如 negentropy(负熵)来进行优化。

2.5 算法公式

FastICA 的迭代计算方法可以通过以下公式表示:

  • 中心化:移除数据的均值,使数据零均值化。
  • 白化:将观测信号进行线性变换,使其成为白噪声(各维度独立且方差为1)。
  • 迭代求解独立成分:使用如负熵等准则进行非高斯性最大化。

具体的迭代公式如下: [ w + = E [ X g ( w T X ) ] − E [ g ′ ( w T X ) ] w ] [ \mathbf{w}_{+} = \mathbb{E}[\mathbf{X}g(\mathbf{w}^T \mathbf{X})] - \mathbb{E}[g'(\mathbf{w}^T \mathbf{X})] \mathbf{w} ] [w+=E[Xg(wTX)]E[g(wTX)]w]

其中,

  • ( g ) ( g ) (g) 通常选择为非线性函数,如 ( g ( u ) = tanh ⁡ ( u ) ) ( g(u) = \tanh(u) ) (g(u)=tanh(u))
  • ( w ) ( \mathbf{w} ) (w) 是权重向量,通过迭代求解得到。

2.6 代码示例

# -*- coding:utf-8 -*-
# @Time   : 2024-05-30
# @Author : Carl_DJ

import numpy as np
import matplotlib.pyplot as plt
from sklearn.decomposition import FastICA

# 生成随机信号
np.random.seed(0)
n_samples = 2000
time = np.linspace(0, 8, n_samples)

s1 = np.sin(2 * time)  # 正弦波
s2 = np.sign(np.sin(3 * time))  # 方波
s3 = np.cumsum(np.random.randn(n_samples))  # 随机步进信号

S = np.c_[s1, s2, s3]
S += 0.2 * np.random.normal(size=S.shape)  # 加入噪声
S /= S.std(axis=0)  # 标准化

# 混合信号
A = np.array([[1, 1, 1], [0.5, 2, 1.0], [1.5, 1.0, 2.0]])  # 混合矩阵
X = np.dot(S, A.T)  # 混合后的信号

# 使用FastICA还原信号
ica = FastICA(n_components=3)
S_ = ica.fit_transform(X)  # 重建信号
A_ = ica.mixing_  # 估计的混合矩阵

# 我们可以看到A_的乘法近似为单位矩阵,表明信号已经被很好地分离
assert np.allclose(X, np.dot(S_, A_.T) + ica.mean_)

# 绘图
plt.figure()

models = [X, S, S_]
names = ['混合信号 (观察信号)',
         '源信号 (实际信号)',
         '重建信号 (ICA)']
colors = ['red', 'steelblue', 'orange']

for i, (model, name) in enumerate(zip(models, names), 1):
    plt.subplot(3, 1, i)
    plt.title(name)
    for sig, color in zip(model.T, colors):
        plt.plot(sig, color=color)

plt.tight_layout()
plt.show()



解析

  • 首先、生成了三种不同类型的信号(正弦波、方波和随机步进信号),并将它们混合为观测信号 ( X ) ( X ) (X)
  • 其次、使用FastICA从观测信号 ( X ) ( X ) (X) 中分离出独立成分 ( S_ )。
  • 最后、通过绘图,比较混合信号、实际信号和 ICA 重建后的信号。

在这里插入图片描述

3、总结

独立成分分析(ICA)是一种强大的降维和信号分离方法,广泛应用于各个领域。

通过最大化信号的非高斯性,ICA 能够有效地分离出互相独立的源信号,从而在复杂的混合信号中提取出有用的信息。

我是小鱼

  • CSDN 博客专家
  • 阿里云 专家博主
  • 51CTO博客专家
  • 企业认证金牌面试官
  • 多个名企认证&特邀讲师等
  • 名企签约职场面试培训、职场规划师
  • 多个国内主流技术社区的认证专家博主
  • 多款主流产品(阿里云等)评测一等奖获得者

关注小鱼,学习【机器学习】&【深度学习】领域的知识。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1793479.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【面试八股总结】死锁:产生条件、预防死锁、处理死锁、避免死锁

一、什么是死锁? 死锁是指两个(或多个)线程互相等待对方数据的过程,死锁的产生导致程序卡死,不解锁程序将永远⽆法进⾏下 去 二、死锁产生条件 死锁只有同时满足以下四个条件才会发生:互斥条件&#xff1b…

基于飞腾 D2000 8 核+ 32G DDR+板载 6 千兆电口+ 4 千兆光口高性能网络安全主板

第一章、产品介绍 1.1 产品概述 XM-D2000GW是一款基于飞腾 D2000 8 核X100 桥片高性能网络安全主板,D2000 为飞腾首款支持 8 核桌面平 台处理器,支持双通道 DDR4-2666 内存,芯片内置国密 SM2/SM3/SM4/SM9 加速引擎,支持单精度、双…

oracle 打补丁遇到 check “CheckActiveFilesAndExecutables“ failed报错处理方法

该报错是因为打补丁的时候停止集群没有停止干净进程导致的 问题 处理方法 强制停止打补丁所在节点集群服务 查看grid和oracle相关进程是否停止干净,发现有未关闭的进程手动kill 处理完毕继续打补丁即可

终于搞懂了!原来vue3中template使用ref无需.value是因为这个

前言 众所周知&#xff0c;vue3的template中使用ref变量无需使用.value。还可以在事件处理器中进行赋值操作时&#xff0c;无需使用.value就可以直接修改ref变量的值&#xff0c;比如&#xff1a;<button click"msg Hello Vue3">change msg</button>。…

探索UWB模块的多功能应用——UWB技术赋能智慧生活

超宽带&#xff08;Ultra-Wideband, UWB&#xff09;技术&#xff0c;凭借其高精度、低功耗和强抗干扰能力&#xff0c;正在成为智能家居领域的一项关键技术。UWB模块的应用不仅提高了智能家居设备的性能&#xff0c;还为家庭安全、设备管理和用户体验带来了显著的改善。 UWB模…

【JS实战02】轮播图

一&#xff1a;HTML页面结构 1 整体外观 2 HTML结构以及CSS样式 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0">…

【微信小程序】配置

全局配置 window 节点常用配置&#xff1a; tabbar 在小程序中分为 顶部 tabbar 和 底部 tabbar。 tabbar 最少配置两个&#xff0c;最多配置五个。当渲染顶部 rabbar 时&#xff0c;不显示 icon&#xff0c;只显示文本。 tabbar 节点配置&#xff1a; 每个 tab 项的配置&…

String常用操作

String常用方法 构造字符串 常用的构造字符串有3种&#xff1a; 1.直接赋值String s "abcd"; 2.实例化调用构造方法String s new String("abcd"); 3.实例化传字符数组 char[] ch {a,b,c,d}; String s new String(ch);字符串比较 比较 比较的是两个…

odoo16 档案管理

档案管理&#xff0c;odoo15升级至odoo16完善 电子档案管理是指将传统纸质档案数字化&#xff0c;以便更加方便、快捷、安全地进行档案管理。电子档案管理系统可以对档案进行数字化、存储、检索、共享、传递和销毁等操作&#xff0c;从而提高了档案管理的效率和准确性&#xf…

剪画小程序:自媒体必备神器:【视频翻译】自动识别语言、翻译、配音,让外语视频秒变母语!

Hello&#xff0c;大家好呀&#xff01;我是不会画画的小画~ 今天给大家带来一款敲实用的视频翻译工具一一 小程序【剪画】 我们有很小伙伴在学习他国语言时&#xff0c;最大的障碍就是语言的问题了&#xff0c;想要 理解其中的内容&#xff0c;在这之前要下很大的功夫去掌握…

Python语法详解module3(组合数据类型列表、元组、字典、集合详细用法)

目录 一、列表列表的创建多维列表列表的访问和修改列表的添加和删除列表的遍历使用 for 循环遍历使用 while 循环遍历同时遍历索引和元素列表推导式 常用的列表函数len()sort()reverse()index()count()extend()clear() 二、元组创建元组访问元组元素元组的不可变性元组的优点元…

DP 和 HDMI 哪个比较好?它们的区别有哪些?

什么是 DP DisplayPort&#xff08;DP&#xff09;是一种数字显示接口标准&#xff0c;由视频电子标准协会&#xff08;VESA&#xff09;开发。DP 接口主要用于计算机连接显示器&#xff0c;但也被广泛应用于其他设备&#xff0c;如电视和投影仪。DP 支持高分辨率和高刷新率&a…

好书推荐-人工智能数学基础

本书以零基础讲解为宗旨&#xff0c;面向学习数据科学与人工智能的读者&#xff0c;通俗地讲解每一个知识点&#xff0c;旨在帮助读者快速打下数学基础。    全书分为 4 篇&#xff0c;共 17 章。其中第 1 篇为数学知识基础篇&#xff0c;主要讲述了高等数学基础、微积分、泰…

go的反射和断言

在go中对于一个变量&#xff0c;主要包含两个信息变量类型&#xff08;type&#xff09;和变量值&#xff08;value&#xff09; 可以通过reflect包在运行的时候动态获取变量信息&#xff0c;并能够进行操作 对于Type可以通过reflect.TypeOf()获取到变量的类型信息 reflect.Ty…

Java环境配置(超详细)

Java环境配置&#xff08;超详细&#xff09; 引言1、安装 JDK1.1、下载安装JDK1.2、配置环境变量&#xff1a;JAVA_HOME1.3、将JAVA_HOME添加到Path中 2、安装 Maven2.1、下载安装Maven2.2、配置maven的环境变量: M2_HOME2.3、将Maven变量添加到Path中 引言 Java开发环境的配…

气膜羽毛球馆如何提升运动体验—轻空间

随着人们对健康和运动的关注度日益增加&#xff0c;羽毛球作为一项受欢迎的运动&#xff0c;得到了越来越多人的喜爱。而气膜羽毛球馆&#xff0c;以其独特的优势&#xff0c;正在改变传统羽毛球馆的运动体验。那么&#xff0c;气膜羽毛球馆是如何提升运动体验的呢&#xff1f;…

C++第二十四弹---从零开始模拟STL中的list(上)

✨个人主页&#xff1a; 熬夜学编程的小林 &#x1f497;系列专栏&#xff1a; 【C语言详解】 【数据结构详解】【C详解】 目录 1、基本结构 2、基本函数实现 2.1、默认构造函数 2.2、尾插数据 3、迭代器的封装 3.1、迭代器的基本结构 3.2、迭代器重载函数的实现 4、迭…

代码随想录——二叉搜索树中的插入操作(Leetcode701)

题目链接 递归 /*** Definition for a binary tree node.* public class TreeNode {* int val;* TreeNode left;* TreeNode right;* TreeNode() {}* TreeNode(int val) { this.val val; }* TreeNode(int val, TreeNode left, TreeNode right) {* …

git: 批量删除分支

环境&#xff1a; window11git version 2.42.0git-bash.exe window环境下&#xff1a; 1. 批量删除本地 git branch |grep xxx |xargs git branch -D比如&#xff1a; 想批量删除本地含有 release 关键字的分支&#xff1a; 2. 批量删除远程 git branch -r | grep xxxx | …

华硕NUC 14 Pro+ :科技与艺术相得益彰

什么样的迷你主机可以称之为“艺术品”&#xff1f;让我们一起认识NUC 14 Pro&#xff0c;看科技与艺术可以交汇出怎样的独特韵味&#xff1f; 科技与美学的邂逅 华硕NUC 14 Pro不仅是一台性能强劲的电脑主机&#xff0c;更像是一件可以在桌面“展出”的艺术品。精致小巧的体积…