【盲源分离】快速理解FastICA算法(附MATLAB绘图程序)

news2024/11/19 21:17:36

今天讲一个在信号分析领域较为常用的一个方法,即盲源分离算法中的FastICA。

我们先从一个经典的问题引入。

一、鸡尾酒舞会问题

想象一下,你身处一个熙熙攘攘的鸡尾酒舞会中。四周回荡着各种声音:笑声、交谈声、玻璃碰撞声,甚至还有远处柔和的爵士乐。这个场景就是所谓的“鸡尾酒舞会问题”的现实写照。

在这个舞会中,每个人都在与他人交流,他们的声音混合在一起,形成了一片难以分辨的嘈杂声。假如你是一个参与者,尽管周围噪音重重,你仍然能够集中注意力,听清楚你对话伙伴的每一个字。但是,对于房间里的录音设备来说,挑战就来了。它捕捉到的是一个复杂的声音混合体,所有的声音都叠加在一起,没有明显的分界线。

鸡尾酒舞会

现在,假设我们的目标是从录音设备捕获的这个声音混合体中,分离出每一个单独的声音源,无论是一个人的谈话声,还是那柔和的背景爵士乐。这就是盲源分离问题的核心,它试图恢复出原始的、独立的声音信号。盲源分离在这种情况下的难度在于,我们事先并不知道声音是如何混合在一起的,也不知道有多少个独立的声音源

这个问题之所以被称为“鸡尾酒舞会问题”,是因为它非常形象地描绘了在一个充满杂音的环境中,如何分辨和关注单一声音源的挑战。正如在一个真实的鸡尾酒舞会上,尽管周围噪声四起,人们还是能够聚焦于某个特定的对话或声音,盲源分离算法试图模拟这种人类的听觉选择能力,从一团混乱中恢复出清晰的、独立的声音信号。

二、类似于“鸡尾酒舞会”的研究问题

2.1 故障诊断中的多个传感器采样

在工业生产和设备维护中,故障诊断是确保生产安全和提高效率的重要环节。设备上安装有多个传感器,用于实时监控机械的多通道震动参数。这些传感器收集的数据往往是多种故障信号和正常运行信号的混合体。通过应用盲源分离技术,我们可以从这些混合的传感器数据中分离出代表特定故障特征的信号,从而准确地诊断出设备的具体问题。

2.2 语音信号分离

在多人通话、会议记录或在嘈杂环境中的语音识别场景中,语音信号分离技术尤为重要。这些场景中,我们需要从包含多个说话者声音的混合音频信号中分离出每个个体的语音。这种技术的挑战在于,说话者的语音信号可能相互重叠,并且背景噪音的存在进一步增加了分离的难度。利用盲源分离等技术,可以有效地从混合信号中恢复出清晰的单一说话者语音,这对于提高语音识别的准确率、实现高质量的通话记录以及增强听力辅助设备的性能等都至关重要。

三、盲源分离常用工具之FastICA

了解FastICA算法的本质和流程,我们需要深入探讨其数学原理和实现细节。FastICA算法是基于非高斯性最大化原理的独立成分分析方法,旨在从多维观测数据中提取出统计独立的信号源。下面是FastICA算法的详细步骤和相关解释[1]:

变量含义:
x :表示观测信号。在FastICA的框架下, x 是多维观测数据,可以理解为包含多个混合信号的向量。例如,在声音处理的场景中,如果有多个麦克风同时记录多人对话,每个麦克风接收到的声音信号可以组成一个观测向量 x 。
w :表示权重向量。在寻找最大非高斯方向的步骤中, w 用于投影观测数据 x 以提取独立成分。权重向量 w 的方向决定了数据投影的方向,其目的是找到一个方向,使得在这个方向上投影的数据的非高斯性最大。
s :表示独立成分。这是FastICA算法的输出,代表从观测数据 x 中提取出的统计独立的信号。在理想情况下,每个独立成分 s 对应于原始数据源中的一个单独成分,且这些成分之间统计独立。
在FastICA算法的迭代过程中,通过调整权重向量 w 来最大化观测数据 x 在某个方向上投影的非高斯性。当找到最优的 w 后,使用它来计算独立成分  \mathbf{s} = \mathbf{w}^T\mathbf{x}'' ,这里的 x″ 是经过预处理(中心化和白化)后的观测数据。这个过程可以提取出原始混合信号中的独立成分,进而实现信号的分离和特征提取。

步骤 1: 中心化

  • 操作: 对每个观测向量 x 计算均值 μ ,然后对所有观测向量进行中心化处理,即 x′=x−μ 。这一步骤确保数据的均值为零,为后续的白化和独立成分提取准备数据。

步骤 2: 白化

  • 目的: 白化的目的是将输入数据转换为新的数据集,新数据集中的变量相互独立且具有相同的方差。这是通过消除数据的协方差来实现的,从而简化了后续的独立成分提取过程。
  • 操作:
  1. 计算中心化后数据的协方差矩阵C=E\left[ x'x'^{T} \right]
  2. 对协方差矩阵进行特征值分解C=EDE^{T},其中 D 是特征值对角矩阵, E 是对应的特征向量矩阵。
  3. 使用特征值和特征向量对数据进行变换,得到白化数据。

步骤 3: 寻找最大非高斯方向

  • 原理: FastICA的核心在于利用非高斯性最大化原理来提取独立成分。非高斯性是通过非高斯性度量(如峰度或熵的近似)来量化的。在所有具有相同方差的分布中,高斯分布具有最小的非高斯性(即,最大的熵)。
  • 操作:
  1. 初始化: 选择一个随机的单位向量 w 作为权重向量的初始值。
  2. 固定点迭代更新: 对权重向量 w 应用以下更新规则,直到收敛:其中, g(⋅) 是非线性函数,用于捕捉非高斯性, g′(⋅) 是其导数。更新后,需要对 w+ 进行归一化。
  3. 正交化: 如果提取多个独立成分,需要对新的权重向量进行正交化处理,以确保它们相互独立。

步骤 4: 计算独立成分

  • 操作: 使用最终得到的权重向量 w 将白化后的数据投影到独立成分上,即\mathbf{s} = \mathbf{w}^T\mathbf{x}'' 。

步骤 5: 重复对其他成分的提取

  • 操作: 重复步骤 3 和步骤 4 来提取更多的独立成分,每次提取时都要确保新的权重向量与之前提取的独立成分正交(或独立)。

四、FastICA的几个重要问题

1.所谓的“非高斯性”指的是什么?

高斯性信号指的是其概率分布遵循高斯分布(正态分布)的信号,而白噪声就是高斯性信号的一种。

许多实际应用中的信号(如语音、图像和生物医学信号)自然地呈现非高斯分布。利用这一特点,可以将混合信号分离为其独立源信号,这是ICA的主要目标之一。

非高斯性可以作为随机变量独立性的一种度量。在ICA中,这意味着通过寻找最大化非高斯性的投影,可以帮助识别出数据中的独立成分。非高斯性可以通过多种方式量化,其中包括:

  • 峰度(Kurtosis):峰度是衡量概率分布尖锐程度的统计量。对于高斯分布,峰度为3。峰度大于3的分布称为“超高斯”,表现为尖峰和厚尾;峰度小于3的分布称为“亚高斯”,表现为平坦的峰顶。
  • 熵(Entropy)或负熵(Negentropy):熵是度量随机变量不确定性的统计量。相比高斯分布,非高斯分布的熵较低,因此负熵可以作为非高斯性的另一种度量。

2.非线性函数g(⋅)的作用?

在FastICA算法中,非线性函数g(⋅),常被称为G函数,起着至关重要的作用。它是实现非高斯性最大化的核心,直接影响到算法能够如何以及多么有效地提取出独立成分。

通过选择不同的G函数,FastICA可以适应不同分布类型的源信号。

  • 对于超高斯(具有厚尾分布)的信号,通常使用 g(u) = \tanh(a \cdot u)作为G函数;
  • 对于亚高斯(具有尖峰分布)的信号,可以选择 g(u) = u^3
  • 使用 g(u) = u \exp\left(-\frac{a^2 u^2}{2}\right)函数特别适用于那些在零附近有尖峰而在尾部较平坦的分布,因为它通过指数项强化了信号中心部分的贡献,而抑制了远离中心的部分。

这种灵活性允许FastICA处理各种不同的信号类型。、

不图的g(u)曲线图对比

3.关于输出向量排列顺序的不确定性

FastICA算法在提取独立成分时存在一个显著特征,即输出向量(独立成分)的排列顺序具有不确定性。这意味着,当你对同一数据集运行FastICA算法多次时,即使算法每次都成功地分离出了独立成分,这些成分的排列顺序却可能在每次运行之间有所不同。

输出向量排列顺序的不确定性通常不会影响到FastICA算法的有效性和实用性,因为独立成分的物理或统计意义并不依赖于它们的排列顺序。在实际应用中,更关注的是如何准确地识别和解释这些成分,而不是它们的相对位置。

4.关于输出信号幅度的不确定性

FastICA算法在提取独立成分时,除了输出向量排列顺序的不确定性外,还存在输出信号幅度(即独立成分的幅度或标度)的不确定性。这种不确定性源于独立成分分析(ICA)本身的数学性质和FastICA算法的工作原理。下面详细解释这一现象的原因及其对实际应用的影响。

输出信号幅度的不确定性意味着,虽然FastICA能够有效地分离出独立成分,但这些成分的幅度是相对的,而非绝对的。在实际应用中,比较不同数据集的相同独立成分时,不能直接比较它们的幅度。

五、案例演示

下面我们通过案例来演示FastICA的用途及特性。

首先通过下边的代码生成正弦、方波、锯齿波、白噪声,然后将他们混合成四组信号。

%% 该程序用于生成仿真信号,并将混合后的信号保存为data.mat文件
% 定义信号长度和采样频率
Fs = 1000; % 采样频率1000Hz
t = 0:1/Fs:1-1/Fs; % 信号总时长为1秒

% 生成测试信号
s1 = sin(2*pi*5*t); % 5Hz的正弦波
s2 = square(2*pi*12*t); % 5Hz的方波
s3 = sawtooth(2*pi*23*t); % 5Hz的锯齿波
s4 = 0.5*randn(size(t)); % 白噪声,振幅缩小一半

% 将信号堆叠成矩阵,每行一个信号
S = [s1; s2; s3; s4];
% 绘制混合信号X的子图
figure('Color','w'); % 创建新图形窗口
for i = 1:size(S, 1)
    subplot(size(S, 1), 1, i); % 为每个混合信号指定子图位置
    plot(t, S(i, :)); % 绘制每个混合信号
    title(['信号 ' num2str(i)]);
    xlabel('时间 (秒)');
    ylabel('信号强度');
end
% 添加总标题
sgtitle('未混合信号');

% 生成混合矩阵A,这里使用随机矩阵
A = rand(4,4);

% 混合信号
X = A*S;
% 绘制混合信号X的子图
figure('Color','w'); % 创建新图形窗口
for i = 1:size(X, 1)
    subplot(size(X, 1), 1, i); % 为每个混合信号指定子图位置
    plot(t, X(i, :)); % 绘制每个混合信号
    title(['混合信号 ' num2str(i)]);
    xlabel('时间 (秒)');
    ylabel('信号强度');
end
% 添加总标题
sgtitle('混合后信号');
save data.mat X

注意未混合信号的幅值都为1。

下边我们进行FastICA分解,网上可以找到FastICA的工具箱,笔者按照本专栏的惯例对该分解算法进行了傻瓜化的封装,只需要下边三行代码即可:

numOfIC = 0;  % 需要提取的独立成分数目,如果不指定数目,则输入0
g = 'pow3';   % 使用的非线性函数类型,可选'pow3', 'tanh', 'gauss', 'skew'
[icasig, A, W] = pFastICA(X, numOfIC, g);

可以绘制出以下图像:

此时信号波形已经完美地还原出来,但是需要注意,幅值已经不是原来的幅值了。

现在把同样的程序再运行一遍:

从两次结果对比中可以看出,输出向量排列顺序的不确定性和幅值都是存在不确定性的。

有些同学可能会想对独立成分的频谱进行分析,对此我也封装了绘制各个分量频谱图的函数,像这样调用:

numOfIC = 0;  % 需要提取的独立成分数目,如果不指定数目,则输入0
g = 'pow3';   % 使用的非线性函数类型,可选'pow3', 'tanh', 'gauss'
fs = 1000; %采样频率
[icasig, A, W] = pFastICAandFFT(X, numOfIC, g,fs);

可以得到如下图像:

对于上述两个封装函数,我留出了2个常用的参数。

其一是需要提取的独立成分数目numOfIC,如果不指定数目,则输入0,此时程序会自动判断独立成分数量;也可以指定数目。在上边例子中,我们知道信号由4个独立分量组成,但是如果强制将numOfIC设置为2或者6,会有怎样的结果呢?

我们可以看一下:

numOfIC设置为2时的结果

numOfIC设置为2时,分解结果为其中的两个独立分量。

numOfIC设置为2时的结果

numOfIC设置为6时,分解结果为4个独立分量,并不会额外多得到两个分量。

六、FastICA的MATLAB代码实现

其实在上边的案例里已经连带讲到了MATLAB实现,其中我封装了两个绘图函数,其介绍如下:

使用FastICA算法分解混合信号并画图的函数:

function [icasig, A, W] = pFastICA(mixedsig, numOfIC, g)
% pFastICA 使用FastICA算法分解混合信号并画图的代码
% 输入:
% mixedsig - 混合信号矩阵,每行代表一个观测值,每列代表一个观测点
% numOfIC - 需要提取的独立成分数目,如果不指定数目,则输入0
% g - 使用的非线性函数类型,可选'pow3', 'tanh', 'gauss'
%                       Value of 'g':      Nonlinearity used:
%                       'pow3' (default)   g(u)=u^3
%                       'tanh'             g(u)=tanh(a1*u)
%                       'gauss             g(u)=u*exp(-a2*u^2/2)
%
% 输出:
% icasig - 分解后的独立成分信号矩阵
% A - 混合矩阵
% W - 解混矩阵

使用FastICA算法分解混合信号并画图及其频谱的函数:

function [icasig, A, W] = pFastICAandFFT(mixedsig, numOfIC, g, fs)
% pFastICAandFFT 使用FastICA算法分解混合信号并画图及其频谱的代码
% 输入:
% mixedsig - 混合信号矩阵,每行代表一个观测值,每列代表一个观测点
% numOfIC - 需要提取的独立成分数目,如果不指定数目,则输入0
% g - 使用的非线性函数类型,可选'pow3', 'tanh', 'gauss'
%                       Value of 'g':      Nonlinearity used:
%                       'pow3' (default)   g(u)=u^3
%                       'tanh'             g(u)=tanh(a1*u)
%                       'gauss             g(u)=u*exp(-a2*u^2/2)
%
% fs - 采样频率

% 输出:
% icasig - 分解后的独立成分信号矩阵
% A - 混合矩阵
% W - 解混矩阵

上述函数不仅可以画出分解图像、频谱图像,也可以导出分解结果和两个矩阵。

其输出变量的计算关系为:

icasig=W\cdot X

X=A\cdot icasig

上式中的X就是混合矩阵,也就是函数中的mixedsig变量。

获取代码

上边的测试代码和封装函数,包括工具箱都可以在下边链接,编程不易,感谢支持~

FastICA盲源分离 - 工具箱文档 | 工具箱文档

参考

  1. ^基于改进的 FastICA 盲源分离研究

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1475594.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

swagger-ui.html报错404,解决办法

swagger-ui.html报错404,解决办法!现在后端开发项目中,为了节省时间,使用swagger插件,可以方便的快捷生成接口文档。但是如果你在请求前端页面路径比如:http://127.0.0.1:7777/swagger-ui.html。找不到。那是因为你的配…

C语言-数据结构-顺序表

🌈个人主页: 会编辑的果子君 💫个人格言:“成为自己未来的主人~” 目录 数据结构相关概念 顺序表 顺序表的概念和结构 线性表 顺序表分类 顺序表和数组的区别 顺序表分类 静态顺序表 动态顺序表 头插和尾插 尾插 数据结构相关概念 数据结构…

统计分析笔记3

文章目录 统计检验选择正确的统计检验统计检验是做什么的?何时进行统计检验选择参数化测试:回归、比较或相关性选择非参数检验 假设检验的假设条件skewness什么是零偏度right skewleft skew计算skewnesswhat to do if your data is skewed kurtosis怎么计…

《大模型时代-ChatGPT开启通用人工智能浪潮》精华摘抄

原书很长,有19.3w字,本文尝试浓缩一下其中的精华。 知识点 GPT相关 谷歌发布LaMDA、BERT和PaLM-E,PaLM 2 Facebook的母公司Meta推出LLaMA,并在博客上免费公开LLM:OPT-175B。 在GPT中,P代表经过预训练(…

C++:类与对象(1)

创作不易,谢谢支持! 一、面向过程和面向对象 1、C语言是面向过程的,关注的是过程,分析出求解问题的步骤,通过函数调用逐步解决问题。 如我们要实现洗衣服: 2、而C是基于面向对象的,关注的是…

跨境电商与支付介绍

1、跨境电商定义和分类; 2、国际贸易清结算; 3、跨境支付; 1、跨境电商定义和分类 跨境电商业务简单说就是指不同国家地域的主体通过电子商务进行交易的一种业务模式。同传统的电商不同,交易双方属于不同的国家。因此&#xff0…

积累:使用QPushButton模拟开关按键

1. 效果图 2. 源码实现 2.1 设置 QPushButton 默认样式 QPushButton{border:none;border-image: url(:/image/close.png); }2.2 主要实现源码 void MainWindow::on_switch_btn_clicked() {if(m_switchisopen){ui->switch_btn->setStyleSheet("QPushButton{\border…

可观测性在威胁检测和取证日志分析中的作用

在网络中,威胁是指可能影响其平稳运行的恶意元素,因此,对于任何希望避免任何财政损失或生产力下降机会的组织来说,威胁检测都是必要的。为了先发制人地抵御来自不同来源的任何此类攻击,需要有效的威胁检测情报。 威胁…

单片机蓝桥杯实训(一)—— 初步了解赛点(省赛)资源包

本篇文章是我在准备单片机蓝桥杯赛事中的第一篇文章,旨在记录初步了解该赛事省赛的赛点资源包,以便更好的提前准备和训练相关的模块代码。文章末尾附有资源包的链接。 一、赛点资源包 赛点资源包所提供的资源如下: 二、赛点资源包解读 这里…

Android+uniapp微信小程序的高校二手商品交易系统卖家vue+springboot/php/nodejs-python

高校的二手商品市场绝对是一个大市场,每年都有毕业生要毕业,每年都有新生来报到,二手商品网站为广大用户提供了一个很好的供需平台,人们可以将自己不用的东西放在网上,也可在网上找到自己需要的东西,物美价…

2024.2.28每日一题

LeetCode 使二叉树所有路径值相等的最小代价 2673. 使二叉树所有路径值相等的最小代价 - 力扣(LeetCode) 题目描述 给你一个整数 n 表示一棵 满二叉树 里面节点的数目,节点编号从 1 到 n 。根节点编号为 1 ,树中每个非叶子节点…

RunnerGo UI自动化测试脚本如何配置

RunnerGo提供从API管理到API性能再到可视化的API自动化、UI自动化测试功能模块,覆盖了整个产品测试周期。 RunnerGo UI自动化基于Selenium浏览器自动化方案构建,内嵌高度可复用的测试脚本,测试团队无需复杂的代码编写即可开展低代码的自动化…

智能工业革新,自研工业操作系统携手AI解决行业痛点

一台银色的机械臂流畅地伸展出“手臂”,精准地从料框中抓取目标工件,并将其安装在指定位置进行固定。整个过程中,机械臂的动作顺滑,无一丝卡顿。这可不是什么科幻电影中的场景,而是真实发生在一家电力装备企业智能生产…

二次供水物联网:HiWoo Cloud助力城市水务管理升级

随着城市化的快速推进,二次供水系统作为城市基础设施的重要组成部分,其稳定运行和高效管理显得至关重要。然而,传统的二次供水管理方式在应对复杂多变的城市供水需求时,显得力不从心。为了破解这一难题,HiWoo Cloud平台…

MATLAB中的makeweight函数

W makeweight(dcgain,[freq,mag],hfgain) W makeweight(dcgain,[freq,mag],hfgain,Ts) W makeweight(dcgain,[freq,mag],hfgain,Ts,N) W makeweight(dcgain,wc,hfgain,___) W makeweight(dcgain,wc,hfgain,___)表示增益交叉频率wc。该语法相当于将…

高通 AI Hub 上手指南

文章介绍 2月26日,高通在2024年世界移动通信大会(MWC2024)上发布高通AI Hub, AI Hub 简化了AI 模型部署到边缘设备的过程。可以利用AI-hub云端托管 Qualcomm 设备上,在几分钟内完成模型的优化、验证和部署。本文以Pyto…

osi模型,tcp/ip模型(名字由来+各层介绍+中间设备介绍)

目录 网络协议如何分层 引入 osi模型 tcp/ip模型 引入 命名由来 介绍 物理层 数据链路层 网络层 传输层 应用层 中间设备 网络协议如何分层 引入 我们已经知道了网络协议是层状结构,接下来就来了解了解下网络协议如何分层 常见的网络协议分层模型是OSI模型 和 …

JavaEE:多线程(3):案例代码

多线程基础知识要点 案例一:单例模式 是一种设计模式 软件设计需要框架,这是硬性的规定;设计模式是软性的规定。遵循好设计模式,代码的下限就被兜住了 单例 单个实例(对象) 某个类在一个进程中只应该创…

【mysql】1812 - Tablespace is missing for table `job`.`xxl_job_log`.

打开表提示: 1812 - Tablespace is missing for table job.xxl_job_log. 1812-表“job”缺少表空间xxl_job_log。 尝试删除表重建表 DROP TABLE IF EXISTS job.xxl_job_log; 提示: 1051 - Unknown table job.xxl_job_log 1051-未知表“job.xxl_job_lo…

基于springboot实现二次元商品购物系统项目【项目源码+论文说明】

基于springboot实现二次元商品购物系统演示 摘要 时代的变化速度实在超出人类的所料,21世纪,计算机已经发展到各行各业,各个地区,它的载体媒介-计算机,大众称之为的电脑,是一种特高速的科学仪器&#xff0…