【脑电信号处理与特征提取】P7-涂毅恒:运用机器学习技术和脑电进行大脑解码

news2024/12/23 23:22:49

运用机器学习技术和脑电进行大脑解码

科学研究中的大脑解码

比如2019年在Nature上一篇文章,来自UCSF的Chang院士的课题组,利用大脑活动解码语言,帮助一些患者恢复语言功能。
在这里插入图片描述

大脑解码的重要步骤

大脑解码最重要的两步就是信号采集信号解码 ,信号采集就是所说的脑电技术,信号解码就是机器学习的方法。
在这里插入图片描述

机器学习-基本流程

在这里插入图片描述

机器学习-数据采集

  • 数据采集:确保训练和测试数据集充足且具有代表性
    • 充足的数据:确保存在足够多的数据来训练分类器
    • 有代表的数据:确保有意义的变化都可以从训练和测试数据采样得到

机器数据-预处理

  • 预处理:对获取的数据进行调整,金尽可能消除各种来源的噪声
    • 滤波(去除噪声):
      • 有限冲激响应FIR/无限冲激响应IIR滤波
      • 自适应滤波
      • 空间滤波(独立成分分析)等
    • 剔除异常值(outlier removal)
    • 归一化(normalization)

预处理-剔除异常值

异常值(outlier):数值上与其他数据距离过于远的数据,它将极大地影响正确分类器的训练。
比如:被EOG干扰的EEG试次可能是异常值(在幅度上差别极大)。
在这里插入图片描述
典型方法:设置一个阈值,如果样本值大于阈值,则可以将该样本视为异常值。
例如:3标准差原则,剔除超过样本均值3个标准差的样本值(仅局限于正态或近似正态分布的样本)。
在这里插入图片描述

预处理-归一化

  • 归一化(特征缩放):由于原始数据的取值范围变化很大,如果不进行归一化,某些分类器无法正常工作。
  • 例如,大多数分类器会计算两个样本之间的距离。如果其中一个特征的范围很广,则计算的距离将主要受该特定特征的影响。因此需要对所有特征的范围进行归一化,使每个特征对最终距离的贡献成比例

归一化的方法有两种:标准化(standardization)再缩放(re-scaling)
在这里插入图片描述
还有一种情况可采用对数变换:当特征值存在较大差异的时候,使用对数变换来减小特征值的动态范围。
在这里插入图片描述

机器学习-特征提取和选择

当对正眼闭眼状态的EEG进行分类时

  • 重要特征为枕区的 α \alpha α频段能量
  • 冗余特征可能为枕区不同通道的 α \alpha α频段能量
  • 无用特征可能为其它频段其它脑区的EEG能量

Q: 为什么要进行特征提取和选择?
A: 因为数据维数过高会面临无法找到重要特征和过拟合问题,所以需要选择有用的特征进行训练。这里用到的方法叫做降维。

在这里插入图片描述

降维

降维(dimension reduction):主要是由脑电研究中面临的“大数据”挑战所驱动的。

  • 降维的重要性
    少量但信息量大的特征可以显著减少
    • 分类算法的复杂度
    • 运行算法时对时间以及机器的需求
    • 过拟合出现的可能性
  • 特征提取和特征选择都是降维过程

无监督降维-主成分分析

  • 最常见的无监督降维方法为主成分分析(Principal Component Analysis,PCA)

  • PCA通常用于高维特征投影到底维空间中,从而有效地降低维数

  • 在数学上,PCA使用正交变换将相关变量的一组观测值转换为一组被称为主成分(Principal Components,PCs)的线性不相关变量。

  • 主成分分析将观测到的数据转换到一个新的坐标系中,这样对数据进行投影后得到的最大方差就会落在第一个坐标上(即主成分),第二大方差落在第二个坐标上,以此类推。
    在这里插入图片描述
    如何理解选择方差大的特征呢? 因为PCA的目的就是选择重要的特征,重要的特征应该能够区别不同样本,方差大意味着样本在这一个特征下的区分度大,所以我们选择方差大的特征作为主成分。

  • 主成分分析是一种强大的降维工具。

  • 如果一个主成分的方差很小,从数据中删除这个成分后,我们只损失了少量的信息。

  • 假设我们只保留L个主成分,那么新数据将只有L列,但却包含了原始数据中绝大多数的信息
    在这里插入图片描述
    算法如下:
    在这里插入图片描述

  • 主成分分析可应用于脑电分析,以降低以下域上的维数

    • 时间(相邻时间点信号幅度近似)
    • 频率(相邻频率点功率值相似)
    • 空间(相邻通道的脑电相似程度高)
  • 原因:脑电信号在这些域内包涵冗余特征

有监督降维

有监督的降维:利用类标签来确保高纬度数据可以被映射到底维空间,且不同的类可以在这个空间中被很好的区分。
在这里插入图片描述
在这里插入图片描述

机器学习-模型选择与训练

多数分类器为二分类器(输出两个类别),但也有一些分类器允许使用两个以上的类。
多分类:将样本分为L类,其中L>2。
通常来说,多分类是利用常用的二分类器通过不同的策略来实现的:

  • 一对多(One-vs.-Rest)
  • 一对一(One-vs.-One)

模型选择与训练-多分类

在这里插入图片描述
脑电分析中常用的分类器

  • 支持向量机
  • 贝叶斯决策
  • 决策树与随机森林
  • 聚类
  • 神经网络与深度学习

模型选择与训练-支持向量机

  • 支持向量机(Support Vector Machine,SVM)是一类有监督学习(supervised learning)方式对数据进行二元分类的广义线性分类器(generalized linear classifier),其决策边界是对学习样本求解的最大边距超平面
    在这里插入图片描述

模型选择与训练-贝叶斯决策

  • 贝叶斯决策(Bayesian Decision Theory)是概率框架下实施的基本方法。对于分类任务来说,在所有相关概念都已知的理想情形下,贝叶斯决策论考虑如何基于这些概念和误判损失选择最优的类别标记。
    在这里插入图片描述

模型选择与训练-决策树与随机森林

  • 决策树(Decision Tree)是一类常见的机器学习方法。顾名思义,决策树是基于书结构来进行决策的。树中每个节点表示某个对象,而每个分叉路径则代表的某个可能的属性值,而每个叶节点则对于从根节点到该叶节点所经历的路径所表示的对象的值。
    在这里插入图片描述

模型选择与训练-聚类

  • 聚类:将物理或抽象对象的集合分成由类似的对象组成的多个类的过程。由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异。
    在这里插入图片描述

模型选择与训练-神经网络与深度学习

在这里插入图片描述

机器学习-评估

利用训练数据完成模型选择和训练后,需要在测试数据进行广泛化性能评估
在这里插入图片描述
评估的方法之一是交叉验证
在这里插入图片描述
评估的性能度量指标
在这里插入图片描述
所以需要其它指标来进一步评估分类器性能
在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1425022.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【Linux】Daemon守护进程详解

创作不易&#xff0c;本篇文章如果帮助到了你&#xff0c;还请点赞 关注支持一下♡>&#x16966;<)!! 主页专栏有更多知识&#xff0c;如有疑问欢迎大家指正讨论&#xff0c;共同进步&#xff01; &#x1f525;Linux系列专栏&#xff1a;Linux基础 &#x1f525; 给大家…

JAVASE进阶:String常量池内存原理分析、字符串输入源码分析

&#x1f468;‍&#x1f393;作者简介&#xff1a;一位大四、研0学生&#xff0c;正在努力准备大四暑假的实习 &#x1f30c;上期文章&#xff1a;JAVASE进阶&#xff1a;内存原理剖析&#xff08;1&#xff09;——数组、方法、对象、this关键字的内存原理 &#x1f4da;订阅…

嵌入式人工智能/深度学习/神经网络导论

加我微信hezkz17进入嵌入式人工智能技术研究开发交流答疑群 1 嵌入式人工智能&#xff0c;嵌入式深度学习含义&#xff1f; &#xfffc; 嵌入式人工智能&#xff08;Embedded Artificial Intelligence&#xff09;是指将人工智能技术应用于嵌入式系统中&#xff0c;使其具备…

计算机网络_1.4 计算机网络的定义和分类

1.4 计算机网络的定义和分类 一、计算机网络的定义&#xff08;无唯一定义&#xff09;二、计算机网络的分类&#xff08;从不同角度分类&#xff09;1、交换方式2、使用者3、传输介质4、覆盖范围5、拓扑结构 笔记来源&#xff1a; B站 《深入浅出计算机网络》课程 一、计算机…

11张宝藏GIS开发思维导图,重点清晰,建议带走!

在GIS开发过程中&#xff0c;涉及大量的数据、地图、工具和技术。通过思维导图&#xff0c;我们可以将这些复杂的元素进行可视化&#xff0c;更好地理解和整理思路&#xff0c;提高开发效率。 同时思维导图利用了色彩、线条、关键词、图像等元素&#xff0c;可以加强记忆的可能…

Android平台如何实现RTSP转GB28181

为什么要做GB28181设备接入侧&#xff1f; 实际上&#xff0c;在做Android平台GB28181设备接入模块的时候&#xff0c;我们已经有了非常好的技术积累&#xff0c;比如RTMP推送、轻量级RTSP服务、一对一互动模块、业内几乎最好的RTMP|RTSP低延迟播放器。 Android平台GB28181接…

好书推荐丨保姆级Midjourney教程,这本写给大家看的设计书闭眼入!

文章目录 写在前面好书推荐Part.1Part.2Part.3 粉丝福利写在后面 写在前面 在AI绘画界&#xff0c;有每日经典一问&#xff1a;“你今天用Midjourney画了啥&#xff1f;”晒作品成为重头戏。 小红书上关于Midjourney出的图片点赞数惊人。 reddit上的恶搞幽默图片热度居高不下…

C#,幸运数字(Lucky Number)的算法与源代码

Lucky Number不是蔡依林的歌曲名字哦。 给你的NV朋友选一个幸运数字吧。 1 幸运数字是怎么产生的&#xff1f; 幸运数是整数的子集。与其进行大量理论研究&#xff0c;不如让我们来看看得出幸运数字的过程&#xff0c; 以整数集为例&#xff1a; 1,2,3,4,5,6,7,8,9,10,11,…

NAT 机制的工作流

NAT机制&#xff08;网络地址映射&#xff09;先把IP地址分成两个大类 1. 私网IP / 局域网IP 2. 公网IP / 广域网IP 要求公网的设备&#xff0c;对应的公网IP&#xff0c;都必须是唯一的&#xff0c;但是私网上/局域网上的设备&#xff0c;使用私网IP&#xff0c;只要保证局域网…

Linux 网络配置及基础服务

目录 一. 查看网络配置信息的相关命令 1.1 ifconfig 命令 作用 1&#xff1a; 作用 2&#xff1a; 拓展&#xff1a; 1.2 ip/ethtool命令 1.3 hostname命令 1.4 route 命令 1.5 netstat 命令 1.6 ss&#xff08;socket statistics&#xff09;命令 1.7 ping 命令 …

vscode 插件 Tailwind CSS IntelliSense 解决 class 提示问题

问题描述&#xff1a; 如下写js字符串是没有class智能提示的&#xff1a; const clsName bg-[#123456] text-[#654321] return <div className{clsName}></div>解决方案&#xff1a; 安装 clsx 依赖 pnpm i clsx设置 vscode 的 settings.json {"tailwin…

【C++】开源:Windows图形库EasyX配置与使用

&#x1f60f;★,:.☆(&#xffe3;▽&#xffe3;)/$:.★ &#x1f60f; 这篇文章主要介绍Windows图形库EasyX配置与使用。 无专精则不能成&#xff0c;无涉猎则不能通。——梁启超 欢迎来到我的博客&#xff0c;一起学习&#xff0c;共同进步。 喜欢的朋友可以关注一下&#…

RabbitMQ 死信队列应用

1. 概念 死信队列&#xff08;Dead Letter Queue&#xff09;是在消息队列系统中的一种特殊队列&#xff0c;用于存储无法被消费的消息。消息可能会因为多种原因变成“死信”&#xff0c;例如消息过期、消息被拒绝、消息队列长度超过限制等。当消息变成“死信”时&#xff0c;…

对付勒索病毒,复杂的往往无法落地

一道道复杂门墙防护安全&#xff0c; 还是一个精密的锁更安全&#xff1f; &#x1f447;&#x1f447;&#x1f447; 在网络数据安全问题频发的当下&#xff0c;除了常规的备份、灾备措施以外&#xff0c;企业是否有做好应对最坏情况的准备&#xff1f;一旦病毒绕过了一道道…

极限的运算法则【高数笔记】

【定理】 1. 无穷小量 * 有界 无穷小量 简单理解为&#xff1a;0 乘以任何数都等于 0 &#xff0c;因为常数 0 是无穷小量 2. 设 lim f&#xff08;x&#xff09; a , lim g (x) b 加减&#xff1a;lim[f(x) g(x) ] lim f(x) g(x) a b 乘&#xff1a;lim[f(x)…

[Visual Studio] vs 2022中如何创建空白的解决方案

在Visual Studio 2022中创建一个空白的解决方案非常简单。请按照以下步骤操作&#xff1a; 打开Visual Studio。 在启动页面上&#xff0c;选择“创建新的项目”。 在“创建新项目”的对话框中&#xff0c;搜索“空白”。 在中间搜索结果中&#xff0c;选择“空白解决方案”…

同时添加多个的远程桌面工具,Windows远程桌面设置多用户同时登录

Windows Server 版本上的 Windows 远程桌面服务 (RDS) 允许多个用户同时登录。 但是&#xff0c;在标准的Windows桌面版本&#xff08;例如Windows 10&#xff09;上&#xff0c;默认情况下&#xff0c;远程桌面是为单个用户一次登录而设计的。 这被称为“管理远程桌面”模式。…

蓝桥杯2024/1/31----第十届省赛题笔记

题目要求&#xff1a; 1、 基本要求 1.1 使用大赛组委会提供的国信长天单片机竞赛实训平台&#xff0c;完成本试题的程序设计 与调试。 1.2 选手在程序设计与调试过程中&#xff0c;可参考组委会提供的“资源数据包”。 1.3 请注意&#xff1a; 程序编写、调试完成后选手…

vmware读取坏掉的虚拟磁盘vmdk文件

vmware centos 7系统挂了&#xff0c;开不了机&#xff0c;重新安装ubuntu22系统&#xff0c;挂载centos7的vmdk文件。 1.找到坏掉的系统的vmdk文件 2.新系统添加硬盘 选择刚才旧系统的vmdk文件&#xff1a; 完成以后&#xff0c;看到多了一块硬盘&#xff1a; 3.读取新硬盘 &…

计算机毕业设计 | springboot 多功能商城 购物网站(附源码)

1&#xff0c; 概述 国家大力推进信息化建设的大背景下&#xff0c;城市网络基础设施和信息化应用水平得到了极大的提高和提高。特别是在经济发达的沿海地区&#xff0c;商业和服务业也比较发达&#xff0c;公众接受新事物的能力和消费水平也比较高。开展商贸流通产业的信息化…