Hum Brain Mapp:用于功能连接体指纹识别和认知状态解码的高精度机器学习技术

news2024/12/27 11:45:36

摘要

人脑是一个复杂的网络,由功能和解剖上相互连接的脑区组成。越来越多的研究表明,对脑网络的实证估计可能有助于发现疾病和认知状态的生物标志物。然而,实现这一目标的先决条件是脑网络还必须是个体的可靠标记。在这里,本研究利用人类连接组项目数据,考察了被试的大脑指纹和认知状态。本研究的方法在识别fMRI扫描被试和对先前未见过的被试的认知状态进行分类方面实现了高达99%的准确率。更广泛地说,本研究使用大量被试(865名)在不同认知状态(8种)下的fMRI功能连接数据,探索了五种不同机器学习技术在个体指纹识别和认知状态解码目标上的准确性和可靠性。此外,本研究还比较了16种不同的功能连接体(FC)矩阵构建流程,以表征FC生成的不同方面对个体和任务分类准确性的影响,并确定可能存在的混淆因素。

前言

功能连接是一种衡量不同脑区活动之间的统计依赖性指标。实际上,它作为一种相关性度量,通常在所谓的“静息状态”下进行估计,也就是说,在没有明确任务指令的情况下进行估计。所有神经元素之间的全功能连接集定义了一个功能性脑网络,可以将其建模为节点(脑区)和边(功能连接权重)。大量研究表明,连接权重的变化可用于准确地预测个体的认知、临床和发育状态。

近年来,人们对基于网络的“指纹识别”产生了浓厚的兴趣。也就是说,使用统计分析来发现功能性大脑网络的特征,这些特征能够可靠地区分个体。先前的研究表明,功能连接体(FC)可以在fMRI扫描中提供一致的个体指纹,并以可识别的方式编码一般认知状态的各个方面。然而,目前仍存在一些关键的方法学问题。例如,大多数研究没有直接评估不同指纹识别算法的相对性能,也没有详尽地探讨FC矩阵构建流程对指纹识别的影响。

因此,本研究利用人类连接组项目(HCP)数据集的FCs,探索了五种不同机器学习技术在个体指纹识别和认知状态解码目标上的准确性和可靠性。此外,为了表征FC生成的不同方面对个体和任务分类准确性的影响,并识别可能存在的混淆因素,本研究还比较了16种不同的功能连接体(FC)矩阵构建流程。

实验结果表明,一些机器学习技术在对HCP数据集中的FCs进行个体指纹识别和任务解码方面具有近乎完美的能力,为FCs揭示了个体及其认知状态的重要特征这一观点提供了支持,并为未来的技术测量提供了基准。这些高精度分类器的另一个好处是能够识别FC的特征,以及大脑哪些区域之间的哪些连接是进一步研究认知状态的感兴趣区域。

方法

数据描述和分类目标

数据集:原始数据集由HCP发布的865名受试者的fMRI扫描数据组成。每名受试者在7项活动任务(情绪、赌博、语言、运动、关系、社会、工作记忆)中的每项都扫描2次,静息态任务(休息)扫描4次,共扫描18次。为了消除因休息扫描次数过多而造成的数据不平衡的影响,实验期间每位受试者仅使用2次休息扫描,共计每位受试者有16次扫描。数据集中不包含任何个人身份信息。此外,通过流程从个体fMRI扫描数据中生成功能连接矩阵,该流程包括脑区分割、混淆回归以及从fMRI时间序列框架中计算相关系数矩阵。

HCP功能预处理:HCP数据集中的图像进行了最小程度的预处理。简而言之,对每个图像的梯度失真和运动进行了校正,并通过样条插值步骤与相应的T1加权(T1w)图像对齐。进一步校正强度偏差,归一化为均值10000,投射到32k_fs_LR网格,排除异常值,并使用多模态表面配准对齐到公共空间。

分割预处理:设计一个由大脑皮层上200个区域组成的分区,以优化fMRI信号的局部梯度和全局相似性指标(Schaefer200)。将分割节点映射到Yeo典型功能网络。对于HCP数据集,Schaefer200是32k_fs_LR空间中的CIFTI文件。这些工具利用在recon-all管道中计算的表面配准,根据个体表面曲率和沟纹模式将组平均图谱转换到被试空间。这种方法为每个被试呈现了一个T1w空间体积。将分割重新采样到2mm T1w空间,以便与功能数据一起使用。相同的过程也可用于其他分辨率(例如Schaefer100)。

功能网络预处理:使用Nilearn的signal.clean对所有BOLD图像进行线性去趋势、带通滤波(0.008~0.08Hz)、混淆回归和标准化处理,去除与时间过滤器正交的混淆。所采用的混淆回归已被证明是减少运动相关伪影的一个相对有效的选择。经过预处理和扰动回归,得到各节点BOLD时间序列的残差均值。

分类目标:在每个实验中,训练一个机器学习分类器以完成以下两个目标之一:受试者识别(指纹识别)或任务识别(解码)。

(1)指纹识别。为了实现这一目标,分类器同时对所有受试者的扫描进行训练,每个受试者完成七项任务,共14次扫描。对于每个受试者,从八项任务(包含静息态任务)中随机选择一项,并保留该任务的两次扫描作为验证数据集。受试者指纹分类器的准确性是使用训练好的分类器正确预测受试者的验证扫描的百分比。

(2)任务解码。对于任务解码目标,分类器在来自受试者子集的扫描上进行训练,涉及八个任务,每个受试者总共扫描16次。验证数据集由所有任务中其余子集的扫描组成。任务解码分类器的准确性是使用训练好的分类器正确预测其任务的验证扫描的百分比。

分类器架构

针对两个目标测试了五种分类器架构:

1、根据Howland和Park(2004)提出的基于广义奇异值分解的LDA分类器,它避免了对维数远低于样本数量的需求。对于每个类别,LDA分类器的结果为输入向量提供了一组线性系数,可用于得出有关输入分量对于特定类别的相对重要性的结论(并生成可视化)。

2、多层感知器神经网络(NN)分类器,其训练可以建模高阶函数。

3、支持向量机(SVM)分类器,一种使用高维数据进行分类的常见机器学习方法。近年来,许多关于人脑功能连接组学的研究都将SVM作为预测工具。

4、最近质心(NC)分类器,其结果可用于对类之间的高维空间关系进行简单推断。

5、基于相关性(CORR)的分类器,这是在FCs上进行受试者指纹识别的经典方法,已知可以在类似的数据集上获得较高的准确率。

FC矩阵构建流程

在这里,本研究考虑了经过测试的四个矩阵构建流程变量,以确定结果对数据准备差异的稳健性,其中包括:

①有无全局信号回归:通过线性回归去除fMRI时间序列的平均信号强度。

②有无任务回归:去除任务诱发激活的一阶效应。

③Schaefer-Yeo 100与200分区:大脑图谱中产生FCs的区域数量。

④截断剩余扫描时间序列帧,以与较短的任务扫描长度保持一致。

整个流程如图1所示。

图片

图1.功能连接体准备步骤的流程图。

结果

分类器精度

LDA分类器

LDA分类器在两个目标和大多数矩阵构建流程中都获得了较高的准确率(见表1)。总体而言,它似乎比NN分类器对矩阵构建流程变化的影响更敏感。

表1.所有分类器架构和所有流程的验证精度得分。

图片

从LDA分类器获得的系数(图3)通过对分类的输入特征重要性进行相对加权,为类区分的方法提供了一些验证。将输入特征映射到已知的大脑系统标签,可用于验证分类器是否“注意”与特定类别任务关联的脑区特征。

前馈神经网络(NN)分类器

表1还显示,在任务解码目标上,NN分类器比LDA分类器实现了更高和更一致的精度。然而,NN分类器在受试者指纹识别目标上的表现明显更差,这可以通过更好地选择NN超参数(更大或更多的隐藏层,不同的学习率,不同的激活函数等)、通过选择另一种NN架构或使用更大的数据集进行训练来改善。

例如,Wang等人(2019)使用DNN架构在七个任务中的类似任务解码目标上能够达到94%的准确率。他们的DNN是基于原始fMRI数据作为输入的卷积。本研究的简单三层神经网络能够在FCs输入维数显著降低的情况下获得更好的精度,这表明这种深度神经网络对于稳健的结果可能不是必要的。此外,虽然Wang等人的结果发现使用DNN的某些任务比其他任务更容易解码,但本研究的NN分类器在不同任务之间的分类精度基本上没有差异。

支持向量机(SVM)分类器

与LDA分类器和NN分类器相比,SVM分类器在任务解码目标上实现了所有架构中最高且最一致的精度分数(见图2),其结果比LDA分类器和NN分类器对矩阵构建流程的变化更稳健。

图片

图2.受试者指纹分类器和任务解码分类器的验证精度分数比较。

在受试者指纹识别目标上,SVM分类器的精度明显低于LDA和NN分类器,并且对矩阵构建流程表现出显著的敏感性。

NC分类器

NC分类器在目标和所有矩阵构建流程上的性能都相对较差;然而,它仍然达到了足够高的精度水平,可以得出一些关于数据集性质的结论。在任务解码方面,一些矩阵构建流程的精度高达90%。鉴于NC分类器中两个连接组之间的相似性度量为L2范数,具有相对较高精度的结果表明该数据集在高维空间中表现出类的聚类特性。相对于其他分类器,NC分类器在个体指纹识别上的结果同样不理想;然而,能够在大约一半的时间内正确识别出865名受试者(仅使用L2范数),再次表明与个体受试者相关的扫描具有相对较强的空间聚类。

相关分类器

Finn等人(2015)通过计算目标扫描和测试矩阵数据库之间的Pearson相关系数,获得了较高的个体识别准确性。它们使用Shen 268个节点的功能分区,对来自HCP数据集中的126名受试者进行了测试,受试者识别目标限定在单一任务扫描的测试数据库。只有当目标矩阵和测试矩阵数据库均来自休息任务时(即rest→rest),才能达到最高准确率(93%),而其他任务组合的准确率较低(例如rest→other)。此外,他们指出识别准确性对分割的选择很敏感。例如,当使用68个节点的FreeSurfer-Yeo图谱时,他们在rest→rest受试者识别上达到了89%的准确率。为了重现他们的结果,使用来自本研究数据集的126名随机受试者,使用200个节点的Schaefer-Yeo图谱,在基于相关性的识别rest→rest扫描方面获得的最高准确率为81%。最后,为了充分比较CORR分类器与LDA分类器的结果,将该技术推广到本研究的完整数据集和与任务无关的识别。使用779名受试者和rest→rest任务目标,准确率降至73%。使用779名受试者和any→all任务目标,最高准确率降至20%(图1)。

LDA特征对认知状态解码的重要性

下列可视化图像(见图3)显示了个体连接组特征与特定认知状态之间的相关性,作为从LDA分类器获得的系数的函数。

图片

图3.可视化热图。

训练/验证分割对LDA分类器的影响

LDA分类器的精度对于训练集中合理减少的扫描次数似乎具有稳健性(见图4)。然而,任务解码分类器在仅对五名受试者(共80次扫描)进行训练后保持近80%的精度,而指纹分类器要达到约80%的类似精度需要至少两个任务的训练集(3460次扫描)。

图片

图4.训练/验证分割对LDA分类器精度的影响。

模块化和中心性

最近,人们对FC研究中纯图论指标的性能产生了浓厚的兴趣。作为比较,本研究考察了使用模块化和中心性指标(而不是连接组边权重)作为两项任务中性能最佳分类器架构的输入。从200个区域中,使用Louvain社区检测和不对称的负权重参数来计算社区结构。从该社区中,计算每个脑区的参与系数,并将正、负参与系数连接作为LDA或NN分类器的输入(n=400个特征)。图5显示了参与系数法和边权重法之间的比较。在个体指纹识别和任务分类目标中,使用连接体边权重作为输入比参与系数具有更好的准确率。

图片

图5.比较LDA和NN在使用脑区参与系数vs连接体边权重作为输入时的分类精度。

FC矩阵构建流程

全局信号回归(GSR)

静息态功能连接MRI研究数量快速增长,数据处理的方法也在不断增加。其中一种处理方法是GSR,虽然有时存在争议,但它也有几个既定的好处。对于所有受试者,GSR的准确率分数要么非常类似于没有GSR的流线,要么分数略高,但有一个例外:在任务解码目标的NN分类器上,GSR的分数总体上明显更高(见图6)。

图片

图6.有与没有全局信号回归。

分割大小

100个区域和200个区域的分割产生了相似的精度分数,100-区域在所有流程和架构中的精度分数略低,但有一个例外:对于任务解码目标的LDA分类器,100-区域的分割在所有流程中的精度略高(图7)。除此之外,由于200分区实际上包含了100分区作为其特征的“子集”,因此精度的略微下降并不奇怪。

图片

图7.100个区域与200个区域的分割。

时间序列截断

截断是一个重要的步骤,一般来说,较短的样本会导致连通性估计中的采样误差越大。为了确保样本数量具有可比性,本研究测试了时间序列的截断,以在所有样本中保持大致相同的帧数。总体而言,截断其余扫描时间序列以匹配任务扫描似乎会导致所有流程和分类器架构的精度略有下降(图8)。与200分区相比,100分区的不利影响要明显得多。

图片

图8.使用与不使用时间序列截断。

任务回归

在所有测试中,使用任务回归的流程比不使用任务回归的流程分类精度更差(图9)。在任务分类目标中,回归旨在消除与每项任务相关但不是真正测量脑区活动的混淆因素。这些特定于任务的混淆的存在可能使任务区分更加容易,而去除它们可能会使任务解码变得更加困难。

图片

图9.有与没有任务回归。

特征选择

本研究考察了三种特征选择方法,以识别FC的边缘:

方差阈值:无监督方法,其中整个数据集中给定特征的方差用作其判别能力的度量,最重要的特征被认为是那些具有最高方差的特征。

SPEC:无监督方法,使用图谱分析来识别对维持数据集的空间聚类属性最重要的特征。

LDA系数:有监督方法,将一个给定特征在所有类别中的系数均值作为其判别能力的度量,最重要的特征被认为是那些系数均值最大的特征。

这三种特征选择方法都对输入特征进行了简单的优先级排序,除了确定要保留多少个“最重要”特征的阈值外,没有其他参数。将每种方法应用于整个数据集,然后使用最高精度矩阵构建流程(200个区域,w/GReg,noTReg)来测试特征缩减的FCs的准确性。特征选择实验的结果表明(图10),仅使用原始19900个特征(在200分区的情况下)中的几百个特征(即连接组的边),就可以在指纹识别和解码目标中保持高精度性能。

图片

图10.使用四种特征选择方法选择的特征子集,在指纹或解码目标上训练LDA分类器的精度(200个区域,w/GReg,noTReg)。

特别是,对于任何单个特征选择方法,从SPEC中获得的特征排序似乎在指纹识别和解码目标之间提供了高精度的最佳平衡——仅用~200个特征就达到了90%的精度。

与从SPEC获得的最高排序特征相关的大脑系统(图11)似乎在某种程度上平衡了方差阈值(DorsAttnA、DorsAttnB、VisCent、VisPeri)的最高排序特征,方差阈值对解码具有最佳的整体性能,而LDA指纹识别系数(ContA、ContB、DefaultA、DefaultB)具有最佳的指纹识别整体性能。

图片

图11.使用每种特征选择方法选择的前200个最重要的连接体边,按大脑系统排序。

高维聚类

作为评估类别(单个受试者或任务)在高维空间中表现出聚类程度的另一种方法,本研究对数据集执行了PCA,将其降至50维,然后使用t-SNE进行二维可视化(图12)。

图片

图12.利用PCA和t-SNE进行降维,以实现认知状态高维聚类的可视化。

本研究还计算了所有样本对的平均类内(组内)和类间(组间)距离,扫描按受试者或任务分组,作为聚类的简单度量(表2)。结果表明,按任务或受试者分组扫描的平均类内距离小于类间距离。

表2.受试者和任务的平均类内和类间距离的度量。

图片

结论

本研究结果表明,一些机器学习技术和矩阵构建流程可以从FCs实现高精度的个体指纹识别和任务解码。在大量受试者中进行个体指纹识别时,LDA分类器提供了最高和最一致的精度分数。在任务解码中,LDA、NN和SVM分类器的性能相似,但SVM在所有流程中略有优势。与较高的分类精度分数最一致的流程是:更精细的分区(更多的脑区)、使用GSR、无任务回归以及不使用时间序列截断。在未来的应用中,当决定使用哪种矩阵构建流程时,需要注意的是,虽然更精细的分区(更多的脑区)似乎能够提高精度,但给定扫描的特征数量会随着区域数量的平方而增加。这意味着更精细的分区虽然提高了精度,但可能会使分类器的训练成本显著增加。这里实现的高精度得益于HCP数据集,该数据集具有较高的一致性标准。未来的工作应该研究这些结果是否对来自其他数据集的扫描数据具有稳健性。

参考文献:Andrew Hannum, Mario A. Lopez. et al. High-accuracy machine learning techniques for functional connectome fingerprinting and cognitive state decoding. Hum Brain Mapp.2023;1-15.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/846873.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

CI/CD—K8S 基本理解与部署

1 K8S 是什么 Kubernetes 是一款容器的编排调度工具,来源于 Google 开源的 Brog 系统。Kubernetes简称K8S,是用8代替8个字符 “ubernete” 而成的缩写,用于管理云平台中多个主机上的容器化的应用,Kubernetes 的目标是让部署容器化…

冠达管理:什么叫死亡换手率?

逝世换手率是一个用于衡量公司股份买卖的目标,其核算方式为每年公司股份由于股东逝世而换手的比率。该目标能够用于评估公司股东结构安稳性,以及更广泛的商场安稳性。在这篇文章中,我们将从多个角度来分析逝世换手率。 首先,关于一…

Day 75:通用BP神经网络 (2. 单层实现)

代码: package dl;import java.util.Arrays; import java.util.Random;/*** Ann layer.*/ public class AnnLayer {/*** The number of input.*/int numInput;/*** The number of output.*/int numOutput;/*** The learning rate.*/double learningRate;/*** The m…

web前端之JS

文章目录 介绍一、JS引入到文件1.1 嵌入到HTML文件中1.2 引入本地独立JS文件1.3 引入网络来源文件 二、JS的注释三、JS输出方式四、JS数据类型4.1 判断数据类型 typeof4.2 charAt返回指定位置的字符4.3 concat连接两个字符串4.4 substring从原字符串提取字符串并返回4.4 substr…

java动态生成excel并且需要合并单元格

java动态生成excel并且需要合并单元格 先上图看一下预期效果 集成poi <dependency><groupId>cn.afterturn</groupId><artifactId>easypoi-base</artifactId><version>4.0.0</version> </dependency> <dependency><…

实践分享:小程序事件系统设计

微信小程序官方文档中解释说&#xff1a;事件是用于子组件向父组件传递数据&#xff0c;可以传递任意数据。 小程序开发中的事件是指视图层到逻辑层的通讯方式&#xff0c;主要是可以将用户的行为反馈到逻辑层进行处理。事件可以绑定在组件上&#xff0c;当达到触发事件&#…

java面向对象查缺

匿名对象 匿名对象只能使用一次 public class Test1 {public static void main(String[] args) {PhoneFactory p1 new PhoneFactory();p1.show(new Phone(1000,"black"));} } class PhoneFactory{public void show(Phone p){p.send();} } class Phone{private int…

Nginx代理接口访问返回404

Nginx代理接口访问返回404 一、背景 因为不同业务系统间有接口调用&#xff0c;存在跨域问题&#xff0c;为了解决同源策略&#xff0c;需要将接口通过nginx去转发&#xff0c;但是配置完后通过postman请求一直存在访问404的问题。 访问地址&#xff1a;https://a.test.com/n…

无代码集成明道云与更多应用连接

明道云是一个APaaS平台&#xff0c;可以帮助用户快速搭建个性化企业应用&#xff0c;用户不需要代码开发就能够搭建出用户体验上佳的销售、运营、人事、采购等核心业务应用&#xff0c;打通企业内部数据&#xff0c;也能够通过API和Webhook和其他系统对接。 场景描述&#xff…

Vue实战技巧:从零开始封装全局防抖和节流函数

前言 你是否曾经遇到过用户频繁点击按钮或滚动页面导致反应迟钝的问题&#xff1f;这是因为事件被连续触发&#xff0c;导致性能下降。在本文中&#xff0c;我将为大家介绍 vue 中的防抖和节流策略&#xff0c;并展示如何封装全局的防抖节流函数&#xff0c;以避免频繁触发事件…

酷开系统丨加入酷开会员,体验有趣的云逛荷兰海牙市立博物馆

夏日炎炎&#xff0c;出门是不可能的&#xff0c;还是宅在家里享受空调的吹拂吧&#xff01;如果想足不出户看展览&#xff0c;感受文化的熏陶&#xff0c;那就打开酷开系统&#xff0c;加入酷开会员&#xff0c;在云端逛逛荷兰海牙市立博物馆吧&#xff01; 荷兰海牙市立博物…

格式化后数据恢复,教你3个实用方法!

“格式化后数据还能恢复吗&#xff1f;前几天因为我的电脑中了病毒&#xff0c;我不得不将它进行格式化操作。但是我电脑里有很多比较重要的文件&#xff0c;有什么方法可以帮我恢复电脑中的文件吗&#xff1f;求解答&#xff01;” 格式化是一种比较常见的数据清除方法&#x…

低代码平台:初创公司的理想选择

对于初创公司而言&#xff0c;时间和资源是宝贵的。他们需要快速构建和部署应用程序&#xff0c;以满足业务需求&#xff0c;提高效率&#xff0c;并保持竞争优势。在这个背景下&#xff0c;低代码平台成为了初创公司的一个理想选择。而Zoho Creator作为一款出色的低代码平台&a…

node 报错:tagOffsetsMap[tag] ??= [];...SyntaxError: Unexpected token ,‘??=‘,亲测解决

安装的 node 版本不支持空值赋值运算符(??) 更换合适的 node 版本就行&#xff0c;如图 看看版本对应支持的 更多支持请在 node.green 上查看各种语法支持的版本

计算机视觉与图形学-神经渲染专题-pi-GAN and CIPS-3D

《pi-GAN: Periodic Implicit Generative Adversarial Networks for 3D-Aware Image Synthesis》 摘要 我们见证了3D感知图像合成的快速进展&#xff0c;利用了生成视觉模型和神经渲染的最新进展。然而&#xff0c;现有的方法在两方面存在不足&#xff1a;首先&#xff0c;它们…

ELK 将数据流转换回常规索引

ELK 将数据流转换回常规索引 现象&#xff1a;创建索引模板是打开了数据流&#xff0c;导致不能创建常规索引&#xff0c;并且手动修改、删除索引模板失败 "reason" : "composable template [logs_template] with index patterns [new-pattern*], priority [2…

SAP中采购文档出现定价转换因子字段溢出是何原因?

近期处理了一笔用户反馈的主题问题。这个问题有意思的地方地于&#xff0c;多重错误的叠加&#xff0c;导致了问题在开始就暴露出来&#xff0c;可以将隐患消除在萌芽状态。 在公司的应用中&#xff0c;会由采购创建价格合同&#xff0c;物流参照价格合同创建计划协议。但采购…

聊聊JDK动态代理原理

1. 示例 首先&#xff0c;定义一个接口&#xff1a; public interface Staff {void work(); }然后&#xff0c;新增一个类并实现上面的接口&#xff1a; public class Coder implements Staff {Overridepublic void work() {System.out.println("认真写bug……");…

为什么说用C端产品的思维做B端产品就是死路一条?

经常听行业大佬说起&#xff1a;如果用C端产品的思维做B端产品就是死路一条&#xff0c;那原因究竟是什么呢&#xff1f; 首先&#xff0c;需要明确的是C端产品和B端产品的用户群体和需求存在很大差异。C端产品的用户主要是消费者&#xff0c;更多的是被情感驱动。而B端产品的…

Visual Studio 2022安装教程(英文版)

文章目录 1.下载安装 1.下载 官网地址&#xff1a;https://visualstudio.microsoft.com/zh-hans/vs/ 选择第一个社区版本&#xff1a;Community 2022 安装 1.将下载好的文件保存到桌面&#xff0c;双击点开 2.等待visual studio installer配置好 3.点击安装后会来到配件选…