导读
在过去的十年中,fNIRS提供了一种非侵入性的方法来研究发展人群的神经激活。尽管fNIRS在发展认知神经科学中的应用越来越多,但在如何预处理和分析婴儿fNIRS数据方面却缺乏一致性或共识。本研究考察了对婴儿fNIRS数据应用更高级统计分析的可行性,并比较了最常用的基线校正平均法、基于一般线性模型(GLM)的单变量法和多变量模式分析(MVPA)方法,展示了基于这些不同分析方法得出的结论是如何趋同或不同的。使用面孔倒置范式测试了这些分析方法,并在30名4-6个月大的婴儿中测量了对正立和倒置面孔刺激的大脑激活变化。通过将更多标准方法与最新机器学习技术相结合,本研究旨在为fNIRS社区提供分析婴儿fNIRS数据集的多种途径。
前言
在过去的50年里,研究人员在研究人类婴儿认知能力的方法和技术方面取得了重大进展,例如脑电图(EEG)和事件相关电位(ERP),功能磁共振成像(fMRI)以及最近的功能近红外光谱(fNIRS)。这种研究婴儿在一岁时大脑功能发育的机遇,使我们对婴儿感知和认知能力的理解取得了重大进展。其中最有前途的方法之一是fNIRS。该技术使用近红外光来检测氧合(oxyHb;HbO2)和脱氧(deoxyHb;HHb)血红蛋白浓度,这是氧气需求增加的结果,并间接反映了大脑功能性激活。大脑功能激活过程中HbO2和HHb的浓度变化可以通过光吸收测量得出。
与任何其他神经成像方法一样,fNIRS有优点也有缺点。在过去的20年中,它在婴儿研究中的广泛应用可归因于这样一个事实,即这种婴儿友好的方法相对便宜且易于使用,与EEG相比,fNIRS不易受到运动伪影的影响,并允许对大脑皮层在各种感官刺激下的反应进行空间研究,从而为婴儿的神经发育提供有价值的见解。
虽然基于NIRS的技术最初主要应用于临床,例如监测新生儿的脑氧合(NIRS血氧测定法),后来,研究人员开始应用fNIRS来研究婴儿期的脑功能激活。最近的研究侧重于研究复杂的认知过程,例如语音处理和语言发展,社会大脑网络和面孔加工,以及多感官线索。
尽管fNIRS在发展认知神经科学中的应用越来越多,但对于如何预处理和分析fNIRS数据仍缺乏共识。事实上,NIRS系统的多样性,以及统计软件和跨婴儿实验室的内置数据分析脚本的异质性,使得建立跨实验的一致和可靠发现变得困难。为此,本研究的主要目的是展示三种fNIRS数据分析方法的结果:基线校正平均法,基于GLM的单变量分析和MVPA分析,并讨论基于这些不同分析方法得出的结论的趋同或不同。
传统上,fNIRS数据是用基线校正平均技术进行分析的,该技术包括将特定条件blocks的神经反应进行平均,并执行基线校正。然后使用方差分析或配对样本逐通道t检验对处理后的fNIRS数据进行分析,以比较实验条件。在这种情况下,首先将时程数据分割成不同的时间窗(即基线和条件):然后从实验试次窗口中减去实验前窗口(基线)的平均HbO2和HHb浓度,以计算平均血流动力学浓度变化。然后,对每个通道和条件下的试次信号进行平均,并进行重复测量分析。然后使用不同的多重比较方法进行事后比较以控制假阳性激活。例如,fNIRS研究使用了错误发现率(FDR),Bonferroni校正,空间连续激活和蒙特卡罗(Monte Carlo)模拟。虽然基线校正平均法相对容易在fNIRS婴儿数据中实现,并且避免了对血流动力学信号形状及其时间过程的假设,但同时也忽略了重要的时间信息。相反,一般线性模型(GLM)考虑了整个时间过程,以良好的时间分辨率证明了其在fNIRS数据分析中的作用。然而,重要的是要承认,在嘈杂的婴儿数据中,这些时间信息可能会部分丢失,由于婴儿的注意力不集中或哭闹,有时不得不丢弃大量数据。基于fMRI和NIRS设计之间的相似性以及它们对血流动力学反应的依赖,GLM方法最初是用fMRI数据实现的,但现已用于光学数据(例如,NIRS-SPM工具箱)。GLM方法包括对预先指定的回归因子进行建模,然后将其与预期的血流动力学响应函数(HRF)进行卷积并拟合到数据中。然而,GLM的缺点是它需要假设一个预定义的HRF,预定义的HRF在被试内和被试间可能有所不同,并且在新生儿和幼儿中尚未得到充分证实。
近来,为fMRI数据开发的复杂技术,如多体素/多变量模式分析(MVPA)等多变量方法,也被用于分析fNIRS数据。MVPA允许通过考虑多个变量之间的关系来分析分布在皮层区域的大脑活动模式。例如,MVPA技术允许研究人员研究fNIRS激活模式是否可以区分两种或多种条件。Emberson及其同事(2017)将MVPA应用于婴儿fNIRS数据,使用基于相关性的解码方法对事件相关设计中记录的血流动力学信号进行解码,并成功解码了对感兴趣条件作出响应的通道。与标准的单变量检验相比,MVPA能够提供有关血流动力学信号方面的大量细节,而使用经典单变量检验可能会遗漏这些细节。首先,MVPA方法可以检测神经激活模式,这是观察一种条件与另一种条件相比所特有的,因此,与标准的单变量分析相比,MVPA提供了更高水平的分析复杂性。fMRI和fNIRS研究都发现,多变量方法能够成功地发现分布式激活模式和通道贡献的显著差异,而单变量检验无法做到这一点。其次,该方法可以通过吸收多个噪声信号来降低观测中噪声的影响。然而,MVPA的一个问题是,这种方法没有考虑某些类型的混淆,这些混淆可以使用更标准的分析来适当处理。例如,因为MVPA检测到的是个体特有的大脑信号,在一种情况下解码的独特神经活动模式可能是由于个体差异(例如,任务表现的个体差异)所致,而不是条件本身。因此,MVPA分析有可能导致假阳性。然而,与MVPA相关的一些局限性可以通过遵循某些程序来克服,例如避免训练和测试集与来自同一运行的数据重叠,以减少假阳性。总体而言,考虑到fNIRS社区中广泛使用各种分析方法,比较不同的方法来分析相同的fNIRS数据集可以深入了解每种方法在探索婴儿大脑反应时的缺陷和优势。
方法
参与者
根据power分析,计算出所需样本量为26名婴儿。共招募39名4-6个月大的足月健康婴儿参加了该研究。根据数据排除标准,8名参与者被排除在外,因为每个实验条件下不足3个次试次;1名参与者根据NIRS数据预处理被排除(超过30%的通道被enPruneChannels拒绝)。最终样本由30名参与者组成(13名女性;Mage=162.03天,SD=21.40天)。
对样本量的论证集中在证明所提出的多元模式分析能够提供令人满意的性能,根据整体的准确性来分类对应于每个条件的模式。本研究提出的分析方法的有效性是使用相关发育认知神经科学fNIRS数据集的有效模式分类来确定的,其中基于相关的解码方法已经应用了MVPA。在本研究方法中,MVPA分析的可靠性取决于监督学习模型(线性SVM)的性能,其输入由激活模式组成。线性SVM分类器寻找一组权重,这些权重通过它们之间的最大分离裕度对每个条件对应的激活模式进行最佳分类。为此,本研究使用了Emberson及其同事(2017)原始研究的样本数据。这项研究考察了5-6个月大的婴儿对视听刺激的神经处理。结果发现个体通道的信息量存在差异,并证明了在发育人群中使用MVPA解码由fNIRS测量的神经模式是可行的。
为了预测当前研究中MVPA令人满意的性能所需的样本量,本研究使用了Figueroa及其同事(2012)建议的方法。在这项工作中,每个性能值(准确率)所需的样本量是基于小标注训练集分类器精度趋势的逆幂律模型估计的。使用Emberson数据进行此分析的结果如图1所示。而且从图1可知,基于MVPA的方法对于之前在相关工作和本研究所考虑的参与者数量中是稳健的(N=26)。
图1.使用正则化线性SVM方法对本研究MVPA方法进行多变量解码的错误风险的说明性表示。红色实线表示呈递增趋势的逆幂律曲线。精度定义为(真阳性+真阴性)/(真阳性+真阴性+假阳性+假阴性),而Emberson的23名参与者的研究(数据集1),精度为0.8696(值用黑色虚线交叉点显示)。
刺激和程序
基线期的刺激包括5种蔬菜的全彩照片图像,测试期的刺激包括5张女性面孔的全彩色照片图像,面部表情中性,或正立或倒置。面部刺激选自NimStim面部刺激集(可在http://www.macbrain.org/resources.htm)获得。为了增加视觉辨别刺激的可能性(基于亮度、空间频率和颜色),选择了多个种族和民族的面孔。这些面孔被裁剪至脖子正下方。LED显示器的尺寸为23.6英寸,距离参与者眼睛90cm处。
在每个试次中,五张面孔图像以1Hz的速率和伪随机顺序呈现,以确保同一试次或同一面孔图像不会出现超过两次或连续出现(图2)。在一半的试次中呈现正立面孔,在另一半试次中呈现倒置面孔。使用伪随机顺序来确保给定的条件不会连续出现超过三次。刺激呈现一直持续到婴儿变得烦躁或无聊,或者由监测其行为的实验者评估至少30个试次。试次持续时间固定为8s。在基线试次期间,5张蔬菜图像以1Hz的速率随机呈现两次,持续10s。
图2.本研究采用的block设计的说明性示例。
参与者在光线昏暗、声音微弱的房间里,坐在父母的腿上接受测试。鼓励婴儿观看显示器上呈现的刺激。要求父母在刺激呈现期间避免与婴儿交谈或互动,除非婴儿变得烦躁不安。通过E-prime播放刺激,用惠普笔记本电脑记录NIRS信号。NIRS机器使用了脉冲LED发射器(NIRScout系统,NIRx,BrainProducts)。整个测试过程持续了大约10min。
fNIRS记录和预处理
采用NIRx NIRScout记录fNIRS数据(源-探测器距离:2.5cm;两种波长:760nm和850nm;采样率:约10Hz)。将光学探测帽戴在婴儿头部,对准两个半球的颞叶区域(左,LH;右,RH)。先前的研究使用相似的源探测器蒙太奇对fNIRS和MRI进行共配准,证明它可以测量对应于IFG、STS和TPJ区域的大脑反应。将光学传感器内置于脑电帽(Quick-cap,Compumedics Neuroscan)中,并使用表面解剖标记将其放置在婴儿头部的两侧(近似源探测器的位置见图3)。
图3.源-探测器配置的说明性示例。红点表示源的近似位置,蓝点表示探测器的近似位置。白色圆圈代表通道。
使用Matlab软件包Homer2对数据进行预处理。实验中的数据会自动保存为“.nirs”格式,与Homer2兼容。本研究遵循一种处理流程,该流程适用于噪声数据和少量试次(典型的婴儿fNIRS数据)。首先将光强度数据转换为光密度,拒绝原始强度小于0.001V或大于10V的通道(enPruneChannels函数)。此外,NaN值超过20%的通道都被排除在分析之外,并且剔除session中所有时间段的NaN值。手动剔除婴儿没有参加或照顾者影响婴儿观察行为的试次。根据Brigadoi等人(2014)的建议,使用0.5倍四分位间距的小波分析校正运动伪影。为了衰减慢漂移和高频噪声,本研究使用Homer中提供的默认滤波选项对数据进行带通滤波(高通:0.01Hz;低通:0.80Hz)。因信号微弱或噪声超过30%的通道数据被排除在分析之外。最后,使用路径长度因子为5.1的修正Beer-Lambert定律将数据转换为含氧血红蛋白(HbO2)和脱氧血红蛋白(HHb)的相对浓度。与以前的婴儿fNIRS研究一样,进行基线校正平均和GLM分析需要最少6个试次(每个条件3个试次)。对于MVPA方法,每个参与者的最小试次数目设置为16(每个条件8个试次)。
数据分析
尽管本研究主要预期STS区域存在的差异,但使用的阵列与以前的共配准工作略有不同,这使得很难确切地知道在潜在的ROI分析中应该包括哪些通道。因此,本研究进行了全阵列分析。
①基线校正平均法
本研究计算了从每个试次开始前3s到试次偏移结束后7s的18s长周期内HbO2和HHb的相对变化。从15s分析期的浓度中减去3s实验前窗口期(基线)的平均HbO2和HHb浓度。然后对每个通道和条件的试次信号进行平均。本研究首先量化了试次开始后五个3s子周期的平均血流动力学浓度变化。接下来对这五个子阶段进行重复测量分析,将两个条件(正立与倒置)作为被试内因素,以确定在同时考虑这两种情况时,HbO2较基线显著增加或显著降低的通道。为了评估两个条件(正立与倒置)之间的血流动力学响应是否存在差异,对每个显示出显著血流动力学响应的预选择通道进行了重复测量分析。通过使用Benjamini-Hochberg方法控制错误发现率以进行多重比较校正。
②一般线性模型(GLM)分析
使用自定义Matlab脚本(代码可通过GitHub获得)和SPM-NIRS工具箱进行数据分析。对于每个婴儿,构建一个具有三个回归量的设计矩阵。第一个回归量对正立面孔试次(8s)进行建模,第二个回归量对倒置面孔试次(8s)进行建模,第三个回归量对基线试次建模(10s)。将排除的试次周期设置为零,从而有效地将其从分析中删除。这些回归因子与标准的典型血液动力学响应函数进行卷积,得到设计矩阵,然后使用SPM-NIRS工具箱中的一般线性模型对数据进行拟合。对于每个回归量和每个婴儿,获得beta参数,然后用于计算每个婴儿感兴趣条件之间的差异。为了确保通道激活的统计可靠性,使用基线校正平均法中描述的Benjamini-Hochberg方法进行FDR校正。
③多变量模式分析(MVPA)
数据分析是使用自定义的内置脚本进行(代码可通过GitHub获得)。多变量解码精度的估计作为SVM预测的基础,对每个向量使用以下目标标签进行训练:正立vs.基线;倒置vs.基线;正立vs.倒置。在后续的MVPA分析中,每个条件的第一级GLM β系数的多通道向量被用作特征(即使用来自GLM的输出,每个条件和通道都有一个回归量)。为了验证MVPA结果的泛化性,在5折交叉验证过程中生成测试集和训练集,其中被试不重叠,并将结果值报告为交叉验证测试的均值。利用贝叶斯主成分插补法,以同一区域内非缺失通道的β值为参考,估计缺失通道的β值。采用SVM作为二元分类器,与以往的MVPA分析和fNIRS信号一样。对于MVPA,推荐使用线性核SVM,因为这种更简单的模型不太容易出现过拟合(即建模噪声和相关信息)。此外,还使用L2正则化对SVM进行拟合,目的是保持模型权重较小,从而降低其复杂性并避免过拟合。由遗传算法引导的搜索用于查找最决定性的通道beta子集,以最大化MVPA精度。SVM的参数化仅通过训练集中的交叉验证过程进行估计。通过随机化方法(蒙特卡罗方法)应用数据集重采样程序,以嵌套的5折交叉验证进行组水平分析。使用置换标签进行多次分类分析,以获得零分布或机会性能分布,并通过零分布的经验p值评估观测结果的显著性。对灵敏度执行相同的过程,即对每个特征的分类器评分。图4显示了从原始光强度(Volts)测量到MVPA分析的所有处理步骤的示意图。
图4.数据处理架构,包括三种分析方法的所有步骤(基线校正平均:方法1;GLM:方法2;MVPA:方法3)。
结果
①基线校正平均结果
初步分析发现,与同时考虑两个条件时的基线期相比,有三个通道在试次期间显示出显著的血流动力学响应。这些通道在基线期和试次期之间具有明显的HbO2增加:通道8(p=.0006),通道18(p=.003),通道20(p=.046)。通道8具有明显的HHb下降(p=.010)。对于通道18,与倒置面孔相比,正立面孔的HbO2反应明显更大(p=.036;见图5),这表明在整个分析期间,正立面孔的HbO2反应更大。然而,该通道经FDR校正为p=.108。
图5.通道18(左上)、17(右上)、9(左下)和11(右下)正立(实线)和倒置(虚线)面孔的血流动力学反应。
②一般线性模型(GLM)结果
对个体条件与基线之间beta值的t检验显示,与基线相比,正立面孔(或倒置面孔)的HbO2/HHb没有显著增加/降低。因此,GLM输出数据没有通过初始质量检查。对正立和倒置面孔之间beta值的t检验显示,有两个通道对面孔朝向敏感,一个通道位于左侧颞顶叶皮层(通道8),另一个通道位于左侧额下皮层(通道1)。通道8的血流动力学反应(基于HbO2)显示,与倒置面孔相比,正立面孔的血流动力学反应明显更强(p=0.031)。然而,这个通道未能通过多重比较校正,FDR校正p=.56。通道1显示,与倒置面孔相比,正立面孔的血流动力学反应(基于HHb)明显更大(p=.028)。然而,该通道未能通过多重比较校正,FDR校正p=0.62。与正立面孔条件相比,在倒置条件下没有通道显示出明显更大的响应。
③多变量模式分析(MVPA)结果
对30名参与者(每个条件至少3个试次;在后述中称为数据集1)和13名参与者(每个条件至少8个试次;数据集2)进行了MVPA分析。对于数据集1,与基线期相比,HbO2在试次期的解码精度(50%)不存在统计学显著性。同样,HbO2在正立和倒置条件下的解码精度(58%)在统计学上也不显著(p=.13)。在所有比较中,HHb的解码精度也没有统计学显著性。对于正立vs.倒置条件下的HbO2解码,本研究还提取了通道解码相关性(图6),正如用于MVPA分析的基于线性SVM方法的系数绝对值所示。左半球的通道15和17显示出比两个半球其他通道更大的系数。然而,这些通道的相关性并不显著高于其他通道。
图6.基于数据集1的MVPA线性SVM的基本模型系数揭示了通道解码相关性。
在数据集2中发现了类似的结果。与基线期相比,HbO2在试次期的解码精度没有统计学显著性。在所有比较中,HHb的解码精度也没有统计学意义。因此,这表明该模型无法成功地建立一个准确的解码,无论样本中的婴儿观看的是正立面孔刺激还是倒置面孔刺激。
对于正立与倒置条件下的HbO2解码,本研究还提取了通道解码相关性(图7),正如用于MVPA分析的基于线性SVM方法的系数绝对值所示。右半球的通道7显示出比两个半球其他通道更大的系数。然而,该通道的相关性并不显著高于其他通道。
图7.基于数据集2的MVPA线性SVM的基本模型系数揭示了通道解码相关性。
结论
在过去的几十年里,fNIRS研究在发展认知神经科学领域发展迅速。可能是由于该领域的快速发展,有许多不同的方法来分析发展中的fNIRS数据。本研究的目的是在涉及正立和倒置面孔(即经典的面孔倒置效应)范式的背景下,比较和对比三种fNIRS数据分析方法,即基线校正平均、基于GLM的单变量分析和MVPA分析。
基线校正平均法显示,只有大约位于右侧STS后部的通道18,对正立面孔的HbO2反应明显大于倒置面孔,同时也显示出显著时间主效应。但是通道18未能通过多重比较校正,因此应谨慎对待此结果。本研究还确定了位于双侧后部区域的两个通道(通道17和9)和一个位于右侧前部区域的通道(通道11),这些通道对面孔方向比较敏感,但当同时考虑这两种情况时,没有显示明显的血流动力学反应的证据(以HbO2增加或HHb减少为指标)。这些通道的位置位于双侧STS后部区域和右侧额下回。总的来说,这些结果与Otsuka等人(2017)的发现是一致的,他们发现5-8个月大的婴儿在面对正立(而不是倒置)面孔时,右颞叶的HbO2显著增加。
基于GLM的单变量分析显示,位于左后侧区域(通道8;对应于左侧STS后部区域)的一个通道对正立面孔的HbO2反应明显大于倒置面孔。这一结果证实了先前的研究,即STS是与社会知觉有关的关键大脑区域。然而,考虑到这种效应无法通过多重比较校正,且单个通道上的显著差异(在相邻通道上没有显著效应的情况下)可能缺乏统计可靠性,这可能是一个假阳性发现。此外,鉴于没有发现正立状态下(与基线相比)显著的血流动力学反应的证据,因而有理由质疑GLM分析的敏感性。鉴于HRF在幼儿中没有得到很好的实证,关于HRF的假设容易受到模型错误规范的影响。一个潜在的解决方案是在HR建模时使用时间和弥散导数,这考虑到了血流动力学响应的起始时间和形状的可变性。总的来说,尽管本研究的GLM模型可能缺乏敏感性,但这些结果与基线校正分析一致,即位于婴儿大脑STS区域的通道对面孔方向比较敏感。
考虑到GLM方法的这些潜在问题,使用beta系数的MVPA分析无法以预期的精度区分fNIRS数据中的两种刺激条件。基于基线平均的MVPA和基于GLM的beta系数的MVPA可以实现更高的解码精度。位于婴儿大脑右侧STS区域的大量通道共同促成了高解码能力。这表明,基于β的MVPA方法不应依赖于对β系数的先验估计,除非实验设计或人群有助于引出一个明确的规范HR。其他不依赖于β权重回归或HRF拟合的多变量方法也可能有所帮助。总的来说,所有这些分析似乎确实指出位于婴儿大脑STS区域的通道对面孔方向敏感,正立和倒置面孔状况之间存在单变量差异。此外,未来的研究在使用单变量或多变量方法进行fNIRS发展性研究时应仔细考虑当前研究中所概述的注意事项。
参考文献:Maria Laura Filippetti , Javier Andreu-Perez , Carina de Klerk , Chloe Richmond , Silvia Rigato , Are advanced methods necessary to improve infant fNIRS data analysis? An assessment of baseline-corrected averaging, general linear model (GLM) and multivariate pattern analysis (MVPA) based approaches, NeuroImage (2022), doi: https://doi.org/10.1016/j.neuroimage.2022.119756