利用非线性解码模型从人类听觉皮层的活动中重构音乐

news2025/1/20 14:59:23

e04743e8e0e2a5843c549781a2f2e37a.png

音乐是人类体验的核心,但音乐感知背后的精确神经动力学仍然未知。本研究分析了29名患者的独特颅内脑电图(iEEG)数据集,这些患者听了Pink Floyd的歌曲,并应用了先前在语音领域使用的刺激重建方法。本研究成功地从直接神经录音中重建了可识别的歌曲,并量化了不同因素对解码精度的影响。结合编码和解码分析,本研究发现大脑右半部分主导音乐感知,颞上回(STG)起主要作用,证明了一个新的颞上回亚区适应音乐节奏,并定义了一个对音乐元素表现出持续和开始反应的前后侧STG组织。本研究结果表明,在单个患者获得的短数据集上应用预测建模是可行的,为在脑机接口(BCI)应用程序中添加音乐元素铺平了道路。

416666619d53345bf80c11b531bbd264.png

    方法与实验

本次实验共29例耐药癫痫患者参与研究(女性15例;年龄16 ~ 60岁,平均33.4岁,全量表智商范围为74 ~ 122)。所有患者均通过手术植入颅内栅格或电极条(ECoG)来定位癫痫病灶,电极定位完全由临床指导。所有患者均自称听力正常,并被要求全神贯注地听着Pink Floyd的歌曲《Another Brick in the Wall》(第一部分)。总歌曲持续时间为190.72秒(波形如图1A所示)。听觉刺激频率为44.1 kHz,并通过入耳式监听耳机(带宽12 Hz至23.5 kHz,与周围噪声隔离20 dB)在每个患者调节的舒适声级(50至60 dB SL)下传递。

为了研究听觉刺激的声学效果与ECoG记录的神经活动之间的关系,使用NSL MATLAB Toolbox将歌曲波形转换为仅振幅的听觉谱图。所得到的听觉频谱图有128个频率段,从180到7246 Hz,特征频率沿对数频率轴均匀分布,采样率为100 Hz。为了减少计算负荷和特征的数量,输出了一个从188到6745 Hz的32个频仓的简化谱图(图1A,底部)。

本研究使用基于回归的解码模型,根据记录的神经活动重建经典摇滚歌曲的听觉谱图,量化了3个因素对解码准确性的影响,并通过编码模型和损伤分析研究了音乐感知的神经动力学和区域。

    结果

歌曲响应电极的分布

为了识别编码歌曲声学信息的电极,本研究为数据集中所有2379个电极拟合了光谱颞感受野(STRF),评估了在这些位置记录的HFA可以从歌曲的听觉谱图中线性预测的程度(图1)。从密集的、双侧的、主要是额颞覆盖(图2A)中,确定了347个具有显著STRF的电极(图2B)。研究发现大脑右半球有更高比例的对歌曲有反应的电极。在左半球的1479个电极中有199个有意义,在右半球的900个电极中有148个有意义(图2B)。347个显著电极中的大多数(87%)集中在3个区域:68%在双侧颞上回(STG),14.4%在双侧感觉运动皮层(SMCs,位于中央前和后回),4.6%在双侧IFG(图2C)。STRF预测精度分析发现偏侧性是主要影响因素(图2D),右半球的相关系数高于左半球。

c351e42a0c58c7b484b7538b88a8767b.png

▲图1. 协议,数据准备和编码模型拟合。(A)顶部:整个歌曲刺激的波形。下:歌曲的听觉谱图。顶部的橙色条代表歌曲中有人声的部分。(B) x线显示1例代表性患者的电极覆盖。每个点是一个电极,突出显示的4个电极发出的信号如图(C)所示。(C)歌曲刺激在4个代表性电极中引发的HFA。(D)放大10秒(A和C中的黑色条)的听觉谱图和代表性电极中引发的神经活动。这里使用的线性编码模型包括通过找到最佳截距(a)和系数(w),从听觉谱图(X)预测神经活动(y)。(E) (B)、(C)和(D)中红色显示的电极的STRF。STRF系数为z值,在前面的方程中表示为w。

22d074d584c7b6667f7bf6fe99f92b89.png

▲图2. 歌曲反应电极的解剖位置。(A) MNI模板显示的所有29例患者的电极覆盖率(N = 2,379)。所有呈现的电极都没有任何人工或癫痫活动。(B)电极位置显著编码歌曲的声学(Nsig = 347)。显著性是由超过250个训练、验证和测试集样本的STRF预测精度确定的。标记颜色表示使用FreeSurfer图谱确定的解剖标记,标记大小表示STRF的预测精度。(C)每个解剖区域的重要电极数。深色表示右半球的位置。(D)每个解剖区域的平均STRF预测精度。先前标记为上边缘,其他颞叶(即STG以外)和其他额叶(即SMC或IFG以外)的电极被合并在一起,标记为其他并以白色/灰色表示。HFA:高频活动;IFG,额下回;蒙特利尔神经学研究所;SEM,均值的标准误差;感觉运动皮层;STG,颞上回;光谱时间接受野。

影响译码精度的歌曲重构与方法因素

本研究通过拟合线性解码模型,对电极子集进行了自举分析,揭示了解码模型中用作预测器的电极数量与预测精度之间的对数关系(图3A)。使用bootstrap分析观察到数据集持续时间和预测精度之间存在类似的对数关系(图3B)。对于模型类型,与MLP更高的有效r平方相一致,解码的光谱图揭示了模型类型之间的差异,非线性重建(图3C,底部)相对于线性重建(图3C,中间)显示了更精细的光谱时间细节。总体而言,线性重建在前景元素(人声音节和吉他主音)的存在下听起来充满了强烈的节奏线索,但节奏感有限的吉他模式。与线性重建相比,非线性重建提供了可识别的歌曲,具有更丰富的细节。对音高、音色等谱元素的感知质量得到显著提高,音素同一性明显。使用非线性模型从患者P29的61个重要电极中重建歌曲(图3D)。这些模型的表现优于基于所有患者电极的线性重建,但解码精度低于来自所有患者的347个显著电极的解码精度。在感知方面,这些基于单个患者的模型提供了足够高的光谱时间细节来识别歌曲。

72714f776f6a6700ddd2cdcdc8b4db31.png

▲图3. 歌曲重构与方法论思考。(A)预测精度作为线性解码模型中作为预测器的电极数的函数。在y轴上,100%表示使用所有347个重要电极获得的最大解码精度。黑色曲线显示了从每个电极数量的100个样本的自举分析中获得的数据点,而红色曲线显示了两项幂级数拟合线。(B)预测精度作为数据集持续时间的函数。(C)原始歌曲(上)和使用线性(中)或非线性模型(下)从所有响应电极解码的重建歌曲的听觉谱图。(D)仅使用患者P29电极的非线性模型重建歌曲的听觉谱图。

然后,本研究通过将原始歌曲与解码歌曲谱图的摘录相关联来量化解码歌曲的可识别性。线性(图4A)和非线性(图4B)重建都提供了很高的正确率(分别为32/38和36/38);图4,左面板)和显著识别平均百分位数(分别为95.2%和96.3%;图4,右侧面板)。

bbd1085c5cc0113383f45b344627f200.png

▲图4. 歌曲节选识别等级分析。在通过12个不同的15秒测试集解码整首歌曲后,将原始歌曲和解码谱图分成5秒的片段,并计算所有可能的原始解码对的相关系数。(A)使用线性模型解码。左面板显示相关矩阵,红点表示逐行最大值。右面板显示了摘录识别等级的直方图,衡量原始解码的最大相关系数与真实摘录识别的接近程度。灰色阴影区域表示通过1,000个原始歌曲摘录身份的随机排列估计的零分布的95%置信区间。红色竖线显示了所有歌曲节选的平均识别等级。(B)使用非线性模型解码的相同面板。

音乐元素的编码

本研究分析了所有347个重要电极的STRF系数,以评估不同的音乐元素是如何在不同的大脑区域编码的。该分析揭示了各种光谱时间调谐模式(图5A)。为了充分表征音乐谱图与神经活动之间的关系,对所有重要的strf进行了独立分量分析(ICA)。确定了具有不同光谱时间调谐模式的3个分量,每个分量解释5%以上的方差,共同解释52.5%的方差(图5B)。

fb1028f831fa131780bce894c6415034.png

▲图5. STRF调谐模式分析。(A)有代表性的一组10个STRF (在347个重要STRF中),在MNI模板上的位置使用匹配标记。颜色代码与图1中使用的颜色代码相同。(B)三个ICA分量各解释了所有347个显著strf的5%以上方差。(C)这三个分量的ICA系数,绘制在MNI模板上。颜色代码表示系数振幅,红色表示STRF代表分量最多的电极。(D)为了捕捉吉他节奏模式的调谐,计算了所有重要STRF的时间调制谱。对于每个电极,以6.66 Hz(红色矩形)的速率提取了所有频谱频率的最大时间调制值。(E)所有提取的值都表示在MNI模板上。红色的电极显示了对吉他节奏模式的调音。

第一个分量(28%的解释方差)显示了一组正系数(图5B中红色部分,上排),分布在大约500 Hz至7 kHz的宽频率范围内,在观测到的HFA之前约90 ms的窄时间窗口内。这个暂时的瞬态集群揭示了对声音启动的调优。该成分被称为“起始成分”,仅在位于双侧STG后部的电极中发现(图5C,顶行,电极用红色表示)。在图6C的顶行,用红色显示了在具有这个起始分量的电极中,音乐中引起HFA增加最高的部分。这些部分对应于主吉他或合成器主题的开始(图6A,分别为蓝色和紫色条;图6E为放大图),每2小节播放一次(绿色小节),以及元音音节核的开始(橙色小节;图6D为放大图)。

be2a91f378303405cc09941af4422e13.png

▲图6. 音乐元素的编码。(A)整首歌的听觉谱图。声谱图上方的橙色条形标志着人声的所有部分。蓝色条标记主吉他主题,紫色条标记合成器主题。绿色竖条表示一系列的8个4/4小节(或小节)。较粗的橙色和蓝色条分别标记了(D)和(E)中放大的位置。(B)如图5B所示的三个STRF组成部分,即开始(上)、持续(中)和晚开始(下)。(C)音乐谱图(A)和3个STRF分量(B)之间滑动相关性的输出。(D)放大第三声部。歌词呈现在谱图上方,分解成音节。大多数音节在开始和晚开始图(分别为顶部和底部)都触发了HFA的增加,而在整个发声过程中(中间)都观察到HFA的持续增加。(E)放大吉他主音主题。乐谱在谱图的上方。大多数音符在发病和晚发病图(分别为顶部和底部)触发HFA增加,而持续成分(中间)没有HFA增加。

第二个分量(14.7%的解释方差)显示了一组正系数(图5B中行中红色部分),分布在整个750毫秒的时间窗口和大约4.8到7 kHz的狭窄频率范围内。该成分被称为“持续成分”,在位于双侧STG中部和前部以及双侧SMC的电极中发现(图5C中)。此外,这一成分与音乐中包含人声的部分最相关,因此暗示了对语音的调音(图6C中,红色;图6D为放大图)。

第三个分量(9.8%的解释方差)显示出与开始分量相似的调谐模式,只是在观察到的HFA之前延迟时间更长,约为210 ms(图5B下)。该成分,从现在起被称为“晚发成分”,在双侧STG后部和前部,靠近代表起发成分的电极,以及双侧SMC中发现(图5C下)。与开始分量一样,这个分量与主音吉他的开始以及声乐中音节核的开始最相关,只是潜伏期更长(图6C下;放大图见图6D和6E)。

第四个分量:通过计算时间调制并提取所有347个STRF(图5D红色矩形)在6.66 Hz的速率附近的最大系数,发现了第四个分量。这个速度与节奏吉他的第16个音符相对应,在音乐中无处不在,音乐的节奏为每分钟99次(图5A,电极5)。该成分被称为“节奏成分”,在位于双侧STG中部的电极中发现(图5E)。

音乐声学信息的解剖功能分布

为了评估这些不同的皮质区域和功能成分在表示音乐特征方面的作用,使用线性解码模型进行了损伤分析。本研究使用完整的347个电极模型的预测精度作为基线值(图7)。研究发现电极组的主要影响较为显著。然后,我们进行了一系列事后分析,以检查每个集合对预测准确性的影响。

81fc7881bc17ef03f01596718c3255ec.png

▲图7. 线性解码模型的损伤分析。通过解剖(A)或功能(B)电极组,在解码模型的预测器中进行了“虚拟病变”。x轴上显示了损伤集,y轴上显示了它们对线性解码模型的预测精度的影响,与使用所有347个重要电极的基线解码模型的性能相比。

解剖损伤(图7A):去除所有STG或所有正确的STG电极会影响预测精度,与所有其他电极组相比,去除所有STG电极的影响最大。去除右侧STG电极比去除左侧STG电极影响更大,去除左侧STG电极无影响。综上所述,这表明:

(1)与其他区域相比,双侧STG代表了独特的音乐信息;

(2)右侧STG相对于左侧STG具有独特的信息;

(3)左侧STG中的部分音乐信息被冗余编码到右侧STG中,切除SMC、IFG或所有其他区域不影响预测精度。

这些结果表明两个半球代表独特的信息,并有助于音乐解码。此外,去除左半球的单个区域没有影响,但去除所有左电极确实表明左半球存在冗余,音乐信息在空间上分布在左半球区域。

功能性损伤(图7B):去除所有起始电极和右起始电极都会影响预测精度,对所有发病的影响都最大。没有发现去除左起电极的影响。这表明,与左起跳电极相比,右起跳电极具有独特的信息,并且左起跳电极中的部分音乐信息在右起跳电极中被冗余编码。在晚发性成分中观察到类似的右半球受累模式、。去除所有节律电极和右节律电极都显著影响解码精度。而本研究发现去除左侧节律电极没有影响,去除所有节律电极和右侧节律电极没有差异。这表明,右侧节律电极具有独特的信息,而左侧节律电极中没有多余的信息。尽管有大量的持续电极,但没有发现移除任何一组电极的影响。

    结论

本研究对听取音乐的患者的脑电图数据进行了预测建模分析,利用非线性模型从直接的人类神经记录中以最稳健的效果重建音乐。通过基于编码和解码模型的综合解剖功能方法,本研究证实了右半球偏好和STG在音乐感知中的主要作用,证明了一个新的STG亚区适应音乐节奏,并定义了一个对音乐元素表现出持续和开始反应的前后STG组织。这些结果进一步加深了人类对音乐感知背后的神经动力学的理解。

参考文献:

https://doi.org/10.1371/journal.pbio.3002176

—— End ——

仅用于学术分享,若侵权请留言,即时删侵!

更多阅读

格拉斯哥大学中国博士生提出计算鬼成像架构

专家观点:最近Neuralink FDA IDE的真正含义是什么?

植入式脑机接口技术的医疗器械之路

LMDA-Net第一作者亲自讲述其设计思想

伸手运动想象训练与伸手抓取想象的关系

3aee0dee1aadd9c62c95733d53865c1f.png

   加入社群  

欢迎加入脑机接口社区交流群,

探讨脑机接口领域话题,实时跟踪脑机接口前沿。

加微信群:

添加微信:RoseBrain【备注:姓名+行业/专业】。

加QQ群:913607986

  欢迎来稿  

1.欢迎来稿。投稿咨询,请联系微信:RoseBrain

2.加入社区成为兼职创作者,请联系微信:RoseBrain

ebf70ce0a30433da4fa1d3421e9fb294.png

9794634e599cc2aa195b038e8e2aa5a5.jpeg

37d3bf62c16e273e0c18c9470228c9e7.png

一键三连「分享」、「点赞」和「在看」

不错每一条脑机前沿进展 ~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/966817.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【性能优化】聊聊性能优化那些事

针对于互联网应用来说,性能优化其实就是一直需要做的事情,因为系统响应慢,是非常影响用户的体验,可能回造成用户流失。所以对于性能非常重要。最近正好接到一个性能优化的需求,需要对所负责的系统进行性能提升。目前接…

Python自动化小技巧22——获取中国高校排名数据

背景 【软科排名】2023年最新软科中国大学排名|中国最好大学排名 (shanghairanking.cn) 爬取这个网站所有的高校的数据,包括学习名称,层次,地区,分数等等信息:[办学层次,学科水平,办学资源,师资规模与结构,人才培养,…

红日靶场五(vulnstack5)渗透分析

环境搭建 win7 192.168.111.132(仅主机) 192.168.123.212(桥接) .\heart p-0p-0p-0win2008 ip: 192.168.111.131(仅主机) sun\admin 2020.comkali ip: 192.168.10.131(nat)vps&…

字节一面:说说地址栏输入 URL 敲下回车后发生了什么?

前言 最近博主在字节面试中遇到这样一个面试题,这个问题也是前端面试的高频问题,作为一名前端开发工程师,我们只有了解地址栏输入 URL 敲下回车后发生的事件,才知道性能优化如何下手,性能优化也是前端必备知识&#xf…

第一章_线程基础知识

先拜拜大神 Doug Lea(道格.利) java.util.concurrent在并发编程中使用的工具包 为什么学习并用好多线程极其重要 硬件方面 摩尔定律失效 摩尔定律:它是由英特尔创始人之一Gordon Moore(戈登.摩尔)提出来的。其内容为…

Centos 6.5 升级到Centos7指导手册

一、背景 某业务系统因建设较早,使用的OS比较过时,还是centos6.5的系统,因国产化需要,需将该系统升级到BClinux 8.6,但官方显示不支持centos 6.x升级到8,需先将centos6.5升级到centos7的最新版&#xff0c…

Python之作业(一)

Python之作业(一) 作业 打印九九乘法表 用户登录验证 用户依次输入用户名和密码,然后提交验证用户不存在、密码错误,都显示用户名或密码错误提示错误3次,则退出程序验证成功则显示登录信息 九九乘法表 代码分析 先…

【100天精通Python】Day52:Python 数据分析_Numpy入门基础与数组操作

目录 1 NumPy 基础概述 1.1 NumPy的主要特点和功能 1.2 NumPy 安装和导入 2 Numpy 数组 2.1 创建NumPy数组 2.2 数组的形状和维度 2.3 数组的数据类型 2.4 访问和修改数组元素 3 数组操作 3.1 数组运算 3.2 数学函数 3.3 统计函数 4 数组形状操作 4.1 重塑数组形…

Sentinel 流量控制框架

1. Sentinel 是什么? Sentinel是由阿里中间件团队开源的,面向分布式服务架构的轻量级高可用流量控制组件。 2. 主要优势和特性 轻量级,核心库无多余依赖,性能损耗小。 方便接入,开源生态广泛。 丰富的流量控制场景。 …

【C#】泛型

【C#】泛型 泛型是什么 泛型是将类型作为参数传递给类、结构、接口和方法,这些参数相当于类型占位符。当我们定义类或方法时使用占位符代替变量类型,真正使用时再具体指定数据类型,以此来达到代码重用目的。 泛型特点 提高代码重用性一定…

ThreadLocal源码剖析(简单理解)

Thread部分源码 public class Thread implements Runnable {ThreadLocal.ThreadLocalMap threadLocals null; }ThreadLocal源码,其中ThreadLocal有一个静态内部类ThreadLocalMap,这个Map不是类似二叉树类型的,只是一个普通数组,其中具体使用什么算法其实我也不太理解. 然后对…

【LeetCode】剑指 Offer <二刷>(5)

目录 题目:剑指 Offer 10- II. 青蛙跳台阶问题 - 力扣(LeetCode) 题目的接口: 解题思路: 代码: 过啦!!! 题目:剑指 Offer 11. 旋转数组的最小数字 - 力…

MIPI D-PHY的初始化(MIPI Alliance Xilinx)

DPHY的基本介绍及使用已有很多文章,基本是基于《MIPI Alliance Specification for D-PHY 》的内容,学习时也以此为准,可参考CSDN上的文章。着重讲述MIPI D-PHY的初始化部分 1 D-PHY的功能及使用 下面的文章讲的不错,既有理论&…

内存管理方式

内存管理 一、C/C内存分布1、内存空间的介绍2、示例题目3、示例题目图解 二、C语言动态内存管理方式1、代码2、介绍 三、C内存管理方式1、概念2、代码3、代码所代表的意义 四、new和delete操作自定义类型1、代码2、运行结果3、特点 五、operator new与operator delete函数1、概…

【算法系列篇】模拟算法

文章目录 前言1.替换所有问号1.1 题目要求1.2 做题思路1.3 Java代码实现 2. 提莫攻击2.1 题目要求2.2 做题思路2.3 Java代码实现 3. N 字形变换3.1 题目要求3.2 做题思路3.3 Java代码实现 4. 外观数列4.1 题目要求4.2 做题思路4.3 Java代码实现 5. 数青蛙5.1 题目要求5.2 做题思…

CXL.mem S2M Message 释义

🔥点击查看精选 CXL 系列文章🔥 🔥点击进入【芯片设计验证】社区,查看更多精彩内容🔥 📢 声明: 🥭 作者主页:【MangoPapa的CSDN主页】。⚠️ 本文首发于CSDN&#xff0c…

【操作系统】一文快速入门,很适合JAVA后端看

作者简介: 目录 1.概述 2.CPU管理 3.内存管理 4.IO管理 1.概述 操作系统可以看作一个计算机的管理系统,对计算机的硬件资源提供了一套完整的管理解决方案。计算机的硬件组成有五大模块:运算器、控制器、存储器、输入设备、输出设备。操作…

使用candump+grep查看CAN报文

在Linux系统中观察看CAN报文,我们一般使用candump,但是有时候会发现总线上CAN报文太多,例如开启了好几个PDO,这就导致想看的报文被夹杂到报文的海洋里,然后再去找,非常麻烦。 candump也提供了只观察某个报…

LeetCode 无重复字符的最长子串 打败100%的人

😀前言 LeetCode上的“无重复字符的最长子串”问题要求我们找到给定字符串中不包含重复字符的最长子串的长度。这个问题是一个典型的滑动窗口技巧的应用,需要有效地处理字符出现的情况来找到解决方案。 . 在本解决方案中,我们将探讨两种不同的…

EMC VNX2代一键关机方法

由于不正确的EMC VNX存储系统的关机导致客户业务中断,数据丢失的案例数不胜数。不正确的关机顺序,很容易造成内存中的数据丢失,进而导致dirty cache,然后系统的LUN和POOL就无法online,业务中断。本文仅仅对EMC 2代产品…