JointVAE用于单细胞多模态插补和embedding

news2025/1/6 20:00:34

单细胞多模态数据能够测量细胞的各种特征,从而深入了解细胞和分子机制。然而,多模态数据的生成仍然昂贵且具有挑战性,同时缺失模态也经常发生。最近,机器学习方法已经被开发用于数据补全,但通常需要完全匹配的多模态数据才能学习共同的潜在特征,可能缺乏模态特异性。为了解决这些问题,作者开发了一个机器学习模型,名为JAMIE。JAMIE接受单细胞多模态数据,这些数据可以在模态之间部分匹配样本。变分自编码器学习每个模态的潜在特征。然后,跨模态匹配样本的特征被聚合以识别联合的跨模态潜在特征,然后进行重构。为了进行跨模态补全,可以使用一个模态的潜在特征和另一个模态的解码器。

来自:Joint variational autoencoders for multimodal imputation and embedding

目录

  • 背景
  • 方法

背景

以细胞为基础理解分子机制可以更深入地洞察细胞功能、发育和疾病进展,但目前仍然难以实现这个目标。为此,最近出现了单细胞多模态数据集,通过使用新的测序技术测量单个细胞的各种特征,并确定细胞功能(例如,细胞类型)。因此,整合单细胞多模态数据集可以发现跨模态关系,显著帮助我们理解贡献于细胞类型和疾病的生物学机制。目前研究人员已经开发了许多方法来整合多模态数据集,以改进对细胞类型的预测(参见图1a)。虽然这些方法主要关注预测,但其基本思想可以扩展到预测分布在不同模态中的数据,即下面所称的跨模态插值(参见图1b)。跨模态插值随着深度学习的发展,已经得到了越来越多的探索。此外,自编码器允许灵活定义潜在空间的形式。现有方法主要专注于常见的多组学数据,如scRNA-seq + scATAC-seq,并且不考虑来自其他单细胞模态(例如电生理)的高度非线性特征。此外,它们要求完全一致的多模态数据(匹配的细胞),这限制了对缺失模态数据的处理能力(比如UnitedNet)。

fig1

  • 图1:多模态数据整合与插补的困难。
  • a:使用多模态数据来有效地预测缺失的表型(例如,来自多模态单细胞数据的细胞类型)是困难的,因为不同模态具有异质特征。识别跨模态的相似潜在空间可以进行跨模态比较,机器学习可用于发现相似的跨模态潜在空间,并实现比较和表型预测。
  • b:某些模态成本过高,但其能对生物学机制提供重要的见解。例如,用于细胞型表观基因组学的scATAC-seq数据是昂贵的,单细胞分辨率的ephys数据很难产生。通过使用机器学习从一种模态推导另一种模态可以缓解这些限制。

方法

JAMIE采用联合自编码器模型进行数据整合和插补(图2a)。对于输入,JAMIE接受两个模态的数据矩阵 X 和 Y。可选地,当两个模态的样本部分对应时(例如,来自相同单个细胞),可以提供额外的对应关系矩阵 F。JAMIE中的编码器将 X 和 Y 转换为潜在空间中的特征,并利用可用的对应信息进行聚合。JAMIE中的解码器预测原始模态的重构 X 和 Y。在训练完JAMIE模型后,可以依次使用其用于模态 X 的编码器和用于模态 Y 的解码器进行从一种模态到另一种模态的插补(图2b)。此外,JAMIE模型的潜在空间可以用于表型预测(细胞分类)。使用Shapley加法解释值(Shapley additive explanation values)等重要性评估方法,可以对用于插补的多模态特征进行排序(图2c)。
fig2

  • 图2:JAMIE使用了一种新的潜在空间聚合技术来为每个模态生成相似的潜在空间。
  • a:数据矩阵 X X X Y Y Y被输入编码器 f E X ( ⋅ ) f^{X}_{E}(\cdot) fEX() f E Y ( ⋅ ) f^{Y}_{E}(\cdot) fEY(),其输出 μ i X , σ i X \mu_{i}^{X},\sigma_{i}^{X} μiX,σiX(对应模态 X X X的样本 i i i)和 μ j Y , σ j Y \mu_{j}^{Y},\sigma_{j}^{Y} μjY,σjY(对应模态 Y Y Y的样本 j j j)。然后, L i X ∼ N ( μ i X , σ i X ) L_{i}^{X}\sim N(\mu_{i}^{X},\sigma_{i}^{X}) LiXN(μiX,σiX) L j Y ∼ N ( μ j Y , σ j Y ) L_{j}^{Y}\sim N(\mu_{j}^{Y},\sigma_{j}^{Y}) LjYN(μjY,σjY)为从隐空间中采样得到的隐表示。使用 F F F可以优化隐表示,得到 M X M^{X} MX M Y M^{Y} MY。最后,解码得到 X ~ = f D X ( M X ) \widetilde{X}=f^{X}_{D}(M^X) X =fDX(MX) Y ~ = f D Y ( M Y ) \widetilde{Y}=f^{Y}_{D}(M^Y) Y =fDY(MY)。隐表示 L X L^{X} LX L Y L^{Y} LY可以拼接在一起用于混合的细胞分类。
  • b:通过不同模态的编码器和解码器的耦合,训练后的模型可以重复用于跨模态的预测。
  • c:插补函数为 f ( x ) = f D Y ( L x ) = y f(x)=f^{Y}_{D}(L^{x})=y f(x)=fDY(Lx)=y x ∈ R d X x\in R^{d_{X}} xRdX y ∈ R d Y y\in R^{d_{Y}} yRdY,使用Shapley加性解释值进行评估,该值通过选择性地用背景掩盖输入特征向量来估计每个输入特征的贡献。符号 a 1 , a 2 a_1, a_2 a1,a2表示模态 X X X的特征,而符号 b 1 , b 2 b_1, b_2 b1,b2表示模态 Y Y Y的特征,期望值用 E E E表示。

关于 F ∈ R n X × n Y F\in R^{n_{X}\times n_{Y}} FRnX×nY得到 M X M^{X} MX M Y M^{Y} MY,可以执行聚合计算来组合已知对齐点的隐含表示: M X = ( L X + δ L Y F T ) ( d i a g ( 1 + δ F 1 n Y ) ) − 1 M^{X}=(L^{X}+\delta L^{Y}F^{T})(diag(1+\delta F 1_{n_{Y}}))^{-1} MX=(LX+δLYFT)(diag(1+δF1nY))1 M Y = ( L Y + δ − 1 L X F ) ( d i a g ( 1 + δ − 1 F T 1 n X ) ) − 1 M^{Y}=(L^{Y}+\delta^{-1} L^{X}F)(diag(1+\delta^{-1} F^{T} 1_{n_{X}}))^{-1} MY=(LY+δ1LXF)(diag(1+δ1FT1nX))1其中, 1 n X ∈ R n X 1_{n_{X}}\in R^{n_{X}} 1nXRnX 1 n Y ∈ R n Y 1_{n_{Y}}\in R^{n_{Y}} 1nYRnY为全1向量。 δ \delta δ表示聚合函数中模态 X X X和模态 Y Y Y之间的相对权重,我们在训练过程中学习 δ \delta δ。当 δ < 1 δ < 1 δ<1时,表示 X X X在聚合过程中的权重大于 Y Y Y,而 δ > 1 δ > 1 δ>1则表示相反。在蓝色向量的表述中, M X M^X MX M Y M^Y MY的构造如图2a所示。图2a显示了 F i k = 1 F_{ik} = 1 Fik=1的情况,第 i i i行和第 k k k列的所有其他条目为0,这导致只需要简单地平均 X X X的细胞 i i i Y Y Y的细胞 k k k的潜在特征向量。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/721375.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【剑指 Offer】52. 两个链表的第一个公共节点。 难度等级:简答 -- 中等。双指针法太秀了

文章目录 1. 题目2. 我的解法&#xff1a;哈希表&#xff0c;空间复杂度 0(n)&#xff0c;不符合要求2.1 算法思路2.2 code 3. 双指针法&#xff1a;浪漫相遇太秀了3.1 算法思路3.2 code 1. 题目 题目链接&#xff1a;剑指 Offer 52. 两个链表的第一个公共节点 输入两个链表&…

丢失msvcr120.dll的解决方法

1、什么是MSVCR120.dll&#xff1f; MSVCR120.dll是微软公司开发的Visual 2013程序的一部分。某些应用程序或游戏可能需要此文件才能正常工作。如果msvcr120.dll缺失&#xff0c;无论何时启动应用程序/游戏&#xff0c;都可能会遇到各种错误。 2、 msvcr120.dll软件特色 1、该…

九.图像处理与光学之图像几何变换算法(双线性插值)

九.图像处理与光学之图像几何变换算法(双线性插值) 9.0 前言 ​ 图像几何变换是图像处理中非常基础实用的技能,主要包括图片位移、缩放、镜像、剪切、放射变换等,在对图像进行空间变换的过程中,典型的情况是在对图像进行放大,旋转处理的时候,图像会出现失真的现象。这是…

【半监督医学图像分割 2023 MICCAI】SCP-Net

文章目录 【半监督医学图像分割 2023 MICCAI】SCP-Net摘要1. 简介2. 方法2.1 自交原型预测2.2 典型预测不确定性2.3 无监督原型一致性约束SPCCCPCC 3 实验与结果3.1 数据集和评价指标3.2 实施细节3.3 与其他方法的比较3.4 消融研究 4. 总结 【半监督医学图像分割 2023 MICCAI】…

Word表格设置边框不生效的解决方法

1、这是新建并随意设置的表格&#xff0c;可以看出来上边框、内边框和下边框都是不同的粗细&#xff0c;很不协调。 2、选中表格&#xff0c;然后右击——>表格属性——>边框和底纹。 3、三线表&#xff0c;一般上边框和下边框都是1磅&#xff0c;内边框是0.5磅&#xff…

别再瞎忙活,掌握营销策划的核心机密

很多时候看多了那些广告门上的案例&#xff0c;就感觉出一个策略就一定要引爆市场才行&#xff0c;如果不能引爆&#xff0c;那营销策划就没用&#xff0c;这个非黑即白的思维要改改。 事实上&#xff0c;我们大部分的营销人&#xff0c;做的营销策划方案都是处于灰色地带&…

QT获取电脑系统,主板型号,CPU型号,硬盘型号,内存大小等相关信息(一)通过CMD和WMIC命令行的方式

QT通过CMD和WMIC命令行的方式获取电脑系统&#xff0c;主板型号&#xff0c;CPU型号&#xff0c;硬盘型号等相关信息&#xff0c;包括使用diskpart,wmic,DIrectX等 目录导读 一、DIrectX诊断工具打开窗体查看命令行输出 二、 直接CMD输入SYSTEMiNFO三、WMIC命令查询1.获取系统盘…

PaddleClas:自定义backbone

PaddleClas提供的都是现成的网络结构和权重&#xff0c;不一定适用&#xff0c;所以有必要掌握魔改的技能。 PaddleClas版本&#xff1a;2.5 1&#xff1a;新建 mynet.py 在 ppcls/arch/backbone/model_zoo/ 文件夹下新建一个自己的模型结构文件 mynet.py&#xff0c;即你自己…

抖音seo矩阵系统源码开发部署-开源分享(二)

目录 市场背景分析 一、 抖音seo矩阵系统开发部署流程 二、 源码开发功能构思 三、 抖音seo源码开发部署注意事项 四、 部分开发代码展示 市场背景分析 账号矩阵是通过不同平台不同账号之间建立联系&#xff0c;通过将同一品牌下不同平台不同账号的粉丝流量进行账号互通&a…

【MySQL】不允许你不了解联结表

&#x1f3ac; 博客主页&#xff1a;博主链接 &#x1f3a5; 本文由 M malloc 原创&#xff0c;首发于 CSDN&#x1f649; &#x1f384; 学习专栏推荐&#xff1a;LeetCode刷题集&#xff01; &#x1f3c5; 欢迎点赞 &#x1f44d; 收藏 ⭐留言 &#x1f4dd; 如有错误敬请指…

测试人如何高效地设计自动化测试框架?

目录 前言&#xff1a; 什么是自动化测试框架&#xff1f; 好框架的定义 设计框架的思路 自动化测试实施思路&#xff1a; 自动化开展建议&#xff1a; 总结&#xff1a; 前言&#xff1a; 关于测试框架的好处&#xff0c;比如快速回归提高测试效率&#xff0c;提高测试…

IBM服务器RAID5磁盘阵列出现故障的数据恢复案例

服务器数据恢复环境&#xff1a; IBM某型号服务器&#xff0c;服务器中5块SAS磁盘组建了一组RAID5磁盘阵列。划分了一个LUN以及3个分区&#xff1a;第一个分区存放windows server系统&#xff0c;第二个分区存放SQL Server数据库&#xff0c;第三个分区存放备份文件。 服务器故…

第一章:L2JMobius学习 - 安装mariadb10数据库

L2JMobius是一套开源的 LineageII 的服务器端代码&#xff0c;使用Java语言编写。想要运行L2JMobius源程序的话&#xff0c;首先要搭建环境&#xff0c;需要安装mariadb数据库和jdk。本章节&#xff0c;我们介绍如何安装mariadb10 数据库。下载地址为&#xff08;阿里云镜像&am…

分布式运用——监控平台 Zabbix

分布式运用——监控平台 Zabbix 一、监控平台种类二、我们今天介绍Linux操作系统的传统监控平台——zabbix 6.0版本1.zabbix 是什么&#xff1f;2.**zabbix 监控原理&#xff1a;**3.Zabbix 6.0 新特性&#xff1a;4. Zabbix 6.0 功能组件&#xff1a;5.数据库6.Web 界面7.Zabb…

Xcode通过Add package自动集成第三方SDK问题汇总

问题1&#xff1a; 解决方法&#xff1a;这个问题可能是因为 Adjust 或者 Facebook 的库当中依赖的某些类库的仓库地址是 git:// 协议&#xff0c;通过这种协议与 GitHub 通讯时会使用到你的 SSH 配置&#xff0c;你电脑上相关的 ssh key 使用了 GitHub 不再支持的格式&#xf…

Java集合框架进阶学习(ArrayList源码分析、HashMap实现原理)

文章目录 1、算法复杂度1.1、时间复杂度分析1.2、空间复杂度小总结 2、List2.1、数组小总结 2.2、ArrayList源码分析2.3、单向链表2.4、双向链表小总结 3、HashMap3.1、二叉树小总结 3.2、散列表小总结 3.3、HashMap的实现原理3.4、HashMap的put方法的具体流程3.5、HashMap的扩…

简历石沉大海!这份新鲜出炉的测试用人需求分析报告揭示了原因

最近有朋友吐槽简历投递后石沉大海&#xff0c;而主动打电话面试的除了外包还是外包。软件测试就业形势真的这么糟糕了&#xff1f; 小酋决定用数据揭开真相。因此小酋选取“软件测试”、“自动化测试”、“测试开发”作为搜索关键词&#xff0c;统计了 无忧网 近一个月用人市…

目标跟踪基础:两张图片相似度算法

本文来自公众号“AI大道理” —————— 目标跟踪就是在时序帧中搜索目标的过程&#xff0c;本质上就是检索。 不管是传统的目标跟踪中的生成模型和判别模型&#xff0c;还是用深度学习来做目标跟踪&#xff0c;本质上都是来求取目标区域与搜索区域的相似度&#xff0c;这就…

C# 依赖倒置原则(DIP)

目录 一&#xff0c;引子 1.1 传统的程序架构 1.2 依赖倒置 1.3 依赖倒置的作用 二&#xff0c;依赖注入 一&#xff0c;引子 1.1 传统的程序架构 在程序执行过程中&#xff0c;传统的程序架构如图&#xff1a; 可以看到&#xff0c;在传统的三层架构中&#xff0c;层与…

CSS的学习4(盒子模型及浮动)

CSS的学习3&#xff1a;http://t.csdn.cn/xDxIJ 盒子模型 网页布局过程 先准备好相关的网页元素&#xff0c;网页元素基本都是盒子Box利用CSS设置好盒子样式&#xff0c;然后摆放到相应位置往盒子里面装内容 封装周围的HTML元素&#xff1a; 边框&#xff08;border&#…