Nat. Methods | scPerturb——单细胞扰动数据的标准化资源与统计分析方法

Nat. Methods | scPerturb——单细胞扰动数据的标准化资源与统计分析方法

news2026/2/12 8:01:06

《Nature Methods》提出scPerturb资源平台，整合44个单细胞扰动数据集（涵盖转录组、表观组、蛋白组读值），并通过能量统计量（E-statistics）量化扰动效应，旨在解决单细胞扰动数据的互操作性差、缺乏统一分析方法的问题，推动计算工具开发和实验设计优化。

引言

单细胞扰动实验通过靶向基因或蛋白的干预，解析细胞调控网络，但因数据规模化和技术差异，存在以下问题：

1. 数据异构性：不同研究的数据格式、技术（CRISPR、小分子药物等）和测序深度差异显著，跨数据集分析困难。

2. 分析方法瓶颈：

伪批量分析（pseudo-bulk）忽略单细胞间的异质性。
缺乏统计工具比较扰动效果的差异（如基因敲除与药物扰动的对比）。

3. 实验设计优化需求：现有研究对细胞数量、测序深度等参数缺乏标准化指导，导致结果可比性低。

本文目标：

建立scPerturb数据库，统一质控流程和注释。
引入E-statistics，量化扰动强度与相似性，支持跨数据集的标准化分析。

方法概述

scPerturb构建与E-statistics流程：

1. 数据整合：

收集44个公共数据集，涵盖CRISPR基因编辑（knockout/i/a）、药物扰动、细胞因子刺激等多技术平台。
统一预处理：标准化质控（过滤低质量细胞/基因）、注释扰动靶点及分子读值。

2. E-statistics分析：

E-距离计算：基于PCA降维后的单细胞表达谱，计算扰动组与对照组之间的分布差异。公式核心：组间距离均值 vs 组内距离均值（公式详见原文）。
E-test显著性检验：通过蒙特卡洛置换检验评估扰动效果的统计显著性。

3. 工具开发：提供Python（scperturb）和R（scperturbR）包，支持用户自定义分析。

数据集覆盖多样性及质量控制

本文整合的44个数据集涵盖单细胞转录组（32个）、表观（3个）、蛋白（2个）及多模态数据（9个），CRISPR技术占比72%（基因敲除/激活/干扰），药物扰动占比21%。

UMI中位数在1,000-20,000间波动，基因检出数中位为2,500-5,000。

部分数据集（如NormanWeissman2019）因双靶点CRISPRa设计，扰动信号更强。

E-距离量化扰动强度异质性

不同数据集E-距离差异显著，如NormanWeissman2019（CRISPRa双靶点）的平均E-距离最高。

其中：

强扰动组（如CEBPA+KLF1共敲除）：UMAP中与未扰动细胞明显分离
弱扰动组（如TGFBR2敲除）：E-距离低（<10），细胞群与对照组重叠
E-test验证60%扰动在P<0.05水平显著

基于E-距离的扰动功能聚类

干扰素γ信号通路案例：

在Papalexi*Satija2021数据集中，敲除IFNGR1/2、JAK2、STAT1的E-距离矩阵聚类显示高度相似性，反映其在IRF1上游的级联调控。

下游基因（如SMAD4）扰动则形成独立聚类，佐证功能模块差异

实验参数对分析结果的影响

细胞数阈值

当单扰动组细胞数<200时，E-test假阴性率显著上升；>500细胞/扰动组可稳定检测80%显著效应。

测序深度

UMI数>1,000/细胞时，E-test敏感性饱和；低深度下虽E-距离降低，但统计显著性仍保留。

参考资料

Peidli, S., Green, T.D., Shen, C. et al. scPerturb: harmonized single-cell perturbation data. Nat Methods 21, 531–540 (2024).

代码链接： https://github.com/sanderlab/scPerturb/

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2313693.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

【易康eCognition实验教程】005：影像波段组合显示与单波段显示

【易康eCognition实验教程】005：影像波段组合显示与单波段显示

文章目录一、加载多波段影像二、单波段显示三、彩色显示一、加载多波段影像二、单波段显示如果导入的影像数据具有三个或者更多的波段，影像场景将自动以RGB（红绿蓝）模式默认显示，如上图所示。在视图设置（View Settings）窗口中使用单波段灰度显示（Single LayuerGrays…

阅读更多...

使用Process Explorer、Dependency Walker和PE信息查看工具快速排查dll动态库因库与库版本不一致导致的加载失败问题

目录 1、问题说明 2、使用Process Explorer查看目标dll动态库有没有动态加载起来 3、使用Dependency Walker查看xxpadll.dll库的库依赖关系，找到xxpadll.dll加载失败的原因 4、使用PE信息查看工具查看目标dll库的时间戳 5、关于xxsipstack2.dll中调用xxdatanet…

阅读更多...

Git的命令学习——适用小白版

Git的命令学习——适用小白版

浅要了解一下Git是什么： Git是目前世界上最先进的的分布式控制系统。Git 和其他版本控制系统的主要差别在于，Git 只关心文件数据的整体是否发生变化，而大多数其他系统则只关心文件内容的具体差异。Git 并不保存这些前后变化的差异数据。实际上…

阅读更多...

如何安全处置旧设备？

如何安全处置旧设备？

每年，数百万台旧设备因老化、故障或被新产品取代而被丢弃，这些设备上存储的数据可能带来安全风险。如果设备没有被正确删除数据，这些数据往往仍可被恢复。因此，安全处置旧设备至关重要。旧设备可能包含的敏感数据旧设备中可能…

阅读更多...

Java 学习记录：基础到进阶之路（一）

Java 学习记录：基础到进阶之路（一）

今天，让我们深入到 Java 项目构建、基础语法及核心编程概念的领域，一探究竟。软件安装及环境配置请查看之前更新的博客有着详细的介绍： IDEA软件安装&环境配置&中文插件-CSDN博客目录 1.Java 项目构建基础 1.项目中的 SRC 目录…

阅读更多...

系统架构设计师—系统架构设计篇—软件架构风格

系统架构设计师—系统架构设计篇—软件架构风格

文章目录概述经典体系结构风格数据流风格批处理管道过滤器对比调用/返回风格主程序/子程序面向对象架构风格层次架构风格独立构件风格进程通信事件驱动的系统虚拟机风格解释器基于规则的系统仓库风格（数据共享风格）数据库系统黑板系统超文本系统闭…

阅读更多...

工厂模式加策略模式 -- 具体实现

工厂模式加策略模式 -- 具体实现

这里写目录标题定义接口定义抽象类定义主处理器分支处理器定义工厂demo 定义接口 public interface EntityHandler extends InitializingBean {MatchContentDTO match(MatchEntityDTO matchEntityDTO);String supportEntityType(); }定义抽象类 public abstract class Abstr…

阅读更多...

STM32---FreeRTOS消息队列

STM32---FreeRTOS消息队列

一、简介 1、队列简介： 队列：是任务到任务，任务到中断、中断到任务数据交流的一种机制（消息传递）。 FreeRTOS基于队列，实现了多种功能，其中包括队列集、互斥信号量、计数型信号量、二值信号量…

阅读更多...

python-leetcode-删掉一个元素以后全为 1 的最长子数组

python-leetcode-删掉一个元素以后全为 1 的最长子数组

1493. 删掉一个元素以后全为 1 的最长子数组 - 力扣（LeetCode）可以使用滑动窗口的方式来解决这个问题。我们要找到最长的全 1 子数组，但必须删除一个元素，因此可以将问题转化为寻找最多包含一个 0 的最长子数组。解题思路使用双指针（滑动窗口），维护窗口内最多包含一…

阅读更多...

【赵渝强老师】PostgreSQL的模板数据库

【赵渝强老师】PostgreSQL的模板数据库

在PostgreSQL中，创建数据库时实际上通过拷贝一个已有数据库进行工作的。在默认情况下，将拷贝名为template1的标准系统数据库。所以该数据库是创建新数据库的“模板”。如果为template1数据库增加对象，这些对象将被拷贝到后续创建的用户数据库…

阅读更多...

vue2中，在table单元格上右键，对行、列的增删操作（模拟wps里的表格交互）

vue2中，在table单元格上右键，对行、列的增删操作（模拟wps里的表格交互）

HTML <template><div><divclass"editable-area"v-html"htmlContent"contenteditableblur"handleBlur"contextmenu.prevent"showContextMenu"></div><button click"transformToMd">点击转成M…

阅读更多...

使用DeepSeek+蓝耘快速设计网页简易版《我的世界》小游戏

使用DeepSeek+蓝耘快速设计网页简易版《我的世界》小游戏

前言：如今，借助先进的人工智能模型与便捷的云平台，即便是新手开发者，也能开启创意游戏的设计之旅。DeepSeek 作为前沿的人工智能模型，具备强大的功能与潜力，而蓝耘智算云平台则为其提供了稳定高效的运行环境…

阅读更多...

解决微信小程序中调用流式接口，处理二进制数据时 TextDecoder 不兼容的问题

解决微信小程序中调用流式接口，处理二进制数据时 TextDecoder 不兼容的问题

问题复现最近在开发一个 AI 问答小程序时，由于接口返回的是流式二进制数据，因此我使用了 TextDecoder 的 decode 方法将二进制数据转换为文本。在开发环境中，数据处理一直没有问题，但在真机测试及上线后，发现调用接口…

阅读更多...

Java 大视界 -- Java 大数据在智慧农业农产品质量追溯与品牌建设中的应用（124）

Java 大视界 -- Java 大数据在智慧农业农产品质量追溯与品牌建设中的应用（124）

💖亲爱的朋友们，热烈欢迎来到青云交的博客！能与诸位在此相逢，我倍感荣幸。在这飞速更迭的时代，我们都渴望一方心灵净土，而我的博客正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识，也…

阅读更多...

c++介绍信号六

c++介绍信号六

信号量是c中实现对有限资源访问控制，现成通过信号量获得对资源访问的许可。可用资源大于0，线程可以对资源进行访问，此时计数器减1。当计数器为0时，不可访问资源，线程进入等待。当资源释放时，线程结束等待&a…

阅读更多...

GStreamer —— 2.18、Windows下Qt加载GStreamer库后运行 - “播放教程 6：音频可视化“（附：完整源码）

GStreamer —— 2.18、Windows下Qt加载GStreamer库后运行 - “播放教程 6：音频可视化“（附：完整源码）

运行效果介绍 GStreamer 带有一组将音频转换为视频的元素。他们可用于科学可视化或为您的音乐增添趣味 player 的本教程展示了： • 如何启用音频可视化 • 如何选择可视化元素启用音频可视化实际上非常简单。设置相应的标志，当纯音频流为 found&#…

阅读更多...

用Deepseek写一个 HTML 和 JavaScript 实现一个简单的飞机游戏

用Deepseek写一个 HTML 和 JavaScript 实现一个简单的飞机游戏

大家好！今天我将分享如何使用 HTML 和 JavaScript 编写一个简单的飞机游戏。这个游戏的核心功能包括：控制飞机移动、发射子弹、敌机生成、碰撞检测和得分统计。代码简洁易懂，适合初学者学习和实践。游戏功能概述玩家控制：使用键…

阅读更多...

Android Compose MutableInteractionSource介绍

Android Compose MutableInteractionSource介绍

在 Android 开发中，Compose 是 Google 推出的现代化 UI 工具包，它让开发者能够更简洁高效地构建应用界面。而 MutableInteractionSource 是 Compose 中一个重要的组件，它可以帮助你处理用户与界面交互时的状态变化，尤其在处理交互…

阅读更多...

[杂学笔记] TCP和UDP的区别，对http接口解释， Cookie和Session的区别，http和https的区别，智能指针，断点续传

[杂学笔记] TCP和UDP的区别，对http接口解释， Cookie和Session的区别，http和https的区别，智能指针，断点续传

文章目录 1. TCP和UDP的区别2. 对http接口解释3. Cookie和Session的区别4. http和https的区别5. 智能指针6.断点续传 1. TCP和UDP的区别 tcp的特点： 面向连接，可靠性高，全双工，面向字节流udp特点：无连接，不…

阅读更多...

【NLP 29、项目 Ⅰ：电商评论分类（好评 / 差评）】

【NLP 29、项目 Ⅰ：电商评论分类（好评 / 差评）】

目录项目介绍一、训练及测试数据二、代码实现 1.配置文件 config.py 2.分割训练集和验证集 split_train_valid.py 3.数据加载文件 loader.py Ⅰ、加载和处理数据 DataGenerator ① 初始化 ② 数据加载 ③ 文本编码 ④ 补齐 / 截断 ⑤ 获取数据集长度和指定索引的数据 Ⅱ、加…

阅读更多...

推荐文章

最新文章