概述
在代谢活跃的细胞中,表达的代谢酶催化代谢反应生成许多代谢物。这些代谢物中的一些可以扩散到细胞外空间并作为信号分子发挥作用。某些细胞外代谢物可以与空间上邻近细胞的感应蛋白结合。我们将分泌代谢物的细胞称为发送细胞,而表达感应蛋白的细胞称为接收细胞。因此,这些代谢物和感应蛋白之间的相互作用可以以旁分泌方式介导发送和接收细胞之间的通信。如果发送细胞和接收细胞是同一个细胞,也可以通过自分泌方式介导通信。为了分析发送和接收细胞之间的代谢物-感应器通信,开发了一种称为MEBOCOST的算法,该算法以处理过的单细胞RNA测序(scRNA-seq)数据为输入。
算法步骤
1. 输入数据:使用处理过的scRNA-seq数据,结合先前关于细胞外代谢物、代谢酶和代谢物-感应器伙伴的知识,检测代谢物-感应器通信。
2. 代谢物预测:
• 从scRNA-seq数据中提取代谢酶的基因表达,并基于酶RNA表达推断细胞内代谢物的存在。代谢物的酶基因信息来自Human Metabolome Database (HMDB)。
• 由于代谢酶的RNA表达水平与代谢物丰度之间的关系通常是非线性的,MEBOCOST并不定量计算代谢物的丰度,而是推断代谢物的存在。
3. 算法整合:
• MEBOCOST集成了几种算法来推断代谢物的存在,包括scFBA、scFEA和COMPASS,分别采用不同的流量平衡分析方法。
• 为了比较这些方法的性能,MEBOCOST使用CCLE数据集,计算推断代谢物与实际代谢组学数据之间的Jaccard指数。结果表明,算术平均和几何平均算法的性能优于COMPASS算法,且与scFEA算法相当,但计算速度更快。因此,MEBOCOST默认使用算术平均算法来推断代谢物的存在。
4. 感应基因表达提取:从scRNA-seq数据中提取感应基因的表达值。
5. 计算通信评分:
• 对于每对代谢物-感应器伙伴和每对细胞类型,计算代谢物-感应器通信评分。具体方法是将发送细胞组中代谢物存在的平均评分与接收细胞组中感应蛋白的平均表达相乘。
• 每对细胞类型将被分配一组通信评分,这些评分是为所有代谢物-感应器伙伴计算的。
6. 显著性评估:
• 为每个代谢物-感应器通信生成一个通信评分的空统计分布,通过对scRNA-seq数据中的细胞标签进行1000次随机排列来实现。
• 进行置换检验以计算通信评分的p值,并使用Benjamini-Hochberg方法校正p值以计算假发现率(FDR)。
结论
MEBOCOST通过整合单细胞RNA表达数据和先验知识,检测发送和接收细胞之间的代谢物-感应器通信。算法使用不同方法推断代谢物的存在,并计算通信评分和显著性,从而识别潜在的细胞间代谢通信。
参考:zhengrongbin/MEBOCOST: A python-based package and software to predict metabolite mediated cell-cell communications by single-cell RNA-seq data (github.com)
MEBOCOST: Metabolic Cell-Cell Communication Modeling by Single Cell Transcriptome | bioRxiv