异质性,或更具体地说,病变组织中的不同的细胞群,是许多复杂疾病治疗失败的主要原因(如癌症、阿尔茨海默症、中风和COVID-19等),也是精准医疗成功的主要障碍。近年来,单细胞技术,特别是单细胞RNA测序(scRNA-seq)技术取得了重大进展,能够以高分辨率分析细胞间异质性,在理解乳腺癌、肝癌和COVID-19等疾病机制方面取得了许多突破。然而,它在精准医疗方面的潜力还没有完全发挥出来。
来自:ASGARD is A Single-cell Guided Pipeline to Aid Repurposing of Drugs
药物再利用(也称为药物重定位、或重分配)是一种在原始医学批准或调查范围之外识别新药用途的策略。到目前为止,很少有人利用scRNA-seq数据中包含的高价值信息开发药物重定位方法。Alakwaa等人的pipeline识别特定细胞簇的显著差异基因(DEGs),然后使用CLUE平台预测DEGs的候选药物,然后使用综合排名评分系统对这些药物进行优先级排序。利用scRNA-seq数据,该pipeline识别didanosine是一种潜在的COVID-19治疗药。Guo等人的pipeline使用了scRNA-seq分析工具Seurat和CLUE的简单组合,识别了281种FDA批准的可能有效治疗COVID-19的药物。
- 上述pipeline为患者体内的每个细胞簇预测药物。然而,在由多种类型细胞引起的异质性疾病中,有效的药物应该能够处理多个细胞簇。上述两种pipeline都不能预测多种细胞簇的药物,限制了它们在精准医疗时代的应用。
前置内容
- p值与FDR:在假设检验中,我们设立零假设 H 0 H_{0} H0,以及对应的非零假设,在假设 H 0 H_{0} H0成立的前提下,计算 H 0 H_{0} H0发生的概率,若概率很低,则可以拒绝零假设。但是对于多次试验,又称多重假设检验,我们不关注每一次假设检验的准确性,而是需要控制在作出的多个统计推断中犯错误的概率,即FDR。FDR衡量的是在进行多次统计推断后,在所有判定结果里,有多大比例是误判的。因此,需要FDR校正p值。
- L1000数据集:包含1400000个基因表达谱,涉及50个人类细胞系对不同浓度范围内20000种化合物之间的反应。
作者提出ASGARD,使用scRNA-seq数据,ASGARD通过充分考虑患者的细胞异质性进行药物重定位治疗疾病。在ASGARD中,根据在患病细胞和正常细胞之间一致表达的 “anchor” 基因,患者样本中的每个细胞簇都与正常(或对照)样本中的细胞簇配对。然后导出scRNA-seq数据中患病和正常成对簇之间的差异表达(DE)基因(adjusted p value< 0.05),其中,DE检测方法由用户选择。为了识别每种簇(细胞类型)的对应药物,ASGARD使用这些一致差异表达的基因作为输入,以识别能够显著(单簇FDR < 0.05)逆转其在L1000药物反应数据集中表达水平的药物。为了识别用于多个细胞群的药物,ASGARD定义了一个药物评分来评估用户选择的多个细胞群的药物疗效。药物评分通过考虑细胞类型比例,药物治疗在每个选定的细胞簇中逆转差异基因表达(单簇FDR)的显著性,以及药物治疗在每个选定的细胞簇中可以逆转的显著去调控基因的比例(adjusted p value< 0.05)来评估药物疗效。最后,ASGARD使用药物评分对该疾病的药物进行排名和选择。
- ASGARD的pipeline。