CBM|用于lncRNA-疾病关联预测的数据资源和计算方法(综述)
最近搞了个公众号《AI and Bioinformatics》介绍应用于生物信息学的人工智能算法和研究进展,以及网络表示学习算法研究,欢迎向本公众号投稿文献解读类原创文章,可以是自己or自己组的论文,也可以是阅读觉得不错的论文。投稿邮箱:nan_sheng@yeah.net
今天给大家介绍我们最近接收的一篇关于lncRNA-疾病关联预测的综述文章,来自吉林大学黄岚教授、王岩教授大数据智能团队在期刊《Computers in Biology and Medicine》发表题为“Data resources and computational methods for lncRNA-disease association prediction”的论文。
简介
由于lncRNA在基因组调控中的多种功能作用,通过预测lncRNA-disease association (LDA)来破译潜在的疾病发病机制越来越引起人们的兴趣。同时,计算模型和算法有利于系统的生物学研究,甚至有助于经典的生物学实验过程。在这篇综述中,我们介绍了与lncRNA相关的代表性疾病,如癌症、心血管疾病和神经系统疾病。目前公开的lncRNA与疾病相关的资源(常用数据库)也被纳入。此外,收集了2013-2022年存在的64种LDA预测计算方法(当时2022年初开始投稿,一波三折后最近才被接收,一些2022年最新文章未提及,后面会定期在github中更新)被分为5组,包括基于机器学习的方法、基于网络传播的方法、基于矩阵分解和补全的方法、基于深度学习的方法和基于图神经网络的方法。讨论了LDA预测中常用的评价方法和指标。最后讨论了LDA预测面临的挑战和未来的发展趋势。LDA预测方法的最新进展已在GitHub知识库https://github.com/sheng-n/lncRNA-disease-methods中进行了总结。
Data resources
Computational methods for LDA prediction
个人总结
考虑到上一篇关于lncRNA-疾病关联预测的综述还是中国矿业大学陈兴老师在2017年在BIB发表的,最近几年该领域的方法可以说是快速增长,特别是基于深度学习和图神经网络的文章。因此,我们的最初目的主要还是想对目前存在的lncRNA-疾病关联预测方法作一个全面的总结,并把他们放在github中,方便相关研究人员查找相关领域进展。当然我们对计算方法的分类及对每种方法的描述还有不足和瑕疵(比如对每种方法的描述过于简单,未给出关键公式等)。
我们当时还从2019-2021年计算方法论文中的案例研究章节查找了预测出来的7种疾病相关lncRNAs候选(截至目前还未被相关文献验证)。查找过程中也会发现一些当时未经过验证的lncRNAs候选,最近两年被湿实验验证,如文中提到的:
当然还有一些其他例子,文中就没有一一列举。当时做这件事的目的还是说想让计算科学家预测出来的结果,能够真正服务到生物科学家使用(当然也知道想的太简单)。后来因为审稿人觉得综述文章不应该出现案例研究(可能也是因为当时标题起的不好,就叫Case studies)就把该部分内容给删除了。但是,当时总结的结果还是提供在github中,如下图所示。(后续我们也会维持更新该列表)
由于也是初次写综述,对于该方向面临的挑战和未来展望部分描述不是很准确和贴切,我们在后面其他方向的相关综述文章中也做了一些改进。此贴仅记录一下自己写这篇文章时的一个感受,欢迎批评和指出不足。
参考资料:
Sheng N, Huang L, Lu Y et al. Data resources and computational methods for lncRNA-disease association prediction, Computers in Biology and Medicine 2023:106527.
文章地址:
https://doi.org/10.1016/j.compbiomed.2022.106527
Github地址:
https://github.com/sheng-n/lncRNA-disease-methods