70万个哺乳动物功能基因集!这个数据库值得重视

news2024/12/24 2:38:10

生信碱移

Rummagene数据库

Rummagene 从 PubMed Central (PMC) 出版物提取了超70万个基因集,用于各类基因功能关联注释。

组学技术的引入逐渐将生物和生物医学研究从研究单个基因和蛋白质转向研究基因集、基因簇、分子复合物和基因表达模块。许多生物医学和生物研究产生并发布基因和蛋白质集。例如,来自转录组学和蛋白质组学检测的差异表达基因和蛋白质、被确定为与表型相关的基因组变异相关的基因、通过ChIP-seq实验确定的转录因子靶基因、差异磷酸化蛋白质组学中识别的蛋白质、来自CRISPR筛选的与细胞表型相关的基因。这些研究生成基因集非常有价值,但并不常被重复使用。这种缺乏重复使用的情况部分是因为在出版物中提交基因集没有标准,并且没有明确的数据库用于存放这些基因和蛋白质集。因此,关于基因集功能注释的潜在有用信息被埋藏在以PDF、Excel、CSV或Word文件格式存储的支持材料表格中。

图片

▲ 上图展示了PMC数据库索引的大量基因集相关文献。

为此,来自美国西奈山伊坎医学院的研究学者开发了一个数据库Rummagene,于今年4月份发表于Communications Biology[IF:5.6],可以从PubMed Central (PMC) 的学术出版物中批量提取超十万个基因集。Rummagene包含一个软机器人,可以扫描PMC上所列出版物的辅助材料,并且不断更新资源。通过爬取PMC中的5,448,589篇文章,Rummagene服务器目前提供了对数十万个哺乳动物基因集的访问。这些被埋没的基因集,可用于富集分析、自由文本和表格标题搜索。通过研究Rummagene数据库中的统计模式,作者证明Rummagene可以用于转录因子和激酶富集分析,以及基因功能预测。

图片

▲ DOI: 10.1038/s42003-024-06177-7

Rummagene数据库提供了多种基因集检索/富集功能,小编接下来会做一个简单的介绍,感兴趣的铁子可以进入官网试试:

  • https://rummagene.com/

功能一: 基因集搜索

点进Rummagene主页显示的便是Gene set search模块,下图中可以看到该数据库目前一共收录了748,657个基因集,左下的白框中输入自己的基因集即可富集与之相关的功能。

图片

▲ 直接输入自己的基因集进行检索,不需要指定物种,会自行检索与之相交的基因集。

图片

▲ 小编的检索结果如上,可以看到显著富集了一万多个基因集,其中附上了每个基因集的来源文献。确实够猛,这些文献估计也是重量级(与感兴趣基因集相关的研究)。

功能二: PMC搜索

PMC search模块下,输入任意关键词检索PMC数据库中文献,并从返回的文献中提取相关的基因集文件。

图片

▲ 检索与Ⅱ型糖尿病相关的基因集。

图片

▲ 检索结果如上,可以看到展示了282个Ⅱ型糖尿病相关的文章。点击

图片

符号后出现VIEW GENE SET选项,提示该文章提供了11个相关基因。

图片

▲ 点击上一张图显示的VIEW GENE SET选项,即可看到每个基因的详细介绍。

功能三: 基因集名称检索

Table title search模块下,输入任意关键词,在基因集名称中进行匹配以查找相关基因集。

图片

▲ 这里检索与CRISPR相关的基因集。

图片

▲ 检索结果如上,其实与上一个功能的区别不大,只不过是限定标题检索(看红线)。

功能四: 基因集的下载

Download模块下,可以下载以gmt格式提供的所有基因集文件,用于大批量基因集分析。

图片

▲ 作者对可供下载的基因集集合进行了分类。latest.gmt 是汇总的文件,包含 748,657 个基因集,提供了最新的通用注释。Rummagene_transcription_factors.gmt.gz 和 Rummagene_kinases.gmt.gz 分别是转录因子和激酶相关的基因集,适用于研究基因调控和信号转导。random50k_co-occurrence.f.gz 包含基因相关性分析的数据,可以用于揭示基因间的关联。更多的介绍信息可以看看发表这个数据库发表的文章。

感觉还是蛮有意义的 

作为网药、疾病相关基因的备用数据库;

筛选自己研究潜在的相关文献;

找小众的疾病基因集;

看多个疾病的基因关联;

头脑风暴一下还有很多应用

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2103451.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

log4j 清除MDC上下文 MDC分类日志

在项目里需要分类收集处理日志信息,使用 log4j的MDC在线程中添加分类信息。不过最近却出现日志信息记录错误的情况,具体来说,就是会出现本来是属于下一个分类的一部分信息莫名的记录到上一个分类的日志文件中了。这很显然是MDC信息错误造成的…

【nnUNet】环境安装

很高兴在雪易的CSDN遇见你 VTK技术爱好者 QQ:870202403 公众号:VTK忠粉 前言 本文分享医疗分割模型nnUNet的环境安装教程,希望对各位小伙伴有所帮助! 感谢各位小伙伴的点赞关注,小易会继续努力分享&#xff0…

数据中台 | 数据智能平台产品系列文章,企业开发和盘活数据资产的利器!(上篇)

引言 发展数字经济,实现数字中国是我国的国家战略,坚定且不可动摇,近期随着《数据二十条》、《“数据要素”三年行动计划》、《关于加强数据资产管理的指导意见》等重磅政策的发布,使数字化转型成为越来越多企业增强竞争、扩大营收…

LabVIEW程序员错误排查思路

当LabVIEW程序员在开发过程中遇到难以解决的错误且网上搜不到答案时,需要采取系统性的方法进行排查和解决。这包括回顾代码逻辑、深入理解LabVIEW的底层机制、参考专业文献和求助社区等方式。下面将从多角度详细解读专业程序员在面对这种困境时的应对策略&#xff0…

【系统分析师】-面向对象方法

目录 1、基本概念 2、UML 2.1、基本结构 2.1.1.构造块 2.1.1.1、事物 2.1.1.2、关系 2.1.1.3、图形 2.1.2.规则 2.1.3.公共机制 2.2、41视图 3、面向对象分析OOA 3.1、用例模型 3.2、分析模型 4、面向对象设计OOD 4.1、细分 4.2、设计原则 5、面向对象的程序设…

一字线模组厂家的选择与使用技巧

在当今自动化与智能制造的浪潮中,一字线模组作为精密定位与传输的核心部件,其性能与质量直接关系到整个生产线的效率与稳定性。因此,选择合适的一字线模组厂家并掌握其使用技巧,对于提升企业竞争力至关重要。接下来我们跟着鑫优威…

四、配置三层交换实验组网

一、实验拓扑 二、实验目的 通过配置交换机&#xff0c;令不同vlan间的主机能够互相通信 三、实验步骤 SW12 <Huawei>undo terminal monitor Info: Current terminal monitor is off. <Huawei>system-view Enter system view, return user view with CtrlZ. [H…

Spring 学习笔记

概述 Spring 是一个企业级 J2EE 应用开发一站式解决方案&#xff0c;其提供的功能贯穿了项目开发的表现层、业务层和持久化层&#xff0c;同时&#xff0c;Spring 可以和其他应用框架无缝整合 Spring 的特性包括以下几个方面&#xff1a; 轻量&#xff1a;Spring 是一个轻量…

CISAW软件安全开发模型的核心思想

在软件安全开发的领域中&#xff0c;采用的模型与信息安全保障体系紧密相连&#xff0c;它们共同构成了一个坚实的防御机制。 这种模型不仅注重程序、数据和文档三个实体对象的全生命周期管理&#xff0c;还强调实现这些对象的可用性、完整性、真实性、机密性和不可否认性等关…

Cesium 展示——绘制等值线图

文章目录 需求分析资料需求 分析 首先需要开启地形数据 开启方式见:地形开启否则会遇到以下问题直接上实例代码export function getPoints

mysql 8.0 的 建表 和八种 建表引擎实例

文章目录 MySQL 8.0 中&#xff0c;主要有以下八种常见的建表引擎一、InnoDB 引擎建表注意点建表知识点 二、MyISAM 引擎建表使用场景 三、Memory 引擎使用场景 四、Archive 引擎五、BLACKHOLE 引擎一、特点二、适用场景三、注意事项 六、MRG_MyISAM 引擎MRG_MyISAM 和 MyISAM …

Echarts可视化

echarts是一个基于javascripts的开源可视化图表库 画图步骤&#xff1a; 1.引入echarts.js文件 <script src" https://cdn.jsdelivr.net/npm/echarts5.5.1/dist/echarts.min.js"></script> 也可将文件下载到本地通过src引入。 2. 准备一个呈现图表的…

spring boot3框架@Validated失效

项目中使用的springboot3.2.1,在使用Validated校验controller里参数时始终不生效&#xff1b;在网上查了相关资料&#xff0c;添加了spring-boot-starter-validation依赖但还是不行 经过层层调试&#xff0c;终于发现问题&#xff1b; springboot3添加Validated后校验的是 ja…

唯众2024年高职云计算实训室方案解读

一、引言 1.1 云计算技术的发展背景 云计算技术自本世纪初开始迅速发展&#xff0c;已经成为信息技术产业的重要组成部分。随着数据量的爆炸性增长和互联网技术的不断进步&#xff0c;云计算提供了灵活、可扩展的计算资源&#xff0c;为企业和个人用户提供了按需使用计算资源…

设计模式 -- 观察者模式(Observer Pattern)

1 问题引出 1.1 天气预报项目需求 气象站可以将每天测量到的温度&#xff0c;湿度&#xff0c;气压等等以公告的形式发布出去(比如发布到自己的网站或第三方)。 需要设计开放型 API&#xff0c;便于其他第三方也能接入气象站获取数据。 提供温度、气压和湿度的接口 测量数据…

C语言指针进阶二:(函数指针数组,转移表)

函数指针数组 函数指针数组就是存放函数指针的一个数组&#xff0c;数组里都是函数指针&#xff0c;那么该怎么定义: int (*parr[10])(); 因为 [] 的优先级高于 * &#xff0c;所以parr先与 [] 结合说明是一个数组&#xff0c;元素类型是 int(*)() 的函数指针。 函数指针…

Tool-SQL:基于Agent智能体的Text2SQL解决方案,显著提升Text2SQL效果

Tool-SQL&#xff1a;基于Agent智能体的Text2SQL解决方案&#xff0c;显著提升Text2SQL效果 近期&#xff0c;Text-to-SQL 技术通过整合数据库系统的反馈&#xff0c;有效利用了大型语言模型&#xff08;LLMs&#xff09;。尽管这些技术能有效纠正 SQL 查询的执行错误&#xff…

计算机工具软件安装攻略:Visual Studio Code下载

Visual Studio Code下载、安装和使用 1 Visual Studio Code简介 Visual Studio Code通常简称为VS Code&#xff0c;是一款由微软开发的免费、开源的轻量级代码编辑器。它在开发者社区中非常受欢迎&#xff0c;具有强大的功能和扩展性&#xff0c;适用于多种编程语言和开发场景…

文章解读与仿真程序复现思路——中国电机工程学报EI\CSCD\北大核心《考虑极端事件的电力系统惯量与一次调频备用联合规划配置方法》

本专栏栏目提供文章与程序复现思路&#xff0c;具体已有的论文与论文源程序可翻阅本博主免费的专栏栏目《论文与完整程序》 论文与完整源程序_电网论文源程序的博客-CSDN博客https://blog.csdn.net/liang674027206/category_12531414.html 电网论文源程序-CSDN博客电网论文源…

统计学习与方法实战——统计学习方法概论

统计学习方法概论题 统计学习方法概论实现统计学习方法的步骤统计学习方法三要素模型策略损失函数与风险函数定义 常用损失函数经验风险最小化(ERM)与结构风险最小化(SRM) 模型评估与模型选择过拟合与模型选择 正则化与交叉验证泛化能力生成模型与判别模型生成方法判别方法 最小…