科普篇 | 如何查找参考基因组信息

news2024/11/29 0:49:11

前   言

很多老师会发现,高通量测序后需要生信分析的过程中,需要填写一个信息分析表。而信息分析表中有一个对生信分析很重要的信息——基因组文件及注释文件。通常这类文件我们都是需要老师提供对应的下载链接,以便于生信直接利用这个链接去下载数据进而做分析,这样做的目的主要是为了避免公司分析使用的基因组信息不是老师研究的物种(同一物种不同属有不同的基因组)或者研究的版本(基因组版本经常会更新,但是不同版本的注释文件略有差异,尽量不要用来进行联合分析)。因此,老师自己去寻找对应的基因组注释信息以及提供对应的下载链接就显得很重要啦~而这类信息很多老师都不知道该怎么去寻找并提供。

参考基因组的注释信息通常需要基因组文件(genome.fa)、基因结构注释文件(gene annotation.GFF)以及蛋白注释文件(pep.fa)。相关文件具体内容及展现形式可参考如何填写测序项目信息分析表?。在此,爱基百客基于比较常见的数据库NCBI和Ensembl(除此之外还有Encode、UCSC、CNCB、或者针对某类物种单独的数据库如BRAD等,老师们选择自己常用的即可),今天我们对参考基因组注释信息的查找做了一个简单的介绍,有需要的老师可以参考一下。

01  NCBI

网址:https://www.ncbi.nlm.nih.gov/

以人(human,homo Sapiens)为例

1. 打开NCBI,在搜索栏输入homoSapiens(或human,优先选拉丁名),Database选择genome,点击search。

图片

2. NCBI会弹出一个新页面,可以看到目前NCBI最为推荐(通常为最新,用【√】标注)以及以前的基因组相关信息。包含基因组名称、Genbank编号、物种、可能存在的特定品系、基因组组装水平(优先选择chromosome)、基因组出现时间等等。

图片

图片

3. 以最新推荐的GRCh38.p14为例,点击右边的Action,可链接到下载页面或基因组细节。

图片

  • 3.1 下载对应基因组文件

点击Download,直接下载下图红框内三个文件即可。注意,有些基因组可能只能下载genome.fa,对应注释文件可能未开放下载,这种要考虑更新基因组或更换数据库。

图片

  • 3.2 提供下载链接(如填写爱基百客分析表)

点击View Detail,到达基因组详细页面,直接复制网页链接;或者(更为推荐)点击页面内FTP,到达文件下载页面,找到对应文件后右键选择复制

图片

图片

图片

某信息分析表参考基因组注释示例:

图片

02 Ensembl

动物组网址:http://ensembl.org/index.html

植物组网址:http://plants.ensembl.org/index.html

细菌组网址:http://bacteria.ensembl.org/index.html

真菌组网址:http://fungi.ensembl.org/index.html

以动物的页面为例:

1. 基因组查找

(1)打开Ensembl官网,像人、小鼠和斑马鱼这类的常用模式物种,我们可以直接点进去查看基因组信息。

图片

(2)若ensembl数据库中有收录我们要查找的物种基因组,点击view full list of all Ensembl species,我们可以在list中找到我们关注的物种。

图片

(3)如果需要寻找最新基因组,还可以找到FTP的页面,直接去ensembl最新的release版本里去搜索物种拉丁名(针对于非常规物种最为方便)

图片

图片

图片

2. 找到具体物种基因组后,需要接着找到其对应注释信息,以homo sapiens为例:

(1)基因组genome.fa:

图片

图片

(2)基因结构注释文件gff:

图片

(3)蛋白注释文件pep.fa:

图片

同样也是将复制链接地址或者直接下载。

备   注

由于生信分析需要参考基因组信息,而正确的参考基因组链接对生信进行数据的下载以及后续的分析极为重要,因此,老师提供正确的参考基因组下载链接是很有必要的。

在爱基百客的信息分析表附录中,会包含部分物种是我们已经收录的,如包含老师想研究的物种及对应版本,可直接将附录中的链接复制粘贴进信息分析表的表格中。

图片

若没有老师想研究的物种及基因组版本,或老师有额外想要提供的其他参考基因组信息时,为避免产生因后续多次沟通基因组信息从而拉长生信分析周期等问题,请务必粘贴正确的“genome.fa;genome.gff以及pep.fa”文件的下载链接。

除“NCBI”和“Ensembl”数据库外,有时候还会有一些其他的数据库,如“TPIA”、“Phytozome”、“Encode”、“UCSC”等,也是可以提供对应基因组注释信息的。老师们只要把对应正确的参考基因组注释文件的下载链接复制粘贴进信息分析表的表格,我们就可以进行下载分析。

祝各位老师科研顺利~

图片

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2062294.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Git介绍及配置

目录 Git GitHub GitLab Gitee 配置Git 安装git 初次运行 Git 前的配置 注册一个代码托管平台 用户信息 获取 Git 仓库 初始化仓库 克隆现有的仓库 https方式: ssh方式: 上传本地项目至Git仓库 https方式 ssh-key方式 添加个人公钥​ …

【python】PyQt5中的QFrame控件,控制图形的边框样式、阴影效果、形状等属性

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,…

【Redis】Redis 底层的数据结构(结合源码)

众所周知,Redis 是一个高性能的开源内存数据库,支持多种数据结构(如字符串、哈希、列表和集合),提供持久化选项以确保数据安全,并具备高可用性和分布式功能。 下面我们就来了解一下其底层所使用到的数据结…

包装类和简单泛型

一、包装类 在Java中,由于基本类型不是继承自Object,为了在泛型代码中可以支持基本类型,Java给每个基本类型都对应了一个包装类型。 1.1 基本数据类型和对应的包装类 注意:除了 Integer 和 Character, 其余基本类型的…

微信怎么恢复好友?找回失联好友,5个有效方法奉上!

微信,这个我们日常沟通不可或缺的工具,但有时会因为一些小疏忽,让我们不小心与好友失去了联系。可能是误删了好友,也可能是换了手机没来得及备份,导致那些熟悉的面孔从列表中消失。 那么,微信怎么恢复好友…

软件设计师全套备考系列文章9 -- 算法设计与分析

软考-- 软件设计师(9)-- 算法设计与分析 文章目录 软考-- 软件设计师(9)-- 算法设计与分析前言一、章节考点二、分治法三、回溯法四、贪心法五、动态规划法 前言 考试时间:每年5月、11月,软件设计师每年都…

当《黑神话:悟空》中的天命人,被AI换脸成老外…

前言 挡不住,根本挡不住! 《黑神话:悟空》,这款由游戏科学公司制作的, 以中国神话为背景的角色扮演游戏,8月20日一上线, 就连续霸榜Steam、WeGame 等平台销量榜首, 肉饼的朋友圈…

软件测试学习笔记丨多表查询及子查询

本文转自测试人社区,原文链接:https://ceshiren.com/t/topic/31940 一、多表简介 定义:结合两个或多个表来执行SQL数据库操作,这通常涉及到一个或多个表的关联,基于某些共享的列(通常是键)之间…

C++面试基础系列-polymorphic多态性

系列文章目录 文章目录 系列文章目录C面试基础系列-polymorphic多态性Overview1.polymorphic多态性2.编译时多态的实现示例代码:函数重载示例:运算符重载示例:模板示例: 3.运行时多态的实现示例代码 4.编译时多态的优点关于作者 C…

高校考勤小程序的设计与实现---附源码131039

摘 要 随着计算机的发展及网络技术的应用,当今社会正快速向信息自动化社会前进,信息自动化的作用也闲的的尤为重要,特别是各行业的管理领域,智能化信息处理已是提高效率、规范管理、客观审查的最有效方法。近年来,随着…

双模显示器是什么?原来是可变化的显示屏

随着科技的进步和人们对高品质视觉体验需求的增加,显示技术正在经历一场深刻的变革。近年来,双模显示器逐渐引起了广泛关注,成为显示器设计的新趋势。那么什么是双模显示器呢?它都有哪些优势?下面就一起来了解一下。 …

C++学习笔记----4、用C++进行程序设计(三)---- 类间关系

作为一名程序员,会不可避免地碰到不同的类具有相同的特点,或者看起来相互之间有一定的关系。面向对象的编程语言提供许多技术来处理类间的这种关系。比较令人迷惑的部分就是理解 这些关系到底是什么?有两种主要的类间关系--复合关系&#xff…

【三维语义分割模型】PAConv

【版权声明】本文为博主原创文章,未经博主允许严禁转载,我们会定期进行侵权检索。 参考书籍:《人工智能点云处理及深度学习算法》 本文为专栏《Python三维点云实战宝典》系列文章,专栏介绍地址“【python三维深度学习】python…

780nm扫地机器人模组出现质量问题怎么检测?

随着智能家居的普及,扫地机器人已成为现代家庭不可或缺的清洁助手。其中,780nm扫地机器人模组作为扫地机器人的核心部件之一,其质量和性能直接影响到扫地机器人的整体表现。然而,在使用过程中,有时会遇到模组出现质量问…

无线领夹麦克风怎么挑选?选购领夹麦克风必看的五大智商税!

在数字音频技术飞速发展的今天,无线领夹麦克风已经不再是遥不可及的奢侈设备,而逐渐成为普通人记录生活、录制音视频、乃至直播互动的得力助手。但如今市面上的麦克风多到让眼眼花缭乱,对于一些没有经验的新手小伙伴,更是不知从何…

以简单的例子从头开始建spring boot web多模块项目(二)-mybatis简单集成

继续使用以简单的例子从头开始建spring boot web多模块项目&#xff08;一&#xff09;中的项目进行mybatis集成。 1、pom.xml文件中&#xff0c;增加相关的依赖包的引入&#xff0c;分别是mybatis-spring-boot-starter、lombok、mysql-connector-java 如下&#xff1a; <d…

python实用教程(二):安装配置Pycharm及使用(Win10)

上一篇&#xff1a;python实用教程&#xff08;一&#xff09;&#xff1a;安装配置anaconda&#xff08;Win10&#xff09;-CSDN博客 1、简介及下载 PyCharm是一款功能强大的 Python 编辑器&#xff0c;具有跨平台性。是Jetbrains家族中的一个明星产品。 下载地址&#xff…

Nacos漏洞检测总结

弱口令 默认账号密码 nacos/nacos POST /nacos/v1/auth/users/login HTTP/1.1 Host: xxxx:8848 Connection: keep-alive Content-Length: 29 Accept: application/json, text/plain, */* User-Agent: Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like…

高效分页策略:掌握 LIMIT 语句的正确使用方法与最佳实践

本文主要介绍limit 分页的弊端及线上应该怎么用 LIMIT M,N 平时经常见到使用 <limit m,n> 合适的 order by 来实现分页查询&#xff0c;这样做到底性能如何呢&#xff1f; 先来简单分析下&#xff0c;然后再实际验证一下。 无索引条件下&#xff0c;需要做大量的文件排…

代码随想录 刷题记录-13 回溯(2)组合问题

在这里涉及到的回溯中的抽象树&#xff0c;都是“选哪一个元素”的思想。 1.第77题. 组合 回溯法就用递归来解决嵌套层数的问题。 把组合问题抽象为如下树形结构&#xff1a; 可以看出这棵树&#xff0c;一开始集合是 1&#xff0c;2&#xff0c;3&#xff0c;4&#xff0c; …