基因组学系列4:参考转录本数据库MANE

news2024/9/22 4:06:53

1. 参考转录本数据库MANE简介

为了促进临床参照的一致性,美国国家生物技术信息中心( NCBI)和欧洲分子生物学实验室-欧洲生物信息学研究所(EMBL-EBI)合作发布了参考转录本数据库MANE(Matched Annotation from the NCBI and EMBL-EBI),旨在汇集人类基因和转录本注释,并定义一组全基因组的代表性转录本和人类蛋白质编码基因的相应蛋白质。

MANE转录本与GRCh 38参考基因组组装完全匹配,并且是基于生物相关标准(例如转录本表达水平和编码区的保守性)进行选择的。

虽然NCBI的RefSeq 和 EMBL-EBI的Ensembl GENCODE注释具有相似性,但它们在转录水平上可能不同,代表特定剪接结构或编码序列的转录物可能从两个基因组之一缺失。此外,代表相同剪接结构的转录物可能在非翻译区(UTR)的长度上不同,或者由于SNP而具有序列错配。因此,研究人员使用偏好的基因集来设计研究和报告结果,可能会发现很难将他们的工作与科学界的其他人交流。数据资源,如基因组浏览器和变异数据库,也可能使用不同的注释集来表示默认转录本,这可能会导致混淆。NAME转录物在RefSeq和Ensembl/GENCODE注释集中是相同的,当在大多数公共基因组资源中表示时,预计将促进科学界之间更好的沟通和数据交换

NAME网址(提供NCBI和UCSC查看MANE推荐转录本示例):

https://www.ncbi.nlm.nih.gov/refseq/MANE/

2. MANE数据库的MANE select 和 MANE plus Clinical集

MANE的主要集有两个:MANE select 和 MANE plus Clinical;MANE(版本1.0)覆盖了99%的人类蛋白质编码基因和99.8%的临床相关基因。

MANE Select:

MANE Select集是由每个蛋白编码基因的一个代表性转录本组成,经计算机预测和专家组人工审核。该转录本通常作为临床报告的通用标准、基因组浏览器的默认配置等,作为临床报告的最终转录本编号。

MANE select选择流程

MANE Plus Clinical:

MANE Plus Clinical集合包括了一些基因的特殊转录本,考虑到某些基因会组织特异性表达,仅靠MANE Select就不足以报告公共资源中所有的“致病(P)”或“可能致病(LP)”临床变异,因此采用MANE Plus Clinical作为补充。

3. 基因与转录本关系

基因是指DNA上一段编码蛋白质或RNA的序列,而转录本则是从基因DNA序列转录成的RNA序列。一个基因若要发挥功能,需先转录为mRNA,进而转移到细胞质翻译成蛋白。转录过程中mRNA的加工(如选择性剪接、修饰等)可能会产生不同的可供编码蛋白质的成熟mRNA剪接体(即转录本)

一个基因可能会有多个转录本,产生原因包括可变剪切、启动子的选择性使用、选择性起始、核糖体移码等 。

1)选择性剪接(Alternative splicing)

真核生物的基因CDS序列包含内含子(intron)和外显子(exon),两者相互交替,仅外显子能够转录成mRNA。通过选择性剪接可以将同一基因中的外显子以不同方式进行组合,进而形成不同的蛋白质。

2)启动子的选择性使用(alternative promoter usage)

同一个基因可结合不同的启动子,使用不同的启动子产生不同的mRNA转录本,导致产生多种蛋白。

3)选择性起始(alternative initiation)

同一条mRNA中含有多个起始密码子,通常产生的蛋白序列仅在N端有差异。

4)核糖体移码(ribosomal frameshifting)

一种翻译重编码机制,导致核糖体改变其对密码子的读取(即从一个阅读框位移到另一个阅读框),产生不是由mRNA直接编码的蛋白质,或者两种甚至更多种不同的蛋白质。

不同转录本产生的原因中,选择性剪接是研究较早且被广泛认知的,选择性剪接作为发育和组织特异性的调节因子,在组织发育和细胞分化中发挥着重要的作用。

4. MANE文件下载

MANE地址: https://ftp.ncbi.nlm.nih.gov/refseq/MANE/

MANE

# linux下载
# 下载1.3版本 MANE gtf
wget https://ftp.ncbi.nlm.nih.gov/refseq/MANE/MANE_human/release_1.3/MANE.GRCh38.v1.3.ensembl_genomic.gtf.gz

# 搜索BRCA1的第9号exon推荐转录本
zcat MANE.GRCh38.v1.3.ensembl_genomic.gtf.gz|grep BRCA1|grep 'exon_number 9'
# RefSeq:NM_007294.4

查询结果

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2048665.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Python之格式化输出

格式化输出 方法一:用%方法二:用format()函数设置输出的内容的宽度和小数位数 方法一:用% 直接用print()函数对字符串进行输出,是没有进行格式化控制的。 格式化,是对输出内容的显示方式进行设置。 首先,要…

有名管道和信号

3.无名管道 只能用于 亲缘关系 进程间 A.c B.c | | A B 有名管道 fifo:先入先出 创建有名管道:makepipe 1.是一种特殊文件 a.存在于 内存中 b.在系统中,有一个对应的名称 c.看文件的大小 0bytes pathname…

仓颉编程语言入门 -- I/O 流概述

I/O 流概述 一 . 什么是I/O 在仓颉编程语言的设计理念中,与外部实体(如文件系统、网络、用户输入等)的数据交换活动被统称为I/O操作,其中“I”代表输入(Input),而“O”则代表输出(O…

算法打卡 Day22(二叉树)-最大二叉树 + 合并二叉树 + 二叉搜索树中的搜索 + 验证二叉搜索树

文章目录 Leetcode 654-最大二叉树题目描述解题思路 Leetcode 617-合并二叉树**题目描述**解题思路 Leetcode 700-二叉搜索树中的搜索**题目描述**解题思路 Leetcode 98-验证二叉搜索树**题目描述**解题思路 Leetcode 654-最大二叉树 题目描述 https://leetcode.cn/problems/…

Nginx--虚拟机配置

前言:本博客仅作记录学习使用,部分图片出自网络,如有侵犯您的权益,请联系删除 1、什么是虚拟主机 虚拟主机是一种特殊的软硬件技术,它可以将网络上的每一台计算机分成多个虚拟主机,每个虚拟主机可以独立对…

C语言日常练习 Day16

目录 一、求一个3*3的整型矩阵对角线元素之和 二、有一个已经排序好了的数组,要求输入一个数后,按原来排序的规律将它插入数组中 三、输出“魔方阵”,所谓魔方阵是指它的每一行、每一列和对角线之和均相等 一、求一个3*3的整型矩阵对角线元…

3D数据可视化,B/S和C/S架构该如何选择?

针对3D数据可视化的展现形式,有B/S和C/两种架构可以选择,这两者区别是什么,分别有哪些优劣势,又有哪些对应的开发引擎或者软件,该如何选择呢,千汇数据工场通过本文给你讲明白。 一、什么是B/S和C/S模式 在…

DC-6靶机复现

靶机设置 设置靶机为NAT模式 靶机IP发现 nmap 192.168.112.0/24 靶机IP为192.168.112.141 目录扫描 访问浏览器 绑定hosts 再次访问成功 目录拼接 拼接/wp-login.php 发现后台登陆页面 使用webscan扫描 wpscan --url http://wordy -e u 发现了 admin,mark&am…

酷炫时尚未来科技视频开头PR模板MOGRT

这是一个高质量、组织良好、易于定制的pr模板。可以将此模板用于特殊活动、体育揭幕战、演示视频、快速和最小的企业促销。创建旅行介绍、干净的幻灯片、派对开场白和动态幻灯片。为YouTube、Vimeo或其他媒体托管网站创建视频。制作自己的杂志演示卷,展示你的作品集…

qt-13 进度条(模态和非模态)

进度条-模态和非模态 progressdlg.hprogressdlg.cppmain.cpp运行图模态非模态 progressdlg.h #ifndef PROGRESSDLG_H #define PROGRESSDLG_H#include <QDialog> #include <QLabel> #include <QLineEdit> #include <QProgressBar> #include <QCombo…

闲鱼卖1000元的带腾讯备案的 gaapqcloud.com.cn 域名低成本获取方法!

最近在闲鱼看到有人卖域名&#xff0c;声称是腾讯的备案&#xff0c;还卖1000多元&#xff01;逆天了&#xff01;这个信息差是真能割韭菜&#xff0c;我一查&#xff0c;这不就是腾讯云的全球应用加速域名吗&#xff1f;&#xff1f;&#xff1f;&#xff1f;&#xff1f;这样…

嵌入式day30

管道 --- 半双工通信方式 单工 //广播 --- 单一方向的数据通道 半双工 //对讲机 --- 同一时刻 只能有一个方向 全双工 //手机电话 --- 同一时刻两个方向都可以通信 无名管道 只能用于 亲缘关系进程间 有名管道 是一种特殊的文件 1.存在于 内…

GNN(一)

一、GNN应用领域 芯片设计 场景分析与问题推理 道路交通&#xff0c;动态流量预测 知识图谱 化学医疗等场景 物理模型相关 二、图的基本组成 利用神经网络的目的就是整合特征 图的邻接矩阵 每个像素点周围都有邻居 GAN中数据格式不固定&#xff0c;例如社交网络中人物关…

Processing练习之自动绘制

案例代码如下&#xff1a; import processing.pdf.*; import java.util.Calendar; boolean savePDF false; int maxCount 5000; int currentCount 1; float[] xnew float[maxCount]; float[] ynew float[maxCount]; float[] rnew float[maxCount]; void setup(){ siz…

可视化工具VOFA数据格式介绍

目录 概述 1 认识VOFA 1.1 VOFA特点 1.2 应用简介 2 数据格式介绍 2.1 FireWater格式 2.2 JustFloat格式 概述 本文主要介绍使用可视化工具VOFA打印数据的方法&#xff0c;该工具可以支持字符串类型和float类型的数据可视化操作&#xff0c;使用者只需按照协议要求填充数…

C++ stack、queue、priority_queue【介绍、常用接口、模拟实现】

0.容器适配器 0.1什么是适配器 适配器是一种设计模式&#xff0c;该种模式是将一个类的接口转换成客户希望的另外一个接口。 0.2 STL标准库中stack和queue的底层结构 虽然stack和queue中也可以存放元素&#xff0c;但在STL中并没有将其划分在容器的行列&#xff0c;而是将其…

RabbitMQ 消息可靠保障

RabbitMQ 消息可靠保障 消息的可靠性保证生产端到交换机和队列的可靠性保障解决思路A-确认机制解决思路B-备份交换机 MQ 服务器宕机导致消息丢失消费端消息的可靠性保障 消费端限流 消息的可靠性保证 实际项目中 MQ 的流程一般是&#xff1a;生产端把消息路由到交换机&#xf…

树 状 数 组

可差分信息&#xff1a;如果知道部分的信息&#xff0c;用整体的信息和部分的信息就可以求出剩余部分的信息&#xff0c;那么这个信息是可差分的 P3374 【模板】树状数组 1 - 洛谷 | 计算机科学教育新生态 (luogu.com.cn) #include <iostream> #include <vector> u…

【微信小程序】微信小程序开发前的准备

在正式开发微信小程序之前&#xff0c;需要先进行开发前的准备工作&#xff0c;包括&#xff1a; 注册微信小程序开发账号获取微信小程序AppID安装微信开发者工具创建微信小程序项目 一、注册微信小程序开发账号 1. 点击注册按钮 使用浏览器打开 https://mp.weixin.qq.com/…