NGS基因测序(panel)报告解读数据库汇总

news2024/9/20 1:05:26

今天我们来梳理一下肿瘤基因报告解读常见的数据库,大家有机会可以自己查询并且解读,涉及到的数据库有dbSNP数据库 、gnomAD数据库、ExAC数据库、1000 Genomes、HGMD 数据库、OMIM数据库、ClinVar数据库、InterVar数据库 、ClinGen数据库、GeneReviews数据库、HPO数据库、NCBI Gene数据库、UCSC Genome Browser、OncoKB、COSMIC、TCGA、HGVS、DECIPHER、esp6500、Cancer Gene Census数据库,Familial Cancer Database数据库、intOGen数据库,真的是非常多,我们一个一个来了解一下。

人群数据库

dbSNP数据库(https://www.ncbi.nlm.nih.gov/snp/)

dbSNP是由NCBI提供的,在这个数据库,可以查看是否有人已经发现了你的变体。dbSNP不仅包含SNPs(单核苷酸多态性),还有很多其他的变异,如短删除、插入和多核苷酸多态性。dbSNP中的数据有两种主要类型:由用户提交,可以通过“提交的SNP”(ss)标识符来识别;由多个提交的数据和来自其他来源的数据组合而成的数据,可以通过“reference SNP” (rs)标识符识别。
在这里插入图片描述
如上图所示,dbSNP提供了关于变异体的大量信息,将显示任何可用的rs。以BRCA2为例,dbSNP不仅给出了一些基本信息,例如命名法、有机体或分子类型,而且它还列出了PubMed中关于该变体的引用,并提供了指向所有引用文章的直接链接。在中间的列中,可以找到更多的分类信息,比如MAF/Minor Allele Count, MAF是一个等位基因在人群中发生的频率。在第三栏中,会发现人类基因组变异学会(HGVS)的名字,根据不同的术语来识别正在研究的基因。

gnomAD数据库(http://gnomad.broadinstitute.org)

基因组聚合数据库 (Genome Aggregation Database, gnomAD)是一个致力于从各种大规模测序项目中收集和协调外显子组和基因组测序数据,并为更广泛的科学界提供汇总数据的研究者联盟。

外显子组聚合联盟 (Exome Aggregation Consortium, ExAC)是gnomAD的前身(第一个发布版),包含了大量自有的人类外显子组数据。

gnomAD(v3.1.1)基于GRCh38,其中短变异(short variant)数据集涵盖了76,156个互不相关个体的基因组测序数据,是各种疾病特异性研究和群体遗传研究的一部分。

gnomAD(v2.1.1)基于GRCh37,其中短变异数据集涵盖了125,748个外显子和15,708个基因组,这些基因组来自作为各种疾病特异性研究和群体遗传研究的一部分的不相关的个体,总计141,456个。

gnomAD是目前最大的人群频率数据库。这些数据来源于各种疾病研究项目及大型人群测序项目。数据库包含基因的基本信息(基因名称、包含的变异位点个数、其他数据库的链接等);覆盖度信息(外显子测序的数据和全基因组测序的数据) 。

ExAC数据库(http://gnomad.broadinstitute.org)

ExAC数据库的全称是(the Exome Aggregation Consortium),外显子组整合数据库,是gnomAD数据库的第一个版本,只包含了外显子测序的数据,该数据库旨在汇总和协调各种大规模测序项目的外显子组测序数据,并为科学界提供更广泛的摘要数据,该数据库已被整合到gnomAD数据库。

1000 Genomes(https://www.internationalgenome.org/)

1000 Genome Project 的目标是发现在人群中频率大于1%的变异位点,对来自不同人群的大量样本进行测序,识别到了许多的变异位点,为人类遗传变异的研究提供了一个综合的资源。

疾病数据库

HGMD 数据库(http://www.hgmd.org)

HGMD 是人类遗传性疾病突变位点金标准数据库,通过遗传咨询专家阅读高质量的文献,收集和整理相关变异位点信息构建。该数据库提供变异位点对应的转录本、变异类型、致病性、相关表型、参考文献、人群频率、功能预测、结构域等信息。

HGMD专业版提供变异位点对应的HGVS编号、蛋白质的变化、等级分类、Hg19和Hg38基因组坐标、蛋白结构域、人群频率、软件预测结果等。
在这里插入图片描述

OMIM数据库(https://www.ncbi.nlm.nih.gov/omim/)

OMIM,即在线人类孟德尔遗传(Online Mendelian Inheritance in Man),是一个综合的、权威的研究人类表型和基因型关系的数据库,收录了所有已知的孟德尔疾病,和超过16000个基因的信息(涵盖一大半人类已知的基因)。

OMIM并不是创造了这些数据,而是对已发表的研究结果的非常系统的整理与整合,并每日更新、免费获取。OMIM中的一个常见的疾病的页面,其内容类似一篇综述,包含:表型与基因的关系、临床简介、疾病基本信息与描述、临床特征、诊断、临床管理、发病机制、分子遗传、群体遗传、动物模型、背景历史、研究进展和参考文献。

ClinVar数据库(https://www.ncbi.nlm.nih.gov/clinvar/)

clinvar数据库是一个人类遗传变异及其与疾病关联信息的公共数据库,收录了包括单核苷酸变异(SNP)、插入缺失(Indel)等在内的各种遗传变异,目前已经成为了人类遗传变异及其与疾病关联信息的最权威和最全面的公共数据库,是人类基因组信息的重要组成部分之一。

该数据库的主要特点如下:

1、数据来源:clinvar数据库主要来源于各种文献报道,包括科研论文、临床诊断报告、重要数据库汇总等。

2、数据形式:clinvar数据库为非关系型数据库,使用XML格式进行存储,数据分为变异基因型、疾病与遗传变异之间的关联、变异性质、变异对宿主基因的影响程度、证据等多个维度进行描述。

3、数据质量:clinvar数据库对各种遗传变异的收录要求较高,要求进行规范的表述、严格的证据支持、清晰的证据链路等,从而保证数据的准确性、权威性。

InterVar数据库(http://wintervar.WGlab.org/)

InterVar同样是位点致病性评判数据库,可以实现对ACMG 28条判读标准中的18条进行自动化评分,其余10条由于需要后续证据输入或者参数调整(例如Sanger测序验证结果或家系验证等)。

ClinGen数据库(https://www.clinicalgenome.org/)

ClinGen是美国国立卫生研究院(NIH)资助的数据库资源,用于精准医学,研究基因和变异的临床相关性。ClinGen提供了变异的剂量敏感性,有助于辨别突变的显隐性异常模式。更重要的是ClinGen结合临床、遗传模式、人群、功能证据及专家评审,根据ACMG/AMP指南对变异进行致病性分类,结果保存在ClinVar中。实验室和临床医生也可以使用ClinGen的”variant curation tools”来**评估尚未经过专家审查的变异致病性的证据。

综合性肿瘤数据库

OncoKB(https://www.oncokb.org/)

OncoKB数据库介绍及爬虫爬取位点用药信息

COSMIC(https://cancer.sanger.ac.uk/cosmic)

COSMIC是世界上最大最全面的有关肿瘤的体细胞突变以及其影响的资源库。

COSMIC是一个在人类癌症中发现的体细胞获得性突变的在线数据库。体细胞突变是在非生殖细胞中发生的,不是由儿童遗传的。 COSMIC是癌症中体细胞突变目录(Catalogue Of Somatic Mutations In Cancer)的首字母缩写,它从科学文献中的论文和桑格研究所癌症基因组计划的大规模实验筛选中提取数据。该数据库可供学术研究人员免费使用,并可向其他人商业许可。

COSMIC数据库旨在收集和显示有关癌症体细胞突变的信息。它于2004年推出,仅有四种基因HRAS,KRAS2,NRAS和BRAF的数据。已知这四种基因在癌症中是体细胞突变的。自创建以来,数据库迅速扩展。到2005年,COSMIC包含从115,327个肿瘤中筛选出的529个基因,描述了20,981个突变。到2009年8月,它包含了150万次实验的信息,包括近370,000个肿瘤中的13,423个基因,并描述了超过90,000个突变。2010年7月发布的COSMIC第48版,与国际癌症研究机构合作,整合了p53的突变数据。此外,它还为最新的人类参考基因组构建提供了更新的基因坐标。以后每 3 个月更新一次。

COSMIC数据库包含数千种与癌症发展有关的体细胞突变。该数据库从两个主要来源收集信息:

(1)从文献中收集已知癌症基因的突变。经历人工治疗的基因列表通过它们在癌症基因普查中的存在来确定。
(2)纳入数据库的数据来自癌症基因组计划进行的癌症样本的全基因组重测序研究。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1366438.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

大创项目推荐 深度学习图像风格迁移

文章目录 0 前言1 VGG网络2 风格迁移3 内容损失4 风格损失5 主代码实现6 迁移模型实现7 效果展示8 最后 0 前言 🔥 优质竞赛项目系列,今天要分享的是 🚩 深度学习图像风格迁移 - opencv python 该项目较为新颖,适合作为竞赛课题…

自学编程资源收集

Java,Python,C,JavaScript,SpringBoot,Vue,MySql等各种编程资料收集 mksz712-系统玩转OpenGLAI,实现各种酷炫视频特效mksz709-从0到1训练私有大模型 ,企业急迫需求,抢占市场先机~8mksz702-Chat…

布偶猫必囤主食冻干有哪些?三款K9、sc、希喂主食冻干深度测评!

喂养布偶猫的小诀窍:既要满足其食肉习性,又需关注其敏感肠胃。主食冻干是理想选择,它既符合猫咪天然的饮食结构,又采用新鲜生肉为原料。搭配其他营养元素,既美味又营养,还能增强抵抗力。我们将为您测评市场…

IPv6路由协议---IPv6动态路由(RIPng)

IPv6动态路由协议 动态路由协议有自己的路由算法,能够自动适应网络拓扑的变化,适用于具有一定数量三层设备的网络。缺点是配置对用户要求比较高,对系统的要求高于静态路由,并将占用一定的网络资源和系统资源。 路由表和FIB表 路由器转发数据包的关键是路由表和FIB表,每…

如何写一篇专利?格式与要求

如何写一篇专利?格式与要求 知识产权专利类型发明实用新型外观设计 专利的审查专利授权的标准新颖性创造性实用性 不授予专利的情形 专利的挖掘专利五书权力要求书说明书技术领域背景技术发明内容附图说明具体实施方式 说明书附图说明书摘要摘要附图 知识产权 市场…

流量控制在计算机网络中的应用

计算机网络是我们现代社会中必不可少的一部分,其在信息传输和分享方面起到了至关重要的作用。然而,面对大量的数据流量和用户请求,网络必须进行流量控制,以保证网络的稳定性和性能。本文将探讨流量控制在计算机网络中的应用。 流…

本地部署Canal笔记-实现MySQL与ElasticSearch7数据同步

背景 本地搭建canal实现mysql数据到es的简单的数据同步,仅供学习参考 建议首先熟悉一下canal同步方式:https://github.com/alibaba/canal/wiki 前提条件 本地搭建MySQL数据库本地搭建ElasticSearch本地搭建canal-server本地搭建canal-adapter 操作步骤…

设计模式④ :分开考虑

一、前言 有时候不想动脑子,就懒得看源码又不像浪费时间所以会看看书,但是又记不住,所以决定开始写"抄书"系列。本系列大部分内容都是来源于《 图解设计模式》(【日】结城浩 著)。该系列文章可随意转载。 …

小白入门基础 - Restful

一:REST与RESTful: REST:表现层状态转移,资源在网络中以某种形式进行状态转移。 RESTful是基于REST理念的一套开发风格,是具体的开发规则。 服务器端只返回数据,以json或者xml的格式。 RESTful开发规范&a…

小白新手轻松部署扫雷小游戏

小白新手轻松部署扫雷小游戏 云效云效操作导入资源镜像仓库应用配置 最后 说到扫雷小游戏,可以说大家都玩儿过,印象中刚接触计算机的时候,对于这个扫雷小游戏,很多人都很喜欢,觉得很有意思,大家一起挑战看谁…

win10报错“COMDLG32.OCX文件丢失,软件无法启动”,快速修复方法,亲测有效

COMDLG32.OCX文件是Windows操作系统中的一个ActiveX控件文件,是Common Dialogs控件的一部分,主要用于支持各种软件运行时的一些基本功能,如打开、保存文件对话框等。 COMDLG32.OCX文件的作用主要体现在以下几点: 1. 提供应用程序通…

Commander One for Mac:强大的双窗格文件管理器,让你的工作效率倍增!

Commander One for Mac是一款功能强大的文件管理工具,具有以下主要功能: 双窗格设计:主界面分为两个窗格,用户可以在左侧窗格中导航和浏览文件系统的目录结构,在右侧窗格中查看文件和文件夹的内容。文件操作&#xff…

【教学类-45-02】X-Y之间的三连减题(a-b-c=)

作品展示: 背景需求: 【教学类-45-01】X-Y之间的三连加题(abc)-CSDN博客文章浏览阅读5次。【教学类-45-01】X-Y之间的三连加题(abc)https://blog.csdn.net/reasonsummer/article/details/135436915 有了三连加怎么能没有三连减,修改参数&am…

Vmware安装Windows11系统及下载MySQL步骤(超详细)

一、创建虚拟机 ①选择自定义 ②直接点击下一步 ③选择Windows 11 x64 ④命名虚拟机以及选择路径 ⑤新版本的虚拟机需要加密(密码需要8个字符以上) ⑥选择UEFI ⑦处理器配置(根据自己的需求) ⑧设置虚拟机的内存 ⑨选择不使用网络…

LeetCode 2807. 在链表中插入最大公约数【链表,迭代,递归】1279

本文属于「征服LeetCode」系列文章之一,这一系列正式开始于2021/08/12。由于LeetCode上部分题目有锁,本系列将至少持续到刷完所有无锁题之日为止;由于LeetCode还在不断地创建新题,本系列的终止日期可能是永远。在这一系列刷题文章…

天锐绿盾文档加密系统

绿盾文档加密系统是一种针对企业数据安全而设计的解决方案,旨在保护企业核心数据不被泄露。该系统由文件加密模块、内网安全模块等部分组成,主要功能包括对需要保护的文件进行强制加密保护,并对文件的使用进行全程监控。通过绿盾文档加密系统…

数据结构之B树和B+树

数据结构可视化演示链接,也就是视频中的网址 文章目录 一、B-Tree二、BTree(B-Tree变种) 一、B-Tree 叶节点具有相同的深度,叶节点的指针为空所有索引元素不重复节点中的数据索引从左到右递增排列 二、BTree(B-Tree变种) 非叶子节点不存储 data &#…

如何进行深入的竞品分析:掌握这些技巧让你更加了解市场

随着互联网行业的快速发展,产品经理需要对竞品进行深入分析,才能更好地把握市场需求和趋势,为公司带来更好的商业价值。那么,如何做好竞品分析呢?以下是我对于这个问题的思考和建议。 一、确定分析的目的和范围 在开…

积分的求法

1.第一类换元积分法(凑微分法):用dt代替dx,积分消失加常数 2.第二类换元积分法(用于开根号):用sint,cost,tant代替x,其中tant可以用于secx的平方-1tanx的平方 3.倒代换&#xff1a…

10个常用恶意软件检测分析平台(网工精选)

你们好,我的网工朋友。 我们往期的文章已经同步过很多的好用工具,毕竟,作为一个职场网工人,提升效率才是才能在单位时间内赚到更多的工资 往期的好用工具收到了不少好的反响,今天更新一波新的工具安利,专…