生物数据下载

news2024/11/15 21:37:13

目录

1. 获取数据下载的地址  

2. 生物数据常用的下载站点

1、核酸数据库

2、非编码RNA数据库

(1).非编码小RNA数据库

(2).长非编码RNA数据库:

(3).非编码RNA家族数据库

(4).非编码RNA序列数据库

3、蛋白质数据库

(1).蛋白质信息

(2).蛋白序列数据库

(3).蛋白质结构数据库

(4).蛋白组数据库

(5).蛋白质功能域数据库

(6).蛋白互作数据库

4、代谢数据库

(1).代谢途径数据库

(2).代谢组学常用数据库

(3).表型数据库

5、序列比对

(1).序列与数据库比对

(2).多序列间比对

(3).序列进化树分析

6、基因分析

(1).基因信息

(2).基因注释

(3).基因功能预测:

(4).基因结构预测

(5).同源基因分析

(6).亚细胞定位预测

(7).启动子分析

(8).调控目的基因的miRNA预测

(9).表达分析

(10).基因结构绘制

7、蛋白质分析

(1).蛋白二级三级结构预测及绘图

(2).蛋白特性分析

(3).蛋白亲疏水性分析

(4).跨膜结构分析

(5).信号肽分析

(6).磷酸化位点分析


1. 获取数据下载的地址  

例如在ncbi官网输入SRR1239601

点击SRA---Run---

 点击Data access---选中NCBI的网址,鼠标右键----IDM下载(IDM下载)

 

 注:利用IDM软件下载数据,可以多线程下载;另外,注意不能利用nohup wget wangzhi &挂载下载,否则会报错。另外,迅雷也可以用于下载数据。

2. 生物数据常用的下载站点

1、核酸数据库

  • NCBI [https://www.ncbi.nlm.nih.gov/genbank/]

    NCBI (National Center for Biotechnology Information)是指美国国立生物技术信息中心

  • EMBL [ENA Browser]---Ensembl

    欧洲分子生物学实验室EMBL(The European Molecular Biology Laboratory)

  • DDBJ [DDBJ]

    DDBJ(DNA Data Bank of Japan),于1984年建立,是世界三大DNA 数据库之一,与NCBI的GenBank,EMBL的EBI数据库共同组成国际DNA数据库

  • CNGB [CNGBdb - China National GeneBank DataBase]

    中国国家数据库(China National GeneBank)位于深圳大鹏新区,是继世界三大数据库之后的全球第四大国家级数据库。它是中国首个,也是唯一一个国家基因库,相对于全球另外三个基因库而言,国家基因库样品保存的规模、存储量和可访问的数据量皆是全球最大。

  • BIGD [Home - National Genomics Data Center]

    中国国家基因组科学数据中心 生命与健康大数据中心 (National Genomics Data Center BIG Data Center)

  • UCSC[UCSC官网]---在线浏览基因组信息---下载指定区域的文件---Tabal Browsel

2、非编码RNA数据库

(1)非编码小RNA数据库
  • miRBase [miRBase]

  • piRNAbank [piRNA Database]

  • piRNAbank [GtRNAdb: Genomic tRNA Database]

  • SILVA [https://www.arb-silva.de/]

(2)长非编码RNA数据库:
  • LncRNAdb [http://www.lncrnadb.org/]

    真核生物

  • LncRNAwiki [LncRNAWiki]

    人类长非编码RNA数据库

(3)非编码RNA家族数据库
  • Rfam[Rfam: The RNA families database]

    类似于Pfam的RNA家族注释数据库

(4)非编码RNA序列数据库
  • RNAcentral [RNAcentral: The non-coding RNA sequence database ]

3、蛋白质数据库

(1)蛋白质信息
  • Human protein atlas [The Human Protein Atlas ]

    人体蛋白在细胞、组织、病理条件下的表达

(2)蛋白序列数据库
  • Pfam [Pfam is now hosted by InterPro]

    Pfam是蛋白质家族的数据库,包括使用隐马尔可夫模型生成的注释和多序列比对。

  • SwissProt [UniProtKB/Swiss-Prot - SIB Swiss Institute of Bioinformatics | Expasy]

    手动注释的非冗余蛋白序列数据库

  • UniProt [ UniProt]

  • PIR [Welcome to PIR [Protein Information Resource]]

  • Antibodies [bioinf.org.uk - Prof. Andrew C.R. Martin's group at UCL]

  • BRENDA [ BRENDA Enzyme Database]

  • HPRD [Human Protein Reference Database]

  • InterPro [InterPro]

    通过整合多个蛋白相关数据库,提供了一个方便的对蛋白序列进行功能注释的平台,包括对蛋白质家族、结构域、功能位点的预测

  • iProClass [iProClass]

  • PRF [一般財団法人 蛋白質研究奨励会]

  • REBASE [Official REBASE Homepage | The Restriction Enzyme Database | NEB]

(3)蛋白质结构数据库
  • PDB [RCSB PDB: Homepage]

    通过实验测定的结构

  • SCOP [Legacy SCOP redirect]

  • CATH [CATH: Protein Structure Classification Database at UCL]

  • PSI [http://www.uwstructuralgenomics.org/]

(4)蛋白组数据库
  • PRIDE [https://www.ebi.ac.uk/pride/archive/]
(5)蛋白质功能域数据库
  • PROSITE [https://prosite.expasy.org/]

    最全面

  • Pfam [http://pfam.xfam.org/]

    最专业

  • ProDom [http://prodom.prabi.fr/]

  • CCD [http://www.ncbi.nlm.nih.gov/Structure/cdd/cdd.shtm]

  • Prints [http://www.bioinf.man.ac.uk/dbbrowser/PRINTS/index.php]

  • SMART [ http://smart.embl-heidelberg.de/]

  • TIGRFAM [http://www.tigr.org/TIGRFAMs/]

(6)蛋白互作数据库
  • STRING [https://string-db.org/]

  • DIP [https://dip.doe-mbi.ucla.edu/dip/Main.cgi]

    实验验证的蛋白相互作用数据库

  • BioGRID [https://thebiogrid.org/] :

  • IntAct [ https://www.ebi.ac.uk/intact/]

4、代谢数据库

MapMan:一个功能强大的代谢途径查看和编辑软件

(1)代谢途径数据库
  • KEGG [https://www.kegg.jp/]

  • GO [http://www.geneontology.org/]

  • NCBI BioSystems [https://www.ncbi.nlm.nih.gov/biosystems]

  • IMP [http://imp.princeton.edu/]

  • plantCyc [https://www.plantcyc.org/]

  • MANET [ https://manet.illinois.edu/]

  • MetaNetX [ https://www.metanetx.org/]

(2)代谢组学常用数据库
  • MataboLights [https://www.ebi.ac.uk/metabolights/]

  • HMDB [http://www.hmdb.ca/]

  • YMDB [http://www.ymdb.ca/]

  • ECMDB [http://ecmdb.ca/]

(3)表型数据库
  • Planteome [http://www.planteome.org/]

  • dbGaP [https://www.ncbi.nlm.nih.gov/gap/]

  • IPPN [https://www.plant-phenotyping.org/]

5、序列比对

(1)序列与数据库比对
  • Blast [https://blast.ncbi.nlm.nih.gov/Blast.cgi]
(2)多序列间比对
  • Clustal
(3)序列进化树分析
  • MEGA

6、基因分析

(1)基因信息
  • GeneCard [https://www.genecards.org/]

  • Gene Wiki[https://en.wikipedia.org/wiki/Wikipedia:Gene_Wiki ]

(2)基因注释
  • Blast [https://blast.ncbi.nlm.nih.gov/Blast.cgi]

  • Interproscan [http://www.ebi.ac.uk/interpro/],

  • WEGO [http://wego.genomics.org.cn/]

  • KAAS [https://www.genome.jp/tools/kaas/]

(3)基因功能预测:
  • FGENESH [http://linux1.softberry.com/berry.phtml?topic=fgenesh&group=programs&subgroup=gfind]

  • AUGUSTUS [http://bioinf.uni-greifswald.de/augustus/submission.php ]

  • GENESCAN [http://argonaute.mit.edu/GENSCAN.html]

  • GeneMark [http://topaz.gatech.edu/GeneMark/]

  • Glimmer [http://ccb.jhu.edu/software/glimmer/index.shtml]

(4)基因结构预测
  • Exon-Intron Graphic Maker [http://wormweb.org/exonintron]

    根据候选基因的外显子和内含子等信息绘制基因结构

  • Blastp [https://blast.ncbi.nlm.nih.gov/Blast.cgi?PROGRAM=blastp&PAGE_TYPE=BlastSearch&LINK_LOC=blasthome]

    可在线获取蛋白结构域的注释和位置信息

(5)同源基因分析
  • OrthoDB是直系同源物的综合目录[https://www.orthodb.org/]
(6)亚细胞定位预测
  • PSORT Prediction [http://psort1.hgc.jp/form.html]
(7)启动子分析
  • Plantcare [http://bioinformatics.psb.ugent.be/webtools/plantcare/html/]
(8)调控目的基因的miRNA预测
  • psRNAtarget [http://plantgrn.noble.org/psRNATarget/analysis?function=2]
(9)表达分析
  • ArrayExpress [https://www.ebi.ac.uk/arrayexpress/ ]

    数据来自EMBL的高通量功能基因组学实验的数据;

  • BAR [http://bar.utoronto.ca]

    在分析基因功能时,通常会参考基因的表达模式,即基因在植物不同组织不同发育时期的表达丰度变化。通过在线分析网站BAR对候基因进行表达分析。 是一个植物生信分析资源网站,用该网站分析基因表达时,不仅可以获得基因表达模式的热图,还可以获得可视化的电子荧光图片,直观呈现基因在植物组织中的表达位置。

(10)基因结构绘制
  • GSDS [http://gsds.cbi.pku.edu.cn/]

    Gene Structure Display Server,基于基因组注释文件绘制序列基因结构等功能

7、蛋白质分析

(1)蛋白二级三级结构预测及绘图
  • CFSSP [http://www.biogem.org/tool/chou-fasman/]
  • SOPMA [https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html]
  • PredictProtein [https://www.predictprotein.org/]
  • SWISS-MODEL [https://swissmodel.expasy.org/interactive]
(2)蛋白特性分析
  • ProtParam [http://web.expasy.org/protparam/]

    蛋白特性分析是指蛋白的一些物理和化学参数,如分子量、等电点、氨基酸和原子组成、消光系数、半衰期、不稳定系数、脂肪族氨基酸指数、亲水性。这些参数,有助于进行蛋白的相关生化实验。比如在体外体系(大肠杆菌、酵母等)表达和纯化目的蛋白时,需要考虑蛋白的分子量、等电点、消光系数、不稳定系数和亲水性等。在酶活实验中,也需要根据这些参数优化实验体系。

(3)蛋白亲疏水性分析
  • Protscale [https://web.expasy.org/protscale/]

    蛋白氨基酸的亲疏水性主要由其侧链基团R,如果R只是H或是C、H两元素组成的话,都是疏水的,如果含有极性侧链基团,如-OH、-SH、-COOH、-NH2 等,则就是极性的(亲水的)。疏水性氨基酸有酪氨酸、色氨酸、苯丙氨酸、缬氨酸、亮氨酸、异亮氨酸、丙氨酸和蛋氨酸(甲硫氨酸)。疏水性氨基酸在蛋白质内部,在保持蛋白质的三级结构上,酶和基质、抗体和抗原间的相互作用等各种非共价键的分子结合方面,具有重要作用。

(4)跨膜结构分析
  • TMHMM [http://www.cbs.dtu.dk/services/TMHMM/]

    蛋白的跨膜结构分析对于预测蛋白的亚细胞定位密切相关。如果具有跨膜结构,蛋白很可能定位于细胞中与膜相关的结构,如细胞质膜、叶绿体膜或线粒体膜等内膜系统。此外,蛋白跨膜结构分析对于蛋白功能分析也有一定的帮助。比如某蛋白没有跨膜结构,但是亚细胞定位实验显示其可定位于膜相关结构,这说明该蛋白可能通过其他膜定位蛋白招募过去的。

(5)信号肽分析
  • SignalP [http://www.cbs.dtu.dk/services/SignalP/]

    峰信号位置为信号肽切割点,峰之前的序列为信号肽

    信号肽是指引导新合成的蛋白质向分泌通路转移的短肽链,常位于蛋白的N-末端,负责把蛋白质引导到不同膜结构的亚细胞器内。编码分泌蛋白的mRNA在翻译时首先合成N末端的信号肽,它被信号肽识别蛋白(SRP)所识别,SRP将核糖体携带至内质网上,内质网膜上的 SPR 受体识别并与之结合。新合成蛋白在信号肽引导下到达内质网内腔,而信号肽则在信号肽酶的作用下被切除。由于它的引导,新生的多肽就能够通过内质网膜进入腔内,最终被分泌到胞外。在宿主菌中表达外源蛋白时,可用信号肽引导外源蛋白定位分泌到胞外,提高蛋白可溶性,在原核表达系统(大肠杆菌、芽孢杆菌等)和真核表达系统(如毕赤酵母)中均有应用。

(6)磷酸化位点分析
  • NetPhos [http://www.cbs.dtu.dk/services/NetPhos/]

  • KinasePhos-2.0 [http://kinasephos2.mbc.nctu.edu.tw/]

    蛋白质磷酸化指由蛋白质激酶催化的把 ATP 的磷酸基转移到底物蛋白质氨基酸残基(丝氨酸、苏氨酸、酪氨酸)上的过程,或者在信号作用下结合 GTP(通常以 GTP 取代 GDP),是生物体内一种普通的调节方式,在细胞信号转导的过程中起重要作用。在信号达到时通过获得一个或几个磷酸集团而被激活,而在信号减弱时能去除这些集团,从而失去活性。有时某个信号蛋白磷酸化通常造成下游的蛋白依次发生磷酸化,形成磷酸化级联反应。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/696848.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C++ day41

1、总结类和结构体的区别 结构体中是变量和函数;类中是成员属性(成员变量)、成员方法(成员函数)/行为类的成员变量和成员函数的默认访问权限是私有的;结构体的成员变量和成员函数的默认访问权限是公开的类创建一个对象后,对该对象的任何修改…

2022年全国硕士研究生入学统一考试管理类专业学位联考数学试题——纯题目版

2022 年全国硕士研究生入学统一考试管理类专业学位联考数学试题 一、问题求解:第 1∼15 小题,每小题 3 分,共 45 分。下列每题给出的 A、B、C、D、E 五个选项中,只有一项是符合试题要求的,请在答.题&#…

PC市场的寒冬,该如何看待?

✅作者简介:2022年博客新星 第八。热爱国学的Java后端开发者,修心和技术同步精进。 🍎个人主页:Java Fans的博客 🍊个人信条:不迁怒,不贰过。小知识,大智慧。 💞当前专栏…

prometheus告警发送到钉钉群机器人的全部署流程

前置条件:prometheus安装完成,创建钉钉群机器人,我这里使用的是指定ip的方式 定义告警规则 修改Prometheus配置文件prometheus.yml,添加以下配置: rule_files:- /usr/local/prometheus/rules/*.rulesalerting:alertmanagers:- s…

Spring、Bean 创建 和 使⽤

目录 前言 1、创建 Spring 项目 1.1、创建一个 Maven 项目 1.2、在 Maven 项目中,添加 Spring 框架支持(spring-context,spring-beans) 1.2.1添加依赖 1.2.2 配置国内源 1.2.3 添加maven 1.3、创建一个启动类 和 main 方法…

Mybatis 操作数据库的基本 CRUD 以及查询操作详析

目录 1. 什么是 MyBaits ? 2. 搭建 MyBaits 环境 3. 了解 MyBaits 设计模式 MyBaits 操作数据库: 前置工作: (1)建库建表 (2) 添加实体类 (3)添加 Mapper 接口 &#xff…

CPU上下文切换原理剖析

CPU上下文 CPU上下文其实是一些环境正是有这些环境的支撑,任务得以运行,而这些环境的硬件条件便是CPU寄存器和程序计数器。CPU寄存器是CPU内置的容量非常小但是速度极快的存储设备,程序计数器则是CPU在运行任何任务时必要的,里面…

亿级数据过滤算法----布隆过滤器

在程序的世界中,布隆过滤器是程序员的一把利器,利用它可以快速地解决项目中一些比较棘手的问题。如网页 URL 去重、垃圾邮件识别、大集合中重复元素的判断和缓存穿透等问题。 布隆过滤器(Bloom Filter)是 1970 年由布隆提出的。它…

水站桶装水订水小程序

水站桶装水订水小程序正式上线,支持多种商品展示形式,会员卡、积分、分销等功能,有需要的老板可以先看演示!​​​​​​​​​​​​​​​​​​​​​

Java框架之spring 的 messaging

写在前面 本文看下spring message相关的内容。 1:Message?Messaging? Message是消息的意思,是一个名词。而Messaging是一个动名词,是将消息发送出去的意思,因此,我们的消息系统是messaging s…

SuperMap iServer 扩展账户信息合规度校验规则

作者:lisong 目录 功能简介配置文件详情扩展和配置流程 功能简介 SuperMap iServer 11i(2023) 新增了扩展账户信息合规度校验规则的能力,您可以灵活定制满足自身项目需求的用户名、密码合规度校验规则,用于校验您创建…

企业邮箱如何修改管理员密码

1、登录企业邮局,点击顶部“邮局管理”。在邮局管理中点击“组织与成员”,在用户列表中,点击“邮局管理员”(postmaster)。 2、在编辑用户中,点击“重置密码”,然后输入新的密码,保存即可。

java中的xxl-job-core完成定时任务的步骤

首先这个是基于docker的所以需要进行docker配置 1、先导入官方提供的SQL到虚拟机中mysql中 2、创建容器 docker run -e PARAMS"--spring.datasource.urljdbc:mysql://192.168.211.136:3306/xxl_job?useUnicodetrue&characterEncodingUTF-8&autoReconnecttrue&a…

2014年全国硕士研究生入学统一考试管理类专业学位联考数学试题——纯题目版

2014 年考研管理类联考数学真题 一、问题求解(本大题共 15 小题,每小题 3 分,共 45 分)下列每题给出 5 个选项中,只有一个是符合要求的,请在答题卡上将所选择的字母涂黑。 1.某部门在一次联欢活动中共设了 …

python接口自动化测试 - configparser配置文件解析器详细使用

configparser简介 ConfigParser模块已在Python 3中重命名为configparser该模块定义了ConfigParser类。 ConfigParser类实现一种基本的配置文件解析器语言,该语言提供的结构类似于 .ini 文件中的结构 Python自动化测试:手把手教你做60个实战项目&#xf…

设计模式(二十三)——解释器模式(Interpreter )

解释器模式(Interpreter ) 实现了一个表达式接口,该接口解释一个特定的上下文 应用 编译器,正则表达式,SQL解析 实现 实现一个一位数的加法运算 public class Interpreter {public int add(String s){if (s.char…

代码复现:基于精英动态反向学习的增强型正余弦算法—EDOLSCA,可用于对比试验

代码复现:基于精英动态反向学习的增强型正余弦算法—EDOLSCA,可用于对比试验。 参考文献:Zhang L, Hu T, Yang Z, et al. Elite and dynamic opposite learning enhanced sine cosine algorithm for application to plat-fin heat exchanger…

带你用Python制作超级经典的2048游戏(文末赠书)

名字:阿玥的小东东 学习:Python、C/C 主页链接:阿玥的小东东的博客_CSDN博客-python&&c高级知识,过年必备,C/C知识讲解领域博主 目录 2048游戏Python实现 本期赠书 2048游戏Python实现 2048游戏是一款非常流行的益智游戏&#xff0…

vue-cli的Nuxt重构

我的博客用vuecli写的,SEO不忍直视。于是用Nuxt重构了代码,过程中踩了无数坑 一:body样式不生效 正常的body样式设置不能生效,需要在nuxt.config.js中配置 1、设置bodyAttrs的class属性,该属性值对应一个类名 2、该…

Unity 聚焦任意大小的物体

聚焦任意大小的物体 🍱效果🥪食用方法 🍱效果 🥪食用方法 💡.安装Cinemachine 💡.把Assets/ZYF/Tools/Camera/Scene/FocusGo/FocusCtrl.prefab拖入场景 💡.调用FocusCtrl.Focus(gameObject)即可…