生信入门:序列比对之ncbi_blast在线使用

news2025/4/6 18:10:15

1.背景

blast作为一种序列相似性比对工具,是生物信息分析最常用的一款软件,必须掌握。不管是做两序列相似性的简单比对,还是引物特异性、序列的来源等个性化分析,都会用到blast比对。许多看似高大上的基因分析,都可归类于序列间的比较,因此blast是生信分析中基础性的工具。

序列比对(Sequence Alignment)的基本问题是比较两个或两个以上序列的相似性。

如果你有一堆测序回来的序列,想要看看它们是来自于哪个物种的,或者想在数据库中搜索对应的同源序列,使用ncbi的在线blast,数据库很全,速度很快,马上就能知道结果。

blastp:蛋白序列与蛋白库作比对,直接比对蛋白序列的同源性。

blastx:核酸序列与蛋白库作比对,将核酸序列先翻译成蛋白序列,再将其与蛋白库作比对。

blastn:核酸序列与核酸库的比对,直接比对核酸序列的同源性。

tblastn:蛋白序列对核算库的比对,现将核酸库翻译成蛋白库,再将蛋白序列与翻译后的蛋白库进行比对。

tblastx:核酸与核酸数据库在蛋白质水平比较

同源性(homology)VS 一致性(identity)
同源性是来描述物种之间的进化关系的,所以在同源性的表达中只能用“有”或者“无”,对于有同源性的物种可以描述为“部分同源”或者“完全同源”。

有些小伙伴们会说“序列A和序列B之间有85%的同源性”,这种说法是不正确的,A和B之间要么有同源性,要么没有同源性,可以这样说:序列A和序列B之间有85%的identity,A和B之间有同源性。

在线blast
blast网站 blsatn_ncbi

Nucleotide BLAST :核酸序列到核酸库中的一种查询,库中存在的每条已知序列都将同所查序列作一对一的核酸序列比对。

Protein BLAST:蛋白序列到蛋白库中的一种查询,库中存在的每条已知序列将逐一地同每条所查序列作一对一的序列比对。

BLASTX:核酸序列到蛋白库中的一种查询,先将核酸序列翻译成蛋白序列,再对翻译成的每一条序列作一对一的蛋白序列比对。

TBLASTN:蛋白序列到核酸库的一种查询,与BLASTX相反,它是将库中的核酸序列翻译成蛋白质序列,再对所查序列作蛋白与蛋白的比对。

我们点击“Nucleotide BLAST”后就到了blastn的初始界面,输入以下序列

GACGCGGCCGTCGAGGGCGCTCAGGTGGACTTCGACACCGCCAGCCGCATCGAGAGCCGCTACTTCACCCAGCTGGTCACCGGCCAGGTCGCCAAGAACATGATCCAGGCGTTCTTCTTCGACCTCCAGCACATCAACGGCGGCGGCTCCCGCCCCGAGGGCATCGAGCCGGTCAAGATCAACAAGATCGGTGTGCTCGGCGCGGGCATGATGGGCGCCGGCATCGCCTACGTCTCGGCCAAGGC

数据库可以有很多选择,默认是nr/nt库

点击“BLAST”即可进行比对,20秒之内就会出现如下结果:

然后点击Expect(E值)和Identities(一致性)值靠前的几个进行比较,筛选出此序列是属于哪个菌的序列

 

发现这是一段来 Kosakonia oryzendophytica strain FY-07  的序列。

其中,Expect(E值)和Identities(一致性)是评价blast结果的标准。E值接近零或者为零时,说明比上的序列很接近;一致性:匹配上的碱基数占总序列长的百分数。

如果比对其他序列出现如下界面,说明没比上,可以试着选择其他参数

可以选择 Somewhat similar sequences (blastn) 进行再次比对

MEGABLAST : 采用贪婪式算法,多用于比较相似性比较高(相似性在>95%)的序列,灵敏度高,速度快。

Discontiguous MEGABLAST : 灵敏度更高,用于更精确的序列的比对。主要用于跨物种之间的同源比对。

BlastN : 用于比对相似性较差的序列,,相似度较低的序列也可以查找到,比对结果最多,速度最慢。 但允许更短序列的比对(如短到7个碱基的序列),例如做短的引物的比较可以使用这个选项。

如果想比较手头上的序列A和序列B之间的相似性,可以在blastn的初始界面点击
Align two or more sequences,就可以分别放入序列进行比对了。

参考文献来源:

生信入门:序列比对之blast在线和本地使用_生物信息学blast-CSDN博客


          

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2036179.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

1688商品详情API返回值中的物流与配送信息

在阿里巴巴1688平台上,商品详情API的返回值通常会包含丰富的商品信息,但具体到“物流与配送信息”这部分,它可能不直接包含在API的标准返回字段中,因为物流和配送信息往往与订单处理、库存状态以及物流服务商的实时数据相关联&…

探索Linux -- 冯诺依曼体系、初始操作系统、初始进程、fork函数

一、冯诺依曼体系结构 1、概念 冯诺依曼结构也称普林斯顿结构,是一种将程序指令存储器和数据存储器合并在一起的存储器结构。 最早的计算机器仅内含固定用途的程序。若想要改变此机器的程序,就必须更改线路、更改结构甚至重新设计此机器。当然最早的计…

安卓应用开发学习:查看手机传感器信息

一、引言 在手机app的开发中经常会用到手机的传感器,在《Android App 开发进阶与项目实战》一书的第10章就介绍了传感器的一些功能和用法。要想使用传感器,首先得知道手机具备哪些传感器。书中有传感器类型取值的说明,并提供了一个查看手机传…

vulnhub系列:DC-9

vulnhub系列:DC-9 靶机下载 一、信息收集 nmap扫描存活,根据mac地址寻找IP nmap 192.168.23.0/24nmap扫描IP 端口等信息 nmap 192.168.23.144 -p- -sV -Pn -O访问80端口 dirsearch目录扫描 python3 dirsearch.py -u http://192.168.23.144/页面查看…

8.12-基于gtids的主从复制搭建+lvs

一、LVS 1.角色 主机名ip地址功能web01192.168.2.101rsweb02192.168.2.102realserveenat内网:192.168.2.103 外网:192.168.2.120directorserver,ntpdns192.168.2.105dns 2..web服务器 [rootweb01 ~]# yum -y install nginx ​ [rootweb01 ~]# echo "web01" > …

【kruskal】最小生成树算法详解

最小生成树kruskal 洛谷 P3366 【模板】最小生成树 算法介绍 最小生成树(Minimum Spanning Tree, MST)是一个无向图中连接所有顶点的边的集合,这个集合满足两点:第一,它是一棵树,即任意两个顶点之间恰好有…

打靶记录9——Vikings

靶机下载地址:https://www.vulnhub.com/entry/vikings-1,741/ 难度: 低(中),CTF风格的靶机 目标: 取得 root 权限 2 个flag 涉及的攻击方法: 主机发现端口扫描Web信息收集编码转换/文件还…

ThinkPHP5.1.C+CmsEasy-SQL注入

目录 1、ThinkPHP 中存在的 SQL注入 漏洞( select 方法注入) 1.1环境配置 1.1.1将 composer.json 文件的 require 字段设置成如下: 1.1.2设置application/index/controller/Index.php 文件 1.1.3在 application/database.php 文件中配置…

Xcode 在原生集成flutter项目

笔者公司有一个从2017年就开始开发的iOS和安卓原生项目,现在计划从外到内开始进行项目迁徙。 1》从gitee拉取flutter端的代码;(Android报错Exception: Podfile missing) 2》替换Xcode里的cocopods里Podfile的路径 然后报警 然后…

centos7.9删除home分区扩容至根分区

一、说明 拿到新服务器查看磁盘空间分为根(/),home,swap,boot/efi。home分区站到整个分区的87%以上。和预设的不一致,需要把home删除,扩容至根分区。 新服务器的分区是通过lvm划分的。 二、查看磁盘 三、查看磁盘分区 四、卸载home 卸载前做好备份&a…

自由职业四年,我整理了一些建议

我是勋荣,一个独立开发者。运营了自己的社群,有自己的软件产品。目前还在探索各种副业的路上~ 1我的独立开发之路 刚毕业就找不到Android岗位的我瑟瑟发抖。在广州,稀里糊涂做了Java后端开发。有一天加班 通宵,早上借住在同事家…

机器学习速成第三集——无监督学习之聚类(理论部分)!

目录 聚类的定义和原理 常见的聚类算法 应用场景 总结 无监督学习中聚类算法的最新进展是什么? K-Means聚类算法在处理大规模数据集时的性能优化方法有哪些? 并行计算模型: 多核处理器优化: 分层抽样: 特征缩…

【数值计算方法】非线性方程求根-数值实验

第一题 newton method 非线性方程组的向量函数为: F ( x , y ) ( f 1 ( x , y ) f 2 ( x , y ) ) { ( x − 2 ) 2 ( y − 3 2 x ) 2 − 5 0 , 2 ( x − 3 ) 2 ( y / 3 ) 2 − 4 0. F(x,y)\begin{pmatrix} f_1(x,y)\\f_2(x,y)\end{pmatrix}\left.\left\{\begin{array}{…

Linux 基本指令讲解

linux 基本指令 clear 清屏 Alt Enter 全屏/退出全屏 pwd 显示当前用户所处路径 cd 改变目录 cd /root/mikecd … 返回上级目录cd - 返回最近所处的路径cd ~ 直接返回当前用户自己的家目 roor 中:/root普通用户中:/home/mike mkdir 创建一个文件夹(d) …

高可用集群keepalived详解(基础部署与企业应用示例)

目录 一、高可用集群简介 1.1 集群的类型 1.2系统的可用性 1.3 如何实现高可用 1.4 VRRP(虚拟路由冗余协议)---解决静态网关单点风险 1.4.1 VRRP相关术语 1.4.2 VRRP相关技术 二、Keepalived 部署 2.1 keepalived 架构 2.2 环境准备 三、keepalived基本配置 3.1 全局…

UE开发中的设计模式(三) —— 对象池模式

在FPS游戏中,射击会生成子弹,在命中敌人后子弹会被销毁,那么会导致子弹对象频繁地创建和销毁,会造成运行效率降低且会产生内存碎片问题,而对象池模式可以很好地解决这个问题。 文章目录 问题提出概述问题解决总结 问题…

【C语言】常用函数汇总表

目录 1. C语言常用函数汇总表&#xff08;概念功能&#xff09;1.1 输入/输出函数&#xff08;<stdio.h>&#xff09;1.2 字符串操作函数&#xff08;<string.h>&#xff09;1.3 内存管理函数&#xff08;<stdlib.h>&#xff09;1.4 数学函数&#xff08;<…

快排/堆排/归并/冒泡/

常见的内排序算法 插入排序 直接插入排序 原理&#xff1a;相当于扑克牌变成有序&#xff0c;先拿第一张&#xff0c;把他调节成有序&#xff0c;再拿第二张&#xff0c;与第一张相比找到第二张的位置&#xff0c;再继续拿第三张&#xff0c;以此类推。 void InsertSort(in…

Jupyter Notebook修改文件的默认保存路径

1&#xff0c;安装好后Jupyter Notebook的默认保存路径为用户文件夹&#xff0c; 在jupyter中新建的文件会保存在这里 2&#xff0c;新建一个自己想用来存放Jupyter文件的文件夹 3&#xff0c;找到jupyter的config文件&#xff0c;jupyter_notebook_config.py 4&#xff0c;…

俞敏洪,真窝囊?

文&#xff5c;琥珀食酒社 作者 | 璇子 大家都被俞敏洪骗了 当年《中国合伙人》一播出 俞敏洪竟抱怨黄晓明说&#xff1a; “你把我演得太窝囊&#xff01;” 那俞敏洪真的不窝囊吗&#xff1f; 他培养出董宇辉 让他赚了近6亿 结果人没留住、公司也送了人 还要被丈母娘…