根据蛋白质序列,计算其分子量(molecular weight),在线工具,原理和python代码

news2024/12/23 13:09:50

蛋白质分子量

蛋白质是由许多氨基酸残基通过肽键(一个氨基酸的 α-羧基与另一个氨基酸的 α-氨基脱水缩合形成的化学键)连接而成。蛋白质的分子量(molecular weight)为各个氨基酸的分子量之和,是蛋白质的重要理化参数。单位为Dalton(道尔顿,缩写Da,或D),定义为碳12原子质量的1/121D=1/N gN为阿弗加德罗常数。通常,我们可以使用氨基酸残基数*110大概计算蛋白质的分子量。

目录

一、四个蛋白质分子量计算网站

1)UniProt数据库

2)Expasy

3)EMBOSS

4)PIR

二、python代码版

1)     Biopython包

2)python代码从头计算

附1:Average vs monoisoform

附2:氨基酸分子量表格

一、四个蛋白质分子量计算网站

1)UniProt数据库

打开https://www.uniprot.org,在输入框输入“P05130”,然后点击“Search”按钮。

点击结果页面左侧的“Sequence & Isoform”,链接到序列处。此处有长度679,质量77,695 Da。粗略等于679*110

点击“Download”下载序列备用。

如果仅有几条蛋白质,并且有对应的UniProtKB id,建议直接检索获得结果。

如果有N条蛋白质,并且有对应的UniProtKB id,可以使用UniProtidmapping工具检索,批量下载结果,然后进行解析以获得分子量。

2Expasy

打开Expasy - ProtParam tool,在上面的输入框中输入蛋白质id或者序列id,例如P05130或者KPC1_DROME;或者在下面的输入框中输入蛋白质单字母序列。

点击“compute parameters”提交,弹出来参数,全部默认,点击“Submit”按钮。

分子量就计算出来了。

也可以输入我们在UniProt上获得的序列(这里仅序列)计算蛋白质分子量。略,请大家自行尝试。

3)EMBOSS

打开https://www.ebi.ac.uk/Tools/seqstats/emboss_pepstats/,在输入框中输入在UniProtKB上获得的序列(fasta格式),点击“Submit”按钮提交。

经过约10秒后,会返回结果。

也可以一次性提交N条序列(fasta格式)。略,请大家自行尝试。

4PIR

打开Composition/Molecular Weight Calculation [PIR - Protein Information Resource],在上面的输入框输入UniProtid或者在下面的输入框中输入在UniProt上获得的序列,点击“Submit”按钮。

1秒后返回结果。红框中为计算所用的公式和每个氨基酸的分子量(带水分子的分子量)。

也可以一次性提交N条序列(换行分割)。略,请大家自行尝试。

总结:

工具

输入

批量

新序列

速度

批量结果

Uniprot

UniProtKB id

Yes

NO

下载后解析

Expasy

UniProtKB id/sequence

NO

Yes

EMBOSS

sequence

Yes

Yes

解析网页

PIR

UniProtKB id/sequence

Yes

Yes

解析网页

二、python代码版

  1. Biopython

2python代码从头计算

虽然Biopython 3行代码就可以搞定蛋白质分子量计算,但是我们需要知道计算原理。最重要的就是获得氨基酸对应的分子量表格。

代码解释:

输入1:单字母的氨基酸序列

输入2:每个氨基酸对应的分子量表格

原理:根据每个氨基酸对应的分子量表格,将所有字母对应的分子量数值加起来,然后再加上水分子的分子量,就是最终的分子量。

注意:这里的分子量是不带水分子的,如果你用的表格是带水分子的,需要用PIR结果中的计算公式。

总结:

1)网站上使用的基本都是平均质量。

2)使用上述6种方法计算出来的P05130的分子量基本一样,小数点细微差别可能是由于精度不同或者使用的分子量表格(见附2)不同。

工具

P05130分子质量

UniProt

77695

Expasy

77694.95

EMBOSS

77694.95

PIR

77694.42

Biopython-IUPAC

77694.0959

Python-Expasy

77694.94634

1Average vs monoisoform

蛋白质/化合物的平均质量(average mass,红线处),是由其组成的元素质量的加和,每种元素的质量选取所有同位素的平均质量。

蛋白质/化合物的单同位素质量(monoisoform,最高峰处),是由其组成元素质量的加和,每种元素质量选择其最大丰度同位素的质量。

绝大多数情况下,平均质量>单同位素质量(见附2)。

2:氨基酸分子量表格

参考:

[1] molecular_weight in SeqUtils · Issue #3859 · biopython/biopython · GitHub

[2] X.molecular_weight() · Issue #4002 · biopython/biopython · GitHub

[3] https://en.wikipedia.org/wiki/Proteinogenic_amino_acid#Mass_spectrometry

[4] Expasy - FindMod tool

微生信助力高分文章,用户175000+,谷歌学术3200

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1667078.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

sqli-labs靶场第十四关

目录 1:分析 找闭合符: 2:开始注入 报错注入: 注入数据库名: 注入表名: 注入列名: 注入具体值: 1:分析 经过我们的实验发现当我们输入的密码后面存在双引号时会报…

[数据结构]动画详解单链表

💖💖💖欢迎来到我的博客,我是anmory💖💖💖 又和大家见面了 欢迎来到动画详解数据结构系列 用通俗易懂的动画的动画使数据结构可视化 先来自我推荐一波 个人网站欢迎访问以及捐款 推荐阅读 如何低…

数据分析的统计推断

数据分析的统计推断 前言一、提出问题二、统计归纳方法三、统计推断四、统计推断步骤如何进行统计推断统计推断的基本问题点估计区间估计总体方差已知总体方差未知 假设检验假设检验的假设显著性水平 五、检验统计量常见的检验统计量 六、检验方法七、拒绝域八、假设检验步骤九…

嵌入式C语言高级教程:实现基于STM32的环境监测系统

⬇帮大家整理了单片机的资料 包括stm32的项目合集【源码开发文档】 点击下方蓝字即可领取,感谢支持!⬇ 点击领取更多嵌入式详细资料 问题讨论,stm32的资料领取可以私信! 环境监测系统通过实时收集和分析环境数据,如温度…

外观模式详解

外观模式 1 概述 有些人可能炒过股票,但其实大部分人都不太懂,这种没有足够了解证券知识的情况下做股票是很容易亏钱的,刚开始炒股肯定都会想,如果有个懂行的帮帮手就好,其实基金就是个好帮手,支付宝里就…

【STM32+HAL+Proteus】系列学习教程---中断(NVIC、EXTI、按键)

实现目标 1、掌握STM32的中断知识 2、学会STM32CubeMX软件关于中断的配置 3、具体目标:1、外部中断检测按键,每按一次计一次数,满5次LED1状态取反。 一、中断概述 1.1、中断定义 CPU执行程序时,由于发生了某种随机的事件(包括…

weblogic 任意文件上传 CVE-2018-2894

一、漏洞简介 在 Weblogic Web Service Test Page 中存在一处任意文件上传漏洞, Web Service Test Page 在"生产模式"下默认不开启,所以该漏洞有一定限制。利用该 漏洞,可以上传任意 jsp 文件,进而获取服务器权限。 二…

【WebGPU】WebGPU 中的反应扩散计算着色器

在本教程中,我们将使用 WebGPU 技术中的计算着色器实现图像效果。更多精彩内容尽在数字孪生平台。 程序结构 主要构建两个 WebGPU 管道: 运行反应扩散算法多次迭代的计算管道(js/rd-compute.js 和 js/shader/rd-compute-shader.js&#xff…

java项目之汽车资讯网站源码(springboot+mysql+vue)

风定落花生,歌声逐流水,大家好我是风歌,混迹在java圈的辛苦码农。今天要和大家聊的是一款基于springboot的汽车资讯网站。项目源码以及部署相关请联系风歌,文末附上联系信息 。 项目简介: 汽车资讯网站的主要使用者管…

小学拼音弄一下

import re from xpinyin import Pinyindef remove_middle_characters(text):# 仅保留汉字chinese_chars re.findall(r[\u4e00-\u9fff], text)cleaned_text .join(chinese_chars)# 如果字符数为偶数,则在中间添加空格if len(cleaned_text) % 2 0:middle_index le…

maven找不到依赖,in offline mode

问题描述: [ERROR] Plugin org.jetbrains.kotlin:kotlin-maven-plugin:1.2.71 or one of its dependencies could not be resolved: Failed to read artifact descriptor for org.jetbrains.kotlin:kotlin-maven-plugin:jar:1.2.71: Cannot access aliyunmaven (ht…

JVM从1%到99%【精选】-类加载子系统

目录 1.类的生命周期 1.加载 2.连接 3.初始化 2.类的加载器 1.类加载器的分类 2.双亲委派机制 3.面试题:类的双亲委派机制是什么? 4.打破双亲委派机制 1.类的生命周期 类加载过程:加载、链接(验证、准备、解析&a…

VMware Workstation 16 Pro安装教程

文章目录 1、下载2、安装 1、下载 复制到迅雷下载:https://download3.vmware.com/software/wkst/file/VMware-workstation-full-16.0.0-16894299.exe 2、安装 秘钥: ZF3R0-FHED2-M80TY-8QYGC-NPKYF YF390-0HF8P-M81RQ-2DXQE-M2UT6 ZF71R-DMX85-08DQY-…

易图讯科技三维电子沙盘系统

深圳易图讯科技有限公司(www.3dgis.top)创立于2013年,专注二三维地理信息、三维电子沙盘、电子地图、虚拟现实、大数据、物联网和人工智能技术研发,获得20多项软件著作权和软件检测报告,成功交付并实施了1000多个项目&…

商业数据分析--时间序列图及趋势分析

绘制时间序列图,并指出存在什么样的状态如上两图: 可见状态:从时间序列图可以看出,这些数据存在明显的季节性波动,每年的第4季度值都最高,而第2季度值最低。同时也存在一些下降的趋势。 通过引进虚拟变量,建立多元线性回归模型。答: 通过引入虚拟变量,我们可以建立如下的…

【初级数据结构】队列

目录 前言队列的概念及结构队列的实现队列的结构队列的初始化队列的销毁入队出队取队头元素取队尾元素判断队列是否为空取出队列中元素个数代码测试 完整代码Queue.hQueue.ctest.c 前言 前面我们已经学习了栈,栈是一种后进先出的结构,即LIFO,…

22、Flink 背压下的 Checkpoint处理

1.概述 通常,对齐 Checkpoint 的时长主要受 Checkpointing 过程中的同步和异步两个部分的影响;但当 Flink 作业正运行在严重的背压下时,Checkpoint 端到端延迟的主要影响因子将会是传递 Checkpoint Barrier 到 所有的算子/子任务的时间&…

乡村振兴与农村基础设施建设:加大农村基础设施建设投入,提升农村公共服务水平,改善农民生产生活条件,构建宜居宜业的美丽乡村

一、引言 乡村振兴是我国现代化进程中的重要战略,而农村基础设施建设则是乡村振兴的基石。随着城市化进程的加快,农村基础设施建设滞后的问题日益凸显,成为制约乡村发展的瓶颈。因此,加大农村基础设施建设投入,提升农…

Docker需要代理下载镜像

systemctl status docker查看docker的状态和配置文件是/usr/lib/systemd/system/docker.service vi /usr/lib/systemd/system/docker.service, 增加如下配置项 [Service] Environment"HTTP_PROXYhttp://proxy.example.com:8080" "HTTPS_PROXYhttp:…

SpringBoot基于微信小程序的星座配对(源码)

博主介绍:✌程序员徐师兄、10年大厂程序员经历。全网粉丝12W、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 🍅文末获取源码联系🍅 👇🏻 精彩专栏推荐订阅&#x1f447…