蛋白组学 代谢组

news2024/12/25 1:02:52

https://www.cnblogs.com/yanzhi123/p/11712926.htmlhttps://www.cnblogs.com/yanzhi123/p/11712926.html【3】蛋白质组学鉴定软件之Mascot - 简书 (jianshu.com)

【6】蛋白质组学鉴定定量软件之MaxQuant - 简书 (jianshu.com)

基于Maxquant软件处理的LabelFree蛋白质组学
首先,在使用Maxquant软件进行查库的时候,有两个参数值得大家关注:LFQ和iBAQ。
当我们在进行搜库时,如果两个参数都选择,将会在结果文件中有三个定量结果:Intensity,IBAQ和LFQ。
接下来,我们来详细解释一下这三个定量结果的区别:

Intensity:将Protein Group中的所有Unique和Razor peptides的信号强度求和,作为最原始的强度值
iBAQ:基于 Intensity 的强度值,除以该蛋白的理论肽段数目,主要用于同一样本内,不同蛋白的相互比较
LFQ:基于 Intensity 的强度值,在不同样本间执行矫正操作,达到降低样本预处理,仪器分析等操作造成的样本间的差异,主要用于同一蛋白,不同样本间的表达差异。比如,不同处理方法间,同一蛋白的表达量变化
 

【盘点】代谢组学中常5大分析方法 - 质谱 - 实验与分析

蛋白质组学基础入门系列 |(一) 蛋白质组学的基本概念 - 简书

蛋白质组学基础入门系列 |(二)蛋白质组学研究利器——质谱 - 简书

 Mascot search engine | Protein identification software for mass spec data (matrixscience.com)

 蛋白质组学基础入门系列 |(三)蛋白质组学常用技术盘点(上) - 简书

非标记定量技术 

 基于标记的蛋白质组学定量技术

蛋白质组学基础入门系列 |(四)蛋白质组学常用技术盘点(下) - 简书

蛋白质组学基础入门系列丨(五)蛋白质组学样品制备流程 - 简书

 蛋白质组学基础入门系列丨(六)蛋白质组学质谱检测环节 - 简书

蛋白质组学基础入门系列丨(七)蛋白质组学数据库检索 - 简书

In the context of protein sequence identifiers, "sp" and "tr" are prefixes used to indicate different databases or data subsets.

  1. "sp": The "sp" prefix stands for Swiss-Prot, which is a high-quality manually curated protein sequence database maintained by the Universal Protein Resource (UniProt). Swiss-Prot provides comprehensive and reliable protein sequence information, including functional annotations, post-translational modifications, and protein-protein interactions. The identifiers starting with "sp" indicate protein sequences from the Swiss-Prot database.
  2. "tr": The "tr" prefix stands for TrEMBL (Translated EMBL Nucleotide Sequence Data Library), which is a computer-annotated protein sequence database also maintained by UniProt. TrEMBL contains protein sequences that are automatically generated from the translation of coding sequences from the EMBL-Bank nucleotide sequence database. The identifiers starting with "tr" indicate protein sequences from the TrEMBL database.

Both Swiss-Prot and TrEMBL are parts of the UniProt database, but Swiss-Prot contains manually curated and reviewed entries, while TrEMBL consists of computationally annotated entries. The prefix "sp" indicates proteins from Swiss-Prot that have undergone more extensive curation, while the prefix "tr" indicates proteins from TrEMBL that may have less curated information.

  1. "tr": The prefix "tr" stands for "TrEMBL." It refers to protein entries in the UniProtKB/TrEMBL subsection of the UniProt Knowledgebase. These entries are computationally predicted and automatically annotated using various algorithms and tools. TrEMBL entries contain protein sequences and annotations that have not yet undergone manual curation and review. They serve as a comprehensive and rapidly growing collection of protein data, providing a resource for researchers to access a wide range of protein sequences and functional predictions. The "tr" prefix indicates that the protein entry is from the unreviewed section of UniProtKB.

  2. "con": The prefix "con" is used to denote protein sequences that are artificial or synthetic constructs. These protein sequences may be artificially designed or engineered for experimental purposes, such as studying protein structure-function relationships or investigating specific protein domains. The "con" prefix indicates that the protein entry represents a synthetic or artificial protein construct.

蛋白组学定量值得比较说明

1. Maxquant的iBAQ和LFQ,该用哪个?
我们使用Maxquant做Label Free蛋白质组学定量分析的时候,在Maxquant的参数设置时,会遇到两个参数,LFQ和iBAQ,那么,选择哪个好呢?
如果你都选上,在最终的proteingroups.txt中,会出现三列:Intensity、IBAQ、LFQ intensity,这三列中的数字,也就是蛋白的定量强度,并不一样,那么,到底那一列比较准呢?
首先,让我们来看一下三者的计算原理是什么?
> Intensity是将某Protein Groups里面的所有Unique和Razor peptides的信号强度加起来,作为一个原始强度值。
> iBAQ是在上面的基础上,将原始强度值除以本蛋白的理论肽段数目。
> LFQ则是将原始强度值在样本之间进行校正,以消除处理、上样、预分、仪器等造成的样本间误差。
假设有两个蛋白,A和B,A和B在样本中的量是相等的,也就是等量。 假设A的长度是10个肽段,B的是100个肽段,假设鉴定结果中,覆盖度都是30%,那么蛋白A的强度是3,B的是30,。这时候我们对比一下,B是A的10倍,但是,A和B原本是相等,这样就存在较为严重的误差。
这时候,如果我们将其原始强度值除以理论肽段数目,A的强度变成了3/10, B的强度变成了3/10。 A = B,Perfect!
上面就是IBAQ的原理和用处。
但是在定量蛋白质组学中,我们并不做蛋白A和 B之间的定量,假如你有一个药物处理前的细胞和药物处理后的细胞的对照型样本做的定量蛋白质组学实验,我们关注的蛋白A在处理前和处理后的变化,至于A和B之间的比值,并不重要。
所以,如果是样本内对比,当然用iBAQ,因为其表征的是蛋白的摩尔比值(copy number)。如果是样本间对比,当然是LFQ(正式名称为MaxLFQ,也就是搜库结果中的txt文件中的LFQ Intensity)[1]
当然,如果你执意要用iBAQ,你可以手工校准样本件误差,方法很简单:蛋白IBAQ值除以此样品所有蛋白的强度的和,计算比例(这也是组学中“等质量上样”和“等体积上样”的核心区别,等质量上样来看的是比例,但是计算比例是有压缩效应的)[2]。
最后,总结一下:
同一个(或者说同一针)样品内部的蛋白互相比较,用IBAQ;
不同样品间互相比较(不管是重复还是不同的处理组),用LFQ。
Reference:
[1]Cox J, Hein M Y,Luber C A, et al. Accurate Proteome-wide Label-free Quantification by DelayedNormalization and Maximal Peptide Ratio Extraction, Termed MaxLFQ[J]. Molecular& Cellular Proteomics Mcp, 2014, 13(9):2513.
[2]Shin J B, Krey JF, Hassan A, et al. Molecular architecture of the chick vestibular hairbundle[J]. Nature Neuroscience, 2013, 16(3):365-74.

Significance A and B for protein ratios

实验设计中,一般会做三个生物学重复来确保结果的准确性,尤其在下游分析中。但有时会遇到没有生物学重复,而又需要进行差异分析的情况,这时一般建议考虑foldchange即可,因为根本无法进行T-test等统计学方法嘛。但是如果必须要算一个P值(个人觉得没啥必要。。。),那么不同组学有各自处理的方法(虽然并不是靠谱),比如NGS的转录组的一些软件会预估一个离散度做校正,而质谱的蛋白组则是用Significance A/B算法,这篇文章主要讲下Significance A/B是怎么来的

一般在网上搜Significance A/B是很难搜到相关信息的,因为这个是特定用于蛋白组学的一种统计学方法,而且现在来说用的也比较少了;那当初为何提出这分析方法,个人觉得可能是因为那时蛋白组学成本过高。以前一直只知道有这一分析方法,但是不知其原理,最近在搜索中无意发现一个帖子What statistical methods for ITRAQ with two biological replication?,其中提到一篇文章中有对Significance A/B的介绍

Significance A/B最先是发表于2008年Nature Biotechnology期刊上,MaxQuant enables high peptide identification rates, individualized p.p.b.-range mass accuracies and proteome-wide protein quantification,这篇文章主要是介绍Maxquant这款用于蛋白组定量分析软件的,非常有名,而其附录中作者提到了如何通过protein ratio来计算显著性(P值)

代码实现

了解了上述的Significance A/B的计算过程,那么我们就可以用代码将其实现,下面我用R写了个函数来计算Significance A,而Significance B从上述可知,只要对protein分bin后再用Significance A计算即可(这里不重复展示了),输入为ratio向量

get_significance <- function(ratio){
  ratio <- log2(as.numeric(ratio))
  order_ratio <- ratio[order(ratio)]
  quantiletmp <- quantile(order_ratio, c(0.1587,0.5,0.8413))
  rl <- as.numeric(quantiletmp[1])      #对应公式中的r-1
  rm <- as.numeric(quantiletmp[2])      #对应公式中的r0
  rh <- as.numeric(quantiletmp[3])      #对应公式中的r1
  p <- unlist(lapply(ratio, function(x){
    if (x > rm){
      z <- (x-rm)/(rh-rm)
      pnorm(z,lower.tail = F)
    }else{
      z <- (rm-x)/(rm-rl)
      pnorm(z,lower.tail = F)
    }
  }))
}
p <- get_significance(data)

http://www.bioinfo-scrounger.com

 Introduction to proteomics data analysis: MaxLFQ Summarizationhttps://statomics.github.io/SGA2020/assets/cptac_maxLfQ.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/711237.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

图灵第4期MySQL调优专题学习笔记

目录 一、首先复习打印的课件 二、Explain中的列 三、解读extra 四、索引最佳实践 五、MySQL的内部组结构 2. bin-log归档&#xff1a; 六、常见SQL深入优化 1. order by 与 group by 优化 2. 索引设计原则 3. 分页查询优化&#xff08;根据非主键字段排序的分页查询…

Verilog基础之十三、ROM实现

目录 一、前言 二、非IP核设计 2.1 工程设计文件读取初始化 2.2 测试代码 2.3 仿真结果 三、IP核创建ROM 3.1 IP核生成ROM 3.2 设计代码 3.3 测试代码 3.4 仿真结果 四、modelsim设置 4.1 模拟信号显示 4.2 信号范围显示设置 五、数据文件 一、前言 对于工程中的…

IMX6ULL系统移植篇-uboot启动Log信息

一. 进入uboot 命令模式 只有启动 uboot&#xff0c;进入 uboot的命令行模式时&#xff0c;才能使用 uboot 的命令。 当开发板启动时&#xff0c;快速按下回车键即可进入 uboot命令行模式。这时&#xff0c;进入 uboot 的命令行模式以后输入“help” 或者 “&#xff1f;” &a…

基因遗传进化算法-找最优路径

import random import matplotlib.pyplot as pltplt.rcParams["font.sans-serif"]["SimHei"] #设置字体 plt.rcParams["axes.unicode_minus"]False #该语句解决图像中的“-”负号的乱码问题# 创建初始种群 def create_initial_population():popu…

1024天,CSDN上的时间之旅

1024天&#xff0c;CSDN上的时间之旅 感想收获未来规划职业规划创作规划 感想 今天是在CSDN这个博客上成为博主已经迈入了1024天。这个数字对于计算机领域来说&#xff0c;具有特殊的含义和重要性。 在计算机科学中&#xff0c;1024是2的十次方&#xff0c;也就是2^10。这意味…

rt-thread------串口V1(三)接收

系列文章目录 rt-thread 之 fal移植 rt-thread 之 生成工程模板 STM32------串口理论篇 rt-thread------串口V1版本&#xff08;一&#xff09;配置 rt-thread------串口V1版本&#xff08;二&#xff09;发送篇 文章目录 系列文章目录一、串口的接收中断接收DMA接收 一、串口…

从一次netty分享漫谈

从一次netty分享漫谈 1.前言 上周五&#xff0c;笔者所在的开发小组&#xff0c;组织了一场分享&#xff0c;内容是netty的入门。笔者所在的团队&#xff0c;基本上就是在各条业务线中活蹦乱跳&#xff0c;有经验的看官&#xff0c;到这里已经可以给出分享效果的总体预测&…

Gradle 各个版本下载

每次都要找下载地址&#xff0c;还是记录一下好找点。 http://services.gradle.org/distributions

Unreal 5 官方在Niagara里模拟大型群体笔记

官方视频地址&#xff1a;https://www.bilibili.com/video/BV1FX4y1T7z2/ 如果需要&#xff0c;请查看官方视频。 性能测试 在讲解Niagara之前&#xff0c;视频首先做了一个性能测试&#xff0c;首先放置了100个AI角色&#xff0c;可以想目标角色移动的ai&#xff0c;然后测试…

C语言:猜凶手

题目&#xff1a; 日本某地发生了一件谋杀案&#xff0c;警察通过排查确定杀人凶手必为4个嫌疑犯的一个。 以下为4个嫌疑犯的供词: A说&#xff1a;不是我。 B说&#xff1a;是C。 C说&#xff1a;是D。 D说&#xff1a;C在胡说 已知3个人说了真话&#xff0c;1个人说的是假话。…

山西电力市场日前价格预测【2023-07-03】

日前价格预测 预测明日&#xff08;2023-07-03&#xff09;山西电力市场全天平均日前电价为333.50元/MWh。其中&#xff0c;最高日前电价为398.66元/MWh&#xff0c;预计出现在15: 15。最低日前电价为280.73元/MWh&#xff0c;预计出现在24: 00。 以上预测仅供学习参考&#x…

Spring第一讲:Spring基础概念和环境搭建

一、Spring是什么 Spring 是 Java EE 编程领域的一款轻量级的开源框架&#xff0c;由被称为“Spring 之父”的 Rod Johnson 于 2002 年提出并创立&#xff0c;它的目标就是要简化 Java 企业级应用程序的开发难度和周期。 Spring 自诞生以来备受青睐&#xff0c;一直被广大开发…

二叉树各种函数的实现

如果你觉得迷茫&#xff0c;那就尽可能选择比较困难的路。 目录 前言&#xff1a; &#x1f340;一.通过前序遍历创建二叉树 &#x1f341;二.二叉树的四种遍历 &#x1f342;1.二叉树的前序遍历 &#x1f33c;2.二叉树的中序遍历 &#x1f34c;3.二叉树的后序遍历 …

Mac VSCode配置运行单个C++文件

题外话&#xff1a;VSCode一键整理代码快捷键&#xff1a;ShiftoptionF 方法一&#xff1a;命令行直接编译 g -o 想创建的可执行文件名 ./cpp文件名 ./可执行文件名 以test.cpp为例&#xff0c;我创建的可执行文件名为test&#xff0c;运行结果如下&#xff1a; 方法二&#…

SpringCloud-Nacos配置管理

文章目录 Nacos配置管理统一配置管理在nacos中添加配置文件从微服务拉取配置 配置热更新方式一方式二 配置共享1&#xff09;添加一个环境共享配置2&#xff09;在user-service中读取共享配置3&#xff09;运行两个UserApplication&#xff0c;使用不同的profile3&#xff09;运…

React教程(由浅到深)

文章目录 1. 基本语法1.1 初体验Hello React1.2 JSX语法的基本使用1.2.1 语句与表达式说明 1.3. React面向组件编程1.3.1 函数组件与类组件 1.4 组件实例的三大特性1.4.1 state数据存储状态1.4.2 props的使用1.4.2.1基本使用1.4.2.2 做限制类型&#xff0c;默认值使用1.4.2.3 简…

2、boostrap 多数据类型表单

fileinput 视频图片文本数据表单 插件下载地址&#xff1a;https://github.com/kartik-v/bootstrap-fileinput/ 1、多类型数据from测试 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><title>Title</tit…

Jeston Xavier NX 模块将系统迁移到NVME存储

大家好&#xff0c;我是虎哥&#xff0c;最近完成了自己设计的第一个Xavier NX的载板设计和打样&#xff0c;虽然还有一些小的不完善的地方&#xff0c;但是可以正常使用&#xff0c;这里记录和分享一下我自己设计的载板上如何实现系统迁移。 我自己使用SDK Manager 安装了所有…

c# Invoke使用

在多线程编程中&#xff0c;我们经常要在工作线程中去更新界面显示&#xff0c;而在多线程中直接调用界面控件的方法是错误的做法&#xff0c;Invoke 和 BeginInvoke 就是为了解决这个问题而出现的&#xff0c;使你在多线程中安全的更新界面显示。 正确的做法是将工作线程中涉…

青少年机器人技术一级考试备考重点(三):简单机械

随着机器人技术的飞速发展&#xff0c;越来越多的青少年开始关注并参与其中。青少年机器人技术考试作为一项评估学生机器人技术水平的重要考试&#xff0c;备受广大青少年和家长的关注。为了更好地备战青少年机器人技术一级考试&#xff0c;了解考试的学习要点和备考重点是非常…