易基因:多组学关联分析及组学分子实验验证方法(表观组+转录组+微生物组)|干货系列

news2024/12/22 20:53:28

大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。

生物过程具有复杂性和整体性,单组学数据难以系统全面解析复杂生理过程的分子调控机制。而多组学(Multi-omics)联合分析可同时实现从“因”和“果”两个层面研究生物学问题,并对其相关性进行验证。高通量技术的发展,通过对多组学数据整合分析,已成为科学家探索生命机制的新方向。

多组学研究是探究生物系统中多种物质之间互作的方法,包括基因组学、表观基因组学、转录组学、蛋白质组学、代谢组学、微生物组学等,这些物质共同影响生命系统的表型、性状等。

什么是多组学关联分析?

关联分析是一种实用的分析技术,就是发现存在于大量数据集中的关联性或相关性,从而描述一个事物中某些属性同时变化的规律和模式。

需要特别注意的是:相关 ≠ 因果;相关 ≠ 必然

因果关系的论证一般需要严密的分子实验。

图示:分子的相互作用,产生关联

组学技术及其关联性

不同组学

① 表观组(差异表观分子特征):甲基化、组蛋白修饰、开放染色质区、lncRNA、circleRNA、miRNA... ...

② 转录组(差异基因表达):mRNA

③ 蛋白组(差异蛋白):蛋白质

④ 代谢组(差异代谢物):代谢物

⑤ 微生物组(差异菌群):菌群结构

多组学关联的意义:串联证据,互相验证,从不同的角度合力探索和解释生物学问题

判断组学之间是否可以进行关联:是否有关联的生物学理论基础

如:

• 启动子区甲基化会抑制基因的表达。

• 基因主体甲基化与基因表达正相关。

• 开放染色质状态与基因表达有关。

• 蛋白质是mRNA翻译的产物。

• miRNA可与mRNA相互作用影响其表达和翻译

关联分析的主要套路

基于参考文献和数据库:项目异质性强,Case by Case 模式

基于代谢通路等已知数据库:高度依赖已知代谢网络解读深度,无法探索未知

基于统计学:数据最朴质的结构特征解析,可以获取未知信息,甚至可以为拓展新的知识体系提供帮助

图示:实际应用中往往三管齐下

易基因主要表观组学技术分类

  • DNA甲基化/羟甲基化位点/区域
  • RNA甲基化位点/区域
  • 转录因子结合区、组蛋白结合区
  • DNase超敏位点、开放染色质区

图示:易基因组学技术研究内容

多组学关联分析方法

(1) 直接关联

一个基因的功能元件甲基化情况影响该基因的表达。

• 重叠分析

• Pearson/Spearman 相关性分析

(2)模型关联

基于基因转录、蛋白质、代谢物等之间的上下游相互作用联系。

• 多元线性模型(multiple linear model)

(3)网络关联

基于分子功能和通路的富集性。

• WGCNA module correlation

• EMDN algorithm

• SNF algorithm

多组学关联分析方法图例

(1)直接关联

① 重叠分析

特点:简单粗暴,也适用于样本量少的情况。

分析结果:韦恩图。

图例:WGBS + total RNA-seq,含DMR的差异表达基因、差异miRNA靶向的差异表达基因、差异siRNA靶向的差异表达基因三者之间的重叠关系分析

关联理论基础:DNA甲基化、miRNA和siRNA协同作用调控基因表达。

② 皮尔森/斯皮尔曼相关性分析

特点:准确计算相关性程度(R值),及其显著性(p值)。

分析结果:散点图(+拟合线)、相关性热图

图例:血液组织RRBS+RNA-seq,DMR的甲基化水平与差异表达的表达水平之间的皮尔森关联分析。

关联理论基础:DNA甲基化可直接调控基因表达。

图例:肠道宏基因组+宏病毒组,健康与炎症性肠病(UC)组分别计算噬菌体与细菌丰度之间的皮尔森相关性并发现差异。

关联理论基础:噬菌体可侵染细菌进而影响肠道菌群的结构。

图例:胚胎scRNA-seq+蛋白质组,两连续发育阶段之间的RNA和表蛋白质表达的相关性分析。

关联理论基础:RNA转录和蛋白质翻译具有上下游关系。

图例:肠道宏基因组+代谢组,不同管理状态下川金丝猴肠道中短链脂肪酸与肠道菌群的皮尔森相关性分析。

关联理论基础:肠道中有多类菌群可直接产生短链脂肪酸这类益生物质。

(2)模型关联

回归分析(regression analysis)是确定两组或两组以上变量间关系的统计方法。回归分析按照变量的数量分为一元回归和多元回归。两个变量使用一元回归,两个以上变量使用多元回归。

多元线性回归模型(multiple linear model)

特点:基于基因表达、蛋白质、代谢物等之间的直接和间接相互作用联系。

分析结果:关联网络图

图例:肠道菌群16S+血液代谢组+肝脏转录组,通过多元线性模型关联分析,筛选出若干优秀模型,组建低剂量抗生素饲喂促进仔猪快速生长的多组学调控网络。

关联理论基础:肠道菌群可通过产生代谢物进入血液,运输至肝脏影响肝脏细胞的基因表达。

(3)网络关联

细胞内所有大分子相互作用的集合,称为相互作用组(Interactome),是大多数基因型与表型关系的基础,可以用来指导解释组学技术检测到的变化如何干扰整个机体。

机体的分子响应和变化具有功能富集性、通路富集性。因此不同组学检测数据也具有相似的功能富集性和变化规律。

网络关联算法正是基于这些生物学理论基础。

  • 基于WGCNA的共变关联网络分析(WGCNA module correlation)
  • 基于表观模块的差异网络分析(EMDN algorithm)
  • 相似性网络融合分析(SNF algorithm)

分析结果:关联网络图

  1. ①基于WGCNA的共变关联网络分析
  • 利用组间差异基因鉴定共甲基化和共表达模块。
  • 模块-模块相关性、模块表型相关性可以有效识别具有功能富集性的多组学变化模块。

图例:血液组织RRBS + RNA-seq,基因的差异甲基化模式与基因表达模式的共变关联网络分析。

  • 前期直接关联得到的基因很少;
  • 改变策略,采用基于WGCNA的共变关联网络分析,得到的共甲基化和共表达基因均富集于自噬相关通路。

关联理论基础:基因组DNA的甲基化与基因表达变化具有功能富集性。

图例:肠道宏基因组+代谢组,不同管理状态下川金丝猴粪便代谢物与肠道菌群基于WGCNA的共变关联网络分析。

  • 鉴定了2对强正相关的物种和代谢物的共变化模块。
  • 圈养条件的代表性模块中发现了潜在致病菌和相关代谢物。

关联理论基础:肠道菌群可响应环境变化改变肠道微环境中相关的代谢产物的浓度。

  1. 基于表观模块的差异网络分析(EMDN algorithm)
  • 利用组间差异基因鉴定共甲基化(共表达)模块。
  • 差异共甲基化(差异共表达)网络筛选。
  • 从多个差异共变网络中筛选共同网络。

图例:基于表观模块的差异网络分析(EMDN algorithm)

  1. 相似性网络融合分析 (SNF algorithm)

图例:

  • SNF算法(图1d)使用了一种基于信息传递理论的非线性算法,该方法迭代更新每个网络,使其与其他网络更加相似。经过几次迭代之后,SNF收敛到单个网络中。
  • 算法的优点是,弱相似性(低权重的边)消失,有助于降低噪声,而在一个或多个网络中存在的强相似性(高权重的边)被添加到其他网络中。

图例:融合网络三个cluster内部的连接性、紧密性和cluster之间相对较少的边界,说明该算法可以更清晰地显示多形性成胶质细胞瘤(GBM)患者的分型情况。

  1. 其他网络关联分析方法

从关联走向因果:组学分子实验验证

基因表达相关的组学:

  • 基因敲除/抑制
  • 基因过表达

甲基化组学:

  • 甲基化酶基因的敲除与过表达

宏基因组(肠道菌群):

  • 无菌动物模型
  • 粪菌移植

以上是关于多组学分析方法及组学分子实验验证的解析,易基因提供表观组、转录组、微生物组等多组学科研技术服务。

参考文献:

Yan H, Bombarely A, Xu B, et al.Autopolyploidization in switchgrass alters phenotype and flowering time viaepigenetic and tranion regulation[J]. Journal of experimental botany,2019

Zhang, D., Hu, Q., … Gao, F. (2019). Epigenetic and transcriptional signatures of ex situ conserved golden snub-nosed monkeys (Rhinopithecus roxellana). Biological Conservation, 237, 175–184.

Zuo, T., Lu, X. J., Zhang, Y. (2019). Gut mucosal virome alterations in ulcerative colitis. Gut, 68(7), 1169–1179.

Gao, Y., Liu, X.. (2017). Protein Expression Landscape of Mouse Embryos during Pre-implantation Development. Cell Reports, 21(13), 3957–3969.

Evaluating the influence of conservation activities on the gut microecosystem of Rhinopithecus roxellana based on establishment of a gut microbiome gene catalog. Unpublished.

Inter-correlated gut microbiota and SCFAs changes upon antibiotics exposure links with rapid body-mass gain in weaned piglet model. The Journal of nutritional biochemistry,2019, 74: 108246.

Multiple network algorithm for epigenetic modules via the integration of genome-wide DNA methylation and gene expression data. BMC Bioinformatics , 2017,18(1), 1–13.

Similarity network fusion for aggregating data types on a genomic scale. Nature Methods , 2014,11(3), 333–337.

Di Nanni, N., Bersanelli, M.(2020). Network Diffusion Promotes the Integrative Analysis of Multiple Omics. Frontiers in Genetics,11(February), 1–12.

相关阅读:

多组学关联研究怎么做?DNA甲基化组+转录组+宏基因组+16S研究思路

经验分享:DNA甲基化与多组学研究思路及科研论文写作

独家分享:高通量测序后的下游实验验证方法——DNA甲基化篇

干货系列:高通量测序后的下游实验验证方法——ChIP-seq篇

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/531663.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Cartographer源码阅读---后端优化思路

Cartographer的后端优化是借用SPA(Sparse Pose Adjustment)优化算法的思想. 其主要步骤如下: 确定两个节点在global坐标系下的相对位姿变换.通过其它方式再次获取这两个节点的相对位姿变化对这两个相对位姿变换的差的最小二乘问题进行求解进行求解后得到…

nifi DBCPconnectpool 连接oracle 死链接

nifi DBCPconnectpool 连接oracle 死链接 问题展示问题解决后言官网中文网Groovy脚本学习 问题展示 原因,nifi 连接oracle因为网络波动出现死链接,我的数据同步停止于前一天晚上一点半左右,因为最近一致出现这个问题,综合判断之下…

SAP HUM 嵌套HU初探 II (TCODE:POP1, POF1,HU03) <转载>

SAP HUM 嵌套HU初探 II 这里以物料号ZFG0003为例,做一个阐述。 1,维护好包装指令主数据(POP1/POP2/POP3) 包装指令ZFG0003A 包装指令ZFG0003B 然后维护好PI 确定记录主数据(POF1/POF2/POF3) 2, COR1/…

老域名挖掘方法-网站老域名批量查询

老域名挖掘方法 老域名对于SEO优化非常重要,可以提高网站的排名和曝光度。因此,很多SEO从业者会使用专门的老域名挖掘工具来挖掘高质量的老域名。以下介绍一种常用且有效的老域名挖掘方法,以及推荐一款优秀的老域名挖掘工具——147SEO老域名…

饿了么在即时零售的胜算

平台商家越多,消费者的选择就会越多,然后就会吸引更多的消费者来消费。与此同时,平台商家越多,平台订单量就会越多,相应的骑手的订单配送响应时效就越快,然后还会吸引更多的商家入驻。如此循环,…

Rust每日一练(leetDay0001) 两数之和、两数相加、最长子串

目录 1. 两数之和 Two Sum 🌟 2. 两数相加 Add Two Numbers 🌟🌟 3. 无重复字符的最长子串 Longest substring without repeating characters 🌟🌟 🌟 每日一练刷题专栏 🌟 Rust每日一练…

如何在Windows11下开启IE浏览器

在Windows11下开启IE浏览器 Microsoft 发布 Windows 11 之后,系统使用基于 Chromium 内核的 Edge 浏览器来代替被人唾骂已久的 IE 浏览器,IE 浏览器入口也已经被屏蔽掉了。通过任何常规方式打开 IE 浏览器都会自动使用 Edge 浏览器打开。 最新消息&…

语音与语言处理技术交流会(深圳)

嘉宾介绍 嘉宾介绍:罗艺,2021年在美国哥伦比亚大学获得博士学位后加入腾讯AI Lab Shenzhen任高级研究员,研究方向主要为音频前端处理,包括但不限于音频分离、单/多通道语音增强等。 报告题目:腾讯AI Lab音频与语音前端…

网站备案:阿里云ICP备案服务码是什么?申请流程来了

阿里云备案服务码是什么?ICP备案服务码怎么获取?阿里云备案服务码分为免费和付费两种,申请备案服务码是有限制条件的,需要你的阿里云账号下有可用于申请备案服务码的云产品,如云服务器、建站产品、虚拟主机等&#xff…

关于扇区、簇、块、页等概念的区分

1、什么是扇区和(磁盘)块? 物理层面:一个磁盘按层次分为 : 磁盘组合 -> 单个磁盘 -> 某一盘面 (platter)-> 某一磁道 (track)-> 某一扇区(secto…

未针对内部单位 D 的语言 ZH 定义任何语言特定的单位

在写ABAP程序的时候调用功能函数或者调用BDC的时候会要求输入单位。当我们正常输入单位后调用函数就会报错 提示:未针对内部单位 ** 的语言 ZH 定义任何语言特定的单位。但是我们检查表T006和T006A两个后台表的时候, 发现单位在两个表中都存在&#xff0…

vue通过sync标识符 在子组件中更便捷的修改父组件的值

这里 我们创了一个vue2 项目 根组件 App.vue参考代码如下 <template><div><span>{{ name }}</span><text-data :name "name" /></div> </template><script> import textData from "/components/textData&quo…

python网络爬虫笔记20:批量下载图片并将其转换为pdf文档

对于有些网页,你可以预览所有的页面内容,并且也可以通过F12获取到页面的URL,但是面对动辄几十页的图片,手动下载显然是不可行的。 在这里我们给出一个人机交互的通用解决策略。 第一步:使用F12获取页面所有感兴趣图片的URL 这一步看似简单,其实也暗藏玄机。因为有些网…

Java的继承与组合

继承可以帮助实现类的复用。 所以&#xff0c;很多开发人员在要复用代码时会自然的使用类的继承的方式。 但是&#xff0c;遇到想要复用的场景就直接使用继承&#xff0c;这样做是不对的。长期大量的使用继承会给代码带来很高的维护成本。 本文将介绍一种可以帮助复用的新的…

速锐得解码奔驰Actros 系列网关CAN总线应用车载互联微系统

近年来&#xff0c;改变信号处理方式的低成本高速电子电路和制造技术的进步推动了传感技术的发展。借助这些协同领域内的新发展&#xff0c;传感器和制造商可以采用一套全新的方法&#xff0c;如远程自监控和自校准系统智能化&#xff0c;来提高产品的性能。 类似的&#xff0c…

数据结构与算法lab1-哈工大

title: 数据结构lab1-一元多项式的代数运算 date: 2023-05-16 11:42:26 tags: 数据结构与算法 git地址&#xff1a;https://github.com/944613709/HIT-Data-Structures-and-Algorithms 哈尔滨工业大学计算机科学与技术学院 实验报告 课程名称&#xff1a;数据结构与算法 课…

探索iOS之AudioUnit音效框架

iOS的AVAudioUnit提供的音效包括&#xff1a;混响、延迟、均衡器、失真、变速、变调等。按照类型划分为Audio Effect和Time Effect&#xff0c;其中Audio Effect包括混响、延迟、均衡器和失真&#xff0c;而Time Effect主要是变速、变调。 一、音效应用层框架 音效的应用层框…

Kali-linux使用Metasploit基础

Metasploit是一款开源的安全漏洞检测工具。它可以帮助用户识别安全问题&#xff0c;验证漏洞的缓解措施&#xff0c;并对某些软件进行安全性评估&#xff0c;提供真正的安全风险情报。当用户第一次接触Metasploit渗透测试框架软件&#xff08;MSF&#xff09;时&#xff0c;可能…

限速神器RateLimiter源码解析 | 京东云技术团队

作者&#xff1a;京东科技 李玉亮 目录指引 限流场景 软件系统中一般有两种场景会用到限流&#xff1a; •场景一、高并发的用户端场景。 尤其是C端系统&#xff0c;经常面对海量用户请求&#xff0c;如不做限流&#xff0c;遇到瞬间高并发的场景&#xff0c;则可能压垮系统…

优秀的产品经理需要具备的能力和素质

1. 适应性强。市场不断发展&#xff0c;用户的需求也在不断变化。如果产品不能满足需求&#xff0c;那就改变路线&#xff1b;如果会议不再有效&#xff0c;取消它&#xff1b;如果你需要更多的帮助&#xff0c;尽管开口。了解沉没成本&#xff0c;并采取措施使产品朝着正确的方…