易基因:全基因组CpG密度和DNA甲基化分析方法比较(MeDIP、RRBS和WGBS)| 研究综述

news2024/12/26 21:12:41

大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。

CpG密度(CpG density)与各种组织中的DNA甲基化相关。基因组按CpG密度分为:CpG岛(CpG island,CGI)、CpG岛上下游2kb以内的区域(CpG shore ,CpG岛岸)、CpG岛岸上下游2kb以内的区域(CpG shelve,CpG大陆架),一共5个区域,分别统计各区域的甲基化水平。

全基因组DNA甲基化分析是用于基因组表征和差异DNA甲基化分析的最常见表观遗传学过程之一。先前的全基因组分析表明,CpG密度是DNA甲基化方法中的一个重要变量。目前的研究旨在分析各种不同物种基因组中的CpG密度,并将其与各种DNA甲基化分析数据集进行关联分析。对人、大鼠、鸟类、鱼类的基因组中观察到类似的结果:90%以上的基因组区域属于低密度类别(1-3 CpG/100bp),小于10%的基因组区域属于高密度类别(>5 CpG/100bp)。甲基化DNA免疫沉淀(MeDIP)使用抗5-甲基胞嘧啶抗体免疫沉淀,然后进行下一代测序(MeDIP-Seq),MeDIP偏好<5 CpG/100bp的低CpG密度(对应>95%的基因组)。减少代表性重亚硫酸盐测序(RRBS)通常在≥3CpG/100bp的较高CpG密度区域中鉴定DMR(对应约20%的基因组)。全基因组重亚硫酸盐测序(WGBS)在通常大于10 CpG/100bp更高的CpG密度区域分析,且WGBS可鉴定≥2 CpG/100bp区域(约占基因组50%)。CpG密度是DNA甲基化分析中的关键变量,不同分子技术专注于不同的基因组区域,本文比较了MeDIP-Seq、RRBS、WGBS三种DNA甲基化分析方法。

比较方法

MeDIP-seq、RRBS、WGBS每种技术均从目标细胞类型或组织的DNA提取和纯化开始。

MeDIP-seq将DNA超声处理成几百个碱基对的短片段,产生单链DNA以实现有效的抗体结合,然后使用5-甲基胞嘧啶抗体结合包含甲基化CpG位点的片段。这些片段通常用结合抗体的磁珠分离,并用PCR扩增DNA后测序。PCR包括通用引物和索引引物以及条形码引物,以扩增所有DNA片段。MeDIP-seq的局限在于无法达到单碱基分辨率,不是高通量测序,不能鉴定单个CpG甲基化水平和高密度的CpG位点。

基于亚硫酸盐转化的RRBS和WGBS是可以达到单碱基分辨率的高通量DNA甲基化测序方法。

RRBS使用甲基化敏感的限制性内切酶消化,在高GC密度CpG位点将未甲基化的DNA酶切成片段。对这些片段进一步处理并选择大小并靶向启动子和CpG岛区域,所得片段进行亚硫酸盐转化,将未甲基化的胞嘧啶转化为尿嘧啶,同时保留未转化的甲基化胞嘧啶,随后对片段进行PCR扩增并测序。

WGBS对全基因组进行亚硫酸盐处理和分析,在亚硫酸盐转化之前不进行甲基化片段分离。对亚硫酸盐转化后的全基因组甲基化进行测序,并使用各种生物信息学方案,通常用于基因组表征。

比较结果

在人、大鼠、鱼(斑马鱼和钢头鳟鱼)和鸟类(鸡)基因组中研究了全基因组CpG密度分布。从NCBI或Ensembl获得参考基因组序列,初步分析1000bp窗口鉴定全基因组CpG密度。基因组主要由<3 CpG/100bp的CpG密度较低区域组成,小部分基因组位点的CpG密度较高。在所有不同物种的基因组中观察到类似结果。在<3 CpG/100 bp的基因组区域中,对应于97%的人基因组、98%的大鼠基因组、88%的斑马鱼基因组、93%的钢头鳟鱼基因组、94%的鸡基因组。基因组中很少有1kb区域>20CpG/100bp(人1,鸡8,其他0),存在一些>10CpG/100bp的CpG密度较高区域(即CpG岛)(约占基因组1%),但绝大多数密度<5CpG/100bp。在大鼠基因组中,48%的100bp基因组窗口没有CpG,但当使用1kb窗口时,基因组下降到5%。结果表明基因组主要为低CpG密度,在用于研究全基因组DNA甲基化的方法中需要考虑到这一点。

图1:全基因组CpG密度。对应于CpG/100 bp的全基因组1 kb区域数。

(a)人、(b)大鼠、(c)钢头鳟鱼、(d)斑马鱼、(e)鸡

MeDIP-seq分析

此前研究已证明MeDIP分析偏好基因组低密度CpG区域。在NCBI GEO下载每个物种基因组发布的可用MeDIP-Seq数据集,以鉴定获得数据的CpG密度分布。图2为不同物种MeDIP-seq数据的代表性实例,分析重点在于两个不同样品组比较以鉴定用于数据分析的差异DNA甲基化区域(DMR)。MeDIP-seq数据集的DMR CpG密度分析结果表明大部分DMR为0–3 CpG/100bp的CpG密度,主要密度为1 CpG/100 bp,这与代表性基因组中的主要密度相关。在不同物种样本之间观察到一些变化,斑马鱼DMR尤其显示出向稍高的1-4 CpG/100 bp的CpG密度转变,可能归因为精子和红细胞两种不同细胞类型。总之结果表明MeDIP-seq数据能有效分析低密度基因组CpG区域(<3 CpG/100 bp),其占不同物种的基因组90%以上。

图2:甲基化DNA免疫沉淀测序(MeDIP-Seq)

差异DNA甲基化区(DMRs)的百分比对应于每100bp的CpG位点数量。

(a)人类MeDIP研究1 DMR;(b)人类MeDIP研究2 DMR;(c)大鼠MeDIP研究1 DMR;(d)大鼠MeDIP研究1 DMR;(e)斑马鱼MeDIP研究1 DMR;(f)斑马鱼MeDIP研究1 DMR;(g)斑马鱼MeDIP研究2 DMR;(h)钢头鳟MeDIP研究1 DMR;(i)钢头鳟MeDIP研究1 DMR;(j)鸡MeDIP研究1 DMR;(k)鸡MeDIP研究2 DMR;(l)鸡MeDIP研究2 DMR。

RRBS分析

在几种不同物种中比较了用于DNA甲基化分析的RRBS方法,确定每个数据集的CpG/100bp密度(图3)。数据集分析结果表明在DMR CpG密度分布中显示出分裂:一些数据集显示在>10 CpG/100 bp 的RRBS DMR中,CpG密度向更高方向变化,而其他数据集则显示向中等CpG密度变化。图2(a-c)和图3(c)中>10 CpG/100 bp的 CpG密度主要为10-12 CpG/100 bp,但如果增加到1 kb,则>10 CpG中约2/3低于10 CpG/1 kb。除鱼类之外,只观察到1或2 CpG/100 bp密度可忽略检测。结果表明,与MeDIP分析相比,RRBS数据偏向更高密度的CpG区域(如≥3CpG/100bp)。有趣的是,钢头鳟鱼的数据集在两个不同实验室的相同样品上分别使用了MeDIP-Seq和RRBS方法(图2和图3),因此对相同样品的不同分析进一步证明了MeDIP对较低密度CpG的偏倚和RRBS对较高密度CpG的偏倚。

图3:不同物种的减少代表性亚硫酸盐测序(RRBS)

差异DNA甲基化区域(DMR)的百分比对应于每100bp的CpG位点数量

(a) 人类RRBS研究1 DMR;(b)人类RRBS研究1 DMR;(c)大鼠RRBS研究1 DMR;(d)大鼠RRBS研究1 DMR;(e)斑马鱼RRBS研究1 DMR;(f)斑马鱼RRBS研究1 DMR;(g)斑马鱼RRBS研究2 DMR;(h)斑马鱼RRBS研究2 DMR;(i)钢头鳟鱼RRBS研究1 DMR;(j)钢头鳟鱼RRBS研究1 DMR。

WGBS分析

在几个不同物种中比较了用于DNA甲基化的全基因组重亚硫酸盐(WGBS)分析方法,确定每个分析的DMR CpG/100bp密度(图4)。结果表明WGBS数据集的CpG密度与RRBS数据集CpG密度范围类似。在向更高CpG密度(2-5 CpG/100bp)发生微小变化的分析与>10 CpG/100 bp的CpG密度分析之间存在差异。除了鸡之外,1 CpG/100 bp DMR的检测最少。观察结果表明,WGBS数据靶向比MeDIP分析更高密度的CpG区域。

图4:不同物种的全基因组重亚硫酸盐(WGBS)分析

(a) 人类WGBS研究1 DMR;(b)大鼠WGBS研究1 DMR;(c)大鼠WGBS研究2 DMR;(d)斑马鱼WGBS研究1 DMR;(e)斑马鱼WGBS研究2 DMR;(f)鸡WGBS研究1 DMR。

图5:不同DNA甲基化分析方法的基因组百分比

(a) 每种方法的基因组百分比(1kb基因组窗口的百分比)与所有物种的平均值。总条形图表示MeDIP 0–5 CpG/100bp、WGBS≥2 CpG/100bp、RRBS≥3 CpG/100bp、CpG岛芯片阵列的基因组总百分比。空心条表示不同方法的reads比对限制百分比。

(b) MeDIP 0–5 CpG/100 bp、WGBS≥2 CpG/100 bp和RRBS≥3 CpG/100 bps的每种方法在不同物种的基因组百分比(插图图例)。

易基因科技提供全面的DNA甲基化研究整体解决方案。

参考文献:

Beck D, Ben Maamar M, Skinner MK. Genome-wide CpG density and DNA methylation analysis method (MeDIP, RRBS, and WGBS) comparisons. Epigenetics. 2022 May;17(5):518-530.

相关阅读:

干货系列:DNA甲基化研究的3大前期探索性实验思路

干货分享:DNA甲基化研究的测序数据挖掘思路

14种全基因组DNA甲基化测序(WGBS)标准分析比对软件的比较 | 生信专区

2022最新:8种常用DNA甲基化测序技术,你知道几个?

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/422218.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

FFMPEG VCL Pack Crack显示位置支持或光标

FFMPEG VCL Pack Crack显示位置支持或光标 FFMPEG VCL Pack是一个组合解决方案和平台&#xff0c;用于在Delphi中录制、转换和传播音频和视频&#xff0c;其中包括音频/视频库中的前一个libavcodec。 FFMPEG VCL Pack功能和选项&#xff1a; 新的Live555公司基于Rtsp Media Ser…

基于深度学习的安全帽检测系统(YOLOv5清新界面版,Python代码)

摘要&#xff1a;安全帽检测系统用于自动化监测安全帽佩戴情况&#xff0c;在需要佩戴安全帽的场合自动安全提醒&#xff0c;实现图片、视频和摄像头等多种形式监测。在介绍算法原理的同时&#xff0c;给出Python的实现代码、训练数据集&#xff0c;以及PyQt的UI界面。安全帽检…

设计模式之迭代器模式(C++)

作者&#xff1a;翟天保Steven 版权声明&#xff1a;著作权归作者所有&#xff0c;商业转载请联系作者获得授权&#xff0c;非商业转载请注明出处 一、迭代器模式是什么&#xff1f; 迭代器模式是一种行为型的软件设计模式&#xff0c;提供一种方法能顺序访问聚合对象中的各个元…

如何做好缓存设计?

大家好&#xff0c;我是易安&#xff01;今天我们来谈一谈缓存应该如何设计。 什么是缓存 缓存是一种临时储存数据的方式。当用户查询数据时&#xff0c;系统会首先在缓存中查找&#xff0c;如果数据已经存在于缓存中&#xff0c;则直接使用&#xff0c;否则系统会到数据的原始…

研报精选230410

目录 【行业230410西南证券】医药行业2023年4月投资月报&#xff1a;看好创新药和中药行情【行业230410国信证券】汽车行业4月投资策略&#xff1a;3月新能源乘用车批发销量预计同比增长32%&#xff0c;持续关注板块年报季报行情【行业230410西南证券】医药行业周报&#xff1a…

【集成架构】探索3种顶级「集成框架」Apache、Spring和Mule

正确的集成框架是绑定应用程序架构构建块的粘合剂。应用程序组件必须不断交换关键数据&#xff0c;以方便用户操作、服务扩展、威胁监视、后端操作、事件触发等。如果没有可靠的集成过程&#xff0c;应用程序和服务故障将淹没软件环境。正确的集成框架是绑定应用程序架构构建块…

【JAVA】#详细介绍!!! synchronized 加锁 详解(1)!

本文分以下几点来介绍synchronized&#xff08;根据JDK1.8&#xff09; 1. 介绍synchronized 2. synchronized 为什么能保证线程安全 3. synchronized 的 用法 4. synchronized 的锁特性 目录 1. 介绍synchronized 2. synchronized的用法 2.1 synchronized修饰指定代码块 2…

如何定位Spark数据倾斜问题,解决方案

文章目录前言一、数据倾斜和数据过量二、 数据倾斜的表现三、定位数据倾斜问题定位思路&#xff1a;查看任务-》查看Stage-》查看代码四、7种典型的数据倾斜场景解决方案一&#xff1a;聚合元数据解决方案二&#xff1a;过滤导致倾斜的key解决方案三&#xff1a;提高shuffle操作…

谁才是天下第一关?

什么是关&#xff0c;中华大地有多少关&#xff1f; 关是往来必由之要处。“山川扼要&#xff0c;是设关津。表封藏&#xff0c;以达道路&#xff0c;天险既呈&#xff0c;人力并济”。 关可分为&#xff1a; 关防&#xff0c;驻兵防守的要塞&#xff1b;关津&#xff0c;水陆…

python笔记:qgrid

在Jupyter Notebook中像在Excel一样操作pandas的DataFrames&#xff0c;如sort/filter&#xff0c;并轻松把操作后的数据用于后续分析。 0 安装 pip install qgrid jupyter nbextension enable --py --sys-prefix qgrid 1 基本使用方法 1.1 数据 import numpy as np import…

Carla 保姆级安装教程

一&#xff1a;电脑配置 carla支持windows,Linux系统构建&#xff0c;官方对于安装电脑的最低配置要求是拥有6G显存的GPU&#xff0c;推荐8G显存的GPU&#xff0c;至少需要20G的存储空间&#xff0c;所有对电脑的配置要求是不小的挑战。 我所使用电脑的硬件配置&#xff1a;3…

3.7 曲率

学习目标&#xff1a; 如果我要学习高等数学中的曲率&#xff0c;我会遵循以下步骤&#xff1a; 1.熟悉相关的数学概念&#xff1a;在学习曲率之前&#xff0c;我们需要了解曲线、切线和曲率半径等相关的数学概念。因此&#xff0c;我会复习这些概念&#xff0c;以便更好地理…

网卡别名的设置

文章目录1. 网卡别名是什么2. 工作原理3. 设置3.1 临时添加&#xff0c;重启失效3.1.1 使用ipconfig命令来设置网卡别名3.1.2 使用ip addr命令来设置网卡别名3.2 永久性添加3.3 查看参考1. 网卡别名是什么 IP别名就是一张物理网卡上配置多个IP&#xff0c;实现类似子接口之类的…

制作PassMarkMemTest86启动U盘

制作PassMarkMemTest86启动U盘1. 概述2.制作 PassMarkMemTest86 启动U盘结束语1. 概述 PassMarkMenTest86 是一款免费、开源且强大的内存检测工具&#xff0c;能测试电脑内存的稳定性、存储大小和隐性问题&#xff0c;它还拥有 13 种不同的 RAM 测试算法&#xff0c;在主菜单中…

洛丽运动会 NFT 作品集第一弹

欢迎来到 2036 年洛丽运动会&#xff0c;这是一个以史前世界为背景的体育小游戏体验。为了庆祝这场伟大比赛的开始&#xff0c;结合了史前和运动配件的 NFT 系列将于北 The Sandbox 市场平台发布。 运动和格斗设备将提高你在运动会上的技能&#xff1b;而史前配件将使你与体育场…

Linux高并发服务器(webserver)

一.有限状态机 它的转移函数表示系统从一个状态转移到另一个状态的条件 二.EPOLL 在内核中创建一个数据&#xff0c;这个数据有两个比较重要的数据&#xff0c;一个是需要检测的文件描述符的信息&#xff08;红黑树&#xff09;&#xff0c;一个双向链表&#xff0c;存放检测到…

Java类加载机制介绍

类加载机制的简单介绍 类加载机制是指将.class字节码文件读入到内存中。在运行时数据区中的方法区保留类的数据结构&#xff0c;在堆中创建一个与之对应的Class对象。 类的生命周期主要经历7个阶段&#xff1a;加载、验证、准备、解析、初始化、使用、卸载 其中从加载到初始化…

如何通俗易懂的解释无线通信中的那些专业术语!

这是一篇来自网络的非常经典的一篇老文&#xff0c;原作者不详&#xff0c;但非常值得一读&#xff01; 香农定理 类比&#xff1a;城市道路上的汽车的车速和什么有关系&#xff1f;和道路的宽度有关系&#xff0c;和自己车的动力有关系&#xff0c;也其他干扰因素有关系&…

Unity接SDK - 极光推送

2021.09.09记录&#xff0c;2023发布&#xff0c;如有不对&#xff0c;还请包含。发晚了 如果想看Android原生接入JPush - SDK&#xff0c;移步Android原生集成JPush SDK_jpush android sdk v4.7.2 极光推送 - 接入 版本&#xff1a; Unity 2020.3.10f1 JPush - Unity 3…

linux系统安全及应用

目录一、账号安全控制1.1基本安全措施1.1.1系统账号的清理1.1.1.1将非登录用户的Shell设为/sbin/nologin1.1.1.2锁定长期不使用的账号1.1.1.3删除无用账号1.1.1.4锁定账号文件passwd、shadow1.1.2密码安全控制1.1.2.1设置密码有效期1.1.2.2要求用户下次登录时修改密码1.1.3命令…