转录因子/组蛋白修饰靶基因数据库:Cistrome DB使用教程

news2024/9/23 9:28:53

最近有小伙伴经常询问怎么预测转录因子的下游靶基因,以及预测一些组蛋白修饰影响的靶基因信息。今天就给大家介绍一下Cistrome数据浏览器(Cistrome Data Browser)。

Cistrome DB是来自人类和小鼠的ChIP-seq、ATAC-seq和DNase-seq数据的资源,提供了转录因子、辅因子、染色质重塑因子、组蛋白翻译后修饰和可用于核酸内切酶活性的染色质区域的全基因组位置图。Cistrome DB包含大约45000个人类和44000个小鼠样本;我们可以通过关键字、菜单和数据驱动的搜索工具找到信息丰富的染色质图谱。

浏览器搜索功能可以预测查询基因的调节因子以及潜在顺式调节元件的细胞类型和因子依赖性功能。而且网站还有toolKit可以检索哪个因子调控了我们感兴趣的基因、哪些因子结合在感兴趣的区域;查看哪些转录因子的结果与输入peak的结果有明显的重叠,用于转录因子的colocation分析。Cistrome-GO还可以做ChIP数据集靶基因的功能富集分析。

话不多说,我们来开始操作吧。

网站:http://cistrome.org/db/#/

01  搜索感兴趣的转录因子

打开界面。我们可以在红框里输入感兴趣的转录因子,以CBFB为例。

Species代表物种,Biological Sources 代表生物来源,Factors代表转录因子/组蛋白修饰类型。

图片

这里选择人的造血细胞CBFB的结果进行展示:

图片

每个ChIP-seq和DNase-seq样本都有一个唯一的数据集ID, Cistrome DB为每个数据集(包含手动管理的元数据)进行注释,包括物种、因素、生物来源、发布时间和处理状态。点击单个数据集可获取分析结果和质控指标,点击多个数据集可提取批量数据查看,选择感兴趣的数据集后我们可以将数据发送到genome browser(WashU Browse:、UCSC Browse)进行联合分析,如辅因子、染色质调节因子与组蛋白修饰之间的关系等。

Result下面还有Inspector部分,在红框地方,我们可以点击WashU Brower以及UCSC Browser进行浏览。需要注意的是篮框,我们用到的是CistromeDB:37606的数据。

图片

1. 点击WashU Browser显示如下:

图片

我们可以点击黑灰色部分(上图红色圈圈),弹出如下窗口,进去可以搜索感兴趣的靶基因。

图片

我们也可以直接选中界面区域,进行左右拖动,看整个基因组的可视化情况。下图界面展示CEP20和MYH11的基因可视化情况,可以看到这两个基因的启动子区域都有peak(红框展示)。其中基因上的箭头表示基因的方向性

图片

2. 点击UCSC Browser

直接可以搜索CEP20或MYH11,得到同样的可视化情况。也可以通过点击move的<>等箭头来看整个基因组上的可视化情况。

图片

3. 还可以点击Downlod的BED Peaks 以及BIGWIG File部分进行下载,后用IGV可视化进行浏览(公众号往期文章详细介绍了IGV使用教程)。

图片

找到感兴趣的靶基因后,根据peak的位置提取peak序列后就可以设计引物进行验证了。不过这也只是其他研究者对应的细胞材料的数据,建议大家自己研究还是从ChIP-seq开始,再做ChIP-qPCR,这样更好一些哦。

另外Tools部分还展示了QC reports,QC motifs,Get top putative targets,Check a putative target。

QC reports可以查看数据质量情况:

图片

Motif信息

图片

可以点击查看详细的motif

图片

Get top putative targets

得到排分靠前的靶基因,可以用WashU以及UCSC浏览

图片

点击PER1对应的可视化浏览器得到以下结果:

图片

图片

Check a putative target

查找感兴趣的靶基因,搜索MYH11得到该基因的得分、位置等信息。

图片

02  搜索感兴趣的组蛋白修饰类型

在红框里输入H3K27ac

图片

以3T3-L1(用于贮存脂肪的前脂肪细胞)为例;

点击后

图片

1. 点击WashU Browser显示:

搜感兴趣的基因,以Tcaf1为例;可以看到在启动子区域有明显的peak。

图片

图片

2. 点击UCSC Browser

也定位到Tcaf1这个基因,可以看到同样的peak

图片

3. 还可以点击Downlod的BED Peaks 以及BIGWIG File部分进行下载,后用IGV可视化进行浏览。

图片

图片

另外Tools部分

QC reports可以查看数据质量情况:

图片

Get top putative targets

得到排分靠前的靶基因,可以用WashU以及UCSC浏览

图片

点击Eef2k,看对应的可视化,结果如下:

图片

图片

Check a putative target

查找感兴趣的靶基因;搜索得到Tcaf1该基因的得分、位置等信息

图片

03  Toolkit使用

点击主页面的ToolKit

图片

可以进入以下界面:

  • 1. 查看哪些转录因子靶向感兴趣的基因

  • 2. 查看哪些转录因子靶向感兴趣的区域

  • 3. 查看哪些转录因子的结果与输入peak的结果有明显的重叠,可以用于转录因子的colocation分析。

图片

在第一个找哪些转录因子靶向感兴趣的基因中,输入E2F1为示例,得到结果如下:

可以看到有很多预测到的转录因子靶向E2F1。

图片

点击Result in figure得到以下信息:

图片

  • 1.调节潜能(RP)是一种评估因子调节基因的可能性的分数。

  • 2.X轴表示RP得分。Y轴表示不同的因素。y轴线上的点表示相同的因子。

  • 3.双击某个区域或滚动鼠标放大,然后单击“重新设置”返回。

  • 4.点击每个点提示框中的GSM号码,查找样本信息。

04  Cistrome-GO

为了识别TF直接调控的基因,该网站还开发了一个名为Cistrome GO的网络服务器,该服务器允许用户输入ChIP-seq峰值,并通过加权基因周围峰值的贡献来输出基因得分,以指示TF的调控潜力。重要的是,Cistrome GO使用计算的全基因组评分进一步进行基因本体分析和途径富集。

它有两种工作模式。如果用户同时提供了TF的ChIP-seq文件和差异表达分析文件(基于TF),则Cistrome-GO将基于两种数据类型的整合执行集成模式分析。如果我们仅上传TF ChIP-seq文件,则Cistrome-GO将以单独模式执行分析。

我们可以导入peak的bed文件进行分析。

图片

这里我们直接看一下示例的demo吧

图片

选择GATA4 ChIP的数据

图片

显示的是72934_peaks analysis 前10000个peak

图片

8.941%的峰位于启动子区。这小于20%启动子类型阈值,因此衰减距离设置为10.0kb,适合于增强子类型分析。衰减距离可以在选项中指定。

图片

显示关联基因的信息:

图片

KEGG富集结果

图片

GO结果

图片

总之,Cistrome DB可以找我们感兴趣的转录因子以及组蛋白修饰位点的靶向基因信息,还可以通过toolKit进行可以检索哪个因子调控了我们感兴趣的基因、结合在该区域;查看哪些转录因子的结果与输入peak的结果有明显的重叠,可以用于转录因子的colocation分析。Cistrome-GO还可以做ChIP数据集靶基因的功能富集分析。大家是不是心动了,赶紧用起来吧,顺便提一下做ChIP、CUT&Tag找爱基百客哦,目前CUT&Tag还在春季大促哦。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1527056.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

内网穿透利器 n2n 搭建指南

1. n2n 简介 上文实验分析了 FRP 和 Zerotier 的利弊&#xff0c;本文再介绍另一种内网穿透方案&#xff0c;n2n。 n2n 是 C/S 架构的内网穿透服务&#xff0c;不同于 FRP 的 反向代理&#xff0c;它的原理是类似 Zerotier 的先打孔&#xff0c;打孔失败再尝试转发。关于打孔本…

深入理解Netty以及为什么项目中要使用?(二)Reactor模型

Reactor模型 了解了NIO多路复用后&#xff0c;就有必要再和大家说一下Reactor多路复用高性能I/O设计模式&#xff0c;Reactor本质上就是基于NIO多路复用机制提出的一个高性能IO设计模式&#xff0c;它的核心思想是把响应IO事件和业务处理进行分离&#xff0c;通过一个或者多个…

BUUCTF-Ezsql1

1.打开靶机 打开第一个链接 2.万能密码 使用万能密码&#xff1a;a or 1 # 密码为随意 第二个用kali打开 3.ssh连接靶机 ssh ctf284490d0-7600-4c65-9160-5ced02f45633.node5.buuoj.cn -p 28191 由题可知密码为123456 4.找到并修改index.php文件 找到index.php文件 #内容如…

常见排序及查找算法

内容引用自&#xff1a; 【数据结构和算法】十大经典排序算法&#xff08;动图演示&#xff09; 算法复杂度 1、冒泡排序 1.1、动图演示 遍历列表数据&#xff0c;共遍历length(列表)次&#xff0c;每一次的遍历都要从左到右进行两两比对&#xff0c;左边比右边小&#xff0…

机器人路径规划:基于Bug算法的机器人路径规划(提供Python代码)

一、Bug算法简介 Bug 算法是一种基于追踪障碍物的路径规划算法&#xff0c;它模拟了一种昆虫寻找巢穴的行为&#xff0c;因此得名Bug算法。Bug算法的基本思路是&#xff1a;当机器人遇到障碍物时&#xff0c;他会沿着障碍物的边缘行走&#xff0c;直到到达目标点。该算法可以分…

代码随想录算法训练营第二十五天|216.组合总和III,17.电话号码的字母组合

216.组合总和III 题目 找出所有相加之和为 n 的 k 个数的组合。组合中只允许含有 1 - 9 的正整数&#xff0c;并且每种组合中不存在重复的数字。 说明&#xff1a; 所有数字都是正整数。 解集不能包含重复的组合。 示例 1: 输入: k 3, n 7 输出: [[1,2,4]] 示例 2: 输入…

深入了解JVM底层原理

一、JVM内存结构 1、方法区&#xff1a;存储编译后的类、常量等&#xff08;.class字节码文件&#xff09; 2、堆内存&#xff1a;存储对象 3、程序计数器&#xff1a;存储当前执行的指令地址&#xff08;计算机处理器&#xff08;CPU&#xff09;正在执行的下一条指令在内存…

Java后端八股----JVM篇

上图中线程1&#xff0c;2如果资源被抢占了&#xff0c;则程序计数器记录一下执行的行号&#xff0c;等到资源就绪后会从记录的行号继续向后执行。 Java8把静态变量以及常量放到了线程的本地内存原空间中(避免放在堆中不可控)。 &#x1f446;图中第二种情况不太容易出现…

【Chapter1】操作系统概述,计算机操作系统教程,第四版,左万利,王英

文章目录 一、操作系统的基本概念1.1操作系统的层次结构1.2操作系统的运行视图1.3操作系统的概念(定义)1.4操作系统的功能和目标1.4.1操作系统的功能和目标——作为系统资源的管理者1.4.2操作系统的功能和目标——向上层提供方便易用的服务1.4.2.1GUI&#xff1a;图形化用户接口…

CPU vs. GPU :本质差异是?

他们的目的都是做并行计算的&#xff0c;但并行计算可分为时间上的并行和空间上的并行。所以我觉得本质差异是&#xff1a; CPU 时间并行GPU 空间并行 这样就容易理解他们的工作方式&#xff1a; 对CPU来说&#xff0c;不同的核心可以执行不同的机器指令但GPU则不同&#xff…

长安链开源社区发布2023年度长安链优秀应用案例

1月27日结束的“长安链发布三周年庆暨生态年会”上&#xff0c;在国家区块链技术创新中心的指导下&#xff0c;长安链开源社区联合长安链生态联盟正式发布2023年度长安链行业示范案例、领域精品案例及特色创新案例。 本次评选面向2023年度应用长安链上线并取得应用成效的案例&…

SSA优化最近邻分类预测(matlab代码)

SSA-最近邻分类预测matlab代码 麻雀搜索算法(Sparrow Search Algorithm, SSA)是一种新型的群智能优化算法&#xff0c;在2020年提出&#xff0c;主要是受麻雀的觅食行为和反捕食行为的启发。 数据为Excel分类数据集数据。 数据集划分为训练集、验证集、测试集,比例为8&#…

intelliJ配置Android环境 与 文件目录解释

实验目的与要求&#xff1a; 目的&#xff1a;掌握面向Android编程的开发环境搭建。学习、掌握Android程序编写基本步骤&#xff0c;例如&#xff0c;Android Studio平台编写简单的一个 HelloWorld程序&#xff0c;掌握编译、运行等基本步骤和操作。 内容要求&#xff1a; 搭建…

杂货铺 | vscode配置C/C++环境(亲测极简ver)

文章目录 &#x1f4da;Step1&#xff1a;下载安装VSCode&#x1f4da;Step2&#xff1a;下载安装g&#x1f4da;Step3&#xff1a;编辑环境变量&#x1f4da;Step4&#xff1a;安装vscode插件&#x1f4da;Step5&#xff1a;建好文件夹⭐️&#x1f4da;Step6&#xff1a;开始…

【Node.js从基础到高级运用】十三、NodeJS中间件高级应用

在现代web开发中&#xff0c;Node.js因其高效和灵活性而备受青睐。其中&#xff0c;中间件的概念是构建高效Node.js应用的关键。在这篇博客文章中&#xff0c;我们将深入探讨Node.js中间件的高级应用&#xff0c;包括创建自定义中间件、使用第三方中间件等。我们将从基础讲起&a…

qt vs 编程 字符编码 程序从源码到编译到显示过程中存在的字符编码及隐藏的字符编码转换

理解字符编码&#xff0c;请参考&#xff1a;unicode ucs2 utf16 utf8 ansi GBK GB2312 CSDN博客 了解windows字符显示必须了解locale概念 参考&#xff1a;揭密 Windows 上的各种 locale - 知乎 汉字&#xff08;或者说多字节字符&#xff09;的存放需求&#xff0c;是计算…

【CSP试题回顾】202309-2-坐标变换(其二)

CSP-202309-2-坐标变换&#xff08;其二&#xff09; 解题代码 #include <iostream> #include <vector> #include <cmath> #include <iomanip> using namespace std;struct MyOpt {double k, theta; }; int n, m, opt, s, e; double para, x, y;int …

Java项目:62 基于ssm的校园驿站管理系统+jsp

作者主页&#xff1a;舒克日记 简介&#xff1a;Java领域优质创作者、Java项目、学习资料、技术互助 文中获取源码 项目介绍 管理员管理快递仓库信息&#xff0c;管理待发货信息&#xff0c;管理已收快递&#xff0c;管理物流以及留言信息&#xff0c;管理员工和用户资料。 员…

C++——字符串、读写文件、结构体、枚举

个人简介 &#x1f440;个人主页&#xff1a; 前端杂货铺 &#x1f64b;‍♂️学习方向&#xff1a; 主攻前端方向&#xff0c;正逐渐往全干发展 &#x1f4c3;个人状态&#xff1a; 研发工程师&#xff0c;现效力于中国工业软件事业 &#x1f680;人生格言&#xff1a; 积跬步…

【Java】高级篇1:异常处理

异常&#xff1a;程序在执行过程中出现的非正常情况&#xff0c;如果不处理最终会导致JVM的非正常停止。 Java的异常抛出机制 Java异常体系 1、Throwable 2、Error和Exception 异常处理方式 1、try-catch-finally&#xff08;捕获异常&#xff09; 基本结构&#xff1a; 使用…