UseGalaxy.cn生信云|生物信息必备技能-出版级别的circos圈图绘制

news2025/1/11 20:49:15

2023-11-06,Galaxy生信云平台 UseGalaxy.cn 新增circos圈图绘制工具。

Graph/Display Data

  • Circos visualizes data in a circular layout (Galaxy Version 0.69.8+galaxy12)

Circos(Krzywinski等人,2009年)是一个用于以圆形布局可视化数据的软件包。这使得Circos非常适合探索对象或位置之间的关系。Circos图表已经出现在成千上万的科学出版物中。尽管最初设计用于可视化基因组数据,但它可以根据任何领域的数据创建图表。

文章图形复现

图形/数据来源:

Teles Alves I, Hiltemann S, Hartjes T, et al. Gene fusions by chromothripsis of chromosome 5q in the VCaP prostate cancer cell line. Hum Genet. 2013;132(6):709-713. doi:10.1007/s00439-013-1308-1

664a6731e4e29b4ff5c5c549459047e7.png

在这篇文章中,各种来源的数据被整合到一个综合的Circos图中。下面我们就来复现这个图,首先我们先了解一下Circos的基础。

1. Circos基础

1.1 外层骨架(Ideogram)

对于基因组数据,通常是染色体,但也可能是物种、基因,或者是另一个分辨率级别,这取决于你想要展示的关系。对于非基因组数据,这可能是人群中的个体、国家,或者是你想用来进行分组的数据的任何其他主要方面。

1.2 数据轨道(Data Tracks)

在骨架之内,我们可以绘制数据轨道。有不同类型的图表可用,例如:

  • 散点图(Scatter plot)

  • 线图(Line plot)

  • 直方图(Histogram)

  • 热图(Heatmap)

  • 方块图(Tile)

  • 文本(Text)

  • 连接(Link)

  • 条带(Ribbons)

轨道可以进行很多定制,一些相关的概念包括:

  • Radius:轨道的半径决定了它在中心(0)和表意图(1)之间的位置。

  • Rules:可以定义规则,根据数据点的值改变数据点的颜色,例如。

  • Axes and backgrounds:可以在数据轨道上绘制轴和背景。

2. 复现步骤

工具位置:UseGalaxy.cn首页 > Graph/Display Data > Circos visualizes data in a circular layout

或者:https://usegalaxy.cn/root?tool_id=toolshed.g2.bx.psu.edu/repos/iuc/circos/circos/0.69.8+galaxy12

2.1 数据准备

可以下载原文中的数据上传到网站:

https://zenodo.org/record/4494146/files/VCaP_Copy-Number.tsv
https://zenodo.org/record/4494146/files/VCaP_B-allele-Frequency.tsv
https://zenodo.org/record/4494146/files/VCaP-highConfidenceJunctions.tsv
https://zenodo.org/record/4494146/files/hg18_karyotype_withbands.txt

或者用网站上整理好的共享数据:

网站首页(UseGalaxy.cn)> 数据共享 > 数据库 > circos,该目录下有4个测试文件:

  • hg18_karyotype_withbands.txt,染色体骨架文件

  • circos-sv.tsv,结构变异信息

  • circos-cnv.tsv,拷贝数变异信息

  • circos-baf.tsv,次等位基因频率

2.2 Ideogram

由于圈图要呈现的数据很多,参数设置复杂,因此不可能一次就画好,而是有一个不断迭代的过程,一圈一圈地画。

操作:设置Ideogram

我们首先只设置骨架文件,其他参数保持默认:

6113fad0b07ea8d27fd384419d81a65b.png

运行看看结果:

9bab0cd76cb47bf3da0735fd3fff1448.png

可以看到,只有一个圈。

我们接着设置:

ff0df9a90ac643c9fe0d3b9fe5354ff6.png

点击“Run Tool”,等待运行结束,点击结果文件右边的铅笔图标,将文件改名为:Circos Plot ideogram。

94322647a776bbd9e422918827252d52.png

小知识:

染色体定义的格式如下:chr - ID LABEL START END COLOR

前两个字段始终是chr,表示该行定义了一个染色体,以及 -。第二个字段定义了父结构,仅用于染色体条带定义。

ID 是数据文件中使用的标识符,而 LABEL 是将出现在图像上的骨架旁边的文本。

START和END定义了染色体的大小。核型文件应该存储整个染色体的大小,而不仅仅是您希望绘制的区域。我们可以使用其他参数仅绘制数据的子集(例如,只有一个染色体)。

COLOR参数是可选的,要使用内置的颜色方案,请再次在此列中使用chr1、chr2等。

2.3 数据轨道一:结构变异

结构变异需要提供两个断点的位置,如下:

chromosome    start    end    chromosome    start    end
  • 第一个断点的染色体编号,开始位置,结束位置

  • 第二个断点的染色体编号,开始位置,结束位置

76b72d4de70c2ea3e2178486f74575a9.png

操作:添加结构变异的连线轨道

  1. 点击右侧历史记录中的Circos Plot ideogram文件名,点击“Run Job Again”(一个转圈的箭头)

  2. 结构变异轨道参数设置:

c4adb19d2cc8bfc115c971132534e169.png

82391dbadd277797514d583a0290456f.png

可以看到,5号染色体有许多染色体内的结构变异,我们可以单独画出5号染色体的结构变异。

最后, 将结果文件改名为:Circos Plot SVs

操作:只画5号染色体

  1. 重新运行刚才的工具

  2. 改变参数设置:

315542e60219113fe0d6613c8bfecee8.png

得到如下图片:

3816731bc224f5f35bee1ef88ad9c611.png

2.4 数据轨道二:拷贝数变异

拷贝数变异需要准备的数据格式:

chr    start    end    value
  • chr,染色体

  • chr,变异开始位置

  • end, 变异结束位置

  • value,变异倍数

5b50d603c0c24b6685606bf742bb1d68.png

操作:增加拷贝数轨道

  1. 重新运行画“Circos Plot SVs”的工具。

  2. 增加一个散点图轨道到图形中:

0a2bcc35af4163b559c1b2624b63f7e6.png

结果如下:

0e33b586d0607426360af89e0acf1790.png

可以看到,拷贝数轨道与结构变异轨道重叠了。这是因为没有个性结构变异轨道的半径设置:

  1. 重新运行工具,改变以下参数:

In "Link Tracks":
    - In "1: Link Data":
        - "Inside Radius": 0.75

应该看到这样的图:

e0ab795967c691cdf5c443f4efe8bf82.png

操作:用不同颜色标记拷贝数变异状态

  1. 重新运行上一步的结果

  2. 在2D data track的拷贝数轨道中,增加以下规则:

923a9df70081509f341f1f62f3ca6a30.png

应该得到如下结果:

fe810cbbcd6b96b51999a29353ad4b64.png

操作:为拷贝数轨道增加坐标轴

  1. 重新运行刚才的结果

  2. 在2D data track中的拷贝数轨道设置页面:

6154d3e643109b640b39865d2a9d45c2.png

结果如下:

717c96196c223d3e1621abe15fcef1a2.png

最后, 重命名结果文件为:Circos Plot CopyNumber

2.5 数据轨道三:次等位基因频率

数据格式与拷贝数变异的类似,也是准备4列数据:

chr    start    end    value

操作:增加次等位基因频率到图中

  1. 重新运行刚才的工具(Circos Plot CopyNumber)

  2. 增加新的散点图轨道到图中:

c5b8f111df0ecf0fb3f4ea62a76a2928.png

最后, 重命名结果文件:Circos Plot BAF

结果图:

eb1a4b83a5bada559e5b4e3969b19294.png

2.6 存在问题:如何将结构变异轨道拆分成两个

操作:两个连接轨道

  1. 重新运行刚才的工具(Circos Plot BAF)

  2. 配置两个单独的连接轨道

072f9285e431610807e81d149e50e8e8.png 9c9ee46e11c00ebdc0ed99ed6dd0c68d.png

最后结果:

ad121b599c4722aefef04c61f0282f19.png

可以看到,跟原图完全一样,可以说复现效果达到了100%。

友情提示

使用问题请加入Galaxy中国交流群: 925694514(QQ群,免费加入),或者关注公众号:简说基因。

8d2e2c86366b823b9e7c980a36aac9f0.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1179188.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

lv10 嵌入式开发 在线英英词典

1 有道词典流程分析及本项目功能描述 1.1 抽取项目原理分析 本项目功能描述 用户注册和登录验证服务器端将用户信息和历史记录保存在数据库中。客户端输入用户名和密码,服务器端在数据库中查找、匹配,返回结果单词在线翻译根据客户端输入的单词在字典文…

项目实战:组件扫描实现(1)-扫描类路径所有文件

1、ComponentScan 组件扫描类 一下知识本人都是在Maven工程下总结的,所以目录结构会不一样这个类的作用是扫描所有的classes目录下的所有的字节码文件,找到相应的类,然后找到相应类上的注解 package com.csdn.mymvc.core; import java.io.Fi…

Single-cell 10x Cell Ranger analysis

first step download SRR data #这是批量下载 nohup prefetch -X 100GB --option-file SRR_Acc_List.txt & nohup fastq-dump --gzip --split-files -A ./SRR13633760 -O /home/scRNA/ &next Build a custom reference using Cell Ranger mkref 首先,找…

音视频技术开发周刊 | 318

每周一期,纵览音视频技术领域的干货。 新闻投稿:contributelivevideostack.com。 日程揭晓!速览深圳站大会专题议程详解 LiveVideoStackCon 2023 音视频技术大会深圳站,保持着往届强大的讲师阵容以及高水准的演讲质量。两天的参会…

selenium自动化测试入门 —— 层级定位与定位一组元素

一、层级定位(二次定位) 在实际测试过程中,一个页面可能有多个属性基本相同的元素,如果要定位到其中的一个,这时候需要用到层级定位。先定位其父元素,然后再通过父元素定位该元素。 示例:通过层级定位搜狗输入框 dr…

Mac版eclipse如何安装,运行bpmn文件

一、下载程序包 网址:https://www.eclipse.org/downloads M2芯片安装包名称:eclipse-jee-2022-12-R-macosx-cocoa-aarch64.dmg 具体安装包版本根据自己电脑型号选择 二、eclipse安装步骤 1)双击下载的文件 2)将eclipse拖入到…

京东大数据:2023年Q3美妆行业数据分析报告

近日,珀莱雅发布三季报,今年前三季度,公司实现营收52.49亿元,同比增长32.47%。分季度看,“618大促”所在Q2业绩增长最为亮眼,营收同比增速达到46.22%,进入Q3,在电商大促缺席情况下&a…

Python---字符串的修改方法---split()方法--切割

split()方法 split 英 /splɪt/ v. 分裂,使分裂(成不同的派别);分开,使分开(成为几个部份);(使)撕裂;分担,分享;划破…

Linux:进程控制的概念和理解

文章目录 进程的创建fork函数写时拷贝的原理fork函数的用法和失败原因 进程终止进程的退出进程异常的问题 进程终止进程退出 进程等待什么是进程等待?为什么要进行进程等待?如何进行进程等待?父进程如何知道子进程的退出信息? wai…

element的表单校验证件号规则以及输入“无”的情况校验通过

element的表单校验证件号规则以及输入“无”的情况校验通过 <el-col :span"6"><el-form-item label"证件号码" prop"Idnumber" class"grid-content bg-purple"><el-input v-model"testForm.Idnumber" placeh…

Spark Core

Spark Core 本文来自 B站 黑马程序员 - Spark教程 &#xff1a;原地址 第一章 RDD详解 1.1 为什么需要RDD 分布式计算需要 分区控制shuffle控制数据存储、序列化、发送数据计算API等一系列功能 这些功能&#xff0c;不能简单的通过Python内置的本地集合对象&#xff08;如…

如何使用VSCode来查看二进制文件

2023年11月6日&#xff0c;周一下午 目录 方法1&#xff1a;安装插件Binary Viewer然后用vscode打开一个二进制文件&#xff0c;并点击右上角的"HEX"方法2&#xff1a;安装插件Binary然后用vscode打开一个二进制文件&#xff0c;并点击右上角的"B" 方法1&…

如何使用群晖NAS的Audio Station结合内网穿透实现远程访问本地曲库

文章目录 本教程解决的问题是&#xff1a;按照本教程方法操作后&#xff0c;达到的效果是本教程使用环境&#xff1a;1 群晖系统安装audiostation套件2 下载移动端app3 内网穿透&#xff0c;映射至公网 很多老铁想在上班路上听点喜欢的歌或者相声解解闷儿&#xff0c;于是打开手…

Webpack 中 loader 的作用是什么?常用 loader 有哪些?

说说webpack中常见的Loader&#xff1f;解决了什么问题&#xff1f;- 题目详情 - 前端面试题宝典 1、loader 是什么 loader是 webpack 最重要的部分之一。 通过使用不同的 loader&#xff0c;我们能够调用外部的脚本或者工具&#xff0c;实现对不同格式文件的处理。 loader…

汽车电子中的深力科推荐一款汽车用功率MOSFET NVTFS6H888NLTAG N沟道

NVTFS6H888NLTAG MOSFET是符合AEC-Q101标准的汽车用功率MOSFET&#xff0c;采用WDFN-8封装&#xff0c;实现紧凑设计。具有低QG和电容&#xff08;最大限度地降低驱动器损耗&#xff09;和低 RDS(on)&#xff08;降低传导损耗&#xff09;。还提供可湿性侧翼选项&#xff0c;用…

OpenSign 开源 PDF 电子签名解决方案

OpenSign 是一个开源文档电子签名解决方案&#xff0c;旨在为 DocuSign、PandaDoc、SignNow、Adobe Sign、Smartwaiver、SignRequest、HelloSign 和 Zoho Sign 等商业平台提供安全、可靠且免费的替代方案。 特性&#xff1a; 安全签名&#xff1a;利用最先进的加密算法来确保…

Python 使用Scapy构造特殊数据包

Scapy是一款Python库&#xff0c;可用于构建、发送、接收和解析网络数据包。除了实现端口扫描外&#xff0c;它还可以用于实现各种网络安全工具&#xff0c;例如SynFlood攻击&#xff0c;Sockstress攻击&#xff0c;DNS查询攻击&#xff0c;ARP攻击&#xff0c;ARP中间人等。这…

Akshare获取同花顺行业

使用akshare可以很方便的获取同花顺行业列表&#xff0c;与每个行业对应的个股信息&#xff0c;流程如下&#xff1a; 使用ak.stock_board_industry_summary_ths()获取行业列表循环行业列表&#xff0c;使用ak.stock_board_industry_cons_ths()获取行业对应的个股信息 官方文…

工厂模式 rust和java的实现

文章目录 工厂模式特点介绍工厂模式包含以下几个核心角色&#xff1a;实现架构java 实现rust实现rust代码仓库 工厂模式 工厂模式&#xff08;Factory Pattern&#xff09;是最常用的设计模式之一。这种类型的设计模式属于创建型模式&#xff0c;它提供了一种创建对象的最佳方…

gitlab数据备份和恢复

gitlab数据备份 sudo gitlab-rake gitlab:backup:create备份文件默认存放在/var/opt/gitlab/backups路径下&#xff0c; 生成1697101003_2023_10_12_12.0.3-ee_gitlab_backup.tar 文件 gitlab数据恢复 sudo gitlab-rake gitlab:backup:restore BACKUP1697101003_2023_10_12_…