甲基化组学全流程生信分析教程

news2024/11/24 15:25:15

甲基化组学全流程分析和可视化教程

读取数据目录下的idat文件的甲基化全流程一键分析

功能简介

  1. 甲基化分析模块可以实现甲基化芯片450K, 870kEPIC数据的自动读取,可以读取idat文件,也可以读取beta甲基化矩阵文件
  2. 甲基化数据的缺失值插值
  3. 甲基化数据的质控分析
  4. 甲基化数据的归一化处理分析
  5. 甲基化数据的SVD分析
  6. 甲基化数据的Combat去除批次效应分析
  7. 甲基化数据的DMP差异甲基化位点分析
  8. 甲基化数据的DMR差异甲基化区域分析
  9. 甲基化数据的差异block分析
  10. 甲基化数据的GSEA分析
  11. 甲基化数据的CNA分析

参数解释

func_arraytype:可选450k或EPIC,EPIC是870K的甲基化芯片

func_resultsDir: 分析结果要保存的目录

func_compare__groups__str: 做DMP和DMR分析时候要指定的比较分组,多个分组间用;号隔开

func_runBlock:是否进行比较耗时的block分析,默认为FALSE

func_runGSEA: 是否进行比较耗时的GSEA分析,默认为FALSE

func_runCNA: 是否进行比较耗时的CNA分析,默认为FALSE

nested_function: 是否嵌套函数

run_file_path: 甲基化.idat格式的原始数据所在的目录

run_read_file:是否要读取文件

run_analysis_type_name: 分析项目名称

run_add__res__dir: 是否要创建res_dir结果目录

run_add_save_file_prefix: 是否要添加结果保存文件的前缀

run_add__parent__dir:是否在上一级目录下创建目录或保存结果

提交

参数给定的默认值

func_arraytype: 450K ;

func_resultsDir: D:/omics_tools/demo_data/methylation/lung_results/ ;

func_compare__groups__str: T-C ; func_runBlock: FALSE ; func_runGSEA: FALSE ; func_runCNA: FALSE ; nested_function: TRUE ;

run_file_path: D:/omics_tools/demo_data/methylation/lung_raw/ ;

run_read_file: FALSE ; run_analysis_type_name: 10.met_analysis_from_idat ;

run_add__res__dir: FALSE ; run_add_save_file_prefix: FALSE ;

run_add__parent__dir: FALSE

窗口截图

91b02e38c0c62a26abdbc951a1658257.jpeg

运行中的显示信息

执行中,请稍后, 运行结果保存的目录位置为: D:/omics_tools/demo_data/methylation; 分析结果日志保存的路径为: D:/omics_tools/demo_data/methylation\10.met_analysis_from_idat_last_final_run_res_log.csv

运行完成的显示信息

结果展示

6f27660458d1dd399ea0cb9fb9954ee8.jpeg

读取甲基化beta矩阵文件的甲基化全流程一键分析

功能简介

  1. 甲基化分析模块可以实现甲基化芯片450K, 870kEPIC数据的自动读取,可以读取idat文件,也可以读取beta甲基化矩阵文件
  2. 甲基化数据的缺失值插值
  3. 甲基化数据的质控分析
  4. 甲基化数据的归一化处理分析
  5. 甲基化数据的SVD分析
  6. 甲基化数据的Combat去除批次效应分析
  7. 甲基化数据的DMP差异甲基化位点分析
  8. 甲基化数据的DMR差异甲基化区域分析
  9. 甲基化数据的差异block分析
  10. 甲基化数据的GSEA分析
  11. 甲基化数据的CNA分析

模块使用讲解

参数解释

func_arraytype: 可选450k或EPIC,EPIC是870K的甲基化芯片

func_met__probe__col:甲基化探针所在的列名,当从beta文件开始分析时,要提供

func_resultsDir:分析结果要保存的目录

func_sample__anno__file:样本注释信息的文件,默认是空,如果file_path给的是beta矩阵文件,则需要给出sample.anno.file

func_compare__groups__str:做DMP和DMR分析时候要指定的比较分组,多个分组间用;号隔开

func_runBlock: 是否进行比较耗时的block分析,默认为FALSE

func_runGSEA:是否进行比较耗时的GSEA分析,默认为FALSE

func_runCNA:是否进行比较耗时的CNA分析,默认为FALSE

nested_function:是否嵌套函数

run_file_path:甲基化beta矩阵的文件路径

run_read_file:是否要读取文件

run_analysis_type_name:分析项目名称

run_add__res__dir:是否要创建res_dir结果目录

run_add_save_file_prefix;是否要添加结果保存文件的前缀

run_add__parent__dir:是否在上一级目录下创建目录或保存结果

提交

给定参数的默认值

func_arraytype: 450K ;

func_met__probe__col: V1 ;

func_resultsDir: D:/omics_tools/demo_data/methylation/lung_results/ ; func_sample__anno__file: D:/omics_tools/demo_data/methylation/lung_results/myImpute_pd.csv ; func_compare__groups__str: T-C ; func_runBlock: FALSE ;

func_runGSEA: FALSE ;

func_runCNA: FALSE ;

nested_function: TRUE ;

run_file_path: D:/omics_tools/demo_data/methylation/lung_results/myLoad_beta.csv ;

run_read_file: FALSE ;

run_analysis_type_name: 10.met_analysis_from_beta ;

run_add__res__dir: FALSE ;

run_add_save_file_prefix: FALSE ;

run_add__parent__dir: FALSE

窗口截图

021bcd2096c25d856cb502df21aee70f.jpeg

运行中的显示信息

分析正在执行中,请稍后, 运行结果保存的目录位置为: D:/omics_tools/demo_data/methylation/lung_results; 运行结果日志保存的路径为: D:/omics_tools/demo_data/methylation/lung_results\10.met_analysis_from_beta_last_final_run_res_log.csv

结果展示

7cfa2ed0329789686355f0949837782a.jpeg

样本的PCA分群聚类分析和剔除异常样本

样本的PCA分群聚类分析

83267152c19dec6a2f0924948d4287f4.jpeg

34bbb9b326eeae549d12bb32da7de53d.jpeg

82a9f9f594995ac5c1db67e056d1daee.jpeg

e16d68d5d765100ad607e48d62b30077.jpeg

删除异常样本

f1da2eb257b540f130646dfec2f55597.jpeg

剔除异常样本后再次进行PCA分群聚类分析

b3d1353c995c2f6b044e79e26f304796.jpeg

cb81cd949a8032c43180296e7cab59d1.jpeg

9d77992ecadd3117e042cf197feef6da.jpeg

DMRs差异甲基化区域的基因组circos图

参数解释

func_chr__col: bed文件中染色体编号所在的列名

func_start__col: bed文件中起始位置所在的列名

func_end__col: bed文件中终止位置所在的列名

func_value__col: bed文件中结果数值所在的列名

func_use__value__threshold: 是否对value的阈值进行筛选,默认为TRUE

func_value__threshold: bed文件中结果数值的阈值,默认为0

func_p__value__col: bed文件中p值所在的列名

func_title:图表的标题

func_chr__track:是否绘制不同颜色的染色体轨道

func_species:物种的基因组版本号

nested_function:是否嵌套函数

run_file_path:甲基化DMRs结果的文件路径

run_read_file:是否要读取文件

run_analysis_type_name:分析项目名称

run_add__res__dir:是否要创建res_dir结果目录

run_add_save_file_prefix:是否要添加结果保存文件的前缀

run_add__parent__dir:是否在上一级目录下创建目录或保存结果

提交

已给定参数的默认值

func_chr__col: seqnames ;

func_start__col: start ;

func_end__col: end ;

func_value__col: value ;

func_use__value__threshold: TRUE ;

func_value__threshold: 0 ;

func_p__value__col: p.value ;

func_title: DMRs genome plot ;

func_chr__track: FALSE ;

func_species: hg19 ;

nested_function: TRUE ;

run_file_path: D:/omics_tools/demo_data/methylation/lung_results/myDMR_BumphunterDMR.csv ; run_read_file: FALSE ;

run_analysis_type_name: 10.circlize_plot ;

run_add__res__dir: TRUE ;

run_add_save_file_prefix: TRUE ;

run_add__parent__dir: TRUE

运行中的显示信息

分析正在执行中,请稍后, 运行结果保存的目录位置为: D:/omics_tools/demo_data/methylation\10.circlize_plot; 运行结果日志保存的路径为: D:/omics_tools/demo_data/methylation\10.circlize_plot\10.circlize_plot_last_final_run_res_log.csv

窗口截图

8822b604a38446e6c5071b4f45a48d57.jpeg

运行完成的显示信息

执行已完成,运行结果保存的目录位置为: D:/omics_tools/demo_data/methylation\10.circlize_plot; 分析结果日志保存的路径为: D:/omics_tools/demo_data/methylation\10.circlize_plot\10.circlize_plot_last_final_run_res_log.csv

结果展示

结果文件列表

50b2221ce447c13cce94dd3eaecf1012.jpeg

Circos图

177f1f069bc329dcb422adec31f6ea89.jpeg

差异甲基化位点结果的棒棒糖图可视化

参数解释

func_data__type:数据类型选择methylation

func_sequence__type: 序列类型,是DNA还是protein

func_gtf__anno__file: hg19的基因组注释gtf文件,450K和EPIC都是用的hg19基因组

func_gene__list__str:选择绘制的基因,多个基因用分号分割来批量绘制

func_gene__col: DMP结果文件中基因名称的列名

func_pos__col: DMP甲基化位点位置所在的列名

func_pos__name__col: 甲基化探针名称所在的列名

func_value__col: DMP结果的组间甲基化差值所在的列名

func_pval__col: DMP结果的p值所在的列名

nested_function: 是否嵌套函数

run_file_path: 甲基化DMP结果的文件路径

run_read_file: 是否要读取文件

run_analysis_type_name: 分析项目名称

run_add__res__dir: 是否要创建res_dir结果目录

run_add_save_file_prefix: 是否要添加结果保存文件的前缀

run_add__parent__dir:是否在上一级目录下创建目录或保存结果

提交

已给定的参数默认值

func_data__type: methylation ;

func_sequence__type: DNA ;

func_gtf__anno__file: E:/data/download/Homo_sapiens.GRCh37.75.genome_anno.csv ; func_gene__list__str: HOXB3;CLDN18 ;

func_gene__col: gene ;

func_pos__col: MAPINFO ;

func_pos__name__col: V1 ;

func_value__col: Diff.Value ;

func_pval__col: P.Value ;

nested_function: TRUE ;

run_file_path: D:/omics_tools/demo_data/methylation/lung_results/myDMP_C_to_T_with_gene_anno.csv ; run_read_file: FALSE ;

run_analysis_type_name: 9.met_lollipot_plot ;

run_add__res__dir: TRUE ;

run_add_save_file_prefix: TRUE ;

run_add__parent__dir: TRUE

窗口截图

b3f2ac9ae63c6f127d913ba303072d9d.jpeg

运行中的显示信息

执行中,请稍后, 运行结果保存的目录位置为: D:/omics_tools/demo_data/methylation\9.met_lollipot_plot; 分析结果日志保存的路径为: D:/omics_tools/demo_data/methylation\9.met_lollipot_plot\9.met_lollipot_plot_last_final_run_res_log.csv

运行完成的显示信息

执行已完成,运行结果保存的目录位置为: D:/omics_tools/demo_data/methylation\9.met_lollipot_plot; 分析结果日志保存的路径为: D:/omics_tools/demo_data/methylation\9.met_lollipot_plot\9.met_lollipot_plot_last_final_run_res_log.csv

结果展示

结果文件列表

2f7eeabc9078a960528138eea9303670.jpeg

结果图

89357794e0af09a13cba113b61d84202.jpeg65d15c7badee5f38dab8dc9d861b27d3.jpeg

差异甲基化DMPs的统计分析条形图可视化

b4190a4ffe100d5925bfa45837010e46.jpeg

ed01e32dde7e5bc1c6927c9266c28390.jpeg

0019b2e20e21c9c95da1aa447fad66b5.jpeg

差异甲基化基因的火山图绘制

e90d07faaa5dedafe5e1d453ed5e774e.jpeg

12db007bccdecb80e209283832b81220.jpeg

差异甲基化基因的GO,KEGG和GSEA富集分析

差异甲基化基因的GO和KEGG富集分析

576f0b6fe540e999e7e098daf0764074.jpeg

31e57b85349124e0979b230acd10c92d.jpeg

GO富集分析结果图

04f0748758b7ff5214ac31986490cdc0.jpeg

KEGG富集分析结果图

f1c6ec295c4e753dfd2a596381e27047.jpeg

GSEA富集分析

fd04c86eb3da6f57c8761d6dc8f63861.jpeg

02f80dbcf830a24835fd742ec37ee2c5.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2087049.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【ArcGIS/GeoScenePro】Portal和Server关系

简介 上图简化后 三层 最上面:应用层 中间(门户):连接应用层和服务器,对server上发布的服务进行管理、分享和权限分配 最低面:服务器 例如:桌面想用server里的服务数据资源,需要通过portal去请求 Enterprise = portal(中间)+server(最底面层) 具体的Enterpri…

Unity Foreach循环GC测试

关于网上讨论Foreach循环会不会产生GC的问题,不如自己实验一番,我用的Unity版本是2021.3.23f1c1版本。 测试代码如下: using System.Collections.Generic; using UnityEngine; using UnityEngine.Profiling;namespace Test {public class M…

sqli-labs靶场通关攻略(41-50)

Less-41 1、判断闭合方式 输入?id1 -- 必和成功 2、查看回显点 输入?id-1 union select 1,2,3 -- 得出回显点为2,3 3、查询数据库名 输入?id-1 union select 1,2,database() -- 4、查询数据库中的表名 输入?id-1 union select 1,2,group_concat(table_nam…

Notepad++回车不自动补全

问题 使用Notepad时,按回车经常自动补全,但我们希望回车进行换行,而不是自动补全,而且自动补全使用Tab进行补全足够了。下文介绍设置方法。 设置方法 打开Notepad,进入设置 - 首选项 - 自动完成,在插入选…

代码随想录Day 29|leetcode题目:134.加油站、135.分发糖果、860.柠檬水找零、406.根据身高重建队列

提示:DDU,供自己复习使用。欢迎大家前来讨论~ 文章目录 第八章 贪心算法 part03二、题目题目一:134. 加油站解题思路:暴力方法贪心算法(方法一)贪心算法(方法二) 题目二&#xff1a…

openEuler:日志管理

日志介绍 概述 系统日志是一系列用于记录系统操作和活动进行的文件,这些日志对于监控和排查系统问题非常重要,因为它们可以提供有关系统行为、应用活动和安全事件的见解。系统日志还可以成为识别 Linux 系统中潜在安全弱点和漏洞的重要信息来源。通过分…

[米联客-XILINX-H3_CZ08_7100] FPGA程序设计基础实验连载-20 I2C MASTER控制器驱动设计

软件版本:VIVADO2021.1 操作系统:WIN10 64bit 硬件平台:适用 XILINX A7/K7/Z7/ZU/KU 系列 FPGA 实验平台:米联客-MLK-H3-CZ08-7100开发板 板卡获取平台:https://milianke.tmall.com/ 登录“米联客”FPGA社区 http…

pyautogui通过图像获取定位实现计算器自动计算

使用 pyautogui.locateCenterOnScreen 能够在屏幕上搜索给定图像的位置,并准确地返回该图像的中心点坐标。 🌿使用 pyautogui 实现计算器自动计算 准备工作,把计算器的按钮截图保存下来。例如: 计算“75”,实现代码如…

【网络】WebSocket协议详解

WebSocket协议详解 一 、WebSocket 诞生背景二、WebSocket 特点三、WebSocket 的握手环节四、WebSokect 的数据格式1、 第一个字节2、第二个字节3、Masking-key4、playload Data5、一些注意细节 WebSocket 的官方文档 WebSocket 的中文文档(非官方) 一 、WebSocket 诞生背景 在…

深度学习基础—简单的卷积神经网络

3.1.卷积层 下面以卷积神经网络的某一层为例,详解一下网络的结构。 假设当前位于l层,则输入6*6*3的彩色图片,有两个3*3*3的过滤器,卷积操作后将输出2个4*4的图片。如果把过滤器看成权重w,卷积这一步操作其实就是w*a&am…

消息称华为纯血鸿蒙部分应用采用虚拟机方案

华为预计在11月发布正式版纯血鸿蒙,为了能够适配更多的App,官方也是有了新的解决方案。报道中提到,纯血鸿蒙设备对有些还没上架的应用会使用虚拟机方案过渡。据悉,华为的虚拟机方案作为过渡措施,首先能确保用户在鸿蒙系…

概率论与编程的联系及数据科学应用

目录 引言 第一章 概率模拟与编程实现 1.1 随机数生成与蒙特卡罗模拟 1.1.2 蒙特卡罗模拟 第二章 统计建模与数据分析 2.1 统计模型实现 2.2 概率图模型 第三章 概率论在机器学习中的应用 3.1 随机森林与决策树 3.2 贝叶斯分类器 总结与展望 引言 在大数据和人工智…

学习node.js 十 redis的基本语法

redis Redis(Remote Dictionary Server)是一个开源的内存数据结构存储系统,它提供了一个高效的键值存储解决方案,并支持多种数据结构,如字符串(Strings)、哈希(Hashes)、…

素数之和(c语言)

1./描述 //牛牛刚刚学了素数的定义:素数值指在大于1的自然数中,除了1和它本身以外不再有其他因数的自然数 //牛牛想知道在[l, r] 范围内全部素数的和 //输入描述: //输入两个正整数 l,r 表示闭区间范围 //输出描述: //…

sqli-labs靶场通关攻略 46-50

主页有sqli-labs靶场通关攻略 1-45 第四六关 less-46 步骤一:利用报错注入查询库 ?sort1 and updatexml(1,concat(0x7e,database(),0x7e),1) 步骤二:查询表名 ?sort1 and updatexml(1,concat(0x7e,(select group_concat(table_name)from informatio…

如何通过日志或gv$sql_audit,分析OceanBase运行时的异常SQL

本文作者:郑增权,爱可生 DBA 团队成员,OceanBase 和 MySQL 数据库技术爱好者。本文约 2000 字,预计阅读需要 8 分钟。 简介 在 OCP 云平台的 Top SQL 界面中,能观察到异常SQL,但这些SQL并未明确显示具体的…

防泄密的方法都有哪些?

一、防泄密的方法都有哪些?使用安全通讯工具:采用加密通讯工具,确保敏感信息在传输过程中不被窃取或篡改。定期安全审计:对系统和数据进行定期的安全审计和检查,发现潜在的泄密风险并及时处理。文件加密:对…

光伏电站的施工步骤

施工准备:在施工前,需要进行现场勘查,了解施工场地的地形、地貌、气候等情况,制定施工方案和安全措施。同时,还需要准备好施工所需的材料和设备,如光伏组件、支架、电缆、逆变器等 。基础施工:根…

“面试宝典:高频算法题目详解与总结”

干货分享,感谢您的阅读! (暂存篇---后续会删除,完整版和持续更新见高频面试题基本总结回顾(含笔试高频算法整理)) 备注:引用请标注出处,同时存在的问题请在相关博客留言…

鸿蒙Harmony开发实战:自定义圆形组件-Canvas

在采用Java配合xml布局编写鸿蒙app页面的时候,发现sdk自带的Image组件并不能将图片设置成圆形,反复了翻阅了官方API手册(主要查阅了Compont和Image相关的API),起初发现了一个setCornerRadius方法,于是想着将…