甲基化组学全流程分析(适用于27k的甲基化数据)

news2024/11/14 14:57:25

甲基化组学全流程分析(适用于27k的甲基化数据)

前面我已经讲过450k和870k EPIC的甲基化芯片的全流程分析教程,分析功能更为完善和强大,今天讲讲甲基化位点探针较少的27k甲基化芯片的分析流程。

我开发了一款本地电脑无限使用的零代码生信数据分析作软图神器电脑软件OmicsTools,欢迎大家使用OmicsTools进行生物医学科研数据分析和作图,该软件件能让大家在不需要任何编程和代码编写的基础上,分析次数没有限制,可以无限使用,让您在自己的电脑上快速进行大量的生信分析和加速大家的科学研究。
我开发的本地电脑OmicsTools 软件在github上的zihaoxingstudy1/OmicsTools仓库中,大家可以下载安装OmicsTools进行各种生信分析和可视化作图。

ad90395cfad588b7f02b84e560c35bfb.jpeg


具体的分析流程

分析步骤简介

  1. 第一步把甲基化的表达矩阵提取出来
  2. 第二步拿到甲基化的表达矩阵后,不用再做其它的处理,直接用Limma做差异分析就行了。
  3. 第三步是甲基化探针注释出基因名称,并跟甲基化差异分析结果文件合并
  4. 第四步做火山图热图,箱式图这些
  5. 第五步,go,kegg,gsea通路富集分析等。

我开发了一款本地电脑无限使用的零代码生信数据分析作软图神器电脑软件OmicsTools,欢迎大家使用OmicsTools进行生物医学科研数据分析和作图,该软件件能让大家在不需要任何编程和代码编写的基础上,分析次数没有限制,可以无限使用,让您在自己的电脑上快速进行大量的生信分析和加速大家的科学研究。

我开发的本地电脑OmicsTools 软件在github上的zihaoxingstudy1/OmicsTools仓库中,大家可以下载安装OmicsTools进行各种生信分析和可视化作图。

GEO甲基化27k芯片数据下载教程

1.1根据GEO的GSE数据集编号自动下载和处理GEO数据教程(必须要运行的模块,GEO数据下载要首先运行这个模块)

309b28f027fe16f333966f7b9ba7291c.jpeg

详细教程地址: https://zhuanlan.zhihu.com/p/708053447

下载GEO数据一定要先运行下这个模块,部分数据集不一定能下载提取出表达矩阵,但是一般能下载到非常完整的样本的注释信息等数据文件,这在对GEO数据集临床信息分析或分组差异分析是非常重要的,当然如果少数GSE数据集遇到没有提取出GSEXXX_sample_info.csv的情况,也可以看看我b站的教学视频,根据GEO网页中的样本编号的分组情况,自建一个这样的分组文件,分组文件一般是长这个样子的,有两列,一列列名叫sample.id,是GSM编号信息,另一列是group.level,存放的是分组信息,当然sample.id这一列的样本名还是要以表达矩阵的样本名为准,这样才能让表达矩阵后面跟样本分组信息按照相同的列名整合在一起:

5283ecc207e78637912a7324accae2e5.jpeg

对于部分没有下载出表达矩阵的数据集,如果该数据集的GEO网页中有GSEXXX_RAW.tar格式的压缩包,可以运行下面的1.2这一步对RAW.tar的压缩包文件进行提取和处理。

1.2 甲基化芯片GSE数据集RAW.tar压缩包下载和多样本整合处理教程 (GEO网页中有RAW.tar压缩包可以用这一步下载处理)

bf256c1bfdaa54f917a2e04b7a42f892.jpeg

教程地址

教程地址:转录组和基因芯片GSE数据集RAW.tar压缩包下载和多样本整合处理教程 - 邢博士谈科教的文章 : https://zhuanlan.zhihu.com/p/708244032

7d139d4c3b2da9f7c8ae9ac40a7ae087.jpeg

b3927f6825eff07f3a5c4271bff50c1e.jpeg

1.3 GEO网页中存在可以手动下载的表达矩阵等文件的下载处理教程

如果在1.1步没有自动下载提取出基因表达矩阵,GEO网页中也没有GSEXXX_RAW.tar压缩包文件,但是存在可以手动下载的一些表达矩阵等数据文件,可以用这一步进行下载和处理。

2d6307a3c612d2e5d3c936da6ff27157.jpeg

9358de0d7a206fe14e8f86dedc69aca9.jpeg

教程视频: https://www.bilibili.com/video/BV1Yf421X7Cj/

下载到的甲基化beta矩阵用limma做差异分析

这个分析很简单,刚开始就两步,第一步把甲基化的表达矩阵提取出来,第二步拿到甲基化的表达矩阵后,不用再做其它的处理,直接用Limma做差异分析就行了。

提取得到的甲基化beta矩阵示意图

95ac65127d38b5b6dba1a20229c6f081.jpeg

甲基化beta就是在0-1之间,0是该位点没有发生甲基化,1是该位点完全甲基化了

使用limma甲基化矩阵做差异分析

49cffb062ab1e6fbde85e33acaacf919.jpeg

b9e1b4f8bcac228bb56ffa4d04ca9d57.jpeg

limma差异分析结果

a06d7f4a0b9e75dc48de7f89ce1a12fc.jpeg

这里limma差异分析结果的gene列是甲基化探针位点,不是甲基化基因名称,需要跟甲基化探针跟基因的注释关系文件进行合并

甲基化探针注释出基因名称,并跟甲基化差异分析结果文件合并

因为每个基因含有多个甲基化位点,所以差异分析结果必须同时保留甲基化位点列和基因名称列,不能把甲基化位点列删掉,同时尽量也包含的有甲基化位点在基因组染色体的起始位置,终止位置,染色体编号,甲基化位点的注释区域等信息,这些都可以从甲基化探针对应的注释文件中获取。

3.1 获取甲基化探针的注释文件(以GEO数据集为例)

GEO的数据集的探针注释信息一般都是存放在GPL平台网页的注释文件中。

进入到GPL平台页面后,下拉到页面末尾,如果有Download full table ,就把这个注释table下载一下

下载得到甲基化探针对应的注释信息

e5103e2e5281bdc8829224657baffa74.jpeg

0499a22acea512c1a9e3b16b483e7c7f.jpeg

3.2把甲基化探针注释文件跟差异分析结果文件合并

d36621e2b3e596340b39dd0f5b328069.jpeg

9d4de7e7ec57e870a355f897aff3a6c7.jpeg

4b11a11a815e393cda6f1e447f46d721.jpeg

根据甲基化的差异分析结果绘制火山图

9a6d21339853fa0d16194e9c51ebf15e.jpeg

eafadad9d77475d02f7e4f73d212ef69.jpeg

将甲基化的差异分析结果跟转录组差异分析的结果取交集

因为甲基化的foldchange都比较小,因此甲基化的logFC的阈值过滤是跟转录组差异分析的阈值过滤是不一样的,有两种方法可以让两个差异分析的结果取交集。具体方法如下:

  1. 甲基化位点的差异分析结果先进行过滤筛选,用过滤后的甲基化差异分析结果跟转录组的差异分析结果取交集并绘制韦恩图。
  2. 我后面会更新多个文件取交集绘制韦恩图的模块,新的模块在合并多个差异分析结果文件取交集时候,可以支持对每个差异分析结果文件指定特定的logFC值和p值。
5.1 先对甲基化位点的差异分析文件进行过滤,再跟转录组的差异分析结果进行合并
5.1.1 先对甲基化位点的差异分析文件进行过滤筛选

77a9246e8659eb9aeae1bcc85886468e.jpeg

5.1.2 将筛选好的甲基化位点的差异结果跟转录组的差异结果进行合并

9389359e36665d2b79185b13f5571770.jpeg

a1793fb034409f7f620919d074f95722.jpeg

abd42396ef59773603ffd178bf145179.jpeg

005654572edcfd57ff8e45034f0a83e9.jpeg

甲基化的差异基因跟转录组的差异基因的交集基因的通路富集分析

96e3f2be7edb65b2ed39ea96b490f3ea.jpeg

cffdc9d0b0eb0a9d5e0346d792928e0d.jpeg

go通路富集分析结果

ddf69b2894b3547f5fbab7f66fc39b6b.jpeg

kegg通路富集结果

51b54281cf8468fbed56ed25053de901.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2151024.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

不出海等于出局?

从2023年开始,“出海”已经成了很多企业的主题词。我以前做过一段时间的百度竞价工作,所以有个习惯,会比较关注友商网站上的一些动态信息。2023年开始,以前熟悉的一些公司,网站上都多了一个板块,就是“出海…

HTML常见语法设计

HTML常见语法设计 1.HTML类和ID类id 2.HTML 响应式 Web 设计3.HTML5 语义元素4.HTML 字符实体5.HTML 编码(字符集) 1.HTML类和ID 类 对 HTML 进行分类(设置类),使我们能够为元素的类定义 CSS 样式。为相同的类设置相…

鸿蒙Harmony-Next 徒手撸一个日历控件

本文将介绍如何使用鸿蒙Harmony-Next框架实现一个自定义的日历控件。我们将创建一个名为CalendarView的组件(注意,这里不能叫 Calendar因为系统的日历叫这个),它具有以下功能: 显示当前月份的日历支持选择日期显示农历日期可以切换上一月和下一月 组件…

9月18日国家网络安全通报中心发布的100个高危漏洞(下)

9月18日国家网络安全通报中心发布,公安机关网安部门从危害程度、广泛性、漏洞利用形式、利用难度、检测难度等维度,梳理出了100个突出的高危漏洞,目前这些漏洞是各个网络安全公司检测的重点,广大网络运营者应尽快对照排查自己的网…

火车站高铁站站点时刻查询网站计算机毕设/动车站点时刻查询

创建一个关于火车站高铁站站点时刻查询的毕业设计项目,是一个非常实际且具有挑战性的任务。这样的项目不仅能帮助学生综合运用所学知识,还能够为用户提供便捷的服务。下面将详细说明项目的各个方面: 1. 需求分析 用户需求&am…

代码随想录冲冲冲 Day51 图论Part3

101. 孤岛的总面积 dfs 首先dfs的作用就是在遇到陆地的时候找到所有的周围陆地 对于这道题的dfs 会把所有的链接边缘的陆地变成海洋 这样在全部调整之后 剩下的就是孤岛了 这道题中的dfs的结束条件就是遇到海洋时 遇到每一个陆地就会把面积1,在每一次重新找到…

(2)leetcode 234.回文链表 141.环形链表

234.回文链表 题目链接 234.回文链表 解题思路与代码 获取链表的中间段。 我们将mid这个节点记录下来,然后将这段链表反转,以下是反转的逻辑,最后我们将pre返回就是结果,就是通过中间变量tem记录位置从而实现链表的反转 最后结果…

LLM - 理解 多模态大语言模型(MLLM) 的 对齐微调(Alignment) 与相关技术 (五)

欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/142354652 免责声明:本文来源于个人知识与公开资料,仅用于学术交流,欢迎讨论,不支持转载。 完备(F…

vue scoped解析

不加scoped 加上scoped 从上面的图可以看出,给style加上scoped之后,会给这个模块的所有元素都加上一个自定义属性data-v-xxxx,这个xxxx就是这个文件的相对路径加上文件名生成的hash值,这样就能保证自定义属性独一无二 给所有元…

windows打开可选功能窗口的方式(呜呜设置里面找不到可选功能只能这样找了)

打开方式 winR打开运行窗口,输入fodhelper,按下回车键 即可快速打开可选功能窗口

手动部署并测试内网穿透

文章目录 手动部署并测试内网穿透1、原理2、下载 frp 文件3、配置对应的配置文件4、启动 frp 服务5、效果 手动部署并测试内网穿透 1、原理 原理就是让你需要访问的内网可以被其他内网访问到。 其实就是让内网经过一个公网服务器的转发,使得能够被访问。 这里我们需…

算法课习题汇总(2)

整数划分问题 将正整数n表示成一系列正整数之和&#xff0c;nn1n2…nk(n1>n2>…>nk,k>1)。正整数n的这种表示称为正整数n的划分。 思路&#xff1a; n表示待划分数&#xff0c;m表示最大减数。 #include<iostream> using namespace std;int q(int n, int…

MySQL:库表的基本操作

库操作 查看 查看存在哪些数据库&#xff1a; show databases;查看自己当前处于哪一个数据库&#xff1a; select database(); 由于我不处于任何一个数据库中&#xff0c;此处值为NULL 查看当前有哪些用户连接到了MySQL&#xff1a; show processlist; 创建 创建一个数据库 语…

【JAVA入门】Day48 - 线程池

【JAVA入门】Day48 - 线程池 文章目录 【JAVA入门】Day48 - 线程池一、线程池的主要核心原理二、自定义线程池三、线程池的大小 我们之前写的代码都是&#xff0c;用到线程的时候再创建&#xff0c;用完之后线程也就消失了&#xff0c;实际上这是不对的&#xff0c;它会浪费计算…

【源码+文档+调试讲解】健身房管理平台小程序

摘 要 随着健康意识的增强和移动互联网技术的普及&#xff0c;健身房管理平台小程序应运而生&#xff0c;为健身爱好者提供便捷的健身服务和管理。本设计针对传统健身房会员管理混乱、课程预约不便利、用户互动缺乏等问题&#xff0c;开发了一款集教练、预约教练、会员、健身…

正也科技-辖区与指标管理系统 强化决策支持

正也科技的“辖区与指标管理系统”设计理念先进&#xff0c;旨在通过科学合理的组织架构和精细化的指标管理&#xff0c;帮助企业实现更高效的市场布局、人员配置及业绩监控。以下是对该系统核心功能的进一步阐述及其对企业运营带来的优势&#xff1a; 正也科技辖区管理 1. 组…

基于SpringBoot+Vue+MySQL的社区医院管理系统

系统展示 系统背景 在当前医疗体系日益完善的背景下&#xff0c;社区医院作为基层医疗服务的重要一环&#xff0c;其管理效率和服务质量直接关系到居民的健康福祉。为了提升社区医院的管理水平&#xff0c;优化患者就医体验&#xff0c;我们设计了一套基于SpringBoot、Vue.js与…

深兰科技荣获“2024年度人工智能最具商业合作价值企业”奖

9月19日&#xff0c;以“释放AI应用价值&#xff0c;发展新质生产力”为主题的“AIAC2024人工智能应用大会”在北京隆重举行。大会揭晓了“AI卓智奖”年度人工智能创新评选的获奖榜单&#xff0c;深兰科技荣获“2024年度人工智能最具商业合作价值企业”称号&#xff0c;同时&am…

【高分系列卫星简介——高分一号(GF-1)】

高分一号卫星&#xff08;GF-1&#xff09; 高分一号&#xff08;GF-1&#xff09;是中国高分辨率对地观测系统&#xff08;简称“高分专项”&#xff09;的第一颗卫星&#xff0c;具有里程碑式的意义。以下是对高分一号卫星的详细介绍&#xff1a; 一、基本信息 发射时间&…

标签云效果

产品要求&#xff0c;词云要实现动态滚动。查资料&#xff0c;改写效果。 echarts词云效果 传统的echarts-wordCloud不能满足需求。 标签云 换了标签云&#xff0c;以下是代码 <template><div class"mx-auto" :style"{ width: width px }"&g…