云平台教程 | 手把手教你GSEA富集分析和解读

news2024/11/15 22:52:10

·  爱基百客云平台小工具使用

    1.1 爱基百客云平台之GSEA分析

    1.2 GSEA富集分析原理图

    1.3 GSEA富集分析过程

    1.4 参数设置

    1.5 任务查看

    1.6 结果

         1.6.1 富集结果表格

         1.6.2 富集可视化图解读

01

爱基百客云平台小工具使用

首先,打开爱基百客官网:http://www.igenebook.com;点击菜单栏最右侧“云平台”按钮。

图片

弹出云平台界面(下图),输入账号、密码和验证码方可登录;进入云平台,可以轻松实现多种组学数据的分析和可视化,实现真正的“零代码、无门槛、操作简单”!

图片

登陆后,如下图,我们进入到小工具专栏。当前云平台已上线了32款小工具供大家使用,包括基础绘图,高级绘图,差异检验,聚类分析,序列处理等子模块,本着用户至上的理念,平台小工具将会持续更新维护,积极接受用户的反馈和意见。

图片

1.1 

爱基百客云平台之GSEA分析

上期我们讲到了富集分析。那本期我们就接着来聊一聊富集分析里面的新星:GSEA(Gene Set Enrichment Analysis)富集分析。

常规的富集分析,通过log2fc筛选差异基因,将筛选差异基因的标准聚集在单个基因的差异表达上,可能会错过真正具有生物学含义的基因群差异。于是我们可以选择进行GSEA富集分析。GSEA集富集分析有以下几个优点:

1. 全局视角:GSEA不仅关注单一基因的差异,而是关注一组基因集合的整体行为,这使得它能揭示生物学过程的整体模式,而不仅仅是局部变化。

2. 生物意义:通过预定义的基因集,GSEA提供了生物学意义的验证,比如特定通路的活动,这有助于理解基因表达变化背后的生物学背景。

3. 适应复杂数据:GSEA可以处理复杂的数据分布,如连续的基因表达数据,而不仅仅是二元的上调或下调状态。

1.2 

GSEA富集分析原理图

图片

1.3 

GSEA富集分析过程

1. 计算富集分数(ES) 富集分数:S 反应基因集(比如某个通路内的基因集)成员 s 在排序基因集 L(比如根据 logFC 排序的差异基因集,默认降序,所以上调基因在顶端)的两端富集的程度。富集得分 ES 最后定义为最大的peak值。正值ES表示基因集 S 在基因集 L 的顶部富集,负值ES表示基因集 S 在基因集 L 的底部富集。

2. 估计富集分数的显著性水平:因为每个基因集的大小不同,而 ES 又和基因集大小有关,因此需要对其进行 normalization。为了检验每个基因集的 NES 是否显著,将总基因集 L 随机打乱排列一定次数,每次都计算每个基因集的 NES(ES),得到每个基因集的 NES 在随机排序情况下的理论分布,从而计算其 p 值。

3. 矫正多重假设检验 FDR 则是对 p 值进行 BH 校正之后的 p 值。

爱基百客云平台提供了GSEA分析小工具:http://124.71.149.47:5000/smalltools/detail?id=1638074560383299585。如果您在我司做过项目,直接输入差异分析表格和基因组名称即可一键式完成富集分析。

下面我们进行GSEA富集分析实操练习。

首先点击小工具GSEA富集分析。

图片

右侧的工具介绍和常见问题对富集分析小工具的主要用途,使用方法以及结果解读做了详细的说明。左侧是必要的输入文件和参数选项。任务名称和任务编号系统会自动生成。后面可用于记录查看具体的任务。小工具提供了示例文件给用户做测试分析。同时,该页面还提供了一些常用参数调节选项。您也可进行自定义,后面将详细介绍。输出名自定义,默认Enrich。

图片

1.4 

参数设置

输入文件:支持txt(制表符分隔)文本文件,以及Excel专用的xlsx格式,同样支持旧版Excel的xls(Excel 97-2003 )格式。

差异基因表格必须包含Gene列和logFC列。如下表所示:

图片

如果文件已经上传过,您可以直接点击选择按钮找到需要的文件勾选确定,无须再次上传。

物种选择项目中所使用的基因组名称;富集类型支持GO和KEGG;基因列和logFC列的名字根据输入表格的信息填写;显著性阈值您可根据实际情况进行筛选,默认是p.adjust < 0.05;绘图个数默认选取排名靠前的10个通路绘制,你可自行选择需要展示前多少个;输出名自定义即可。

填写好上述所有的参数后,点击提交即可。

1.5 

任务查看

您可在任务管理栏中查看任务的运行情况和结果。默认情况下新任务将会在最上方展示。也可通过任务名、任务编码、日期点击查询,找到需要的任务。如下图:当状态成功时,表示任务成功结束。

图片

点击下载按钮可直接打包下载全部结果。点击查看按钮可在线查看结果。

图片

您可在在线查看结果后选择是否下载保存。另外如果结果较多时,结果展示区还可通过点击左侧或右侧的箭头进行图片切换。您可挑选自己感兴趣的结果图片进行下载保存。

图片

1.6 

结果

输出结果包含GSEA富集总表和若干通路的GSEA富集图。

1.6.1 

富集结果表格

图片

  • ID:通路名

  • Description:通路描述信息

  • setSize:该通路中包含表达数据集文中的基因数目(经过条件筛选后的值)

  • enrichmentScore:富集分数

  • NES:标准化后的富集分数

  • pvalue:是对 ES 的统计学分析,用来表征富集结果的可信度

  • p.adjust:是多重假设检验校正之后的 p-value

  • qvalues:是多重假设检验(FDR法)校正之后的 p-value,即对NES可能存在的假阳性结果的概率估计。GSEA 对显著性的定义为 p-value<5%,FDR q-val<25%

  • rank:当 ES 最大时,对应基因所在排序好的基因列表中所处的位置

  • leading_edge:tags 表示核心基因占该通路基因集的百分比;list 表示核心基因占所有基因的百分比;signal,将前 2 项统计值结合在一起计算出的富集信号强度

  • core_enrichment:核心富集基因集

1.6.2 

富集可视化图解读

图片

富集图一共分为上中下 3 部分。如A_VS_B差异分析:

  • 第一部分 ES 折线图:显示了当分析沿着排序基因集按排序计算时,ES 值在计算到每个位置时的展示。最高峰处的ES得分 (垂直距离 0.0 最远)便是基因集的 ES 值。

  • 第二部分 hits 图,俗称条形码图,用线条或者 hit 标记了通路基因集(基因组所有)中成员出现在基因排序列表中的位置。如果基因集里的基因 集中在所有基因的前部分,就是在A组里面富集,如果集中在后面部分,就是在B组里面富集。leading edge subset 就是(0,0)到绿色曲线峰值 ES 出现对应的这部分基因(x轴0到虚线那部分)。所谓 Leading-edge subset,就是对富集得分贡献最大的基因成员。如果ES得分都是正值(如上图所示),那么Leading-edge subset就在峰值ES的左侧,反之则在右侧(底部富集 = A/B 下调表达 = B 组高表达)。那么根据本图我们很容易看出,该通路在 A 组高表达。

  • 第三部分是排序后所有基因 rank 值的分布,热图红色部分对应的基因在 A 组高表达,蓝色部分对应的基因在 B 组高表达,每个基因对应的信噪比(Signal2noise,前面选择的排序值计算方式)以灰色面积图展示。

如果常规富集没有拿到预期的结果,大家完全可以拿GSEA再分析一次,说不定有惊喜哦。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1713030.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Linux系统下安装配置nginx,本地访问服务器nginx

一、先安装依赖包 yum install -y gcc-c pcre pcre-devel zlib zlib-devel openssl openssl-devel 二、官网下载Nginx压缩包 官网地址&#xff1a;nginx: download 三、安装Nginx 1.这里我们下载稳定版本即可&#xff0c;在命令行输入以下命令&#xff0c;会在当前目录下生成…

智源与HuggingFace联合推出开放中文大语言模型榜单 - 旗鉴榜

近日&#xff0c;智源研究院与 Hugging Face 开发者社区合作&#xff0c;发布 Open Chinese LLM Leaderboard&#xff0c;旨在跟踪、排名和评估开放式中文大语言模型&#xff0c;通过开源社区共建、用户自主贡献的方式&#xff0c;持续推动和完善中文语言大模型的科学、客观排名…

TPM是如何平衡设备维护与生产需求的?

在当今快节奏的生产环境中&#xff0c;设备维护与生产需求之间的平衡成为了企业持续发展的关键所在。TPM&#xff08;全面生产维护&#xff09;作为一种先进的生产管理理念&#xff0c;为企业提供了实现这一平衡的有效路径。具体如深圳天行健精益管理咨询公司下文所述&#xff…

记录使用自定义编辑器做试题识别功能

习惯了将解析写在代码注释&#xff0c;这里就直接上代码啦&#xff0c;里面用到的bxm-ui3组件库是博主基于element-Plus做的&#xff0c;可以通过npm i bxm-ui3自行安装使用 // 识别方法&#xff1a; // dom 当前识别数据所在区域, questionType 当前点击编辑选择的题目类型&a…

docker的介绍、原理及操作

一、docker介绍 1.容器技术介绍 Container 即容器&#xff0c;平时生活中指的是可以装下其它物品的工具&#xff0c; 以方便人类归纳放置物品 、存储和异 地运输 &#xff0c;比如人类使用的衣柜 、行李箱、 背包等可以成为容器&#xff0c;Container 除了容器以外&#xff…

Simulink从0搭建模型06-P7模型中结构体的使用

Simulink从0搭建模型06-P7模型中结构体的使用 本节课学习内容1. 结构体的创建 Bus Creator&#xff08;多输入单输出&#xff09;2. 结构体的引用 Bus Selector&#xff08;单输入多输出&#xff09;3. 结构体的赋值 Bus Assignment4. 结构体对象的创建 Bus object5. 结构体数组…

vue3 vant4实现抖音短视频功能

文章目录 1. 实现效果2. 精简版核心代码3. 完整功能点&#xff08;本文章不写&#xff0c;只写核心代码&#xff09; 1. 实现效果 2. 精简版核心代码 使用的 vue3 vant4组件使用van-swipe进行轮播图切换实现 <template><div :style"{width: width px,overflo…

Spark中的累加器与广播变量及blockmanager图解

一、累加器 1、累加器的引入 案例&#xff1a;没读取一条文件中的数据&#xff0c;count1&#xff0c;并打印在Drive端&#xff08;控制台&#xff09; import org.apache.spark.{SparkConf, SparkContext} import org.apache.spark.rdd.RDDobject Demo20Accumulator {def ma…

做电商,错过了2020年的抖音!那2024一定要选择视频号小店!

哈喽~我是电商月月 电商老板们集合了&#xff0c;问大家一个问题: 如果能让你回到三四年前&#xff0c;抖音才步入大众视野&#xff0c;这时候让你去做抖音小店&#xff0c;你愿意吗&#xff1f; 我敢相信&#xff01;很多&#xff0c;错过当年抖音红利的商家&#xff0c;一…

【每日力扣】300. 最长递增子序列 与 139. 单词拆分

&#x1f525; 个人主页: 黑洞晓威 &#x1f600;你不必等到非常厉害&#xff0c;才敢开始&#xff0c;你需要开始&#xff0c;才会变的非常厉害 300. 最长递增子序列 给你一个整数数组 nums &#xff0c;找到其中最长严格递增子序列的长度。 子序列 是由数组派生而来的序列&…

【计算机网络】P1 计算机网络概念、组成、功能、分类、标准化工作以及性能评估指标

目录 1 什么是计算机网络2 计算机网络的组成2.1 组成部分上2.2 工作方式上2.3 功能组成上 3 计算机网络的功能3.1 数据通信3.2 资源共享3.3 分布式处理3.4 提高可靠性3.5 负载均衡 4 计算机网络的分类4.1 按分布范围分类4.2 按传输技术分类4.3 按照拓扑结构分类4.4 按使用者分类…

网络智能化的发展对仿真环境的需求

1. 网络智能化背景介绍 1.1 什么是网络智能化 网络智能化是指利用人工智能&#xff08;AI&#xff09;、机器学习&#xff08;ML&#xff09;、优化算法等技术来实现网络的信息化、自动化和智能化。相对5G、6G、算力网络等领域&#xff0c;网络智能化是针对网络全场景、全要素…

低调收藏,这份MobaXterm使用指南很全面

中午好&#xff0c;我的网工朋友。 MobaXterm&#xff0c;这个名字对于我们这些经常需要在Windows环境下与Linux服务器打交道的人来说&#xff0c;应该并不陌生。它不仅仅是一个SSH客户端&#xff0c;更是一个功能强大的终端工具箱&#xff0c;集成了X服务器和Unix命令集&…

HiWoo Box工业4G网关

在飞速发展的工业4.0时代&#xff0c;数据已成为驱动工厂智能化、自动化的核心力量。而如何将这些散布在工厂各个角落的数据高效、安全地汇集起来&#xff0c;成为企业提升生产效率、降低运营成本的关键。今天&#xff0c;我们将为您介绍一款4G网关产品——HiWoo Box&#xff0…

【嵌入式模块芯片开发】DWIN的T5L _DGUS应用开发 显示屏的基本图形显示以及串口命令的动态数据波形功能实现

【嵌入式模块芯片开发】DWIN的T5L _DGUS应用开发 显示屏的基本图形显示以及串口命令的动态数据波形功能实现 T5L _DGUS应用在DWIN的各类显示屏中 如DMG80480T070_05WTR等等 可用DWIN官方工具生成一系列上位机显示控件 通过串口命令进行交互实现显示、触摸等功能 也可以进行C51…

【上】王树森《小红书推荐系统公开课》- 课程笔记(推荐系统基础、召回、排序)

写在前面 本文为王树森老师《小红书推荐系统公开课》的课程笔记 课程来源&#xff1a;ShusenWang的个人空间-ShusenWang个人主页-哔哩哔哩视频 (bilibili.com)课程资料&#xff1a;GitHub - wangshusen/RecommenderSystem 由于篇幅较长&#xff0c;分为【上】【下】两篇文章…

HTML静态网页成品作业(HTML+CSS)——动漫海贼王介绍网页(1个页面)

&#x1f389;不定期分享源码&#xff0c;关注不丢失哦 文章目录 一、作品介绍二、作品演示三、代码目录四、网站代码HTML部分代码 五、源码获取 一、作品介绍 &#x1f3f7;️本套采用HTMLCSS&#xff0c;未使用Javacsript代码&#xff0c;共有1个页面。 二、作品演示 三、代…

VSCode 报错 之 运行 js 文件报错 ReferenceError: document is not defined

1. 背景 持续学习ing 2. 遇到的问题 在VSCode 右键 code runner js 文件报错 ReferenceError: document is not defined eg&#xff1a; // 为每个按钮添加点击事件监听器 document.querySelectorAll(button).forEach(function (button) {button.addEventListener(click, f…

全面盘点多模态融合算法及应用场景

关注作者&#xff0c;分享AI全维度知识。作者拥有10年互联网服务架构、AI产品研发经验、团队管理经验&#xff0c;同济本复旦硕博&#xff0c;复旦机器人智能实验室成员&#xff0c;阿里云认证的资深架构师&#xff0c;项目管理专业人士&#xff0c;上亿营收AI产品研发负责人 多…

AI 绘图要如何入门?有哪些好用的软件推荐?(附工具+教程+变现模式)

1.Ai绘画如何入门 不需要把Ai绘画想的很复杂 抛去复杂的应用 使用现成简单的工具 只需要学会提示词 描述你想要的画面即可 提示词 不需要太复杂&#xff0c;也不能太简单&#xff0c;太简单依赖于ai的基本样式&#xff0c;关键是要抓住你想要的核心描述 AI不太擅长理解人类的…