零代码复现-TCGA联合GEO免疫基因结合代谢基因生信套路(二)

news2025/2/22 1:20:02

零代码复现-TCGA联合GEO免疫基因结合代谢基因生信套路(二)-关键基因集的获取和生存数据准备

前面的分析中,下载TCGA和GEO的数据,并进行简单的处理,接下来就是相关基因集的获取和整理,为后期聚类和降维做准备工作

三、获取免疫基因和代谢相关的基因集

这里可以选择从GSEA官网下载免疫和代谢相关基因,或者换成其他的基因也是可以的

1、取对数,TCGA的数据一般跨度比较大,所以在使用limma做差异之前,需要取一个log进行后续的分析(http://www.sxdyc.com/logarithmicdata)
在这里插入图片描述
运行完成后,点击下载即可
在这里插入图片描述
2、直接提取相关基因的表达谱矩阵

准备好基因集后,可以收到一个一个捕获基因的表达谱,也可以使用我们的工具

首先获取这两个基因集合并为all.gene.txt
在这里插入图片描述
使用工具,提取特定的基因集(提取部分基因表达,http://www.sxdyc.com/geneExpression)

需要上传两个文件,一个是全基因的表达谱数据,一个是基因的列表信息
在这里插入图片描述
运行完成后,直接下载数据
在这里插入图片描述
在这里插入图片描述
四、TCGA数据差异分析

1、准备分组文件

接下来进行差异分析,需要准备一个分组文件,这里选择 4.特征基因表达谱的准备 文件夹中生成的dat.select.txt 的文件
在这里插入图片描述
在这里插入图片描述
从14号位置往后数两个字符,其中01为肿瘤组织,11为正常组织
在这里插入图片描述
02其实也是肿瘤组织,只是很多分析中会去掉,因为01是原发性肿瘤,保存一下(所以只保留了01和11的样本)
在这里插入图片描述
2、差异分析

这里其实有两种做法的,一种是拿免疫+代谢相关基因表达谱进行差异分析,一种是拿全部的基因做差异分析,筛选出差异基因后,在和免疫+代谢相关基因集取交集。(这里选择的是免疫+代谢相关基因表达谱进行差异分析)

http://www.sxdyc.com/diffLimmaAnalyse
在这里插入图片描述
3、差异分析的火山图的绘制

从limma差异分析中下载差异分析的结果
在这里插入图片描述
获取绘制火山图的数据,包含三列,顺序分别为基因,差异倍数,p值

在这里插入图片描述
http://www.sxdyc.com/visualsVolcano
在这里插入图片描述
在这里插入图片描述
补充一点,如果这里用全部的基因做差异,需单独使用venn图的工具取一个交集

4、差异基因表达的热图

差异基因的获取,用excel的筛选工具,对volcan0.txt进行筛选(标准:logFC选择大于1或者小于-1,FDR<0.05,当然这里的标准可以进行修改),把相关基因提取放在heatmap.gene.txt文件中
在这里插入图片描述
在这里插入图片描述
先通过工具获取差异基因的表达谱(http://www.sxdyc.com/geneExpression)
运行成功后,下载数据,并改名为heatmap.exp.txt
在这里插入图片描述
在这里插入图片描述
在使用工具绘制热图(http://www.sxdyc.com/visualsClusterHeat)
在这里插入图片描述
这里需要注意的是

行注释为:基因的分组信息,如上调,下调的分组,代谢还是免疫基因的分组等等;

列注释为:样本的分组信息,例如这个癌组织和癌旁组织

热图的颜色:从低到高的颜色

是否显示行名:这里需要显示基因名,就选yes

是否显示列名:这里需要显示样本命,就选yes

是否进行行聚类:如果需要对基因进行聚类,就选yes

是否进行列聚类:如果需要对样本进行聚类,就选yes

图片的高度和宽度设置好

提交后等待运行成功即可下载
在这里插入图片描述
在这里插入图片描述
五、TCGA和GEO差异基因获取和预后数据的整理

1、差异基因集的获取,获取TCGA和GEO数据集的共有基因

首先,需要将GEO的数据中的基因名单独复制到gse31210.gene.list.txt文件中
在这里插入图片描述
使用venn/upset图绘制工具,获取交集基因(http://www.sxdyc.com/visualsVennUpset)

准备绘制venn图的文件,如这里只要两个组
在这里插入图片描述
在这里插入图片描述
上传后,绘制venn图,这里的颜色指的是分组的颜色(工具写错了,后面会改掉),设置图片的宽度和高度,运行完成后,直接下载即可
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
这时候就需要提取共有基因表达谱,包括TCGA和GEO的表达谱数据,为后面的分型和建模做准备。

2、TCGA数据集肿瘤组织生存数据的准备和表达谱矩阵的准备

提取TCGA的肿瘤组织的表达谱,在5.差异基因热图获取的group.txt和heatmap.exp.txt,打开group.txt,数据筛选,删掉N的样本,只有肿瘤组织的样本,另存为group1.txt(只保留第一列的样本名,去掉列名)。
在这里插入图片描述
在这里插入图片描述
打开生存数据TCGA.merge.cli.txt,去掉生存时间为0的样本
在这里插入图片描述
准备两列数据,第一列数据为生存时间大于0的样本,第二列为肿瘤组织的样本,用excel选择1-12位字符串,接下來复制C列的数据,选择性粘贴在C列,选择数值(这一步很重要)
在这里插入图片描述
然后把A列的数据复制在C列之下,用excel筛选共有的样本
在这里插入图片描述
开始-条件格式-突出显示单元格规则-重复值(选择C列之后)

在这里插入图片描述
将没有颜色的行删掉
在这里插入图片描述
这时候将B列的样本名复制为group1.txt的文件中。

同时将C列中重复的样本复制在生存数据中,将不存在的样本删掉TCGA.merge.cli.txt,一样的方法去掉多余的样本

在这里插入图片描述
打开heatmap.exp.txt文件,转置,如下所示,改为heatmap.exp1.txt
在这里插入图片描述
使用提取部分基因表达工具提取肿瘤组织的表达谱(http://www.sxdyc.com/geneExpression),当然也可以手动一个一个删,这样比较麻烦
在这里插入图片描述
运行完成后,直接下载,并改名为tcga.T.dat.txt

用excel打开tcga.T.dat.txt文件,然后,提取样本的1-12位字符串
在这里插入图片描述
接下來复制B列的数据,选择性粘贴在A列,选择数值(这一步很重要)

在这里插入图片描述
然后删除B列的信息,只留A列的信息即可
在这里插入图片描述
该文件保存一下即可

3、GEO数据生存时间的筛选和表达谱矩阵的获取

首先获取共有基因表达谱,准备文件(2.geo.pre\GSE31210\gse31210.dat.process.txt),6.TCGA和GEO差异基因获取和预后数据的整理中获取的(com.set.txt),使用工具(http://www.sxdyc.com/geneExpression)提取gse31210数据集表达谱
在这里插入图片描述
运行完成后,下载即可
在这里插入图片描述
下载后改名为gse31210.select.gene.txt

打开gse31210的生存数据,删掉正常组织,保留我们想要的临床信息
在这里插入图片描述
修改生存时间名字(习惯性修改为OS.time和OS),并将生存状态Ailve替换为0,dead替换为1
在这里插入图片描述
并将样本复制出现,保存在gse.sample.txt

在这里插入图片描述
打开gse31210.select.gene.txt文件,在excel转置一下,提取肿瘤组织的表达谱数据,和TCGA数据一样
在这里插入图片描述

在这里插入图片描述
运行完成后,下载并改名为gse31210.T.data.txt

接下来就是分子亚型和风险模型的构建

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1170186.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

[ element-ui:table ] 设置table中某些行数据禁止被选中,通过selectable 定义方法解决

业务需求&#xff1a;需要做到table表格中某些行数据不能被选中&#xff0c;比如在审核一些记录数据时&#xff0c;已经被审核的数据就不能再次提交审核&#xff0c;特别是批量多选的情况&#xff0c;列表中既有已经审核的&#xff0c;也有未审核的&#xff0c;只要求选中未审核…

USB Type-C reference circuit

1.OTG功能&#xff0c;只能对负载供电&#xff0c;不能从电脑端给板子供电 2. USB TTL作为usb串口&#xff0c;可以从电脑端给板子供电 3.USB Type-C power supply,仅仅用来从USB电源得到工作电压。但是外部电源供电电压must supply 12V or greater. 4.功能完整的USB3.0 T…

​实现1个电脑打开多个微信​

实现1个电脑打开多个微信&#xff1a;1、快速双击打开微信&#xff0c;可打开多个微信。2、按住回车键&#xff0c;双击打开微信&#xff0c;并快速放开回车键即可打开多个微信。3、用命令符也可打开多个微信。4、建立一个批处理文件实现打开多个微信。 方法一&#xff1a;最简…

飞书开发学习笔记(一)-应用创建和测试

飞书开发学习笔记(一)-应用创建和测试 一.前言 现在大企业用的办公IM软件中,飞书是口碑最好的&#xff0c;不得不说&#xff0c;字节在开发产品方面&#xff0c;确实有自己独到的竞争力&#xff0c;比如说抖音、头条、飞书。在办公会议和云文档的体验上&#xff0c;其它的办公…

[JavaWeb]——过滤器filter与拦截器Interceptor的使用、执行过程、区别

&#x1f308;键盘敲烂&#xff0c;年薪30万&#x1f308; 目录 一、过滤器filter 概念介绍&#xff1a; 过滤器的使用&#xff1a; 过滤器的执行流程&#xff1a; 应用场景(登录校验)&#xff1a; 二、拦截器Interceptor 概念介绍&#xff1a; 拦截器的使用&#xff1…

智慧建筑工地管理平台源码

智慧工地是聚焦工程施工现场&#xff0c;紧紧围绕人、机、料、法、环等关键要素&#xff0c;综合运用物联网、云计算、大数据、移动计算和智能设备等软硬件信息技术&#xff0c;与施工生产过程相融合。 智慧工地管理平台充分运用数字化技术&#xff0c;聚焦施工现场岗位一线&am…

生成带分表和水印的excel压缩文件

功能描述 将查询结果生成带分表和水印的excel压缩文件 功能点 1、将查询结果导出为excel文件 2、每个表格存放50万条数据&#xff0c;超过50万条数据&#xff0c;生成新的分表 3、生成的表格需要添加水印 4、将生成的全部分表&#xff0c;打包成zip压缩文件 引入依赖 <…

【鸿蒙软件开发】ArkUI之Column、ColumnSplit组件

文章目录 前言一、Column1.1 子组件1.2 接口参数 1.3 属性1.4 示例代码 二、ColumnSplit2.1 子组件2.2 接口2.3 属性2.4 示例代码 总结 前言 Column容器组件&#xff1a;沿垂直方向布局的容器。 ColumnSplit组件&#xff1a;将子组件纵向布局&#xff0c;并在每个子组件之间插…

迈巴赫S480升级主动式氛围灯 浪漫又婉转的气氛

主动式氛围灯有263个可多色渐变的LED光源&#xff0c;营造出全情沉浸的动态光影氛围。结合智能驾驶辅助系统&#xff0c;可在转向或检测到危险时&#xff0c;予以红色环境光提示&#xff0c;令光影艺术彰显智能魅力。配件有6个氛围灯&#xff0c;1个电脑模块。 1、气候&#x…

操作系统的线程模型

操作系统的线程调度有几个重要的概念&#xff1a; 调度器&#xff08;Thread Scheduler&#xff09;&#xff1a;内核通过操纵调度器对内核线程进行调度&#xff0c;并负责将线程的任务映射到各个处理器上内核线程&#xff08;Kernel Level Thread&#xff09;&#xff1a;简称…

企业文件防泄密软件哪个好?文件防泄密软件如何选择

企业文件防泄密软件哪个好&#xff1f;文件防泄密软件如何选择 安企神数据防泄密系统下载使用 在互联网迅速发展的大环境下&#xff0c;数据已经成为企业发展的重要资产之一&#xff0c;然而&#xff0c;随着网络攻击手段的不断升级&#xff0c;企业数据泄露事件屡见不鲜&…

机器学习笔记 - 感知器的数学表达

一、假设前提 感知机(或称感知器,Perceptron)是Frank Rosenblatt在1957年就职于Cornell航空实验室(Cornell Aeronautical Laboratory)时所发明的一种人工神经网络。 它可以被视为一种最简单形式的前馈神经网络,是一种二元线性分类模型,其输入为实例的特征向量,输出为实…

使用Python 脚自动化操作服务器配置

“ 有几十台特殊的服务器&#xff0c;没有合适的批量工具只能手动&#xff0c;要一个一个进行点击设置很耗费时间呀\~”,使用 Python 的简单脚本&#xff0c;即可模拟鼠标键盘进行批量作业 01 — 自动化示例 以某服务器中的添加用户权限为例&#xff0c;演示过程皆未触碰鼠标…

(免费分享)基于springboot,vue社区养老服务管理系统

本课题针对养老机构对养老院日常业务信息管理问题&#xff0c;建立一个社区养老管理平台&#xff0c;基于springboot以及vue框架技术&#xff0c;实现了社区养老管理系统&#xff0c;实现了对养老院的员工、管理员对入住的老人及其健康档案实现信息化管理 获取完整源码&…

基于PHP + MySQL实现的文章内容管理系统源码+数据库,采用前后端分离的模板和标签化方式

文章内容管理系统 dc-article是一个通用的文章内容管理系统&#xff0c;基于开源的caozha-admin开发&#xff0c;采用前后端分离的模板和标签化方式&#xff0c;支持文章内容管理、栏目分类管理、评论管理、友情链接管理、碎片管理、远程图片获取器等功能。可以使用本系统很轻…

sql server 对称加密例子,很好用

-- 创建对称密钥 CREATE MASTER KEY ENCRYPTION BY PASSWORD 输入一个对称密钥; -- 创建证书 CREATE CERTIFICATE MyCertificate WITH SUBJECT 创建一个证书名称; -- 创建对称密钥的加密密钥 CREATE SYMMETRIC KEY MySymmetricKey WITH ALGORITHM AES_128 ENCRY…

静态库的概念及影响

1、目标文件的生成&#xff1a; 由编译器针对源文件编译生成&#xff0c;生成的.o或者.so(动态库)或者.a(静态库)也可以看作是目标文件&#xff1b; 2、静态库的生成&#xff1a; 由给定的一堆目标文件以及链接选项&#xff0c;链接器可以生成两种库&#xff0c;分别是静态库…

Java锁常见面试题

图片引用自&#xff1a;不可不说的Java“锁”事 - 美团技术团队 1 java内存模型 java内存模型(JMM)是线程间通信的控制机制。JMM定义了主内存和线程之间抽象关系。线程之间的共享变量存储在主内存中&#xff0c;每个线程都有一个私有的本地内存&#xff0c;本地内存中存储了该…

PostCSS通过px2rem插件和lib-flexible将px单位转换为rem(root em)单位实现大屏适配

目录 文档postcss中使用postcss-plugin-px2rem安装postcss-plugin-px2rem示例默认配置 webpack中使用postcss-plugin-px2rem项目结构安装依赖文件内容 大屏适配参考文章 文档 类似的插件 postcss-plugin-px2rem https://www.npmjs.com/package/postcss-plugin-px2remhttps://g…

【深度学习基础】Pytorch框架CV开发(2)实战篇

&#x1f4e2;&#xff1a;如果你也对机器人、人工智能感兴趣&#xff0c;看来我们志同道合✨ &#x1f4e2;&#xff1a;不妨浏览一下我的博客主页【https://blog.csdn.net/weixin_51244852】 &#x1f4e2;&#xff1a;文章若有幸对你有帮助&#xff0c;可点赞 &#x1f44d;…