2024年TCGA基因表达数据下载(最新版)

news2024/12/23 4:25:03

文章目录

  • 前言
  • 一、如何使用TCGA数据库获取公共数据?
  • 二、使用步骤
    • 1.点击Cohort Builder
    • 2.数据筛选
    • 3. Repository
    • 4.数据下载
      • 4.1 继续选择筛选条件
      • 4.2 添加cart并进入
      • 4.3 下载
  • 总结


前言

TCGA 全称 The Cancer Genome Atlas ,即癌症基因组图谱。它是一个大型的癌症研究项目,旨在通过对大量癌症患者的样本进行全面的基因组分析,来深入了解癌症的发生、发展机制。TCGA 收集了多种癌症类型的样本,包括肿瘤组织和正常组织,并对这些样本进行了基因测序、基因表达分析、DNA 甲基化分析等多种组学层面的研究。TCGA数据库中包含了多种肿瘤类型的数据,如乳腺癌、肺癌、结直肠癌、肾癌等,其中每个肿瘤类型的数据都是由不同实验室和机构采集和上传的,数据涵盖了基因组、转录组、表观基因组和临床等多个层面,可以用于基因组学、生物信息学和医学领域的研究和应用。

通过 TCGA 产生的数据,科学家们能够发现新的癌症相关基因、了解癌症的分子亚型、探索癌症治疗的潜在靶点等,这对于癌症的诊断、治疗和预防都具有重要的意义。


一、如何使用TCGA数据库获取公共数据?

  1. url: TCGA数据下载挂网
  2. 通过条件筛选过滤数据
  3. 下载数据

二、使用步骤

1.点击Cohort Builder

在这里插入图片描述

2.数据筛选

我们这里以肺腺癌的数据下载为例:
注意: GDC只是一个数据存储网站,因此不仅有TCGA的数据存储在这里,其他项目比如 APOLLO等等的数据也都收录在GDC
请添加图片描述
请添加图片描述
条件添加完成之后我们就可以看到筛选到517个样本的数据

3. Repository

在program中点击more选择TCGA项目,在project中选择不同癌种项目类型,也可以根据列出的其他样本信息进一步筛选,筛选完成点击Repository
请添加图片描述

4.数据下载

4.1 继续选择筛选条件

进入Repository后进一步进行数据类型筛选,Experimental Strategy选择RNA-seq,Data Type选择Gene Expression Quantification,然后点击Add All Files to Cart,此时上方购物车图标会显示已将524个要下载的gene_counts文件加入购物车,点击这个购物车图标进入下一个页面
请添加图片描述

4.2 添加cart并进入

请添加图片描述

4.3 下载

注意: 一般下载三个文件 – Cart,Clinical:TSV,Sample sheet

  1. Clinical文件解压后包含每个样本的临床信息
  2. Cart文件解压后即是对应每个样本通过star对比后的gene_counts文件,一个样本一个文件夹
  3. sample_sheet文件包含对应Cart解压后文件夹和样本对应的信息

请添加图片描述
请添加图片描述


总结

以上就是TCGA数据库下载数据的基本流程了,关于TCGA差异分析可跳转进行观看!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2140171.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【Python篇】深度探索NumPy(下篇):从科学计算到机器学习的高效实战技巧

文章目录 Python NumPy学习指南前言第六部分:NumPy在科学计算中的应用1. 数值积分使用梯形规则进行数值积分使用Simpson规则进行数值积分 2. 求解微分方程通过Euler方法求解一阶常微分方程使用scipy.integrate.solve_ivp求解常微分方程 3. 随机过程模拟模拟布朗运动…

Linux下进程间的通信--共享内存

共享内存概述: 共享内存是进程间通信的一种方式,它允许两个或多个进程共享一个给定的存储区。共享内存是最快的一种IPC形式,因为它允许进程直接对内存进行读写操作,而不需要数据在进程之间复制。 共享内存是进程间通信&#xff…

【C++】【网络】【Linux系统编程】单例模式,加锁封装TCP/IP协议套接字

目录 引言 获取套接字 绑定套接字 表明允许监听 单例模式设计 完整代码示例 个人主页:东洛的克莱斯韦克-CSDN博客 引言 有关套接字编程的细节和更多的系统调用课参考《UNIX环境高级编程》一书,可以在如下网站搜索电子版,该书在第16章详…

【C++】缺省(默认)参数

🦄个人主页:小米里的大麦-CSDN博客 🎏所属专栏:C_小米里的大麦的博客-CSDN博客 🎁代码托管:C: 探索C编程精髓,打造高效代码仓库 (gitee.com) ⚙️操作环境:Visual Studio 2022 目录 一、概念 二、 全缺省(Fully Defa…

多态的相关知识

一.多态的概念 1.多态:多态是⼀个继承关系的下的类对象,去调⽤同⼀函数,产⽣了不同的⾏为。 2.多态分为编译时多态(静态多态)和运⾏时多态(动态多态)。 1>编译时多态(静态多态)主要就是函数重载和函数模板,他们传不同类型的…

Powerpaint介绍及实现局部重绘效果测试[comfyui]

🍘背景 powerpaint,是一个高质量多功能的图像修补模型,可以同时支持插入物体、移除物体、图像扩展、形状可控的物体生成。 这个模型也是国产的,原作者是清华大学深圳国际研究生院,清华大学 ,上海人工智能…

JAVA:非对称加密技术的详细指南

请关注微信公众号:拾荒的小海螺 博客地址:http://lsk-ww.cn/ 1、简述 非对称加密是一种加密技术,使用一对密钥进行数据加密和解密。这两个密钥分别是公开密钥(public key)和私有密钥(private key&#xf…

【算法】栈与模拟

【ps】本篇有 5 道 leetcode OJ。 目录 一、算法简介 二、相关例题 1)删除字符串中的所有相邻重复项 .1- 题目解析 .2- 代码编写 2)比较含退格的字符串 .1- 题目解析 .2- 代码编写 3)基本计算器 II .1- 题目解析 .2- 代码编写 4&…

进程状态、进程创建和进程分类

文章目录 进程进程常见的状态进程调度进程状态变化关系 进程标识示例--进程标识的使用以及简介 进程创建fork函数vfork函数示例--使用fork函数创建子进程,并了解进程之间的关系 创建进程时发生的变化虚拟内存空间的变化示例--验证fork函数创建进程时的操作 对文件IO…

【例题】lanqiao3226 宝藏排序Ⅱ

样例输入 5 1 5 9 3 7样例输出 1 3 5 7 9解题思路 这里的n≤10^5,说明O(n ^2)的算法行不通。 基于比较的高效算法和基于数值划分的高效算法全部参考这篇文章 代码 最简单的自带排序 nint(input()) alist(map(int,input().split()))a.sort() print( .join(map…

量化交易backtrader实践(二)_基础加强篇(1)_数据列表准备与主要实践内容

上一篇回顾 上一篇是数据获取篇,在上一篇里,我们初步接触了backtrader的回测逻辑,重点放在了回测的数据获取的问题上,确保了我们在用合适且有效的正规数据在做回测,我们的目的是要通过backtrader深入讨论量化交易的内…

【Linux进程控制】进程等待

目录 进程等待 进程等待是什么? 为什么? 怎么办? wait方法 获取子进程status 多进程的等待问题 waitpid方法 什么是阻塞等待?什么是非阻塞等待? wait/waitpid获取子进程信息原理 进程等待 进程等待是什么&am…

【AI学习】陶哲轩在 2024 年第 65 届国际数学奥林匹克(IMO)的演讲:AI 与数学

陶哲轩在 2024 年第 65 届国际数学奥林匹克关于AI 和数学的演讲,很有意思。陶哲轩的讲话语速太快了,足见其聪明! AI用于数学的一些方面: 陶哲轩介绍到刚刚被数学家接受并开始普及的方法:形式化证明辅助工具。 形式化…

API:连接数字世界的隐形纽带

在这个智能手机和应用程序无处不在的时代,你可能听说过API这个术语,但你知道它究竟是什么吗?API,全称为应用程序编程接口(Application Programming Interface),是一种让不同的软件和服务之间能够…

MySQL基础篇(黑马程序员2022-01-18)

1 MySQL数据库概述 1.1 MySQL数据库的下载,安装,启动停止 1.2 数据模型 (1)关系型数据库(RDBMS) 概念:建立在关系模型基础上,由多张相互连接的二维表组成的数据库。 特点: A. 使用表存储数据,格式统一,便于维护。…

C++11第五弹:线程库 | 互斥锁 | 原子操作

🌈个人主页: 南桥几晴秋 🌈C专栏: 南桥谈C 🌈C语言专栏: C语言学习系列 🌈Linux学习专栏: 南桥谈Linux 🌈数据结构学习专栏: 数据结构杂谈 🌈数据…

蓝牙耳机是入耳式的好还是开放式的好?2024开放式耳机推荐

个人推荐入开放式耳机,戴起来更舒服,主要有以下几方面原因: 减少对耳部的压迫: 不入耳设计:开放式耳机通常不需要插入耳道,避免了对耳道的直接压迫。入耳式耳机的耳塞长时间塞在耳道内,会对耳…

Linux基础---07文件传输

Linux文件传输地图如下,先选取你所需的场景,若你是需要Linux和Linux之间传输文件就查看SCP工具即可。 一.下载网站文件 前提是有网: 检查网络是否畅通命令:ping www.baidu.com,若有持续的返回值就说明网络畅通。Ctr…

前端基础知识(HTML+CSS+JavaScript)

文章目录 一、HTML1.1 HTML 基础:1.1.1 HTML 的概念:1.1.2 认识 HTML 标签:1.1.3 HTML 文件基本结构:1.1.4 标签层次结构: 1.2 HTML 快速入门:1.3 HTML常见标签:1.3.1 标题标签:h1-h…