TCGAbiolinks
- 写在前面
- 学习目的
- GDCquery + GDCdownload +GDC prepare
- 中间遇到的报错
- 下载蛋白质数据
写在前面
由于别人提醒我TCGA的数据可以利用TCGAbiolinks下载并处理,所以我决定阅读该包手册,主要是该包应该是有更新的,我看手册进行更新了,所以也许这是一个值得学习的包。
学习目的
主要学习如何下载并处理数据,其余的非重点。
GDCquery + GDCdownload +GDC prepare
先查找路径名,而后下载,再将下载的数据读取
query <- GDCquery(
project = "TCGA-KIRP",
data.category = "Simple Nucleotide Variation",
data.type = "Masked Somatic Mutation"
)
GDCdownload(query, method = "api", directory = "maf")
maf <- GDCprepare(query, directory = "maf")
临床数据:GDCquery_clinic
中间遇到的报错
运行b = get.GRCh.bioMart(genome = “hg19”)
下载蛋白质数据
library(TCGAbiolinks)
projects <- getGDCprojects()
projects <- projects$project_id
query.rppa <- GDCquery(
project = "TCGA-BRCA",
data.category = "Proteome Profiling",
data.type = "Protein Expression Quantification"
)
GDCdownload(query.rppa)
Proteins <- GDCprepare(query.rppa)
saveRDS(Proteins,file = "tcga_brca_protein.rds")