文章目录
-
- LIRI-JP
-
- 加载R包
- 导入数据
- 生成ExpressionSet
- 输出结果
- TCGA-LIHC
-
- 加载R包
- 导入数据
- 生成ExpressionSet
- 输出结果
- GSE14520
-
- 加载R包
- 导入数据
- 生成ExpressionSet
- 输出结果
- 重叠基因
-
- 加载R包
- 导入数据
- 共有基因
- 生成数据对象
- 输出结果
- 总结
ExpressionSet是Biobase[@huber2015orchestrating]包提供的一种数据对象,专为存储生物学实验数据而设计。它允许用户将表型数据、表达谱以及特征数据(如基因或蛋白质标识符)集成在一个统一的数据结构中。在本章节中,将利用这种数据对象来组织并处理获得的三个数据集:LIRI-JP
,LIHC-US/TCGA-LIHC
和GSE14520
。
ExpressionSet对象在R中非常有用,因为它不仅简化了数据的存储和访问,而且为后续的生物信息学分析提供了便利。每个ExpressionSet对象都包含一个表达矩阵,其中行代表特征(如基因),列代表样本。此外,ExpressionSet对象还可以包含样本的元数据(metadata),这些元数据描述了样本的各种属性,如临床特征或实验条件。
为了查看ExpressionSet对象的元数据,可以使用Biobase包中的pData()
函数。这个函数将返回一个数据框,其中包含样本的元数据信息。同样地,为了获取表达谱数据(即表达矩阵),可以使用exp