1. 准备输入文件,需要四个文件,所有文件都应以制表符分隔的表格输入格式 (.txt) 提供。
a. scRNA-seq 基因表达文件
矩阵必须是基因(行)乘以细胞(列)。 第一行必须包含单个细胞 ID,第一列必须包含基因名称。 第一列(基因名称)必须有标题。 基因表达数据应表示为非标准化计数。
b. 细胞类型标签文件
与 scRNA-seq 基因表达矩阵中的单个细胞 ID 对应的细胞类型标签。细胞类型标签字符串不应包含特殊字符。表格应包含两列,其中第 1 列包含与 scRNA-seq 矩阵的列对应的单个细胞 ID,第 2 列包含相应的细胞类型标签。列必须有标题。
c. 空间转录组学 (ST) 基因表达文件
矩阵必须是基因(行)乘以 ST 点(列)。第一行必须包含 ST 点 ID,第一列必须包含基因名称。
第一列(基因名称)必须有标题。基因表达数据应表示为非标准化计数。
d. 空间转录组学坐标文件
由 3 列组成的表格,其中第一列包含与 ST 基因表达矩阵的列相对应的 ST 点 ID,第 2 列和第 3 列分别包含每个 ST 点的行和列索引。列必须有标题。
2. 安装
git clone https://github.com/digitalcytometry/cytospace
cd cytospace
conda env create -f environment.yml
conda activate cytospace_v1.1.0
pip install .
pip install lapjv==1.3.14
3. 运行,速度很快,大概几分钟就可以运行完
conda activate cytospace_v1.1.0
cytospace \
--scRNA-path /path/to/scRNA_geneexpression \
--cell-type-path /path/to/scRNA_celllabels \
--st-path /path/to/ST_geneexpression \
--coordinates-path /path/to/ST_coordinates \
-o /path/to/output
4. 查看结果,主要的输出文件:
建议读取assigned_expression文件,加入assigned_locations,用scanpy可视化。
参考:digitalcytometry/cytospace: CytoSPACE: Optimal mapping of scRNA-seq data to spatial transcriptomics data (github.com)
在线网站:CytoSPACE (stanford.edu)