大工作量LUAD代谢重编程模型多组学（J Transl Med）

1，单细胞早期、晚期和转移性 LUAD 的细胞动力学变化

2，细胞代谢重编程介导的LUAD驱动恶性转移的异质性

3，模型构建 S-MMR评分管线构建

4，S-MMR 模型的预后评估

5，还开发了S-MMR 评分网络工具

6，S-MMR 评分重塑了 LUAD 中的免疫浸润模式

7，S-MMR评分预测免疫治疗疗效的能力

8，靶点和药物筛选

9，解剖 S-MMR 评分为 3 的恶性细胞

10，泛癌分析

最近的研究越来越多地揭示了代谢重编程与肿瘤进展之间的联系。然而，代谢重编程对肺腺癌（LUAD）患者间异质性和预后的具体影响仍需进一步探索。在这里，我们根据恶性和代谢基因集引入了一个细胞层次结构框架，称为恶性和代谢重编程（MMR），以重新分析178,739个单细胞参考图谱。

亮点：大工作量，支持向量机、随机森林以及决策树模型等多机器学习框架（比单独机器学习模型和算法具有更好的稳健性和精确性）。该研究根据 LUAD scRNA-seq 图谱定义了一组与 LUAD 肿瘤发生和细胞代谢重编程相关的基因，命名为“MMR”。采用Cox回归、随机生存森林（RSF）、CoxBoost、支持向量机（SVM）和梯度提升机（GBM）等机器学习方法，明确了MMR与LUAD预后的关系。我们引入了一种创新的集成学习管道，即三阶段 MMR （3 S-MMR），并通过遗传算法进行增强。该框架分别在特征工程和模型开发中使用双训练集，从而降低了严重过拟合的风险。研究涉及了单细胞、空间代谢组学多组学研究。

1，单细胞早期、晚期和转移性 LUAD 的细胞动力学变化

在解开LUAD细胞层次结构的初始阶段，我们重新分析了178,739个scRNA-seq细胞，覆盖48个样本，包括Nln、nLung、tLung、PE、mLN和tL/B组织，以及根据经典标记基因对T、B、NK、上皮、巨噬细胞、单核细胞、成纤维细胞、MDC、肥大、血浆、内皮和PDC进行明显分类的细胞。

早期、晚期和转移性 LUAD 的细胞动力学变化。（A）样品的细胞分布无显著的批次效应。（B）来自所有 scRNA-seq 样品的细胞的 t-SNE 图谱，通过细胞类型注释着色。（C）显示每种细胞类型的代表性标记基因的点图。（D）每种细胞类型中来自每种来源组织的比例，如图所示。（E）折线图显示通过 Ro/e 评分估计的每种细胞类型的组织流行率。（F）分级热图显示来自每个来源组织的上皮细胞的 CNV。正常肺源性上皮细胞用作对照参考。红色：增益;蓝色：损失。（G）推断 CNV 的 K 均值聚类以获得癌细胞。（H）显示5个K-means聚类CNV分数差异的小提琴图。（簇1被指定为正常上皮细胞，而其余细胞被归类为恶性细胞。）

2，细胞代谢重编程介导的LUAD驱动恶性转移的异质性

由细胞代谢重编程介导的 LUAD 驱动的恶性转移之间的异质性。（A）正常细胞和恶性细胞之间 GSVA 对每个细胞评分的标志性基因集通路活性的差异。（B）来自每个来源组织的恶性细胞的代谢途径活动。统计上不显著的值（随机排列余P > 0.05）显示为空白。（C）基于恶性细胞和正常细胞之间差异表达基因的 Wilcoxon 秩和检验结果的百分比差异（Delta 表示细胞百分比）和对数倍数变化。（D）显示 1290 个 MMR 基因交叉分析的 UpSet 图。（E） 1290 MMR基因的DO富集分析。（女、女）小提琴图（F）和气泡图（G）显示使用 AUCell、UCell、singscore、ssGSEA、AddModulescore 和 Scoreing（其他算法的分数之和）评分的每种细胞类型的 MMR 基因集的富集分数。（H）使用 AUCell、UCell、singscore、ssGSEA、AddModulescore 和 Scoring 评分显示各来源组织的 MMR 基因集富集分数动态变化的小提琴图

3，模型构建 S-MMR评分管线构建

（A） 3 S-MMR 评分的工作流程。（B） 25个LASSO驱动基因对的基因对信息和危害比。（C） 47名基础学习者的C指数和标准

4，S-MMR 模型的预后评估

5，还开发了S-MMR 评分网络工具

6，S-MMR 评分重塑了 LUAD 中的免疫浸润模式

3 S-MMR 评分重塑了 LUAD 中的免疫浸润模式。（A）高 3 S-MMR 评分组和低 3 S-MMR 评分组之间癌症免疫周期各个步骤的差异。（B） 3 S-MMR 评分（riskScore）与基质、免疫和 ESTIMATE 评分之间的相关性。（C） 3 S-MMR 评分与癌症免疫周期步骤之间的相关性（左）。3 个 S-MMR 评分与已发表的免疫细胞特征的富集评分之间的相关性（右）。（D） 3 S-MMR 评分与 6 种 TIIC（CD8 + T 细胞、CD4 + T 细胞、NK 细胞、巨噬细胞、Th1 细胞和树突状细胞）浸润水平之间的相关性，采用 6 种独立算法计算。（E）表示高 3 和低 3 S-MMR 评分组之间病理 HE 染色变化的图像（TCGA 数据库）。（F）从左到右：mRNA表达（中位归一化表达水平）;表达与甲基化（基因表达与 DNA 甲基化 β 值相关）;扩增频率（在特定亚型中扩增 IM 的样本分数与所有样品中的扩增分数之间的差异）;以及高 3 和低 3 S-MMR 评分组对 75 个 IM 基因的缺失频率（作为扩增）。缩写：*P < 0.05;**P < 0.01;P < 0.001。

7，S-MMR评分预测免疫治疗疗效的能力

S-MMR 评分预测免疫治疗效果的能力。（A-F）TIDE （A）、功能障碍（B）、排除（C）、CD8 （D） MDSC （E）和 Merck18 （F）评分的小提琴图。（G）子图算法预测高低 3 个 S-MMR 评分组对 CTLA4 和 PD-1 抑制剂的反应。（H）高低 3 S-MMR 评分组患者之间免疫检查点曲线的相对表达水平的箱线图。（I-N）GSE126044 （I-J）、GSE35640 （K-L）和 GSE78220 （M-N）队列中免疫治疗反应者和非反应者之间 3 个 S-MMR 评分的差异。（O-P）T-SNE 降低映射了 SD 和 PR 患者（O）的细胞分布，以及 GSE207422 数据集中 3 个 S-MMR 评分（P）的分布。（Q） GSE207422数据集中 SD 和 PR 患者之间 3 个 S-MMR 评分的小提琴图。（R）通过 R 估计高低 3 个 S-MMR 组的组织偏好O/E在GSE207422数据集中。（S-T）T-SNE 降低映射了 SD 和 PR 患者（S）细胞的分布，以及 GSE145281 数据集中 3 个 S-MMR 评分（T）的分布。（U） GSE145281数据集中 SD 和 PR 患者之间 3 个 S-MMR 评分的小提琴图。（V）高低 3 个 S-MMR 组的组织偏好通过 R 估计O/E在GSE145281数据集中。缩写：*P < 0.05;**P < 0.01;P < 0.001

8，靶点和药物筛选

首先，我们进行了 Spearman 相关性分析，以探索 TCGA-LUAD 队列中 3 个 S-MMR 评分与潜在药物靶点表达水平之间的关联。由此，我们确定了一组与评分呈正相关的共享基因，将这些基因指定为 3 S-MMR 评分的相关靶标。随后，通过使用肺癌细胞系对 CERES 评分和 3 S-MMR 评分进行 Spearman 相关性分析，我们继续确定 54 个依赖于不良预后的靶点。

9，解剖 S-MMR 评分为 3 的恶性细胞

解剖 S-MMR 评分高 3 的恶性细胞。（A）Monocle2推断的恶性细胞的发展轨迹。3 S-MMR 评分高的恶性细胞主要位于分化根部，3 S-MMR 评分低的恶性细胞主要位于中点和终点状态。（B）恶性细胞中3个S-MMR评分相关基因沿假时间的热图。（C）热图显示了高 3 S-MMR 评分恶性细胞和低 3 S-MMR 评分恶性细胞之间不同 TFs 激活的热图。（D、E）TFs 在恶性细胞高（D）和低 3 S-MMR （E）评分之间的最高活性。RSS 表示调节子特异性评分。（女、女）所有细胞类型的细胞聊天分析。显示了相互作用的数量和相互作用强度。（H，I）显示 SPP1 信号通路推断的细胞间通信网络的分层图。（J） HE染色显示stRNA样品的组织学不同区域。黄色：癌症区域。（K） 3 S-MMR评分强度的空间图。（L）利用RCTD算法识别空间图中不同细胞类型的分布。

10，泛癌分析

（A） 33 种癌症类型中 3 个 S-MMR 评分的 Cox 回归分析。红色表示 P < 0.05 显著性结果。（B）个别癌症类型的平均 3 S-MMR 评分。组织类型、癌症类型和平均 3 S-MMR 评分从内圈到外圈显示。（C-N）在 12 种癌症中，3 个 S-MMR 评分的 Kaplan-Meier 生存曲线显著（对数秩检验）

参考文献：Architecting the metabolic reprogramming survival risk framework in LUAD through single-cell landscape analysis: three-stage ensemble learning with genetic algorithm optimization